SearchWP Documentation

Visualizza la guida all'installazione, sfoglia la Knowledge Base, scopri i numerosi hook di SearchWP

Utilizzo di Apache Tika per l'elaborazione di documenti

SearchWP ha supporto integrato per l'elaborazione di documenti, ma ci sono alcuni casi in cui sono preferiti metodi alternativi. Un esempio è lo scaricamento dell'analisi dei PDF (che può essere un lavoro intensivo di risorse per PHP) su un binario creato appositamente come Xpdf.

Un'altra applicazione popolare in grado di analizzare documenti ed estrarre contenuti è Apache Tika. Se il tuo server dispone di Tika, puoi dire a SearchWP di utilizzarlo per analizzare i documenti PDF in questo modo:

All hooks should be added to your custom SearchWP Customizations Plugin.

<?php
// Use Apache Tika to extract PDF content in SearchWP.
add_filter( 'searchwp\parser\pdf', function( $content, $args ) {
// Ensure this path is updated to match your Tika installation path!
$path_to_tika = '/srv/bin/tika-app-1.18.jar';
// Execute the command.
$cmd = "java -jar {$path_to_tika} -t {$args['file']}";
@exec( $cmd, $output, $exitCode );
// If there was a problem, send the output to the debug log.
if ( $exitCode ) {
do_action( 'searchwp\debug\log', 'Error running Tika, exit code: ' . $exitCode );
}
return $output;
}, 20, 2 );

Apache Tika è un'applicazione molto capace che può analizzare tipi di documenti aggiuntivi, se lo desideri. Lo snippet sopra utilizzerà Tika per analizzare i PDF, i seguenti filtri sono disponibili e possono essere personalizzati allo stesso modo:

Apache Tika potrebbe anche avere un supporto migliore per i tuoi documenti Office, nel qual caso puoi personalizzare il contenuto analizzato con il filtro searchwp\document\content.

Crea Oggi Stesso una Migliore Esperienza di Ricerca WordPress

Non perdere mai più visitatori a causa di risultati di ricerca inutili. SearchWP rende la creazione della tua ricerca intelligente WordPress veloce e facile.

Get SearchWP Now
Icona di motori di ricerca multipli