Descrizione: questo punto di estensione è utilizzato per registrare gli analizzatori di testo utilizzati dalla guida per indicizzare e ricercare la documentazione.
La guida sfrutta la funzionalità del motore di ricerca Lucene, che consente di indicizzare flussi di token (flussi di parole). Gli analizzatori creano token dal flusso di caratteri. Esaminano il contenuto del testo e forniscono token da utilizzare con l'indice. I token possono essere creati dal flusso di testo in molti modi univoci. Un analizzatore elementare può creare token dai flussi in uno spazio vuoto, un altro può eseguire il filtraggio dei token in base alle esigenze dell'applicazione. Poiché la maggioranza della documentazione è costituita di testo leggibile dall'utente, gli analizzatori utilizzati dal sistema della guida devono creare token che riconoscono la lingua e la grammatica ed eseguire la normalizzazione del testo indicizzato. In alcune lingue la qualità della ricerca aumenta in maniera considerevole se sul testo indicizzato viene eseguita l'analisi dell'origine e la rimozione delle parole non significative. Questi punti di estensione consentono di configurare gli analizzatori per lingue rispetto alle quali il sistema della guida predefinito non fornisce analizzatori con riconoscimento linguistico.
Tag di configurazione:
<!ELEMENT analyzer EMPTY>
<!ATTLIST analyzer
locale
CDATA #REQUIRED
class CDATA #REQUIRED
>
Di seguito viene riportato un esempio di configurazione di Lucene Analyzer:
<extension id="com.xyz.XYZ" point="org.eclipse.help.luceneAnalyzer">
<analyzer locale="ll_CC"
class="com.xyz.ll_CCAnalyzer" />
</extension>
Informazione API:
Il valore dell'attributo locale deve essere costituito da una stringa di impostazione internazionale di due o cinque caratteri. Se un analizzatore viene configurato per una lingua mediante una designazione linguistica di due lettere, l'analizzatore verrà utilizzato per tutte le impostazioni locali di questa lingua. Se l'analizzatore è configurato per un'impostazione internazionale di cinque caratteri, sarà utilizzato sempre.
Il valore dell'attributo class deve rappresentare una classe che estende org.apache.lucene.analysis.Analyzer. Per le lingue in cui è possibile aumentare il numero delle corrispondenze scegliendo come opzione di ricerca l'assenza di distinzione tra maiuscolo/minuscolo, si consiglia di eseguire il filtraggio in caratteri minuscoli.
Implementazione fornita: il sistema della guida ha in dotazione analizzatori per inglese e tedesco, configurati per essere utilizzati rispettivamente per le impostazioni internazionali en e de. Questi analizzatori eseguono il filtraggio di parole non significative, il filtraggio di caratteri minuscoli e l'analisi dell'origine. Per le lingue per le quali non è configurato alcun analizzatore, la guida utilizza un semplice analizzatore che esegue il filtraggio di caratteri minuscoli e quello delle parole non significative in inglese.