Description : ce point d'extension est utilisé pour enregistrer des analyseurs de texte pour l'aide lors de l'indexation et de la recherche de documentation.
Le système d'aide a recours à des capacités du moteur de recherche Lucene, ce qui permet d'indexer des flux de sèmes (mots). Les analyseurs créent des sèmes pour à partir du flux de caractères. Ils analysent le contenu et fournissent des jetons à utiliser avec l'index. Il est possible de segmenter le flux de texte en plusieurs sèmes. Un analyseur simple peut segmenter des flux où il y a des espaces, un autre peut filtrer les sèmes en fonction des besoins de l'application. La documentation étant conçue pour être lue, les analyseurs utilisés par le système d'aide doivent effectuer une segmentation linguistique et grammaticale du texte indexé. Pour certaines langues, la qualité de la recherche augmente de façon notable dans le cas de la suppression de mots types et de lemmisation. Ce point d'extension permet de configurer des analyseurs pour les langues n'en possédant pas par défaut.
Marques de configuration :
<!ELEMENT analyzer EMPTY>
<!ATTLIST analyzer
locale
CDATA #REQUIRED
class
CDATA #REQUIRED
>
L'exemple suivant illustre une configuration de l'analyseur Lucene :
<extension id="com.xyz.XYZ" point="org.eclipse.help.luceneAnalyzer">
<analyzer locale="ll_CC"
class="com.xyz.ll_CCAnalyzer" />
</extension>
Informations d'API :
La valeur de l'attribut locale doit représenter une chaîne de deux ou cinq caractères. Si l'analyseur est configuré pour une langue avec un code de deux lettres, il sera utilisé pour tous les environnements locaux de cette langue. S'il s'agit d'un code de cinq caractères, l'analyseur sera utilisé à la place.
La valeur de l'attribut class doit désigner une classe étendant org.apache.lucene.analysis.Analyzer. Il est préférable que cet analyseur effectue un tri en minuscules pour les langues dont les résultats de recherche peuvent être améliorés en ne différenciant pas les majuscules des minuscules.
Implémentation fournie : le système d'aide est fourni avec des analyseurs en anglais et en allemand configurés pour une utilisation avec les environnements locaux "en" et "de", respectivement. Ces analyseurs filtrent les mots types et les minuscules et effectuent une lemmisation. Pour les langues dont les analyseurs ne sont pas configurés, le système d'aide a recours à un filtrage des minuscules et des mots types en anglais.