Analizador Lucene

Identificador: org.eclipse.help.luceneAnalyzer

Descripción: este punto de extensión permite registrar analizadores de texto para que los utilice el sistema de ayuda al indexar la documentación y hacer búsquedas en ella.

La ayuda saca partido de las prestaciones del motor de búsqueda Lucene, que permite indexar corrientes de símbolos (corrientes de palabras). Los analizadores crean símbolos a partir de la corriente de caracteres. Examinan el contenido del texto y proporcionan símbolos destinados a utilizarse con el índice. La corriente de texto se puede señalizar con símbolos de muchas maneras exclusivas. Un analizador trivial puede señalizar las corrientes en espacio en blanco, otro analizador distinto puede llevar a cabo el filtrado de símbolos, en función de las necesidades de la aplicación. Dado que la mayor parte de la documentación es texto legible por personas, conviene que los analizadores utilizados por el sistema de ayuda realicen una señalización y una normalización del texto indexado en las que se tenga en cuenta el idioma y la gramática. Para algunos idiomas, la calidad de la búsqueda aumenta notablemente si se eliminan las palabras de relleno y se indican los temas relacionados en el texto indexado. Este punto de extensión permite configurar analizadores para aquellos idiomas para los que el sistema de ayuda por omisión no proporciona analizadores que tengan en cuenta el idioma.

Códigos XML de configuración:

   <!ELEMENT analyzer EMPTY>
   <!ATTLIST analyzer
      locale         CDATA #REQUIRED
      class          CDATA #REQUIRED
   >

Ejemplos:

A continuación figura un ejemplo de configuración de un analizador Lucene:

    <extension id="com.xyz.XYZ" point="org.eclipse.help.luceneAnalyzer">
        <analyzer locale="ll_CC" class="com.xyz.ll_CCAnalyzer" />
    </extension>

Información sobre las API:

El valor del atributo locale debe representar una serie de entorno local que puede constar de cinco o de dos caracteres. Si el analizador está configurado para un idioma especificando la designación de idioma de dos letras, el analizador se utilizará para todos los entornos locales de ese idioma. Si hay un analizador configurado para que coincida con un entorno local de cinco caracteres, este es el que se utilizará, en vez del otro.

El valor del atributo class debe representar una clase que amplíe org.apache.lucene.analysis.Analyzer. Recomendamos que este analizador realice el filtrado de minúsculas para aquellos idiomas en los que es posible aumentar el número de aciertos de búsqueda haciendo que la búsqueda no detecte las mayúsculas/minúsculas.

Implementación suministrada: el sistema de ayuda viene con los analizadores de inglés y alemán, configurados para utilizarse con los entornos locales en y de, respectivamente. Estos analizadores realizan el filtrado de palabras de relleno, el filtrado de minúsculas y la indicación de temas relacionados. Para los idiomas que no tienen ningún analizador configurado, la ayuda emplea un analizador sencillo que realiza el filtrado de minúsculas y el filtrado de palabras de relleno del inglés.


Copyright IBM Corp. y otros 2000, 2002. Reservados todos los derechos.