Analisador Lucene

Identificador: org.eclipse.help.luceneAnalyzer

Descrição: Este ponto de extensão é utilizado para registrar analisadores de texto para uso pela ajuda ao indexar e pesquisar a documentação.

A ajuda utiliza capacidades do mecanismo de pesquisa Lucene, que permite a indexação de fluxos de token (fluxos de palavras).  Os analisadores criam tokens do fluxo de caracteres.  Eles examinam o conteúdo do texto e fornecem tokens para uso com o índice.  O fluxo de texto pode ser padronizado de várias maneiras exclusivas.  Um analisador trivial pode padronizar fluxos em espaços em branco, um analisador diferente pode executar a filtragem de tokens, com base nas necessidades do aplicativo.  Visto que a documentação é geralmente texto legível pelo usuário, deseja-se que esses analisadores utilizados pelo sistema de ajuda executem o idioma e a gramática cientes da padronização e normalização de texto indexado.  Para alguns idiomas a qualidade de pesquisa aumentará significantemente, se a remoção e o suporte da palavra de parada forem executados no texto indexado.  Esses pontos de extensão permitem a configuração de analisadores para os idiomas que o sistema de ajuda padrão não fornece analisadores cientes de idioma.

Marcação da Configuração:

   <!ELEMENT analyzer EMPTY>
   <!ATTLIST analyzer
      locale         CDATA #REQUIRED
      class          CDATA #REQUIRED
   >

Exemplos:

A seguir encontra-se um exemplo de configuração do Analisador Lucene:

    <extension id="com.xyz.XYZ" point="org.eclipse.help.luceneAnalyzer">
        <analyzer locale="ll_CC" class="com.xyz.ll_CCAnalyzer" />
    </extension>

Informações de API:

O valor do atributo locale deve representar uma cadeia de locales de cinco ou dois caracteres.  Se o analisador for configurado para um idioma especificando a designação de idioma de duas letras, o analisador será utilizado para todos os locales desse idioma.  Se for configurado o analisador que corresponde ao locale de cinco caracteres, ele será utilizado.

O valor do atributo class deve representar uma classe que estende org.apache.lucene.analysis.Analyzer.  Recomenda-se que esse analisador execute a filtragem com letras minúsculas para idiomas onde é possível aumentar o número de acertos de pesquisa tornando o caso da pesquisa insensível.

Implementação Fornecida: O sistema de ajuda é fornecido com os analisadores ingleses e alemães, que são configurados para serem utilizados para os locales en e de respectivamente.  Esses analisadores executam a filtragem de palavra de parada, filtragem com letras minúsculas e suporte.   Para idiomas que nenhum analisador é configurado, a ajuda utiliza o analisador simples que executa filtragem com letra minúscula e filtragem de palavra de parada com letra minúscula.


Copyright IBM Corp. e outros 2000, 2002. Todos os Direitos Reservados.