説明: この拡張ポイントは、ドキュメンテーションを索引付けおよび検索するときに、 ヘルプが使用するテキスト・アナライザーを登録するために使用します。
ヘルプは、Lucene 検索エンジンの機能を活用することで、トークン・ストリーム (ワードのストリーム) を 索引付けできます。 アナライザーは文字ストリームからトークンを作成します。 アナライザーはテキスト・コンテンツを検査し、索引で使用するトークンを提供します。 テキスト・ストリームは多くの固有の方法でトークン化されます。 あるアナライザーは空白の位置でストリームをトークン化し、また別のアナライザーはアプリケーションの 必要性に基づいてトークンにフィルター操作を行うことができます。 ドキュメンテーションの多くは人間が読むことのできるテキストであるため、ヘルプ・システムで使用される アナライザーは、索引付きテキストについて言語と文法を認識するトークン化と正規化を行うことが 要求されます。 索引付きテキストでストップ・ワードの除去とステミングを行なうと、検索の質が飛躍的に向上する言語も あります。 この拡張ポイントは、デフォルトのヘルプ・システムが言語認識アナライザーを提供しない言語のために アナライザーを構成することを可能にします。
構成マークアップ:
<!ELEMENT analyzer EMPTY>
<!ATTLIST analyzer
locale
CDATA #REQUIRED
class CDATA #REQUIRED
>
Lucene Analyzer 構成の例を次に示します。
<extension id="com.xyz.XYZ" point="org.eclipse.help.luceneAnalyzer">
<analyzer locale="ll_CC"
class="com.xyz.ll_CCAnalyzer" />
</extension>
API 情報:
locale 属性の値は 5 文字または 2 文字のロケール・ストリングで表現されます。 アナライザーが 2 文字の言語指定を行なうことで言語について構成される場合、アナライザーは この言語のすべてのロケールに対して使用されることになります。 アナライザーが 5 文字のロケールと一致するように構成される場合、代わりにそれが使用される ことになります。
class 属性の値は、org.apache.lucene.analysis.Analyzer を拡張するクラスを 表します。 大文字小文字を区別せずに検索を行なうと検索ヒット数を増加させることはできますが、このアナライザーに 小文字フィルターを実行させることを推奨します。
3提供されるインプリメンテーション: 英語とドイツ語のヘルプ・システムは、 それぞれ en と de ロケールを使用するように構成されています。 これらのアナライザーはストップ・ワード・フィルター、小文字フィルター、およびステミングを実行します。 アナライザーが構成されていない言語では、ヘルプは小文字フィルターと英語の ストップ・ワード・フィルターを実行するシンプルなアナライザーを使用します。