Click here to view and discuss this page in DocCommentXchange. In the future, you will be sent there automatically.

SQL Anywhere 12.0.1 » SQL Anywhere サーバー SQL の使用法 » データの問い合わせと修正 » 全文検索 » テキスト設定オブジェクトの概念と参照 » テキスト設定オブジェクトの作成または変更時の指定項目

 

STOPLIST 句 - ストップリストの設定

ストップリストは、テキストインデックスの作成時に無視する単語を指定します。

定義されていない場合、ストップリスト設定のデフォルト値は、デフォルトのテキスト設定オブジェクトの設定 (通常は空の状態) になります。

STOPLIST のテキストインデックスへの影響 STOPLIST のクエリ単語への影響
  • GENERIC テキストインデックス   GENERIC テキストインデックスでは、ストップリストに含まれる単語はテキストインデックスに挿入されません。

  • NGRAM テキストインデックス   NGRAM テキストインデックスでは、ストップリストに含まれる単語から構成される N-gram はテキストインデックスには含まれません。

  • GENERIC テキストインデックス   GENERIC テキストインデックスでは、ストップリストに含まれるクエリ単語はテキストインデックスには存在できないため、無視されます。

  • NGRAM テキストインデックス   ストップリストに含まれる単語は N-gram に分割され、N-gram は単語のフィルタリングで使用されます。同様に、クエリ単語も N-gram に分割され、ストップリスト内の N-gram と一致するものはテキストインデックスには存在できないため、削除されます。

テキスト設定オブジェクトの設定は、解析時にストップリストに適用されます。つまり、指定された単語区切りと最小長設定/最大長設定が適用されます。

NGRAM テキストインデックスのストップリストは、指定したストップリストの単語ではなく、N-gram の形式で格納されるため、予期しない結果になる場合があります。たとえば、MAXIMUM TERM LENGTH が 3 の NGRAM テキストインデックスの場合、STOPLIST 'there' を指定すると、the her ere の N-gram がストップリストとして格納されます。これは、the、her、ere の N-gram を含むすべての単語に対する問い合わせに影響します。

注意

文字列リテラルの指定に関連する制約事項は、ストップリストにも該当します。たとえば、アポストロフィはエスケープする必要があります。

Samples ディレクトリには、複数の言語用のストップリストをロードするサンプルコードが含まれています。これらのサンプルストップリストは、GENERIC テキストインデックスでのみ使用することをおすすめします。Samples ディレクトリのロケーションについては、サンプルディレクトリを参照してください。

 参照