Click here to view and discuss this page in DocCommentXchange. In the future, you will be sent there automatically.

SQL Anywhere 12.0.1 (Deutsch) » SQL Anywhere Server - SQL-Benutzerhandbuch » Abfrage und Änderung von Daten » Volltextsuche » Konzepte und Referenz zu Textkonfigurationsobjekten » Angaben beim Erstellen oder Ändern von Textkonfigurationsobjekten

 

STOPLIST-Klausel - Konfigurieren der Stoppliste

Eine Stoppliste gibt die Begriffe an, die beim Erstellen des Textindexes ignoriert werden sollen.

Sofern nicht anders definiert, wird der Standardwert für diese Einstellung von der Einstellung im Standard-Textkonfigurationsobjekt bezogen, die üblicherweise eine leere Stoppliste ist.

STOPLIST-Auswirkung auf Textindizes STOPLIST-Auswirkung auf Abfragebegriffe
  • GENERIC-Textindizes   Bei GENERIC-Textindizes werden Begriffe, die in der Stoppliste enthalten sind, nicht in den Textindex eingefügt.

  • NGRAM-Textindex   Bei NGRAM-Textindizes wird der Textindex nicht die N-Gramme enthalten, die aus den Begriffen in der Stoppliste geformt wurden.

  • GENERIC-Textindizes   Bei GENERIC-Textindizes werden Abfragebegriffe ignoriert, die in der Stoppliste enthalten sind, weil sie im Textindex nicht vorkommen können.

  • NGRAM-Textindex   Begriffe in der Stoppliste werden in N-Gramme aufgeteilt und die N-Gramme werden für das Filtern von Begriffen verwendet. Gleichermaßen werden Abfragebegriffe in N-Gramme aufgeteilt und jene, die mit N-Grammen in der Stoppliste übereinstimmen, werden gelöscht, weil sie im Textindex nicht vorkommen können.

Die Einstellungen im Textkonfigurationsobjekt werden auf die Stoppliste angewendet, wenn diese syntaktisch analysiert wird. Das heißt, der angegebene Begriffsegmentierer und die Einstellungen für minimale bzw. maximale Länge werden angewendet.

Bei NGRAM-Textindizes können Stopplisten zu unerwarteten Ergebnissen führen, weil die Stoppliste in N-Gramm-Form gespeichert wird, und nicht in Form der angegebenen Stopplistenbegriffe. Beispiel: Wenn Sie bei einem NGRAM-Textindex, bei dem MAXIMUM TERM LENGTH 3 ist, STOPLIST 'there' eingeben, werden die folgenden N-Gramme als Stoppliste gespeichert: the her ere. Dies wirkt sich auf die Fähigkeit aus, Begriffe abzufragen, die die N-Gramme "the" "her" und "ere" enthalten.

Hinweis

Die Einschränkungen, die für die Angabe von Zeichenfolgenliteralen gelten, gelten auch für Stopplisten. So müssen beispielsweise die Apostrophe mit Escapezeichen versehen werden, usw.

Das Beispielverzeichnis enthält Beispielcode, der Stopplisten für mehrere Sprachen lädt. Es wird empfohlen, diese Beispiel-Stopplisten nur bei GENERIC-Textindizes zu verwenden. Den Speicherort des Beispielverzeichnisses finden Sie unter Beispielverzeichnis.

 Siehe auch