Ausführliche Beschreibungen von Einstellungen für Textkonfigurationsobjekte und wie sie sich auf den Inhalt eines Textindexes und auf die Ergebnisse der Abfrage eines Textindexes auswirken, finden Sie unter Einstellungen für Textkonfigurationsobjekte.
Um eine Liste aller Textkonfigurationsobjekte in der Datenbank und ihrer Einstellungen zu erhalten, führen Sie eine Abfrage
in der Systemansicht SYSTEXTCONFIG durch (z.B. SELECT * FROM SYSTEXTCONFIG
). Siehe SYSTEXTCONFIG-Systemansicht.
Sie können testen, wie ein Textkonfigurationsobjekt eine Zeichenfolge mit den Systemprozeduren sa_char_terms und sa_nchar_terms in Begriffe segmentiert. Siehe sa_char_terms-Systemprozedur und sa_nchar_terms-Systemprozedur.
SQL Anywhere stellt zwei Standard-Textkonfigurationsobjekte, default_nchar und default_char, für die Verwendung mit NCHAR- bzw. Nicht-NCHAR-Daten bereit. Diese Konfigurationen werden erstellt, wenn Sie erstmals versuchen, ein Textkonfigurationsobjekt oder einen Textindex zu erstellen. Wenn Sie versehentlich eines dieser Objekte löschen, wird es neu erstellt, wenn Sie das nächste Mal versuchen, ein Textkonfigurationsobjekt oder einen Textindex zu erstellen.
Die Einstellungen für default_char und default_nchar zum Zeitpunkt der Installation werden in der untenstehenden Tabelle gezeigt. Diese Einstellungen wurden ausgewählt, weil sie für die meisten zeichenbasierten Sprachen besonders geeignet sind. Es wird ausdrücklich empfohlen, dass Sie diese Einstellungen in den Standard-Textkonfigurationsobjekten nicht ändern.
Einstellung | Installierter Wert |
---|---|
TERM BREAKER |
0 (GENERIC) |
MINIMUM TERM LENGTH | 1 |
MAXIMUM TERM LENGTH | 20 |
STOPLIST | (leer) |
Wenn Sie ein Standard-Textkonfigurationsobjekt löschen, wird es automatisch wieder erstellt, wenn Sie das nächste Mal einen Textindex oder ein Textkonfigurationsobjekt erstellen. Siehe DROP TEXT CONFIGURATION-Anweisung.
Wenn ein Standard-Textkonfigurationsobjekt vom Datenbankserver erstellt wird, werden die Datenbankoptionen, die sich darauf auswirken, wie Datums- und Zeitwerte in Zeichenfolgen konvertiert werden, aus der aktuellen Verbindung heraus im Textkonfigurationsobjekt gespeichert. Siehe Textkonfigurationsobjekte und Datenbankoptionen.
Eine Beschreibung der Einstellungen für Textkonfigurationsobjekte finden Sie unter Einstellungen für Textkonfigurationsobjekte.
Die folgende Tabelle zeigt die Einstellungen für verschiedene Textkonfigurationsobjekte und wie sich die Einstellungen darauf
auswirken, was indiziert wird und wie eine Volltext-Abfragezeichenfolge interpretiert wird. Alle Beispiele verwenden die Zeichenfolge
'I'm not sure I understand'
.
Konfigurationseinstellungen | Begriffe, die indiziert werden | Abfrageinterpretation |
---|---|---|
TERM BREAKER GENERIC MINIMUM TERM LENGTH 1 MAXIMUM TERM LENGTH 20 STOPLIST '' |
|
Beachten Sie dass das 'not' in der ursprünglichen Zeichenfolge als ein Operator, nicht als das Wort 'not' (nicht) interpretiert wird. |
TERM BREAKER GENERIC MINIMUM TERM LENGTH 2 MAXIMUM TERM LENGTH 20 STOPLIST 'not and' |
|
Beachten Sie dass 'sure' gelöscht wird, da 'not' interpretiert als Operator (AND NOT) zwischen der Phrase "i am" und "sure" interpretiert wird. Da die Phrase "i am" Begriffe enthält, die zu kurz sind und daher gelöscht werden, wird die rechte Seite der AND NOT-Bedingung ('sure') ebenfalls gelöscht. Auf diese Weise bleibt nur 'understand' übrig. |
TERM BREAKER NGRAM MAXIMUM TERM LENGTH 3 STOPLIST 'not and' |
|
Bei einer Fuzzy Suche: |
TERM BREAKER GENERIC MINIMUM TERM LENGTH 1 MAXIMUM TERM LENGTH 20 STOPLIST 'not and' |
|
|
TERM BREAKER NGRAM MAXIMUM TERM LENGTH 20 STOPLIST 'not and' |
Nichts wird indiziert, weil kein Begriff gleich oder länger als 20 Zeichen ist. Dies veranschaulicht, wie unterschiedlich sich MAXIMUM TERM LENGTH auf GENERIC- und NGRAM-Textindizes auswirkt. Bei NGRAM-Textindizes legt MAXIMUM TERM LENGTH die Länge der N-Gramme fest, die in die Textindizes eingefügt werden. |
Die Suche gibt eine leere Ergebnismenge zurück, weil kein N-Gramm mit 20 Zeichen aus der Abfragezeichenfolge geformt werden kann. |
Sie können testen, wie ein Textkonfigurationsobjekt eine Zeichenfolge mit den Systemprozeduren sa_char_terms und sa_nchar_terms in Begriffe segmentiert. Siehe sa_char_terms-Systemprozedur und sa_nchar_terms-Systemprozedur.
Die folgende Tabelle enthält Beispiele dafür, wie die Einstellungen der Textkonfigurationsobjekt-Zeichenfolgen interpretiert werden.
Die Zahlen in Klammern in der Spalte "Interpretierte Zeichenfolge" geben die Positionsinformationen wieder, die für jeden Begriff gespeichert sind. Die Zahlen dienen zur Illustration in der Dokumentation. Die tatsächlich gespeicherten Begriffe enthalten keine Zahlen in Klammern.
Konfigurationseinstellungen | Zeichenfolge | Interpretierte Zeichenfolge |
---|---|---|
TERM BREAKER GENERIC MINIMUM TERM LENGTH 3 MAXIMUM TERM LENGTH 20 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
TERM BREAKER NGRAM MAXIMUM TERM LENGTH 3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
TERM BREAKER NGRAM MAXIMUM TERM LENGTH 3 SKIPPED TOKENS IN TABLE AND IN QUERIES |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Sie können testen, wie ein Textkonfigurationsobjekt eine Zeichenfolge mit den Systemprozeduren sa_char_terms und sa_nchar_terms in Begriffe segmentiert. Siehe sa_char_terms-Systemprozedur und sa_nchar_terms-Systemprozedur.
![]() |
Kommentieren Sie diese Seite in DocCommentXchange.
|
Copyright © 2010, iAnywhere Solutions, Inc. - SQL Anywhere 12.0.0 |