Click here to view and discuss this page in DocCommentXchange. In the future, you will be sent there automatically.

SQL Anywhere 11.0.1 (Deutsch) » SQL Anywhere Server - SQL-Benutzerhandbuch » Daten abfragen und ändern » Daten abfragen » Textkonfigurationsobjekte

 

Beispiel-Textkonfigurationsobjekte

Ausführliche Beschreibungen von Einstellungen für Textkonfigurationsobjekte und wie sie sich auf den Inhalt eines Textindexes und auf die Ergebnisse der Abfrage eines Textindexes auswirken, finden Sie unter Einstellungen für Textkonfigurationsobjekte.

Um eine Liste aller Textkonfigurationsobjekte in der Datenbank und ihrer Einstellungen zu erhalten, führen Sie eine Abfrage in der Systemansicht SYSTEXTCONFIG durch (z.B. SELECT * FROM SYSTEXTCONFIG). Weitere Hinweise finden Sie unter SYSTEXTCONFIG-Systemansicht.

Standard-Textkonfigurationsobjekte

SQL Anywhere stellt zwei Standard-Textkonfigurationsobjekte, default_nchar und default_char, für die Verwendung mit NCHAR- bzw. Nicht-NCHAR-Daten bereit. Diese Konfigurationen werden erstellt, wenn Sie erstmals versuchen, ein Textkonfigurationsobjekt oder einen Textindex zu erstellen. Wenn Sie versehentlich eines dieser Objekte löschen, wird es neu erstellt, wenn Sie das nächste Mal versuchen, ein Textkonfigurationsobjekt oder einen Textindex zu erstellen.

Die Einstellungen für default_char und default_nchar zum Zeitpunkt der Installation werden in der untenstehenden Tabelle gezeigt. Diese Einstellungen wurden ausgewählt, weil sie für die meisten zeichenbasierten Sprachen besonders geeignet sind. Es wird ausdrücklich empfohlen, dass Sie diese Einstellungen in den Standard-Textkonfigurationsobjekten nicht ändern.

Einstellung Installierter Wert
TERM BREAKER

0 (GENERIC)

MINIMUM TERM LENGTH 1
MAXIMUM TERM LENGTH 20
STOPLIST (leer)

Wenn Sie ein Standard-Textkonfigurationsobjekt löschen, wird es automatisch wieder erstellt, wenn Sie das nächste Mal einen Textindex oder ein Textkonfigurationsobjekt erstellen. Weitere Hinweise finden Sie unter DROP TEXT CONFIGURATION-Anweisung.

Beispiel-Textkonfigurationsobjekte

Die folgende Tabelle zeigt die Einstellungen für verschiedene Textkonfigurationsobjekte und wie sich die Einstellungen darauf auswirken, was indiziert wird und wie eine Volltext-Abfragezeichenfolge interpretiert wird. Alle Beispiele verwenden die Zeichenfolge 'I'm not sure I understand'.

Konfigurationseinstellungen Begriffe, die indiziert werden Abfrageinterpretation

TERM BREAKER GENERIC

MINIMUM TERM LENGTH 1

MAXIMUM TERM LENGTH 20

STOPLIST ''

I m not sure I understand

"I m" AND not AND sure AND I AND understand'

TERM BREAKER GENERIC

MINIMUM TERM LENGTH 2

MAXIMUM TERM LENGTH 20

STOPLIST 'not and'

sure understand

'sure AND understand'.

TERM BREAKER NGRAM

MAXIMUM TERM LENGTH 3

STOPLIST 'not and'

sur ure und nde der ers rst sta tan

'sur AND ure AND und AND nde AND der AND ers AND rst AND sta AND tan'.

Im Fall einer Fuzzy-Suche:

'sur OR ure OR und OR nde OR der OR ers OR rst OR sta OR tan'

TERM BREAKER GENERIC

MINIMUM TERM LENGTH 1

MAXIMUM TERM LENGTH 20

STOPLIST 'not and'

I m sure I understand

'"I m" AND sure AND I AND understand'.

TERM BREAKER NGRAM

MAXIMUM TERM LENGTH 20

STOPLIST 'not and'

Nichts wird indiziert, weil kein Begriff gleich oder länger als 20 Zeichen ist.

Dies veranschaulicht, wie unterschiedlich sich MAXIMUM TERM LENGTH auf GENERIC- und NGRAM-Textindizes auswirkt. Bei NGRAM-Textindizes legt MAXIMUM TERM LENGTH die Länge der N-Gramme fest, die in die Textindizes eingefügt werden.

Die Suche gibt eine leere Ergebnismenge zurück, weil kein N-Gramm mit 20 Zeichen aus der Abfragezeichenfolge geformt werden kann.

Beispielzeichenfolgen-Interpretationen

Die folgende Tabelle enthält Beispiele dafür, wie die Einstellungen der Textkonfigurationsobjekt-Zeichenfolgen interpretiert werden.

Die Zahlen in Klammern in der Spalte "Interpretierte Zeichenfolge" geben die Positionsinformationen wieder, die für jeden Begriff gespeichert sind. Die Zahlen dienen zur Illustration in der Dokumentation. Die tatsächlich gespeicherten Begriffe enthalten keine Zahlen in Klammern.

Konfigurationseinstellungen Zeichenfolge Interpretierte Zeichenfolge

TERM BREAKER GENERIC

MINIMUM TERM LENGTH 3

MAXIMUM TERM LENGTH 20

'w*'

'"w*(1)"'

'we*'

'"we*(1)"'

'wea*'

'"wea*(1)"'

'we* -the'

'"we*(1)" -"the(1)"'

'we* the'

"we*(1)" & "the(1)"'

'for* | wonderl*'

'"for*(1)" | "wonderl*(1)"'

'wonderlandwonderlandwonderland*'

''

'"tr* weather"'

'"weather(1)"'

'"tr* the weather"'

'"the(1) weather(2)"'

'"wonderlandwonderlandwonderland* wonderland"'

'"wonderland(1)"'

'"wonderlandwonderlandwonderland* weather"'

'"weather(1)"'

'"the_wonderlandwonderlandwonderland* weather"'

'"the(1) weather(3)"'

'the_wonderlandwonderlandwonderland* weather'

'"the(1)" & "weather(1)"'

'"light_a* the end" & tunnel'

'"light(1) the(3) end(4)" & "tunnel(1)"'

light_b* the end" & tunnel'

'"light(1) the(3) end(4)" & "tunnel(1)"'

'"light_at_b* end"'

'"light(1) end(4)"'

'and-te*'

'"and(1) te*(2)"'

'a_long_and_t* & journey'

'"long(2) and(3) t*(4)" & "journey(1)"'

TERM BREAKER NGRAM

MAXIMUM TERM LENGTH 3

'w*'

'"w*(1)"'

'we*'

'"we*(1)"'

'wea*

'"wea(1)"'

'we* -the'

'"we*(1)" -"the(1)"'

'we* the'

'"we*(1)" & "the(1)"'

'for | la*'

'"for(1)" | "la*(1)"'

'weath*'

'"wea(1) eat(2) ath(3)"'

'"ful weat*"'

'"ful(1) wea(2) eat(3)"'

'"wo* la*"'

'"wo*(1)" & "la*(2)"'

'"la* won* "'

'"la*(1)" & "won(2)"'

'"won* weat*"'

'"won(1)" & "wea(2) eat(3)"'

'"won* weat"'

'"won(1)" & "wea(2) eat(3)"'

'"wo* weat*"'

'"wo*(1)" & "wea(2) eat(3)"'

'"weat* wo* "'

'"wea(1) eat(2)" & "wo*(3)"'

'"wo* weat"'

'"wo*(1)" & "wea(2) eat(3)"'

'"weat wo* "'

'"wea(1) eat(2) wo*(3)"'

'w* NEAR[1] f*'

'"w*(1)" & "f*(1)"'

'weat* NEAR[1] f*'

"wea(1) eat(2)" & "f*(1)"'

'f* NEAR[1] weat*'

'"f*(1)" & "wea(1) eat(2)"'

'weat NEAR[1] f*'

'"wea(1) eat(2)" & "f*(1)"'

'f* NEAR[1] weat'

'"f*(1)" & "wea(1) eat(2)"'

'for NEAR[1] weat*'

'"for(1)" & "wea(1) eat(2)"'

'weat* NEAR[1] for'

'"wea(1) eat(2)" & "for(1)"'

'and_tedi*'

'"and(1) ted(2) edi(3)"'

'and-t*'

'"and(1) t*(2)"'

'"and_tedi*"'

'"and(1) ted(2) edi(3)"'

'"and-t*"'

'"and(1) t*(2)"'

'"ligh* at_the_end of_the tun* nel"'

'"lig(1) igh(2)" & ("the(4) end(5) the(7) tun(8)" & "nel(9)")'

'"ligh* at_the_end_of_the_tun* nel"'

'"lig(1) igh(2)" & ("the(4) end(5) the(7) tun(8)" & "nel(9)")'

'"at_the_end of_the tun* ligh* nel"'

'"the(2) end(3) the(5) tun(6)" & ("lig(7) igh(8)" & "nel(9)")'

'l* NEAR[1] and_t*'

"l*(1)" & "and(1) t*(2)"'

'long NEAR[1] and_t*'

'"lon(1) ong(2)" & "and(1) t*(2)"'

'end NEAR[3] tunne*'

'"end(1)" & "tun(1) unn(2) nne(3)"'

TERM BREAKER NGRAM

MAXIMUM TERM LENGTH 3

SKIPPED TOKENS IN TABLE AND IN QUERIES

'"cat in a hat"'

'"cat(1) hat(4)"'

'"cat in_a hat"'

'"cat(1) hat(4)"'

'"cat_in_a_hat"'

'"cat(1) hat(4)"'

'"cat_in a_hat"'

'"cat(1) hat(4)"'

'cat in a hat'

'"cat(1)" & "hat(1)"'

'cat in_a hat'

'"cat(1)" & "hat(1)"'

'"ice hat"'

'"ice(1) hat(2)"'

'ice NEAR[1] hat'

'"ice(1)" NEAR[1] "hat(1)"'

'ear NEAR[2] hat'

'"ear(1)" NEAR[2] "hat(1)"'

'"ear a hat"'

'"ear(1) hat(3)"'

'"cat hat"'

'"cat(1) hat(2)"'

'cat NEAR[1] hat'

'"cat(1)" NEAR[1] "hat(1)"'

'ear NEAR[1] hat'

'"ear(1)" NEAR[1] "hat(1)"'

'"ear hat"'

'"ear(1) hat(2)"'

'"wear a a hat"'

'"wea(1) ear(2) hat(5)"'

Siehe auch