Diese Registerkarte enthält folgende Komponenten:
Begriffsegmentierer Wählen Sie einen der folgenden Algorithmen, um Spaltenwerte in Begriffe zu trennen:
Generisch Der generische Algorithmus behandelt jede Zeichenfolge aus alphanumerischen Zeichen, die durch nicht-alphanumerische Zeichen getrennt sind, als einen Begriff.
N-Gramm Der N-Gramm-Algorithmus teilt Zeichenfolgen in N-Gramme auf. Ein N-Gramm ist eine n-Teilzeichenfolge einer größeren Zeichenfolge. N-Gramme sind bei angenäherten Übereinstimmungen oder bei Dokumenten sinnvoll, die keine Leerstellen zum Trennen von Begriffen verwenden.
Weitere Hinweise zu diesen Algorithmen und zu ihrer Auswahl finden Sie unter Angaben beim Erstellen oder Ändern von Textkonfigurationsobjekten.
Begriff-Mindestlänge Gibt die in einem Textindex erlaubte Mindestlänge von Begriffen in Zeichen ein. Begriffe, die kürzer als diese Einstellung sind, werden beim Aufbau oder bei der Aktualisierung des Textindexes ignoriert. Siehe MINIMUM TERM LENGTH-Klausel, ALTER TEXT CONFIGURATION-Anweisung.
Begriff-Höchstlänge Gibt die in einem Textindex erlaubte Höchstlänge von Begriffen in Zeichen ein. Begriffe, die länger als diese Einstellung sind, werden beim Aufbau oder bei der Aktualisierung des Textindexes ignoriert. Siehe MAXIMUM TERM LENGTH-Klausel, ALTER TEXT CONFIGURATION-Anweisung.
Externen Begriffsegmentierer verwenden Wählen Sie diese Option, um eine externe Bibliotheksfunktion festzulegen, die den Text in Begriffe segmentiert. Diese Option erscheint, wenn der Begriffsegmentierer auf Generisch eingestellt ist. Siehe TERM BREAKER-Klausel, ALTER TEXT CONFIGURATION-Anweisung.
Funktion und Bibliothek Mit dieser Option werden die externe Begriffsegmentiererfunktion und die Bibliothek festgelegt.
Die Funktion und die Bibliothek müssen in folgender Form angegeben werden: Funktionsname@Bibliotheksdateiname
. Wenn Sie andere Funktions- und die Bibliotheksnamen auf Windows- und Unix-Plattformen verwenden wollen, können Sie sie in
folgender Form angeben: function-name@Bibliotheksdateiname.dll;UNIX:Funktionsname@Bibliotheksdateiname.so
.
Beispiel: TermBreakFunct1@myTBlib.dll;Unix:TermBreakFunct2@myTBlib
ruft unter Windows die Funktion TermBreakFunct1 und unter Unix die Funktion TermBreakFunct2 auf.
Externen Vorfilter verwenden Wählen Sie diese Option, um eine externe Bibliotheksfunktion für die Durchführung der Dokumentfilterung festzulegen, die vor der Verarbeitung durch den Begriffsegmentierer durchgeführt werden soll. Ein externer Vorfilter ist nützlich, wenn der zu indizierende Text Formatinformationen und/oder Grafiken enthält. Mit einem Vorfilter können Sie das Dokument in normalen Text konvertieren, indem Sie Formatinformation und Grafiken entfernen. Siehe PREFILTER EXTERNAL NAME-Klausel, ALTER TEXT CONFIGURATION-Anweisung.
Funktion und Bibliothek Mit dieser Option wird die externe Vorfilterfunktion und die Bibliothek festgelegt.
Die Funktion und die Bibliothek müssen in folgender Form angegeben werden: Funktionsname@Bibliotheksdateiname
. Wenn Sie andere Funktions- und die Bibliotheksnamen auf Windows- und Unix-Plattformen verwenden wollen, können Sie sie in
folgender Form angeben: function-name@Bibliotheksdateiname.dll;UNIX:Funktionsname@Bibliotheksdateiname.so
.
Beispiel: PrefilterFunct1@myTBlib.dll;Unix:PrefilterFunct2@myPreFilterlib
ruft unter Windows die Funktion PrefilterFunct1 und unter Unix die Funktion PrefilterFunct2 auf.
![]() |
Kommentieren Sie diese Seite in DocCommentXchange.
|
Copyright © 2012, iAnywhere Solutions, Inc. - SQL Anywhere 12.0.1 |