Einige Sprachen, wie beispielsweise Japanisch und Chinesisch, haben wesentlich mehr als 256 Zeichen. Diese Zeichen können nicht mit einem einzelnen Byte angezeigt werden und müssen daher mit einer Mehrbyte-Kodierung kodiert werden. Außerdem benutzen einige Zeichensätze die viel größere Anzahl von Zeichen in der Mehrbyte-Darstellung, um Zeichen aus vielen Sprachen in einem einzigen, umfassenderen Zeichensatz darzustellen. Ein Beispiel dafür ist UTF-8.
Mehrbyte-Zeichensätze haben möglicherweise eine variable Breite, wobei manche Zeichen Einbytezeichen, andere Zweibyte-Zeichen usw., sind.
Weitere Hinweise zu Mehrbyte-Zeichensätzen und Kollatierungen finden Sie unter SQL Anywhere-Kollatierungsalgorithmus (SACA).
Zeichen in Codepage 932 (Japanisch) z.B. sind entweder ein Byte oder zwei Byte lang. Wenn der Wert des ersten Byte, auch Führungsbyte genannt, im Bereich der hexadezimalen Werte von \x81 bis \x9F oder von \xE0 bis \xFC (Dezimalwerte 129-159 oder 224-252) liegt, ist das Zeichen ein Zweibyte-Zeichen, und das nachfolgende Byte, auch Folgebyte genannt, vervollständigt das Zeichen. Außer dem ersten Byte sind alle Bytes Folgebytes.
Wenn das erste Byte außerhalb des Führungsbyte-Bereichs liegt, ist das Zeichen ein Einbytezeichen und das nächste Byte das erste Byte des folgenden Zeichens.
Kommentieren Sie diese Seite in DocCommentXchange. Senden Sie uns Feedback über diese Seite via E-Mail. |
Copyright © 2009, iAnywhere Solutions, Inc. - SQL Anywhere 11.0.1 |