Click here to view and discuss this page in DocCommentXchange. In the future, you will be sent there automatically.

SQL Anywhere 11.0.1 (中文) » SQL Anywhere 服务器 - 数据库管理 » 配置数据库 » 国际语言和字符集 » 了解字符集

 

多字节字符集

某些语言(如日语和中文)的字符数远远超过 256 个。这些字符无法使用单字节来表示,因此必须使用多字节编码对其进行编码。另外,某些字符集为了包含更大数量的字符,以便在一个更全面的字符集中表示来自多种语言的字符,也使用了多字节形式。其中的一个例子就是 UTF-8。

多字节字符集可以具有可变宽度,由此,某些字符是单字节字符,其它则是双字节等字符。

有关多字节字符集和归类的详细信息,请参见SQL Anywhere 归类算法 (SACA)

示例

举例来说,代码页 932(日语)中字符的长度或者是一个字节或者是两个字节。如果首字节的值(又称为前导字节)在 \x81 到 \x9F 或 \xE0 到 \xFC(十进制值 129 到 159 或 224 到 252)的十六进制值范围内,则该字符是一个双字节字符,而随后的那个字节(又称为后随字节)与首字节共同构成了该字符。后随字节是除首字节之外的一个或多个字节。

如果首字节在前导字节范围之外,则该字符是一个单字节字符,而下一个字节是下一个字符的首字节。