Click here to view and discuss this page in DocCommentXchange. In the future, you will be sent there automatically.

SQL Anywhere 11.0.1 (日本語) » SQL Anywhere サーバ - データベース管理 » データベースの設定 » 国際言語と文字セット » 文字セットの知識

 

マルチバイト文字セット

言語によっては (日本語や中国語など)、256 文字よりもはるかに多い文字があります。この場合はシングルバイトを使用しては表示できないので、マルチバイトのエンコードを使用する必要があります。さらに、多くの言語の文字を単一の文字セットで表現するために、マルチバイトの文字セットよりも多くの文字を使う文字セットも存在します。この例として、UTF-8 が挙げられます。

マルチバイト文字セットは「可変幅」で、いくつかの文字はシングルバイト、他はダブルバイトなどになります。

マルチバイト文字セットと照合の詳細については、SQL Anywhere 照合アルゴリズム (SACA)を参照してください。

たとえば、コード・ページ 932 (日本語) の文字の長さは 1 バイトまたは 2 バイトです。最初のバイト (「リード・バイト」とも呼ばれる) の値が 16 進数値 \x81 ~ \x9F または \xE0 ~ \xEF (10 進数値 129 ~ 159 または 224 ~ 252) の範囲にある場合、その文字は 2 バイト文字であり、直後のバイト (「フォロー・バイト」とも呼ばれる) と併せて文字が成立します。フォロー・バイトとは、最初のバイト以外のすべてのバイトのことです。

最初のバイトがリード・バイトの範囲外にある場合、その文字はシングルバイト文字であり、次のバイトは次の文字の最初のバイトになります。