プログラムテクニックメモ(2001/08/09) 
 

コンピュータで扱う漢字とは

なにげなしに使用しているコンピュータですが、このコンピュータで漢字を扱うという事は非常に難しいのです。何故ならば、そもそもコンピュータが作られたのは欧米圏で、欧米圏では、当たり前ですがアルファベット(A〜Z)を組み合わせた文字で読み書き話されているため、その使用する文字だけを考慮すればよかったのです。

アルファベットとその他の記号を全て足しても、255種類以上にならないため欧米圏では、1バイト(=8ビット)で、全ての文字を表記することができるのです。しかし、日本語や中国語、韓国語など表意文字を使用する言語圏では、1バイト(=8ビット)で表せる文字数(ASCIIコードっとも言います)では到底足りないので、2バイト(=16ビット)を使用して漢字を表示するのですが、漢字コード黎明期(?)と言うかコンピュータ会社では、EUC(IBM)が付けた漢字コード体系なんか使用するかいとか、色々ありまして漢字コード形態として、EUC、JIS、Shift-JIS、Unicodeとできちゃったのです。

それぞれの漢字コード体系について

ちっと勉強中で〜〜〜す。

リンク

JORA WORLD

      日本語処理について詳しく説明されています。ASCIIコード表とか、とっさの時に

      見たいときに便利です。他にJAVA関連も記述も満載で勉強になります。

Yasushi SHINJO, Ph.D

      日本語コードについての記述です。

渡辺尚貴のホームページ

      漢字コードの説明と、サンプルが多数!お進めです。

倶楽部PHP

      漢字コードの説明をされているますが、PHP & MySQL も必読!。

QKC Home Page

      超高速漢字コード変換プログラム。とってもシンプルで使いやすいです♪。

←topへ