文字コード

文字コードは、符号化文字集合と符号化方式から構成される。

符号化文字集合

符号(code)文字集合を定めた規則。 以下のように、unicode,JIS等々

unicode

対象:世界中の文字、記号、等々

JIS

対象:平仮名、カタカナ、漢字、ラテン基本文字、記号、とうとう

KS

対象:ハングル、ラテン等々

符号化方式

符号化文字集合で文字に対応付けた整数値を、実際にコンピュータが利用できるデータ列(通常、バイト列)に変換し符号化(エンコーディング:Encoding)する方式。

例えば、Unicodeであれば、UTF-8,16,32などの符号化方式がある。

符号化文字集合  符号化方式

Unicode       1 UTF-8           2 UTF-16 3 UTF-32