文字コード

★ この記事では、文字コードについて分かりやすく説明することを
  目標としています。随時更新します。

◎ 文字コード

☆文字コードとは、文字をどのように2進数の数値コード(ビットの組み合わせ)に対応させるかという符号化方式のことです。
プログラムを書いてビルド・実行をする時、
例えば、読み込んだテキストファイルの文字コードがシステムロケールと一致しなければ文字化けします。
これはよくあることですが冷静に考えれば当たり前ですね。
海外で(一般的には)日本語が通じないのと同じです。海外では、その土地の言葉に変換して、会話をする必要があるのです。

◎ Unicode

☆Unicodeとは、世界で使われる全ての文字を共通の文字集合にて利用できるようにしようという考えで作られた文字コードのことです。
マイクロソフト、Apple、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムによって作られました。
Unix、Windows、macOSなどに使用されています。
現代の文字だけでなく古代の文字や歴史的な文字、数学記号、絵文字なども含みます。

◎ ASCII

☆ASCIIは、7桁の2進数で表すことのできる整数の数値のそれぞれに、大小のラテン文字や数字、英文でよく使われる約物などを割り当てた文字コードで、世界中で使用されています。
特に、アルファベットと記号ではASCIIコード表が使用されます。
ちなみに、C言語のプログラムでは,文字データもASCIIコードによって変換された整数データとして扱われる。

◎ JIS

☆JISとは、日本語を表現する文字コードのことです。7ビットで文字を表現します。

◎ Shift-JIS

☆Shift-JISは、日本語を表現する文字コードで、JISコードの改良版です。すべての文字を16ビットで表現します。文字の先頭の8ビットで半角文字か全角文字かを区別することができます。

◎ EUC

◎ EBCDIC

>画像という分野

画像という分野

画像に関連することを網羅していきます。

ぜひお時間がある方はのぞいてみてください。

CTR IMG