読み方：もじコード

文字コード【character code】キャラクターコード

概要

文字コードとは、文字や記号をコンピュータ上でデータとして扱うために、一文字ずつ固有の識別番号を与えて区別できるようにした符号のこと。

コンピュータはすべての情報を「0」と「1」のを組み合わせたデジタルデータとして取り扱う。数値は2進数を用いることで容易に表現できるが、文字は字形そのものを画像や図形としてデータ化したものはデータ量が多く、これをそのまま繰り返し並べて文字データとすることは無駄が大きい。

このため、各文字に短い識別番号（正確には2進数の0と1の並びであるビット列）を与え、数字の列として文字データを表現している。この数字と文字の対応関係を定めた規約が文字コードである。

最も普及しているASCII文字コードは英数字や制御文字、記号などを収録した7ビット（7桁のビット列、十進数では0～127）のコード体系であり、例えばアルファベットの大文字の「A」は65番（ビット列で1000001）、小文字の「z」は122番（同1111010）などと定められている。あるデータ列がASCII文字列であることが分かっていれば、番号との対応関係を元に文字の並びを知ることができる。

文字集合と符号化方式

文字コードを定義するには、どの言語を対象にどの文字を収録するかを決めなければならず、まず収録する文字（の字形）を特定して列挙した文字集合（文字セット）を定める。その際、番号などは与えずにただ収録する文字群を定義したものをレパートリ、各文字に一意の番号を与えたものを符号化文字集合（CCS：Coded Character Set）という。

欧米圏の8ビット文字コード規格のように、符号化文字集合をそのまま文字コードとして利用することも多いが、漢字圏など収録文字数の多い言語では各文字に割り当てられた符号をどのようなビット列で表現するかについて、いくつかの異なる方式を定めている場合があり、これを文字符号化方式（CES：Character Encoding Scheme/文字エンコーディング）という。

例えば、代表的な日本語の符号化文字集合の一つであるJIS X 0208規格に定められた符号をそのまま文字コードとしたものを区点コードというが、この文字集合を対象とする符号化方式としてJISコードやShift JISコード、日本語EUC（EUC-JP）などが定められており、同じ文字でも符号化方式によってそれぞれ異なったビット列で表現される。世界中の文字を収録したUnicodeでも、同じ文字集合に対してUTF-8、UTF-16、UTF-32など複数の異なる符号化方式が定義されている。

(2018.6.20更新)

文字コードの用語一覧

他の用語辞典による「文字コード」の解説（外部サイト）

資格試験などの「文字コード」の出題履歴

▼ ITパスポート試験

【平30春問75】 A～Zの26種類の文字を表現する文字コードに最小限必要なビット数は幾つか。

【平25秋問76】 2バイトで1文字を表すとき、何種類の文字まで表せるか。

【平25春問78】世界の主要な言語で使われている文字を一つの文字コード体系で取り扱うための規格はどれか。

【平22秋問83】片面1層記録のDVD-Rは約4.7Gバイトの記憶容量をもつ。1ページ当たり日本語700文字が印刷されている本の場合、約何万ページ分をこのDVD-Rに保存できるか。

文字コード【character code】キャラクターコード

概要

文字集合と符号化方式

文字コードの用語一覧

文字セット

半角文字

全角文字

ASCII

制御文字

Unicode

日本語文字コード

他の用語辞典による「文字コード」の解説（外部サイト）

資格試験などの「文字コード」の出題履歴

文字コード【character code】キャラクターコード

概要

文字集合と符号化方式

文字コードの用語一覧

文字セット

半角文字

全角文字

ASCII

制御文字

Unicode

日本語文字コード

他の用語辞典による「文字コード」の解説 （外部サイト）

資格試験などの「文字コード」の出題履歴

他の用語辞典による「文字コード」の解説（外部サイト）