ISO/IEC 8859 【ISO 8859】 ISO 8859-1

概要

ISO/IEC 8859(ISO 8859)とは、8ビット文字コードの標準規格の一つで、7ビットASCII1ビットを追加して後半部分に文字を割り当てたもの。ヨーロッパの言語など256文字以内ですべて表せる言語の文字を収録している。

ASCIIに収録されていないラテンアルファベットの飾り文字や合字ダイアクリティカルマーク引用符疑問符などの記号、キリル文字、ギリシャ文字、アラビア文字、ヘブライ文字、タイ文字、ケルト文字などを扱う。

8ビット256文字のうち、前半128文字はASCII文字コードISO 646)と同一で、アルファベットや数字、基本的な記号などが収録されている。後半128文字はパート1からパート16までの15種類(パート12は破棄)から選択して使用するようになっている。

各パートにはそれぞれ異なる文字種の集合が収録されており、国や言語に応じて切り替えて使用する。各パートはまったく異なる文字で構成されるわけではなく、複数の言語で共通して使われる文字はなるべく同じコードに重複して現れるようになっている。

各部の違い

最も有名で広く普及しているのは「Latin-1」(ラテン1)と呼ばれる「パート1」(ISO/IEC 8859-1)で、フランス語、ドイツ語、スペイン語、イタリア語など西ヨーロッパのほとんどの言語をカバーしている。欧米圏で最も広く使われており、UnicodeUCS)の最初の256文字もこれと同一になっている。

他に、ポーランド語やチェコ語など中欧言語の文字を収録した「ISO/IEC 8859-2」(Latin-2)、ロシア・東欧のキリル文字を収録した「ISO/IEC 8859-5」(Latin/Cyrillic)、アラビア文字を収録した「ISO/IEC 8859-6」(Latin/Arabic)、ギリシャ文字を収録した「ISO/IEC 8859-7」(Latin/Greek)、ヘブライ文字を収録した「ISO/IEC 8859-8」(Latin/Hebrew)、トルコ語の文字を収録した「ISO/IEC 8859-9」(Latin/Turkish)、タイ文字を収録した「ISO/IEC 8859-11」(Latin/Thai)などがある。

一部の記号は多くの部で共通している。例えば、160番(16進A0)はすべての部でノーブレークスペースNBSP)、173番(AD)は11部を除きソフトハイフンとなっている。他にも、164番(A4)に国際通貨記号(¤)、167番(A7)にセクション記号(§)、176番(B0)に度記号°)などは多くの部で共通している。

歴史

第1部と第2部を含む最初の規格はISOによって1987年に「ISO 8859」として制定され、後にISOIECの合同組織JTC1に移管、「ISO/IEC 8859」と呼ばれるようになった。1989年までに第9部まで揃い、1992年に第10部が、1998年から2001年にかけて第11~16部が制定された。第1部は第15部(Laten-9)で改訂されており、ユーロ記号などが追加されている。

(2024.3.30更新)

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる