ISO/IEC 8859 【ISO 8859】 ISO 8859-1
概要
ISO/IEC 8859(ISO 8859)とは、8ビットの文字コードの標準規格の一つで、7ビットのASCIIに1ビットを追加して後半部分に文字を割り当てたもの。ヨーロッパの言語など256文字以内ですべて表せる言語の文字を収録している。ASCIIに収録されていないラテンアルファベットの飾り文字や合字、ダイアクリティカルマーク、引用符や疑問符などの記号、キリル文字、ギリシャ文字、アラビア文字、ヘブライ文字、タイ文字、ケルト文字などを扱う。
8ビット256文字のうち、前半128文字はASCII文字コード(ISO 646)と同一で、アルファベットや数字、基本的な記号などが収録されている。後半128文字はパート1からパート16までの15種類(パート12は破棄)から選択して使用するようになっている。
各パートにはそれぞれ異なる文字種の集合が収録されており、国や言語に応じて切り替えて使用する。各パートはまったく異なる文字で構成されるわけではなく、複数の言語で共通して使われる文字はなるべく同じコードに重複して現れるようになっている。
各部の違い
最も有名で広く普及しているのは「Latin-1」(ラテン1)と呼ばれる「パート1」(ISO/IEC 8859-1)で、フランス語、ドイツ語、スペイン語、イタリア語など西ヨーロッパのほとんどの言語をカバーしている。欧米圏で最も広く使われており、Unicode(UCS)の最初の256文字もこれと同一になっている。
他に、ポーランド語やチェコ語など中欧言語の文字を収録した「ISO/IEC 8859-2」(Latin-2)、ロシア・東欧のキリル文字を収録した「ISO/IEC 8859-5」(Latin/Cyrillic)、アラビア文字を収録した「ISO/IEC 8859-6」(Latin/Arabic)、ギリシャ文字を収録した「ISO/IEC 8859-7」(Latin/Greek)、ヘブライ文字を収録した「ISO/IEC 8859-8」(Latin/Hebrew)、トルコ語の文字を収録した「ISO/IEC 8859-9」(Latin/Turkish)、タイ文字を収録した「ISO/IEC 8859-11」(Latin/Thai)などがある。
一部の記号は多くの部で共通している。例えば、160番(16進A0)はすべての部でノーブレークスペース(NBSP)、173番(AD)は11部を除きソフトハイフンとなっている。他にも、164番(A4)に国際通貨記号(¤)、167番(A7)にセクション記号(§)、176番(B0)に度記号(°)などは多くの部で共通している。
歴史
第1部と第2部を含む最初の規格はISOによって1987年に「ISO 8859」として制定され、後にISOとIECの合同組織JTC1に移管、「ISO/IEC 8859」と呼ばれるようになった。1989年までに第9部まで揃い、1992年に第10部が、1998年から2001年にかけて第11~16部が制定された。第1部は第15部(Laten-9)で改訂されており、ユーロ記号などが追加されている。