EUC-JP 【Extended UNIX Code】 日本語EUC / 拡張UNIXコード
概要
EUC-JP(Extended UNIX Code)とは、主にUNIX系OSで標準的に用いられる、日本語文字に対応した文字コード規格(正確には符号化方式)の一つ。ISO/IEC 2022に定められた方式に基づき、何らか文字集合規格で定められた各文字の識別番号を符号化する方式を定めている。個々の文字に識別番号を割り当てる文字集合の規格ではなく、別に定められた規格(日本語EUCの場合はASCIIやJIS X 0208など)を利用する。
日本語EUCは1980年代前半に日本語UNIXシステム諮問委員会が策定した方式で、当時UNIXの権利を保有していたAT&Tによって承認され、UNIX系OSで標準的に利用されてきた。初期のインターネットにUNIX系システムが多く参加していたこともあり、Webブラウザなどインターネットで情報を送受信するためのソフトウェアの多くがEUCに対応している。
日本語EUCには文字集合として「JIS X 0208:1990」を用いるものと、「JIS X 0213:2004」を用いるものがあり、単に「日本語EUC」という場合は前者を指すことが多く、実際に利用されているのも前者が多い。
後者の新しい仕様は前者と区別して「EUC-JIS-2004」のように呼ばれることが多い。前者はJIS X 0208以外に、「JIS X 0201」で定められたいわゆる半角カタカナや、「JIS X 0212」に定められたJIS補助漢字を含むことができる。これらはオプションとされるため、実装されていないシステムもある。
EUC(Extended UNIX Code)規格自体は日本語だけでなく、文字の種類が数百から数万あり1文字1バイトでは表現できない多バイト文字(マルチバイト文字)で用いられる。EUC-JP以外にも韓国語(ハングル文字)の「EUC-KR」や、簡体字中国語の「EUC-CN」、繁体字中国語の「EUC-TW」などがある。
(2021.3.9更新)