2バイト文字 【ダブルバイト文字】 DBCS / Double-Byte Character Set

概要

2バイト文字(ダブルバイト文字)とは、コンピュータで文字を扱えるよう各文字に番号を対応付ける文字コード文字セットのうち、一文字を2バイトのデータ量で表すもの。また、そのようなコード体系によって表される文字。

東アジア諸語のように文字の数が多く、1バイト(0~255)では表しきれない国や地域では、早くから2バイトの文字セット文字コードの規格が整備されてきた。例えば、日本の「JIS X 0208」(JIS基本漢字)は、英数字、記号、ギリシャ文字、キリル文字、ひらがな、カタカナ、漢字などが収録され、各文字を2バイト(0~65,535)の番号で識別する2バイトの文字セット文字集合)規格である。

また、これを符号化する方式を定めた「JISコード」「Shift JISコード」「EUC-JP」などの文字コード(文字エンコーディング)規格は、文字セットに収録された各文字の識別番号を2バイトのビット符号化する変換方法を定めた2バイト文字コードと言える。

一方、ASCIIコード(7ビット)や、これを拡張してカタカナ(半角カナ)を収録したJIS X 0201、欧州諸語のアルファベットなどを収録したISO/IEC 8859のような8ビットコードは「1バイト文字」「シングルバイト文字」(SBCS:Single Byte Character Set)という。

また、2バイト文字を含む、一文字を複数バイトの組み合わせで表す方式を「マルチバイト文字」「多バイト文字」(MBCSMultibyte Character Set)という。マルチバイト文字の多くは2バイトだが、UTF-8のように最長で6バイトになる符号化方式などもある。

(2018.6.7更新)

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる