テキスト形式 【text format】 テキストデータ / text data
概要
テキスト形式(text format)とは、コンピュータ向けのコードなどを含まず、人間が読むことのできる文字のみで構成されたデータのこと。ある文字コードで文字として規定される範囲のデータのみを含む。コンピュータでは内部的にすべてのデータを2進数の数値の並び(ビット列)として表現しているが、人間の使っている文字を扱えるようにするため、特定の番号と文字を対応付ける「文字コード」(character code)が規定されている。例えば、最もよく使われているASCII文字コードでは、「65」という数値(2進数では「1000001」)が「A」というアルファベットに対応付けられている。
テキスト形式は、この文字コードで規定された自然言語の文字と、表示制御のための少数の制御コード(空白や改行など)のみを含み、人間が容易に読み書きできる形式のデータを指す。これに対し、コンピュータプログラムによって読み書きや処理を行うことを前提に、文字コードの規約を用いずに任意のビット列によって構成されるデータのことをバイナリ(binary)形式、バイナリデータなどという。
広義のテキスト形式は文字のみで構成されたデータ全般を意味するが、これには文字によってコンピュータへの指示などを記述したHTML形式やコンピュータプログラムのソースコードなどが含まれる。狭義のテキスト形式はこのようなコンピュータ向けの記述を含まず、純粋に人間が読み書きするための文字情報だけで構成されたものを指し、そのことを明示するため「プレーンテキスト」(plain text)と呼んで区別される場合がある。
(2018.3.16更新)