テキスト形式 【text format】 テキストデータ / text data

概要

テキスト形式(text format)とは、コンピュータ向けのコードなどを含まず、人間が読むことのできる文字のみで構成されたデータのこと。ある文字コードで文字として規定される範囲のデータのみを含む。

コンピュータでは内部的にすべてのデータを2進数の数値の並び(ビット列)として表現しているが、人間の使っている文字を扱えるようにするため、特定の番号と文字を対応付ける「文字コード」(character code)が規定されている。例えば、最もよく使われているASCII文字コードでは、「65」という数値(2進数では「1000001」)が「A」というアルファベットに対応付けられている。

テキスト形式は、この文字コードで規定された自然言語の文字と、表示制御のための少数の制御コード(空白や改行など)のみを含み、人間が容易に読み書きできる形式のデータを指す。これに対し、コンピュータプログラムによって読み書きや処理を行うことを前提に、文字コードの規約を用いずに任意のビット列によって構成されるデータのことをバイナリbinary)形式、バイナリデータなどという。

広義のテキスト形式は文字のみで構成されたデータ全般を意味するが、これには文字によってコンピュータへの指示などを記述したHTML形式コンピュータプログラムソースコードなどが含まれる。狭義のテキスト形式はこのようなコンピュータ向けの記述を含まず、純粋に人間が読み書きするための文字情報だけで構成されたものを指し、そのことを明示するため「プレーンテキスト」(plain text)と呼んで区別される場合がある。

(2018.3.16更新)

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。