プレーンテキスト 【plain text】
概要
プレーンテキスト(plain text)とは、テキスト形式(テキストデータ)のうち、コンピュータに対する指示や付加情報などを含まず、見出しや文章など人間に意味のある文字のみで構成されるもの。拡張子が「.txt」の狭義のテキストファイルはこの形式であることが期待される。文字のみで構成された(広義の)テキスト形式には、文字による特殊な記法によりコンピュータ向けの何らかのコードを含んでいるものが多くあり、例えばHTML形式では「<b>太文字</b>」という記述により、<b>と</b>で挟まれた部分を太文字で表示するようソフトウェアに指示している。
一方、プレーンテキストはソフトウェアが解釈して処理すべき記述を含まず、人間にとって意味のある文字群と、空白や改行、タブ文字など最低限の表示制御を行う制御文字のみを含む。文字以外の付加的な情報を持たないため、文字のサイズやフォント、配置、装飾などの指定、あるいは図表や画像など文字以外の表現を含めることはできない。人間が直に読み書きする以外の用途は想定されず、自動処理には適さない。
狭義には、いわゆる半角英数字・記号として知られるASCII文字コード(さらに厳密には8ビット目を使わない7ビットASCII)のみで記述されたものに限られるが、現代では日本語文字コードやUnicodeなどで記述されたものも含める考え方が主流である。
一般的なコンピュータの利用法では、人間が読み書きする文書はWebページやオフィスソフトの文書ファイル、PDFファイルなどの形で作成・編集することが多いため、プレーンテキストで情報をやり取りする機会はあまり多くない。ソフトウェアの配布パッケージに含まれる付属文書(ドキュメント)などに多く見られる形式である。
CSVファイルやTSVファイル、Markdownファイル(.mdファイル)のように、プレーンテキストとしての体裁(コンピュータ専用の制御情報を記さない)を維持しつつ、ソフトウェアによる整形や自動処理に適した記述形式も存在する。
(2023.2.28更新)