テキストファイル 【text file】 TXTファイル / TXT file / .txtファイル
概要
テキストファイル(text file)とは、ある文字コードで文字として規定できる範囲のデータのみを含むファイルのこと。内容全体を文字として表示、編集でき、人間が容易に読み書きできる。コンピュータではすべてのデータを2進数のビット列(0と1の連なり)として表現するが、このうち、ASCIIなど何らかの文字コード規約に基いて自然言語の文字や少数の制御文字(改行や空白、タブ文字など)を表すビット列のみを含むものをテキストファイルという。
これに対し、コンピュータプログラムや画像、動画、音声などを表現するため、文字コード体系とは無関係に任意のビット列が含まれる形式のデータが記録されたファイルのことを「バイナリファイル」(binary file)という。
広義には、HTMLファイルやプログラムのソースコードのように文字表現でコンピュータへの指示などを表記したものを含むが、狭義には、特定の人工言語などによる記述を含まず単純に人間にとって意味のある文章などだけを記したものを指す。ファイル名の拡張子が「.txt」となっているものは後者を指すことが多く、前者と区別するために「プレーンテキスト」(plain text)形式と呼ぶこともある。
文字コードと文字化け
テキストファイルは特定の文字コードに基づいて記述されているが、文字コードには様々な種類があるため、どの文字コードで書かれたものかが分かり、そのコードに対応したソフトウェアで開かなければ正しく表示や編集を行うことはできない。間違ったコード指定で開いてしまうと意味のない文字の並びとなってしまう。これを文字化けという。
テキストファイルそのものには文字コードを指定する仕組みがないため、利用者側で把握・管理を行う必要がある。特定のコードにしか使われないビットパターンや多用されるパターンなどの特徴があるため、近年のソフトウェアの中にはある程度の精度で自動判別できるようになっているものもある。
(2018.4.12更新)