ファイル形式 【file format】 ファイルフォーマット

概要

ファイル形式(file format)とは、ある特定の種類のデータを、コンピュータ外部記憶装置(ストレージ)のファイルにどのような形式や順序で記録するかを定義したもの。

ひとまとまりのデータコンピュータ記憶装置に保存する形式を定めたもので、機種やソフトウェアが異なっても、同じファイル形式に対応していればその形式のデータを同じように読み書き、編集などすることができる。

ファイル形式の種類

コンピュータプログラム、文書、画像、動画、音声など様々な種類のデータについてファイル形式が定義されているが、同じ種類のデータについて多種多様な異なる形式が存在し、データの表現方法や保存できるデータの仕様などがそれぞれ異なる。

広く普及している著名なファイル形式の多くはその仕様が標準化されたり公開されており、誰でも対応するソフトウェア開発することができる。仕様が非公開で開発元企業のソフトウェアでしか扱えないものや、データの生成に特許技術が必要で対応ソフトウェア開発や販売、利用に料金が課されるものもある。

ファイル内でのデータの表現形式として、大きく分けて「テキスト形式」と「バイナリ形式」の2種類がある。テキストファイル文字コードで規定される範囲のデータを並べたもので、内容を文字の並びとして表示・編集することができる。バイナリファイルテキスト以外の形式で、任意のバイト列で表される。

コンテナ形式

画像や動画、音声などのファイル形式の中には、具体的なデータの圧縮符号化方式を定めず、符号化されたデータファイル内での格納方法や、データについての情報メタデータ)の記述形式のみを定めているものがある。このような形式を「コンテナフォーマット」(コンテナ形式)という。

例えば、Windowsなどで標準的に用いられる動画コンテナの「AVI」形式は、具体的な動画の圧縮方式としてMPEG-1MPEG-2MPEG-4H.264などに対応し、音声の圧縮方式としてはPCMMP3AACなどに対応する。具体的なデータの読み書きには、その圧縮方式に対応する「コーデック」と呼ばれるソフトウェアが必要となる。

形式の識別

ファイルコンピュータストレージ内ではファイル名file name)によって識別される。あるファイルがどんなファイル形式なのかを識別するために、Windowsなどではファイル名の末尾を「.」(ドット/ピリオド)で区切って「拡張子」(extension)と呼ばれる3文字前後の英数字を付与することがある。

Web電子メールにおけるデータ伝送では、「MIMEタイプ」あるいは「メディアタイプ」という文字列データ形式を伝達することができる。「主形式名/副形式名」という記法で表され、例えば「text/html」であればテキスト形式HTMLファイルという意味になる。

形式によっては、ファイルの先頭を必ず「マジックナンバー」と呼ばれる識別用の短い符号で始めるよう規定しているものもある。その場合、読み込み時に先頭の数文字(テキスト形式の場合)あるいは数バイトバイナリ形式の場合)を照合することで、どのファイル形式か(あるいは、対応している形式か否か)を知ることができる。例えば、画像形式のJPEGは先頭2バイト16進数で「ff d8」とするよう定めており、ファイルの先頭2バイトがこのであればJPEG画像であると分かる。

(2024.8.20更新)

ファイル形式用語辞典

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる