ファイル形式 【file format】 ファイルフォーマット
ひとまとまりのデータをコンピュータの記憶装置に保存する形式を定めたもので、機種やソフトウェアが異なっても、同じファイル形式に対応していればその形式のデータを同じように読み書き、編集などすることができる。
ファイル形式の種類
コンピュータプログラム、文書、画像、動画、音声など様々な種類のデータについてファイル形式が定義されているが、同じ種類のデータについて多種多様な異なる形式が存在し、データの表現方法や保存できるデータの仕様などがそれぞれ異なる。
広く普及している著名なファイル形式の多くはその仕様が標準化されたり公開されており、誰でも対応するソフトウェアを開発することができる。仕様が非公開で開発元企業のソフトウェアでしか扱えないものや、データの生成に特許技術が必要で対応ソフトウェアの開発や販売、利用に料金が課されるものもある。
ファイル内でのデータの表現形式として、大きく分けて「テキスト形式」と「バイナリ形式」の2種類がある。テキストファイルは文字コードで規定される範囲のデータを並べたもので、内容を文字の並びとして表示・編集することができる。バイナリファイルはテキスト以外の形式で、任意のバイト列で表される。
コンテナ形式
画像や動画、音声などのファイル形式の中には、具体的なデータの圧縮符号化方式を定めず、符号化されたデータのファイル内での格納方法や、データについての情報(メタデータ)の記述形式のみを定めているものがある。このような形式を「コンテナフォーマット」(コンテナ形式)という。
例えば、Windowsなどで標準的に用いられる動画コンテナの「AVI」形式は、具体的な動画の圧縮方式としてMPEG-1やMPEG-2、MPEG-4、H.264などに対応し、音声の圧縮方式としてはPCM、MP3、AACなどに対応する。具体的なデータの読み書きには、その圧縮方式に対応する「コーデック」と呼ばれるソフトウェアが必要となる。
形式の識別
ファイルはコンピュータのストレージ内ではファイル名(file name)によって識別される。あるファイルがどんなファイル形式なのかを識別するために、Windowsなどではファイル名の末尾を「.」(ドット/ピリオド)で区切って「拡張子」(extension)と呼ばれる3文字前後の英数字を付与することがある。
Webや電子メールにおけるデータ伝送では、「MIMEタイプ」あるいは「メディアタイプ」という文字列でデータ形式を伝達することができる。「主形式名/副形式名」という記法で表され、例えば「text/html」であればテキスト形式のHTMLファイルという意味になる。
形式によっては、ファイルの先頭を必ず「マジックナンバー」と呼ばれる識別用の短い符号で始めるよう規定しているものもある。その場合、読み込み時に先頭の数文字(テキスト形式の場合)あるいは数バイト(バイナリ形式の場合)を照合することで、どのファイル形式か(あるいは、対応している形式か否か)を知ることができる。例えば、画像形式のJPEGは先頭2バイトを16進数で「ff d8」とするよう定めており、ファイルの先頭2バイトがこの値であればJPEG画像であると分かる。
関連用語
ファイル形式用語辞典
他の辞典による解説 (外部サイト)
- ウィキペディア 「ファイル形式」
- Insider's Computer Dictionary 「ファイル・タイプ」
- MAU造形ファイル 「ファイルフォーマット」
- OPEN DATA HANDBOOK 用語集 「ファイル形式」
- マンガで分かるプログラミング用語辞典 「ファイルフォーマット」
- Programming Place Plus 用語集 「ファイル形式」
- TechTerms.com (英語) 「File Format」
- Computer Hope (英語) 「File format」
- PC.net Computer Glossary (英語) 「File Format」
- WhatIs.com (英語) 「file format」