XML文書 【XML document】 XMLドキュメント
概要
XML文書(XML document)とは、マークアップ言語のXMLで記述された文書。XML自体がテキスト形式であることから、表題や文章などから成る、いわゆる一般的な文書以外の内容でも便宜上XML文書と呼ばれる。XMLは文章など人間が読むためのデータの中に、「<」(小なり記号)と「>」(大なり記号)で囲まれた「タグ」(tag)と呼ばれる特殊な記法を用いてコンピュータ(ソフトウェア)に対する指示を埋め込むことができるマークアップ言語の一つである。
XML自体は、Webページを記述するためのHTMLのような特定の目的のための仕様は持っておらず、マークアップ言語の基本的な仕組みに関する仕様のみを定めている。実際にXMLに基づくデータを記述するには利用するタグの種類や仕様などを利用者側で定義する必要がある。このためXMLは「マークアップ言語を作るためのメタ言語」とも呼ばれる。
XML文書はXMLの記法に基づいて記述されたひとまとまりのデータで、XMLパーサやプログラミング言語のXML処理機能などを用いて内容の読み込み、変換、書き出しなどを行うことができる。ファイルとして格納したものは「XMLファイル」と呼ばれる。具合的にどんな種類、形式、内容のデータであるかは、データ作成時に用いられたマークアップ言語の仕様(XMLスキーマ)を特定しなければ分からない。
整形式のXML文書 (well-formed XML document)
XMLとして要求される文法に従って記述された文書を「整形式」(well-formed)なXML文書という。すべてのXML文書に共通して求められるXML文法の正確さを備えていることを表し、そのXML文書が個別のスキーマに従っているかどうかは関知しない。
「すべての開始タグと終了タグが対になっている」「ルートとなるタグが他のタグの入れ子になっていない」「入れ子になっているタグの終了タグが親タグの終了タグより後に来ない」など、XMLそのものが規定する形式や文法を満たしていることを表す。
妥当なXML文書 (valid XML document)
整形式なXML文書の条件を満たした上で、ある特定のスキーマに適合した文書のことを「妥当」(valid)なXML文書という。妥当であると認められたXML文書は、同じスキーマに対応したXMLパーサで正しく処理されることが保証される。
XML文書が妥当であるかどうか判断する際にはスキーマを使用するため、どのような文書が妥当であるかはスキーマごとに異なる(妥当かどうかの判断は単一のパーサで行える)。スキーマを使用しない文書は判断の基準がないため、整形式にはなっても妥当にはならない。