XML文書 【XML document】 XMLドキュメント

概要

XML文書(XML document)とは、マークアップ言語XMLで記述された文書。XML自体がテキスト形式であることから、表題や文章などから成る、いわゆる一般的な文書以外の内容でも便宜上XML文書と呼ばれる。

XMLは文章など人間が読むためのデータの中に、「<」(小なり記号)と「>」(大なり記号)で囲まれた「タグ」(tag)と呼ばれる特殊な記法を用いてコンピュータソフトウェア)に対する指示を埋め込むことができるマークアップ言語の一つである。

XML自体は、Webページを記述するためのHTMLのような特定の目的のための仕様は持っておらず、マークアップ言語の基本的な仕組みに関する仕様のみを定めている。実際にXMLに基づくデータを記述するには利用するタグの種類や仕様などを利用者側で定義する必要がある。このためXMLは「マークアップ言語を作るためのメタ言語」とも呼ばれる。

XML文書はXMLの記法に基づいて記述されたひとまとまりのデータで、XMLパーサプログラミング言語XML処理機能などを用いて内容の読み込み、変換、書き出しなどをうことができる。ファイルとして格納したものは「XMLファイル」と呼ばれる。具合的にどんな種類、形式、内容のデータであるかは、データ作成時に用いられたマークアップ言語の仕様(XMLスキーマ)を特定しなければ分からない。

整形式のXML文書 (well-formed XML document)

XMLとして要求される文法に従って記述された文書を「整形式」(well-formed)なXML文書という。すべてのXML文書に共通して求められるXML文法の正確さを備えていることを表し、そのXML文書が個別のスキーマに従っているかどうかは関知しない。

「すべての開始タグ終了タグが対になっている」「ルートとなるタグが他のタグ入れ子になっていない」「入れ子になっているタグ終了タグが親タグ終了タグより後に来ない」など、XMLそのものが規定する形式や文法を満たしていることを表す。

妥当なXML文書 (valid XML document)

整形式なXML文書の条件を満たした上で、ある特定のスキーマに適合した文書のことを「妥当」(valid)なXML文書という。妥当であると認められたXML文書は、同じスキーマに対応したXMLパーサで正しく処理されることが保証される。

XML文書が妥当であるかどうか判断する際にはスキーマを使用するため、どのような文書が妥当であるかはスキーマごとに異なる(妥当かどうかの判断は単一のパーサえる)。スキーマを使用しない文書は判断の基準がないため、整形式にはなっても妥当にはならない。

(2023.7.7更新)

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる