文字参照 【character reference】 HTMLエンティティ / HTML entity

概要

文字参照(character reference)とは、HTMLXMLなどSGMLから派生したマークアップ言語で、文書中に(ある特定の)文字を直接記すことが難しい場合に、特定の英数字や記号の組み合わせを代わりとして用いることができる記法。

数値文字参照/文字参照

表記したい文字を、Unicode/ISO 10646の文字番号(コードポイント)で表す方式をHTMLでは「数値文字参照」(numeric character reference)、XMLでは「文字参照」(character reference)という。十進数を用いる場合は「&#番号;」、16進数を用いる場合は「&#x番号;」のように表記する。

例えば、日本語のひらがなの「あ」は文字番号 U+3042 であるため、文書中で「あ」あるいは「あ」と記述すると、Webブラウザなどの処理系がその箇所を「あ」という文字で置き換えて表示・印刷してくれる。

文字実体参照/定義済み実体

一方、表記したい文字を、特定の文字に与えられている名前で指定する方式もあり、HTMLでは「文字実体参照」(character entity reference)、XMLでは「定義済み実体」(predefined entity)という。数値参照と同じように本文中で「&名前;」と表記すると置き換えて表示される。

例えば、二重引用符「"」(double quotation/ダブルクオーテーション)には「quot」という名前が与えられており、これを用いて「"」のように指定することができる。文字の名前はHTMLXMLの仕様で規定されており、よく用いられる記号文字などに限られている。

(2023.11.10更新)

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。