文字参照 【character reference】 HTMLエンティティ / HTML entity
概要
文字参照(character reference)とは、HTMLやXMLなどSGMLから派生したマークアップ言語で、文書中に(ある特定の)文字を直接記すことが難しい場合に、特定の英数字や記号の組み合わせを代わりとして用いることができる記法。数値文字参照/文字参照
表記したい文字を、Unicode/ISO 10646の文字番号(コードポイント)で表す方式をHTMLでは「数値文字参照」(numeric character reference)、XMLでは「文字参照」(character reference)という。十進数を用いる場合は「&#番号;」、16進数を用いる場合は「&#x番号;」のように表記する。
例えば、日本語のひらがなの「あ」は文字番号 U+3042 であるため、文書中で「あ」あるいは「あ」と記述すると、Webブラウザなどの処理系がその箇所を「あ」という文字で置き換えて表示・印刷してくれる。
文字実体参照/定義済み実体
一方、表記したい文字を、特定の文字に与えられている名前で指定する方式もあり、HTMLでは「文字実体参照」(character entity reference)、XMLでは「定義済み実体」(predefined entity)という。数値参照と同じように本文中で「&名前;」と表記すると置き換えて表示される。
例えば、二重引用符「"」(double quotation/ダブルクオーテーション)には「quot」という名前が与えられており、これを用いて「"」のように指定することができる。文字の名前はHTMLやXMLの仕様で規定されており、よく用いられる記号文字などに限られている。
(2023.11.10更新)