外字 【user-defined character】
概要
外字(user-defined character)とは、文字コード規格に含まれていない文字を、ソフトウェアメーカーなどが独自に追加したもの。通常の文字コードに収録されていない、特殊な人名や地名に用いられる文字、歴史的な文字などを表すために用いられる。文字コード中の未使用の識別番号などを利用して定義されるもので、コードと対応するフォントデータを追加することにより、元からある他の文字と同じように入力、記録、表示、印刷などができるようになる。
専用のソフトウェアを用いて利用者が作成・追加する「ユーザー定義文字」と、メーカーなどが特定の標準規格に追加する外字のセットを独自に定義して利用者に提供する「ベンダー定義文字」あるいは「システム外字」がある。
外字を含むテキストデータは、その外字に対応したシステム以外では同じように入力、表示、印刷することはできない。メーカーなどが定義して自社システム等に組み込んで提供する外字は同じメーカーのコンピュータやソフトウェアでは同じように扱うことができるが、他社製のシステムでは利用できない。
過去の著名なベンダー定義の外字集合としては、MS-DOSなどで用いられていた「IBM外字」や「NEC外字」(98外字)、法務省が漢字圏の外国人名などに用いた「入管正字」(入管外字)、字幕放送などで用いられた「ARIB外字」、NTTドコモが携帯電話の絵文字表示に用いた「iモード絵文字」、新聞記事などに用いられた「共同通信外字」(U-PRESS外字)などがある。これらの多くはUnicodeなどの規格に取り込まれ、現在は規格内の文字となっている。
(2024.1.22更新)