機種依存文字 【platform dependent characters】 環境依存文字 / environment dependent characters
概要
機種依存文字(platform dependent characters)とは、コンピュータの機種やオペレーティングシステム(OS)などの環境が変わると正しく表示されないことがある文字のこと。よく言われるものとして丸囲み数字や括弧囲み文字、ローマ数字、元号、単位、通貨記号、数学記号、半角カタカナ、一部の使用頻度の低い漢字などがある。文字コードの規格の中には一部のコード領域に企業などが独自の記号や文字などを割り当てることを許容しているものがあり、大手コンピュータメーカーやソフトウェアメーカーが同じコードにそれぞれ違う文字を割り当てたことから環境によって表示が変わってしまう文字が生まれた。
正しく表示できない場合には、コードを共有する別の文字に置き換わってしまう場合と、表示環境側で未定義な文字が、空白や「〓」(俗にゲタと呼ばれる)や「□」(俗にトウフと呼ばれる)、「・」など、表示できないことを示す記号に置き換えて表示される場合がある。
1980年代から機種依存状態にある有名な文字として、
- ○や●、( )に数字を入れたもの
- ○に「上」「下」「左」「右」の文字を入れたもの、
- (株) (月) のように括弧で囲んだ漢字(を一文字に収めた文字)、
- 「TEL」「No.」などの略号、
- 「カロリー」「センチ」「トン」「ドル」などを小さな文字で2段に渡って収めた文字、
- 「kg」「m2」などの単位記号(を一文字に収めた文字)、
- 「VIII」のようなローマ数字を一文字に収めた文字、
- 「平成」のような元号二文字を一文字に収めた文字、
- Σや√など一部の数学記号、
- JIS第1水準・第2水準に含まれない漢字
などがある。昔はコンピュータのハードウェアが文字表示の処理を行っており、メーカーによって一部の文字コードの表す文字が異なることから「機種依存文字」と呼ばれるようになったが、現代では文字の処理はソフトウェアが行うため、実態にそぐわない名称となっている。
近年では文字コードが国際的な標準規格の「Unicode」に(文字エンコーディングはUTF-8に)収束しつつあり、また、Unicodeにかつての機種依存文字の多くが収録されているため、長期的には解消していくものと見られている。
(2018.3.31更新)