読み方：もじばけ

文字化け

概要

文字化けとは、コンピュータで文字が正しく表示・印刷されず、本来とは異なる不規則で意味不明な記号や文字の連なりとして現れること。

目
次

テキスト（文字）形式のデータを読み込んで表示しているのに、本来そのデータが表していた文字が表示されずに、まったく異なる文字や記号、制御文字、空白などが連なった意味をなさない文字に変質してしまっている現象を指す。

主な原因として、データ自体の破損（一部の欠落や変質）、文字コードの相違（元の文字コードとは異なるコードとして解釈しようとしている）、フォント環境の違い（その言語に対応するフォントが存在しない）などが挙げられる。

ちなみに、実行可能形式のプログラムや、画像や動画、音声を記録したデータなど、バイナリ形式のデータを何らかの理由でテキストとして表示しようとした場合にも、不規則な文字や記号の連なりが出現するが、元がテキスト形式ではないため文字化けとは呼ばない。

文字化けは主に2バイト以上の文字コードを用いる日中韓などの言語圏で起きるため、欧米圏ではあまり知られておらず、日本人がこの現象を欧米人に説明する際に用いていた “Mojibake” という単語がそのまま文字化けを表す専門用語として流通している。

ある文字コードや文字エンコーディングで表現された文字データを、別の文字コードとして解釈・表示しようとしてしまい、まったく異なる文字列に変わってしまう場合である。

そのデータがどのような文字コードで表現されているのか分からず、自動認識にも失敗して別のコードを選んでしまった場合や、そもそもソフトウェア側がその文字コードに最初から対応していない場合などに起きる。

日本語の電子メールやWebページなどでは、同じ言語でも異なる文字コードが併存しており、どれが使われているのか明確に指定がない場合にはこの種の文字化けが発生する。また、欧米圏のソフトウェアでは日本語などマルチバイト文字に対応していない場合があり、日本語などを入力すると化けて表示されることがある。

文字コードが正しく認識できたとしても対応する文字を表示するためのフォントがシステム内に存在しない場合には、やはり正しく表示することはできない。日本語のWebページを日本語フォントの入っていない英語版のシステムで無理やり表示しようとした場合などに起きる。

また、同じ文字コードでも機種やOSによっては一部の領域に独自に拡張した文字群を当てはめている場合があり、このような機種依存文字を別のシステムで表示しようとした場合にも本来とは異なる表示になる。

(2018.8.10更新)