IT用語辞典 e-Words
トップページへ

IT用語検索

色々な辞典を検索

さくいん

分野別辞典

UTF-8
【8-bit UCS Transformation Format】

02.10.2更新

読み :

ユーティーエフエイト

分野 :

▼ 文中の用語

UCS-2UCS-4(Unicode)で定義される文字集合を用いて記述された文字列をバイト列(数値の列)に変換する方式の一つ。UTF-8では1文字を1〜6バイトの可変長の数値(バイト列)に変換するようになっているが、現在定義されているUnicode文字をUTF-8で表現した場合、最長で4バイトのバイト列に変換される。

UTF-8では、Unicodeの最初の128文字(UCS-2でいうU+0000からU+007F)を変換した結果がASCIIとまったく同じになるため、従来の処理システムとの親和性が高いという特長がある。一方、日本語などの文字は元々2バイトだったものが3バイトや4バイトで表現されてしまうため、UTF-16と比べてデータサイズが大きくなってしまうという欠点がある。

ちなみに、UTF-16ではUCS-4を完全に表現することはできないが、理論上はUTF-8はUCS-4を完全に表現できる。

印刷用ページ | この用語を追加 | 白紙に戻す

関連製品

他の辞書・辞典の解説
by JLogos

ご意見や追加希望はこちらへ : 
 ↑ 検索はページ左上です ←
 
© 1997- Incept Inc.