高校「情報Ⅰ」単語帳 - 開隆堂「実践 情報Ⅰ」 - メディアの特性とコミュニケーション手段

アナログ ⭐⭐

機械で情報を扱う際の表現方法の一つで、情報を電圧の変化など連続的な物理量の変化に対応付けて表現し、保存・伝送する方式のこと。元の情報を高精度に表現することができるが、伝送や複製の際に劣化・変質を避けられない。

対義語は「デジタル」(digital)で、情報を離散的な数値に変換し、段階的な物理量として表現する。アナログで情報を扱う利点として、デジタル化では避けられない離散化に伴なう本来の信号からのズレ(量子化誤差)が生じないという点があり、情報の発生時点では正確に表現して記録することができる。

一方、保存や伝送、再生、複製に際して劣化やノイズによる影響を受けやすく、変化した情報は復元することができないため、伝送・複製を繰り返したり長年に渡って保存すると内容が失われたり変質してしまう難点がある。

かつて音楽の販売に用いられたレコード盤は、樹脂表面に刻まれた溝の凹凸の変化が音声信号の変化に直接対応付けられたアナログ記録方式だったが、コンパクトディスク(CD)では音声信号をサンプリング(標本化)して離散的な数値の列に変換し、これを表面の溝の凹凸にデジタル信号として記録している。

機器などの内部的にはデジタル処理が行われていても、人間には連続的に感じられる多段階の値で量を識別するような方式を便宜上アナログと呼ぶ場合がある。例えば、ゲーム機のコントローラの種類の一つで、方向の指示を多段階に滑らかに変化させられるものをアナログコントローラという。

1990年代頃までは、コンピュータなどによる情報のデジタル処理は限られた用途にのみ用いられてきたが、半導体チップやデジタル機器の性能向上や低価格化により、現代では身近な情報の多くがデジタル方式で保存、加工、伝送されるようになってきている。

比喩や誤用

コンピュータやデジタル方式の情報機器、通信サービスなどが普及するに連れ、旧来の機器や仕組み、考え方などを比喩的にアナログと称するようになった。

そのような用例の多くは情報の表現形式のデジタル・アナログとは無関係で、単に「コンピュータやインターネットによらない」という意味だったり、さらには「電気機械を使わない」ことを表していたりする。

中には本来の語義では誤用と思われる用例もある。例えば、ビデオゲームと対比してカードゲームやボードゲームを「アナログゲーム」と呼んだり、パソコンや電卓と対比してそろばんを「アナログな計算方法」と評することがあるが、これらが扱う情報は離散的な数値であり、電気機械を使っていないだけで情報の取り扱い方自体はデジタル的である。

デジタル 【ディジタル】 ⭐⭐

機械で情報を扱う際の表現方法の一つで、情報をすべて整数のような離散的な値の集合として表現し、段階的な物理量に対応付けて記憶・伝送する方式のこと。特に、情報を2進数の「0」と「1」の組み合わせに置き換えて表現する方式。

現代のコンピュータはデータをすべて2進数の値の列に置き換え、これをスイッチのオン・オフや電圧の高低など明確に区別できる2状態の物理量に対応させて保存・伝送する。これに合わせて、通信回線や記憶媒体などもデジタル方式で情報を取り扱うようになっている。

対義語は「アナログ」(analog)で、情報を連続した物理量で表現する方式を意味する。初期の情報機器はアナログテレビ放送や音楽レコードのようにアナログ方式で情報を記録・伝送していたが、現代ではコンピュータの普及に合わせて動画配信やCDのようにデジタル方式への置き換えが進んでいる。

デジタルで情報を扱う利点として、保存や伝送、再生、複製などを行う際に劣化やノイズの影響を受けにくく、伝送・複製を何度繰り返しても内容が変化しない点や、様々な種類の情報を数値の集合として同じように扱うことができ、情報の種類によって媒体の選択に制限を受けない点などがある。ただし、連続的に変化する信号を離散値に変換する際に、必ず本来の信号からのズレ(量子化誤差/標本化誤差)が生じる。

機器などの内部的にはデジタル処理が行われていても、人間には連続的に感じられる多段階の値で量を識別するような方式を便宜上アナログと呼ぶ場合がある。例えば、ゲーム機のコントローラの種類の一つで、方向の指示を多段階に滑らかに変化させられるものをアナログコントローラという。

比喩や誤用

コンピュータやデータ通信、デジタル方式の記憶媒体などが普及するに連れ、「デジタル」という語をコンピュータやインターネットに関連するものの総称、「アナログ」をその逆、すなわち「電気・電子技術に依らないもの」とする比喩的な用法が広まった。

このような用例の多くは本来の情報の表現形式の違いとは無関係に用いられるため、カードゲームやボードゲームなどをビデオゲームに対比して「アナログゲーム」と呼んだり、そろばんを計算機と対比して「アナログな計算方法」と呼んだりするが、これらは離散的な数値しか扱わないため、情報の扱い方そのものはデジタル的である。

A/Dコンバータ 【ADC】 ⭐⭐

アナログ信号をデジタル信号に変換する電子回路。連続量であるアナログ信号の強度を一定時間ごとに記録(標本化/サンプリング)し、その値を一定のビット数の値で表現(量子化)する。

単位時間あたりの標本化の回数をサンプリング周波数(サンプリングレート)と呼び、毎回の標本データを表現する値のビット数を量子化ビット数という。これらの値が大きいほどアナログ波形をより正確にデジタルデータの集合として記録できるが、単位時間あたりの記録に必要なデータ量は増大する。

音声や光(画像・映像)、電気信号、電波などを電子機器に取り込んでデジタル処理するためには、センサーやアンテナなどが得たアナログ信号をA/D変換でデジタルデータに変換する必要があり、様々な機器の内部に内蔵されている。

A/D変換とは逆に、デジタル信号を元にアナログ信号を生成する電子回路のことをDAC(D/Aコンバータ、デジタルアナログ変換器)という。

サンプリング 【標本化】 ⭐⭐⭐

対象全体の中から何らかの基準や規則に基いて一部を取り出すこと。統計調査などで少数の調査対象を選び出すことや、信号のデジタル化などで一定周期で強度を測定することなどを指す。

アナログ信号のサンプリング

信号処理の手法の一つで、アナログ信号などの連続量の強度を一定の時間間隔で測定し、観測された値(標本値)の列として離散的に記録することを標本化ということが多い。デジタルデータとして記録したい場合は、値を整数などの離散値で表す「量子化」(quantization)処理が連続して行われる。

測定の間隔を「標本化周期」(sampling cycle:標本化周期)、その逆数である測定の頻度(単位時間あたりの回数)を「標本化周波数」(sampling frequency:標本化周波数)という。頻度の多寡は通常標本化周波数で表現され、単位として1秒あたりの回数を表す「Hz」(ヘルツ)が用いられる。

例えば、音声を44.1kHz(キロヘルツ:Hzの1000倍)で標本化する場合、音声信号の強度を毎秒4万4100回記録し、音声データを1秒あたり4万4100個の数値の列として表現する。44.1kHzは人間の可聴音をほぼカバーする周波数とされ、CD(コンパクトディスク)などの音声記録に用いられている。

統計・調査におけるサンプリング

統計や調査などの分野では、調査したい母集団全体を対象とすることが困難な場合に、集団を代表する少数の標本を抽出して対象とし、その結果から統計的に母集団の性質を推計する手法を標本化という。製品の出荷時検査や社会調査などで広く用いられ、標本から母集団の推定値を算出する方法や偏りのない標本の抽出方法などについて様々な手法が提唱されている。

音楽におけるサンプリング

音楽の分野では、楽曲の制作手法の一つで、既存の楽曲や何らかの音源からメロディや歌詞、あるいは音声そのものの断片を抽出し、引用したり繋ぎ合わせる技法を標本化という。また、録音した楽器の音や環境音、人や動物の声などを短い単位に分解し、再構成して楽曲に仕上げる手法のことを標本化ということもある。

量子化 ⭐⭐⭐

アナログ信号などの連続量を整数などの離散値で近似的に表現すること。自然界から取り込んだ信号などをコンピュータで処理・保存できるようデジタルデータに置き換える際などによく行われる。

音や光、電気、電波など物理現象に伴う信号は本来連続量であるため、そのままではコンピュータなどの電子回路で取り扱うことができない。そこで、一定の決まった間隔で信号の強度を測定(標本化/サンプリング)し、決まった細かさの段階に当てはめて表していく。

例えば、4段階の値で量子化を行う系では、信号強度の測定値(標本)は0、1/3、2/3、1の中から最も近い値が選ばれる。0.1に近い標本は0、0.4に近い標本は1/3といった具合である。この段階の数が多いほど元の信号をより高い精度で忠実に表現することができるが、量子化後のデータ量はその分だけ増大する。

この細かさをビット数で表したものを「量子化ビット数」と呼び、これが1ビットであれば2段階(21)、8ビットならば256段階(28)、16ビットならば65,536段階(216)の細かさで強度を表現できる。

エンコード 【符号化】 ⭐⭐⭐

ある形式の情報を一定の規則に従って別の形式に変換すること。元の形式に復元可能な状態に変換することを指し、データ圧縮や暗号化、文字コードの変換などが該当する。

ある形式のアナログ信号やデジタルデータを特定の形式の符号(code)に置き換える操作を指す。得られた符号列に逆方向の変換を行って元の状態に戻す操作は「デコード」(decode)という。デコードによって符号化前の状態を復元することができるが、非可逆圧縮など完全に元の状態には戻せない方式もある。

例えば、動画データは極めてデータ量が大きいため、符号化処理によってデータの間引きや圧縮を行い、短い符号列に置き換えてから保存や伝送を行う。圧縮されたデータはそのままでは再生できないため、再生時にはデコード処理によって元のデータを取り出してから表示を行う。

ある方式の符号化処理を行う装置やソフトウェアを「エンコーダ」(encoder)、その方式でデコード処理を行うものを「デコーダ」(decoder)という。音声の録音と再生、映像の録画と再生など、状況に応じてどちらも行う可能性がある場合には、両者を一体化した「コーデック」(codec:encoder-decoder)を用いる。

ビット ⭐⭐⭐

情報量の最小単位で、二つの選択肢から一つを特定する情報の量。コンピュータなどでは0と1のいずれかを取る二進数の一桁として表される。

語源は “binary digit” (二進法の数字)を繋げて省略した表現と言われる。情報をすべてビット列に置き換えて扱うことを「デジタル」(digital)という。1ビットのデータが表す情報量は、投げたコインの表裏のように、二つの状態のいずれであるかを示すことができる。

複数のビットを連ねて一つのデータとすることで、2ビットなら4状態(22)、3ビットなら8状態(23)といったように、より多い選択肢を識別できる。一般に、nビットのデータは2のn乗個までの選択肢からなる情報を表現することができる。

例えば、大文字のラテンアルファベットは「A」から「Z」の26文字であるため、これを識別するのには4ビット(16値)では足りず、5ビット(32値)が必要となる。小文字を加えると52文字であるため、6ビット(64値)が必要となる。

派生単位

データの読み書きや伝送を行う場合、その速さを表す単位として1秒あたりの伝送ビット数であるビット毎秒(bps:bit per second)という派生単位が用いられる。

また、実用上はビットでは値が大きくなりすぎて不便なことも多いため、8ビットをまとめて一つのデータとした「バイト」(byte)という単位を用いる場面も多い。かつて何ビットを1バイトとするか機種により様々に分かれていた(7ビットバイトや9ビットバイトなどが存在した)名残りで、8ビットの集まりを「オクテット」(octet)とも呼ぶ。

倍量単位

大きな量を表す際には、SI単位系に則って接頭辞を付した倍量単位を用いる場合がある。

  • 1000ビットを「キロビット」(kbit:kilobit)
  • 100万ビットを「メガビット」(Mbit:megabit)
  • 10億ビットを「ギガビット」(Gbit:gigabit)
  • 1兆ビットを「テラビット」(Tbit:terabit)
  • 1000兆ビットを「ペタビット」(Pbit:petabit)
  • 100京ビットを「エクサビット」(Ebit:exabit)

という。また、コンピュータでは2の冪乗を区切りとするのが都合が良いことが多いため、独自の接頭辞を付した倍量単位が用いられることもある。

  • 210(1024)ビットを「キビビット」(Kibit:kibibit)
  • 220(約104万)ビットを「メビビット」あるいは「ミービビット」(Mibit:mebibit)
  • 230(約10億7千万)ビットを「ギビビット」(Gibit:gibibit)
  • 240(約1兆1千億)ビットを「テビビット」あるいは「ティービビット」(Tibit:tebibit)
  • 250(約1126兆)ビットを「ペビビット」あるいは「ピービビット」(Pibit:pebibit)
  • 260(約115京)ビットを「エクスビビット」あるいは「イクシビビット」(Eibit:exibibit)

という。この2進専用の接頭辞はIEC(国際電気標準会議)が標準化しており、一般にはあまり馴染みがないが記憶容量の表記などで用いられることがある。

バイト ⭐⭐⭐

情報量の単位の一つで、8ビットのこと。数としては2進数を8桁並べたものに相当し、2の8乗で256種類の異なる状態を表現することができる。

情報量の最小の単位である「ビット」(bit)は2つの状態(0と1、オンとオフなど)を識別できるが、バイトは8ビットをまとめて一つの単位としたもので、各ビットの状態の組み合わせで256の状態を識別することができる。

単位として数値の後に付ける際にはアルファベット大文字の「B」が用いられるが、ビットを小文字の「b」で表すことが多いため、両者の混同を避けるために「byte」あるいは「bytes」と省略せずに(同様にビットは「bit」「bits」)記すことも多い。通信速度を表す場合は1秒あたりに伝送可能なバイト数を「バイト毎秒」という単位で表す。記号は「B/s」または「Bytes/s」を用いる。

接頭辞付きの単位

大きな量を表す場合はSI単位系に定められた接頭辞を付加し、1,000倍あるいは1,024倍ごとにキロバイト(KB:kilobyte)、メガバイト(MB:megabyte)、ギガバイト(GB:gigabyte)、テラバイト(TB:terabyte)などの単位を用いる。接頭辞は他の物理量のように1,000の累乗倍を表す場合と、情報処理の分野で切りの良い1,024(2の10乗)の累乗倍を表す場合があり、混乱が生じている。

IEC(国際電気標準会議)では1,024倍を表す場合は「KiB」(kibibyte、キビバイト)、「MiB」(mebibyte、メビバイトまたはミービバイト)、「GiB」(gibibyte、ギビバイト)、「TiB」(tebibyte、テビバイトまたはティービバイト)など専用の接頭辞を用いるよう提唱しているが、現状ではあまり定着していない。

nビットバイトとオクテット

もともと1バイトが何ビットか明確な定義はなく、機種や処理系によって都合の良いビット数が割り当てられていた。1バイトをnビットで表すことを「nビットバイト」と呼び、1980年代頃までは「6ビットバイト」や「7ビットバイト」など、8ビット以外のバイトを単位とするコンピュータもあった。

このようなバイトの定義の曖昧さを避けるため、必ず8ビットを表す単位として「オクテット」(octet)が用いられることがある。通信プロトコルの仕様書のように、機種や処理系の違いを超えて共通して利用される可能性がある文脈では、古い時代の名残りで現在でもバイトと言わずにオクテットが好まれる場合がある。

なお、現代では歴史的な文脈以外で8ビット以外のバイトが用いられることはなくなったため、2008年に国際電気標準会議(IEC)がIEC 80000-13規格の改訂版で正式に1バイトを8ビットであると定義した。

2進数 【二進数】 ⭐⭐⭐

数を書き表す方法(記数法)の一つで、基数を2(二)とした表記法のこと。アラビア数字の「0」と「1」を用いてすべての数を表現する。情報を2進法の値の連なりとして表現する手法を「デジタル」(digital)という。

普段我々が日常的な数字の読み書きや算術に用いる位取り記数法は「10進数」(十進数)で、一つの桁の表現に「0」から「9」の10種類の数字を使い、各桁の左の桁が10倍、右の桁は1/10を表している。

一方、2進法は一つの桁の表現が「0」と「1」の二通りしか無い記数法で、桁が一つ左へ移動する毎に値の重みが2倍に、右へ移動するごとに1/2倍になる。整数の右端の桁は1(20)の位、その左は2(21)の位、その左は4(22)の位、その左は8(23)の位…といった具合に各桁の重みが決まる。

<$Fig:binarynumber|center|true>

例えば、2進法の「1101」は左端から順に「8の位」が1、「4の位」が1、「2の位」が0、「1の位」が1であるため、10進数では 1×8 + 1×4 + 0×2 + 1×1 の「13」となる。逆に、10進数の「21」は、2のべき乗の足し算で表すと 16 + 4 + 1、すなわち 24×1 + 23×0 + 22×1 + 21×0 + 20×1 と表せるため、2進数では「10101」となる。

2進数とビット・バイト

2進法は二つの状態の組み合わせですべての数を表現することができるため、これをスイッチのオン・オフや電圧の高低、磁石のN極とS極、電荷の有無など、対となる物理的な状態に対応させることにより、機械による情報の記憶や伝達、演算を容易に取り扱うことができるようになる。

現代の電子式のコンピュータは原則としてすべての情報を2進法のデータに置き換えて処理を行い、2進法の1桁に相当するデータ量の最小単位を「ビット」(bit)という。実用上はある程度まとまった桁数のビット列を対象にデータの保存や操作を行うため、8ビットに相当する「バイト」(byte)という単位が用いられることが多い。1バイトは8桁の2進法に相当するため、28=256種類の状態を表現できる。

16進数 【16進法】 ⭐⭐⭐

数を書き表す方法(記数法)の一つで、基数を16(十六)とした表記法のこと。アラビア数字(算用数字)の「0」から「9」、およびアルファベットの「A」から「F」を用いてすべての数を表現する。

普段我々が日常的な数字の読み書きや算術に用いる位取り記数法は10進数(十進数/10進法)で、一つの桁の表現に「0」から「9」の10種類の数字を使い、各桁の左の桁が10倍、右の桁は10分の1を表している。

一方、16進法では1の位、16の位、256の位…というように桁の重みが16倍ずつ変化する。16進法における「10」は10進数における「16」を意味する。小数点以下も同様で、小数点の右隣から順に、16分の1の位、256分の1の位、4096分の1の位…というように続く。

コンピュータはすべてのデータを2進数で表しており、これを8桁(8ビット)ずつまとめた「バイト」という単位でデータを取り扱う。16進法は一桁で2進数の4桁分(4ビット)の値を書き記すことができるため、1バイトのデータを「00」から「FF」までの2桁の16進法として表記する慣習がある。

表記法

<$Fig:hexadecimal|right|true>

10進数の表記には「0」から「9」まで10種類の数字が必要なように、16進法では一桁を16種類の数字で表す必要がある。我々が日常的に使う数字は10種類しかないため、10から15までの数を一桁で表現するために「A」から「F」までの6つのアルファベットで代用することが多い。

その場合、「0」から「9」までは10進数の値と同じで、10進数の10を「A」、11を「B」、12を「C」、13を「D」、14を「E」、15を「F」でそれぞれ表す。例えば、「A0」は10進数の「160」(16×10)、「FF」は「255」(16×15+15)を表す。言語や処理系によるが、大文字と小文字は区別しない(どちらでもよい)ことが多い。

なお、複数の位取り表記法が混在する文書などの場合、記された数値がそれぞれ何進法なのかを明示するため「(9ABC)16」「(1234)10」のように右下に小さく10進表記で基数を記す場合がある。

各言語における表記

プログラミング言語やマークアップ言語などの数値リテラルでは、日常的な文書などと同じように単に数字を並べた表記は10進数とみなす場合が多く、16進法を記述する場合は先頭に特定の接頭辞を付けるなど特別な表記法を用いる。

多くの言語ではC言語などにならって「0xDEAD」のように先頭に「0x」を付記する表記法を採用しており、文字列中のコード参照では「¥x0D¥x0A」のように「¥x」(日本語圏以外では¥はバックスラッシュ)を用いる。

言語によっては「#x」(Schemeなど)「&h」(BASICなど)などを用いたり、末尾に「h」を付ける(一部のアセンブリ言語など)場合もある。HTMLやXMLなどにおける数値文字参照では「&#x266A;」のように「&#x」と「;」で挟む。

ファイル形式 【ファイルフォーマット】

ある特定の種類のデータを、コンピュータの外部記憶装置(ストレージ)のファイルにどのような形式や順序で記録するかを定義したもの。

ひとまとまりのデータをコンピュータの記憶装置に保存する形式を定めたもので、機種やソフトウェアが異なっても、同じファイル形式に対応していればその形式のデータを同じように読み書き、編集などすることができる。

ファイル形式の種類

コンピュータプログラム、文書、画像、動画、音声など様々な種類のデータについてファイル形式が定義されているが、同じ種類のデータについて多種多様な異なる形式が存在し、データの表現方法や保存できるデータの仕様などがそれぞれ異なる。

広く普及している著名なファイル形式の多くはその仕様が標準化されたり公開されており、誰でも対応するソフトウェアを開発することができる。仕様が非公開で開発元企業のソフトウェアでしか扱えないものや、データの生成に特許技術が必要で対応ソフトウェアの開発や販売、利用に料金が課されるものもある。

ファイル内でのデータの表現形式として、大きく分けて「テキスト形式」と「バイナリ形式」の2種類がある。テキストファイルは文字コードで規定される範囲のデータを並べたもので、内容を文字の並びとして表示・編集することができる。バイナリファイルはテキスト以外の形式で、任意のバイト列で表される。

コンテナ形式

画像や動画、音声などのファイル形式の中には、具体的なデータの圧縮符号化方式を定めず、符号化されたデータのファイル内での格納方法や、データについての情報(メタデータ)の記述形式のみを定めているものがある。このような形式を「コンテナフォーマット」(コンテナ形式)という。

例えば、Windowsなどで標準的に用いられる動画コンテナの「AVI」形式は、具体的な動画の圧縮方式としてMPEG-1やMPEG-2、MPEG-4、H.264などに対応し、音声の圧縮方式としてはPCM、MP3、AACなどに対応する。具体的なデータの読み書きには、その圧縮方式に対応する「コーデック」と呼ばれるソフトウェアが必要となる。

形式の識別

ファイルはコンピュータのストレージ内ではファイル名(file name)によって識別される。あるファイルがどんなファイル形式なのかを識別するために、Windowsなどではファイル名の末尾を「.」(ドット/ピリオド)で区切って「拡張子」(extension)と呼ばれる3文字前後の英数字を付与することがある。

Webや電子メールにおけるデータ伝送では、「MIMEタイプ」あるいは「メディアタイプ」という文字列でデータ形式を伝達することができる。「主形式名/副形式名」という記法で表され、例えば「text/html」であればテキスト形式のHTMLファイルという意味になる。

形式によっては、ファイルの先頭を必ず「マジックナンバー」と呼ばれる識別用の短い符号で始めるよう規定しているものもある。その場合、読み込み時に先頭の数文字(テキスト形式の場合)あるいは数バイト(バイナリ形式の場合)を照合することで、どのファイル形式か(あるいは、対応している形式か否か)を知ることができる。例えば、画像形式のJPEGは先頭2バイトを16進数で「ff d8」とするよう定めており、ファイルの先頭2バイトがこの値であればJPEG画像であると分かる。

QRコード 【Quick Response code】

データを平面上の正方形の領域に表された図形パターンで表すことができる2次元コードの方式の一つ。現在のデンソーウェーブが1994年に開発したもので、「QRコード」は同社の登録商標。1999年にJIS X 0510、2000年にISO/IEC 18004として標準化され、様々な分野で広く普及している。

小さな正方形の点を縦横同じ数だけ並べたマトリックス型2次元コードで、一辺に21個並べた「バージョン1」から、177個並べた「バージョン40」まで、40通りの仕様が用意されている。点の数が多いほうがたくさんの情報を記録できるが、必要な面積は大きくなっていく。

コード領域の三方の角には、中心が黒く塗りつぶされた大きな「回」の字型の「切り出しシンボル」(ファインダパターン)が配置されており、360度どの向きから読み取っても正確に情報が読み出せるようになっている。

記録できる情報量はバージョン40の場合で最大23,648ビットである。文字は独自のコード体系および符号化方式で表され、カナや漢字を含む文字列は最長1,817文字、アルファベットと数字だけなら4,296文字、数字だけなら7,089文字まで記録できる。

データには冗長性を持たせてあり、一部が汚損して読み取れなくてもデータを復元することができる。誤り訂正率は5段階から選択でき、最も低いもので約7%、最も高いもので約50%までの汚損に対応できる。誤り訂正率は高いほどより多くの冗長なデータが必要となるため、記録できるデータ量はその分少なくなる。

同社では自動車工場のカンバン(現品札)の自動読み取り、倉庫や配送の管理の効率化など、産業機器の自動化推進の一環としてQRコードを開発したが、汎用性の高さ、データ密度の高さ、高度な誤り訂正機能、読み取り向きが自由であるなど使い勝手の良さ、関連特許を開放して利用料を求めなかったことなどから、IT分野を中心に広く浸透している。

携帯電話のカメラ機能と組み合わせてインターネット上のURLやメールアドレス、サービス上のID情報などの告知や伝達に使われたり、乗り物の乗車券や搭乗券、イベントや施設のチケットレス入場、キャッシュレス決済などでよく用いられる。

データ圧縮 【圧縮符号化】 ⭐⭐⭐

データを一定の計算手順で加工し、実質的な内容を損なわずにより短い符号列で表すこと。原則として得られた符号は逆の計算手順により元のデータに復元することができ、データの一部を損なって容量を減らす削減や間引きとは異なる。

同じ情報を短いデータ長で表現することで、記憶装置上で占有する領域を小さくすることができ、また、機器間をより短い時間や少ない回線の占有度で伝送することができる。ただし、圧縮後の符号列は元のデータを扱う処理系では利用できないため、使用前に必ず元の状態に戻す処理が必要となる。この復元処理は「解凍」「伸長」「展開」などと呼ばれる。

圧縮処理や解凍処理に費やされる計算量や計算時間などと引き換えにデータ量の縮減という成果を得ており、両者が見合わなければ圧縮を行う意義は失われる。例えば、データ伝送を高速化するためにデータ圧縮を導入したのに、圧縮、伝送、解凍の合計時間が元データの伝送時間を上回ってしまっては元も子もない。

圧縮の逆変換の呼称

圧縮(compress)後の符号列から元のデータを復元する逆方向の変換処理のことを英語では “decompress” (compressに否定の接頭辞de-を付したもの)というが、日本語では定まった訳がなく、解凍、伸長、展開などの用語が用いられる。

ファイルのアーカイバでは複数のファイルを一つの圧縮ファイルにまとめることが多いため、その中から指定されたものを取り出して元の状態に戻すことを「抽出」ということもある(英語でもこの文脈では “extract” を用いる)。

日本では1980年代にパソコン通信やファイル圧縮ソフトの付属文書などを通じて「解凍」という用語が広まった(対応して圧縮のことを凍結と呼ぶこともあったがこれは広まらなかった)ため、慣用的に解凍と呼ぶことが多いが、本来の語義として圧縮と解凍では意味が対応しておらず、解凍には容積の増減の意味はないことなどから批判も多い。

一方、伸長や展開は、伸ばす、広げるという意味は合っているが、圧縮の逆の動作としての元に戻すという意味合いは薄いとの批判もあり、あまり定着していない。

圧縮率と圧縮比

どのくらい圧縮できたかを圧縮率という用語で表すことがある。より小さい量に圧縮できたことを「圧縮率が高い」という。

実際には二つの異なる指標が圧縮率と呼ばれており、一つは圧縮後のデータ量の元のデータ量に対する比率、もう一つは削減量の元の量に対する比率である。いずれを指すのかは文脈により異なる。圧縮後にデータ量が元の10分の1になったことを、前者の指標では圧縮率10%、後者では90%と表現する。

一方、圧縮前と後のデータ量の比や倍率で圧縮の程度を表すこともあり、データ圧縮比と呼ばれる。10分の1に圧縮したことを10:1あるいは10倍と言い表す。

可逆圧縮と非可逆圧縮

完全に元のデータに戻せる符号列に変換する方式を「可逆圧縮」、元のデータの一部を削除・変形することで高い圧縮率を得る代わりに完全には元に戻せなくなる方式を「非可逆圧縮」あるいは「不可逆圧縮」という。

可逆圧縮はわずかでもデータの一部が異なれば元とはまったく違う意味になってしまう文字(テキスト)データやコンピュータプログラムの圧縮や汎用のファイル圧縮などで用いられ、通常単にデータ圧縮といえば可逆圧縮を指す。

非可逆圧縮は主に画像や音声、映像など元のデータに大きな情報の冗長性が含まれる対象に用いられる。人間の視覚や聴覚の特性を利用して、人間が気づきにくい形でデータの一部を改変・削除することで、劇的な高圧縮率を得ることができる。

元の情報を損なう変換を伴うため、非可逆圧縮は厳密にはデータ圧縮手法の一部ではないとする立場もある。また、非可逆圧縮アルゴリズムの中には、元データの形式変換や加工(この段階ではデータ長の縮減は伴わない)を行った後、データ圧縮自体は連長圧縮などの可逆圧縮により行う(すなわち、「非可逆」の工程では圧縮していない)ものも多い。

可逆圧縮 【ロスレス圧縮】 ⭐⭐⭐

データ圧縮方式のうち、圧縮符号化の過程で元のデータを一切毀損せず、完全に元通りに復元できるように圧縮する手法のこと。主にファイル圧縮や通信プロトコルなど、データの種類を特定しない汎用の保存形式や伝送方式で用いられる。

コンピュータプログラムや文字(テキスト)などのデータは、1ビットでも欠けたり変質するとその意味する内容自体が変わってしまうため、圧縮したデータを展開(解凍)したときに元のデータと完全に一致する可逆圧縮が行われる。

一方、画像や動画、音声などの場合には、人間の視聴覚が違いを感じ取りにくいように一部を省略・改変することで実質的な内容を維持しつつ劇的に圧縮率を高める「非可逆圧縮」(不可逆圧縮)が行われることがある。可逆圧縮は元のデータを完全に保存できるが、非可逆圧縮に比べ圧縮率は低い。

主な可逆圧縮アルゴリズムとしてはランレングス符号やハフマン符号、LZ77、LZSS、LZW、Deflateなどが知られる。ZIPやCAB、LZH、RAR、gzip、bzip2など汎用のファイル圧縮形式はすべて可逆圧縮を用いる。画像圧縮ではJPEGなどが非可逆圧縮、GIFやPNG、WebP、AVIF、Loassless JPEGなどが可逆圧縮である。

また、通常は非可逆圧縮が用いられることが多い音声圧縮でも、「ALAC」(Apple Lossless)や「FLAC」「WMA Lossless」など高音質のために可逆圧縮を用いるファイル形式があり、「ロスレス音源」と総称される。

なお、非可逆圧縮は実際には元のデータを圧縮しやすい状態に変換し、圧縮符号化自体は可逆圧縮アルゴリズムを用いて行うため、正確には圧縮方式そのものが可逆と非可逆に分かれているわけではないが、実用的にはこの変換処理も含めて圧縮方式や圧縮形式の仕様の一部とみなされるため、便宜上このような区分が常用されている。

非可逆圧縮 【不可逆圧縮】 ⭐⭐⭐

データ圧縮方式のうち、圧縮符号化の過程でデータの一部の欠落や改変を許容することで極めて効率よく圧縮する手法のこと。非可逆圧縮されたデータを伸長(解凍)しても元のデータには完全には一致しない。

コンピュータプログラムや文字などのデータは1ビットでも変化すればその意味する内容自体が変わってしまうが、画像や動画、音声などはデータ上は細部が僅かに異なっていても人間の視聴覚には違いが気付きにくい場合がある。

このような特性を活かし、人間が認識しにくい手法で元のデータの一部を省略・改変したり、別の表現形式へ変換するなどして、効率よく短い符号に圧縮する方式を非可逆圧縮という。

元のデータを一切毀損しない可逆圧縮とは異なり完全に元のデータを復元することはできないが、人間にほとんど違いがわからない程度の改変でも劇的に圧縮率を高めることができる利点がある。また、多くの方式では圧縮時に品質劣化の程度を指定することができ、品質を犠牲にして極端に小さな容量に圧縮することもできる。

画像や動画、音声の圧縮形式の多くが非可逆圧縮を採用しており、JPEG、MPEG-1、MPEG-2、MPEG-4、H.264、H.265、MP3、AAC、WMAなど主要なデータ形式のほとんどが非可逆となっている。用途に応じて使い分けられるよう、Lossless JPEGやWMA Losslessのように仕様の一部として可逆圧縮を用意している形式もある。

なお、実際には元のデータを効率良く圧縮できる状態に変換し、圧縮符号化自体は可逆圧縮アルゴリズムを用いて行うため、正確には圧縮方式そのものが可逆と非可逆に分かれているわけではないが、実用的にはこの変換処理も含めて圧縮方式や圧縮形式の仕様の一部とみなされるため、便宜上このような区分が常用されている。

Zip 【.zipファイル】

複数のファイルを一つにまとめるアーカイブファイル形式、および、データを圧縮して容量を削減することができる圧縮ファイル形式の一つ。Windowsなどで標準的に用いられる。

Zip形式のファイルは内部に複数のファイルを格納でき、必要なものだけを展開して取り出すことができる。オペレーティングシステム(OS)のファイルシステムのように階層型(入れ子型)のディレクトリ(フォルダ)構造をそのまま取り込むことができる。ファイル名の標準の拡張子は「.zip」である。

ファイルの格納時にデータ圧縮を行うことができ、内容を維持したままファイルサイズを縮減することができる。この機能は本来はオプションで、圧縮せずにアーカイブすることもできるが、ほとんどの場合に圧縮機能が用いられるためZip形式は圧縮形式であると説明されることもある。

32ビットCRC方式の誤り検出符号を付与し、展開時にデータが破損していないか確かめることができる。ファイル作成時にパスワードを設定し、DES、3DES、RC2、RC4などの暗号アルゴリズムで内容を暗号化して格納する拡張仕様があり、展開時にはパスワード入力が必要となる。

圧縮方式

Zipのバージョン2.0からLZ77圧縮アルゴリズムとハフマン符号化を組み合わせたDeflateデフレート方式のデータ圧縮を利用することができるようになり、ファイル単位で圧縮を行い容量を削減することができる。これは内容を損なわない可逆圧縮(ロスレス圧縮)方式であり、どのような種類のデータも圧縮できる。

似た名称の圧縮ファイル形式に「gzip」や「bzip2」、「7z」(7-Zip)などがあるが、gzipはDeflate圧縮を用いるが記録形式としては別物で互換性がなく、bzip2は名前が似ているだけで特に共通点はない。7zはDeflateやbzip2を含む様々な圧縮形式に対応しているが記録形式はZipと異なる。

他のファイル形式での利用

データファイルに様々な種類の複合的なデータを収める必要があるアプリケーションソフトでは、特定のデータ形式やディレクトリ構造で複数のファイルを生成・配置し、これをまとめてZipで圧縮して一つのファイルにまとめたものを標準のファイル形式とする場合がある。

このようなファイルは格納されるデータ形式自体はZipファイルそのものだが、内容を展開するとそのアプリケーション固有のデータの集合体となるため、固有のファイル形式として独自の名称とファイル拡張子によって識別されることが多い。

このような方式を採用したフォーマットとして著名なものとして、Javaのソフトウェア配布に用いられるJAR形式(.jarファイル)、オフィスソフトの標準ファイル形式である「Open Office XML」(DOCXファイル、XLSXファイル、PPTXファイルなど)や「OpenDocument Format」(.odtファイル、.odsファイル、.odpファイルなど)がある。

歴史

Zipは1989年に米PKWARE社のフィル・カッツ(Phil Katz)氏が考案したもので、同社のMS-DOS向けのファイルアーカイブソフトウェア「PKZIP」の標準ファイル形式として発表された。同氏はZipの仕様を公表し、一切の権利を放棄したため、誰でも自由に利用できるようになり、主にMS-DOSやWindowsなどのプラットフォームで標準的なアーカイブ形式および圧縮形式として普及した。2015年にISO/IEC 21320として国際標準となっている。

メディア ⭐⭐⭐

媒体、媒質、伝達手段、中間などの意味を持つ英単語。“medium” の複数形。情報の伝達や記録に用いられる物体や装置、およびこれを利用して人に情報を伝達・配布する仕組みや事業、組織などを指すことが多い。

一般の外来語としては、人が人に情報を伝えたり広く報じるのに用いるモノや仕組みを指し、広義には電話や手紙、書籍、テレビ、映画、電子メール、Webサイトなど様々な伝達手段が含まれる。

狭義には、社会の不特定多数の人々に向けて広く情報を発信する「マスメディア」(mass media)のことをメディアと呼ぶことが多い。現代では日常的に多くの人が接するテレビ放送、ラジオ放送、新聞、雑誌の4つを指し、これを「マス4媒体」「4大メディア」などという。

マスメディアと同じように、インターネットを通じて広く一般に情報を発信、公開するネットサービスやWebサイトなどのことを「ネットメディア」「Webメディア」「オンラインメディア」などと呼ぶ。Webサイトやブログ、メールマガジン、動画配信サービス、動画サービス上のチャンネルなどが含まれ、マスメディア企業がネットメディアも並行して運用する例も多く見られる。

記録メディア・伝送メディア

ITの分野では、一般の用法に加え、データの記録・保管に用いる物体や装置を「記録メディア」、信号やデータを伝送するケーブルや内部の信号線、あるいは電波など伝送の媒介となる物理現象を「伝送メディア」という。

記録メディア(記憶メディアとも呼ばれる)の例としては、磁気テープ、磁気ディスク(ハードディスクなど)、光学ディスク(CD/DVD/Blu-ray Discなど)、フラッシュメモリ(SSD/USBメモリなど/メモリーカード)などがある。伝送メディアの例としては金属線ケーブル(銅線ケーブル/メタルケーブル)、光ファイバーケーブル、電波、赤外線、電子基板上の金属配線などがある。

メディアリテラシー ⭐⭐⭐

情報を伝達する媒体(メディア)を使いこなす基礎的な素養のこと。メディアを通じて情報を取得・収集し、取捨選択および評価・判断する能力や、自らの持つ情報をメディアを通して適切に発信できる能力を指す。

現代人は生活や仕事に必要な情報の多くをテレビや新聞、雑誌などのマスメディアやインターネット上のサイトやサービスなどの情報媒体を通じて得ているが、媒体にはそれぞれ物理的・技術的・商業的な制約や、発信者の立場や意図、経済的・政治的・思想的な背景などから偏りや歪みを避けることはできず、時には誤りや意図的な誇張、改変、虚偽などが含まれることもある。

情報の偏りにも様々な背景があり、例えば、紙面や放送時間の制約から送り手が重要でないと判断した話題が取り上げられなかったり扱いが小さくなることがある。商業的に運営されている媒体が大口広告スポンサーの不祥事を意図的に無視したり、自社や業界が関連する制度を取り上げる際に自らに有利な情報や論調を流すといった媒体の利害に基づく歪みが生じることもある。

また、政治や経済についての話題では、思想的に政権党に親和的な媒体とそうでない媒体で同じ事実について肯定的な論調と否定的な論調に分かれたり、特定の勢力に有利な、あるいは不利な情報を多く流すと行った操作が行われることも珍しくない。

情報の受け手としてのメディアリテラシーは、このような媒体の特性や限界、送り手の意図や背景などを読み解き、メディアから得た情報を鵜呑みにしたり全否定するのではなく、可能な限り客観的かつ正確に評価して活用できるようにする基本的な知識や技能の総体を指す。

1990年代まではメディアリテラシーといえばマスメディアの情報を読み取る受け手としての能力のみを指したが、現代ではインターネットを通じて誰でも公共に情報を発信することができるようになり、自らの持つ情報を適切な手段で発信する基礎的な能力もメディアリテラシーの範疇に含まれるようになった。こうした送り手としての素養はいわゆる「ネットリテラシー」の一部でもある。

SNS 【Social Networking Service】 ⭐⭐⭐

人と人との社会的な繋がりを維持・促進する様々な機能を提供する、会員制のオンラインサービス。友人・知人間のコミュニケーションを円滑にする手段や場を提供したり、趣味や嗜好、居住地域、出身校、あるいは「友人の友人」といった共通点や繋がりを通じて新たな人間関係を構築する場を提供するサービスで、Webサイトや専用のスマートフォンアプリなどで閲覧・利用することができる。

主な特徴

サービスにより機能や特徴が大きく異なるが、多くのサービスに見られる典型的な機能としては、別の会員を「友人」や「購読者」「被購読者」などに登録する機能、自分のプロフィールや写真を公開する機能、同じサービス上の別の会員にメッセージを送る機能、自らのスペースに文章や写真、動画などを投稿して友人などに見せる機能がある。

サービスによっては、複数の会員でメッセージ交換や情報共有ができるコミュニティ機能、イベントの予定や友人の誕生日などを共有したり当日に知らせたりしてくれるカレンダーあるいはスケジュール機能などがある。

多くの商用サービスではサイト内に広告を掲載するなどして、登録や基本的なサービスの利用を無料としているが、一部の機能を有料で提供しているサービスもある。

SNSの種類

多くのサービスはメールアドレスなどがあれば誰でも登録できるが、普及し始めた当初は人の繋がりを重視して「既存の参加者からの招待がないと参加できない」というシステムになっているサービスが多かった。

現在でも、何らかの形で参加資格を限定し、登録時に紹介や審査などが必要なサービスがある。また、参加自体が自由でも、テーマや分野などがあらかじめ設定され、関係や関心のある人の参加を募っているサービスなどもある。

企業などが従業員を対象に運用する「社内SNS」や、大学が教職員や在学生、卒業生を対象に運用する「学内SNS」もあり、業務上の連絡や情報共有に使われたり、業務とは切り離して参加者間の交流の促進のために利用されたりする。「OpenPNE」や「Mastodon」など自らSNSを開設・運用することができるサーバ向けソフトウェアもあり、これを利用したプライベートな集団内のサービスも存在する。

歴史と著名なサービス

2003年頃アメリカを中心に相次いで誕生し、国内事業者によるサービスも2004年頃から普及し始めた。世界的には、初期に登録資格を有名大の学生に絞って人気を博し、後に世界最大のソーシャルネットワークに成長した「Facebook」(フェイスブック)や、短いつぶやきを投稿・共有するマイクロブログ型の「Twitter」(ツイッター:現X)、写真の投稿・共有を中心とする「Instagram」(インスタグラム)、ビジネス・職業上の繋がりに絞った「LinkedIn」(リンクトイン)などが有名である。

日本独自のサービスとしては一時会員数1000万人を超え社会現象ともなった「mixi」(ミクシィ)などが有名だが、近年ではFacebookなど海外事業者に押され利用が低迷しており、オンラインゲーム運営・提供に業態転換するなどしている。

SNS的なサービスの広がり

近年では様々なWebサイトやネットサービス、スマートフォンアプリなどに「ソーシャルな」機能が組み込まれる事例が増えており、何がSNSで何がそうでないか明確に区別することは難しくなりつつある。

例えば、料理レシピ投稿サイトの「クックパッド」(Cookpad)や、スマートフォン利用者間でチャットや音声通話などを提供する「LINE」(ライン)などにも、集団の形成を支援するコミュニティ機能や日記の投稿・共有機能などがあり、これらのサービスをSNSの一種に含める場合もある。

SNSの功罪

SNSによって、一度繋がりの途絶えた古い友人と交流を再開したり、現実に頻繁に会うことは難しい多人数と日常的な繋がりを保ったり、身の回りに同好の士がいなくてもSNSで発見してコミュニティを形成できるなど、SNSのおかげで人間関係が充実した利用者は数多くいる。

一方で、不用意に個人情報や顔写真などを公開してしまい悪意に晒されたり、素性のよくわからない人と交流を持ちトラブルに巻き込まれたり、自分の周囲では特に問題視されなかった話がネット上で拡散されるうちに非難の書き込みが殺到してしまう(「炎上」と呼ばれる現象)など、SNSによって新たに引き起こされる問題もある。

また、SNSが様々な人の間に普及し、継続して利用する期間が長くなるに連れ、上司や家族など「望まれざる」相手とのSNS上での関係や対応に苦慮したり、知り合いの(大抵は良いことしか書かれていない)書き込みを読んで自分の身上と比較してしまったり、興味が湧かない話題でも毎回反応を迫られているように感じて精神的に疲弊する「SNS疲れ」といった問題に直面し、SNSの利用を断って離れる人も増えている。

電子メール 【eメール】 ⭐⭐⭐

通信ネットワークを介してコンピュータなどの機器の間で文字を中心とするメッセージを送受信するシステム。郵便に似た仕組みを電子的な手段で実現したものであることからこのように呼ばれる。

広義には、電子的な手段でメッセージを交換するシステムやサービス、ソフトウェア全般を指し、携帯電話のSMSや、各種のネットサービスやアプリ内で提供される利用者間のメッセージ交換機能などを含む。

狭義には、SMTPやPOP3、IMAP4、MIMEなどインターネット標準の様々なプロトコル(通信規約)やデータ形式を組み合わせて構築されたメッセージ交換システムを指し、現代では単に電子メールといえば一般にこちらを表すことが多い。

メールアドレス

電子メールの送信元や宛先は住所や氏名の代わりに「メールアドレス」(email address)と呼ばれる統一された書式の文字列が用いられる。これは「JohnDoe@example.com」のように「アカウント名@ドメイン名」の形式で表され、ドメイン名の部分が利用者が所属・加入している組織の管理するネットワークの識別名を表し、アカウント名がその中での個人の識別名となる。

企業や行政機関、大学などがメールサーバを運用して所属者にメールアドレスを発行しているほか、インターネットサービスプロバイダ(ISP)や携帯電話事業者などがインターネット接続サービスの一環として加入者にメールアドレスを発行している。

また、ネットサービス事業者などが誰でも自由に無料でメールアドレスを取得して利用できる「フリーメール」(free email)サービスを提供している。一人の人物が立場ごとに複数のアドレスを使い分けたり、企業の代表アドレスのように特定の個人に紐付けられず組織や集団などで共有されるアドレスもある。

メールサーバとメールクライアント

インターネットに接続されたネットワークには「メールサーバ」(mail server)と呼ばれるコンピュータが設置され、利用者からの要請により外部のネットワークに向けてメールを送信したり、外部から利用者に宛てて送られてきたメールを受信し、本人の使うコンピュータに送り届ける。利用者や他のサーバに対する窓口であり、郵便制度における郵便局のような役割を果たす。

メールサーバ内には利用者ごとに私書箱に相当する受信メールの保管領域(メールボックス)が用意され、外部から着信したメールを一時的に保管する。利用者が手元で操作するメールソフト(メールクライアント、メーラーなどと呼ばれる)は通信回線を介してメールサーバに問い合わせ、メールボックス内のメールを受信して画面に表示する。

Webメール

利用者の操作画面をWebアプリケーションとして実装し、Webブラウザからアクセスしてメールの作成や送信、受信、閲覧、添付ファイルのダウンロードなどをできるようにしたシステムを「Webメール」(webmail)という。

フリーメールサービスの多くは標準の操作画面をWebメールの形で提供しており、メールクライアントなどを導入・設定しなくてもWebブラウザのみでメールの送受信を行うことができるようになっている。企業などの組織で運用されるメールシステムでもWebメールを提供する場合があり、自宅や出先のコンピュータなどからアクセスできるようになっている。

メッセージの形式

電子メールには原則として文字(テキスト)データのみを記載することができる。特別な記法や書式を用いずに素の状態の文字データのみが記されたメールを「テキストメール」という。WebページのようにHTMLやCSSなどの言語を用いて書式や装飾、レイアウトなどの指定が埋め込まれたものは「HTMLメール」という。

また、画像や音声、動画、データファイル、プログラムファイルなどテキスト形式ではないデータ(バイナリデータ)を一定の手順でテキストデータに変換して文字メッセージと一緒に送ることができる。こうしたデータをメッセージ中に埋め込む方式の標準として「MIME」(Multipurpose Internet Mail Extension/マイム)が規定されており、これを利用してメールに埋め込んだファイルを「添付ファイル」(attachment file)という。

電子メールの普及と応用

電子メールはWeb(WWW)と共にインターネットの主要な応用サービスとして広く普及し、情報機器間でメッセージを伝達する社会インフラとして機能している。現在ではパソコンやスマートフォン、タブレット端末などのオペレーティングシステム(OS)の多くは標準でメールクライアントを内蔵しており、誰でもすぐに利用できるようになっている。

電子メールシステムでは一通のメールを複数の宛先へ同時に送信する同報送信・一斉配信も容易なため、グループ共通のアドレスを用意してメンバー間の連絡や議論などに用いる「メーリングリスト」(mailing list)や、発行者が購読者に定期的にメールで情報を届ける「メールマガジン」(mail magazine)などの応用システムも活発に利用されている。

一方、広告メールを多数のメールアドレスに宛て無差別に送信する「スパムメール」(spam mail)や、添付ファイルの仕組みをコンピュータウイルスの感染経路に悪用する「ウイルスメール」(virus mail)、送信元を偽って受信者を騙し秘密の情報を詐取する「フィッシング」(phishing)など、電子メールを悪用した迷惑行為や犯罪なども起きており、社会問題ともなっている。

文字化け ⭐⭐

コンピュータで文字が正しく表示・印刷されず、本来とは異なる不規則で意味不明な記号や文字の連なりとして現れること。

テキスト(文字)形式のデータを読み込んで表示しているのに、本来そのデータが表していた文字が表示されずに、まったく異なる文字や記号、制御文字、空白などが連なった意味をなさない文字に変質してしまっている現象を指す。

主な原因として、データ自体の破損(一部の欠落や変質)、文字コードの相違(元の文字コードとは異なるコードとして解釈しようとしている)、フォント環境の違い(その言語に対応するフォントが存在しない)などが挙げられる。

ちなみに、実行可能形式のプログラムや、画像や動画、音声を記録したデータなど、バイナリ形式のデータを何らかの理由でテキストとして表示しようとした場合にも、不規則な文字や記号の連なりが出現するが、元がテキスト形式ではないため文字化けとは呼ばない。

文字化けは主に2バイト以上の文字コードを用いる日中韓などの言語圏で起きるため、欧米圏ではあまり知られておらず、日本人がこの現象を欧米人に説明する際に用いていた “Mojibake” という単語がそのまま文字化けを表す専門用語として流通している。

文字コードの違い

ある文字コードや文字エンコーディングで表現された文字データを、別の文字コードとして解釈・表示しようとしてしまい、まったく異なる文字列に変わってしまう場合である。

そのデータがどのような文字コードで表現されているのか分からず、自動認識にも失敗して別のコードを選んでしまった場合や、そもそもソフトウェア側がその文字コードに最初から対応していない場合などに起きる。

日本語の電子メールやWebページなどでは、同じ言語でも異なる文字コードが併存しており、どれが使われているのか明確に指定がない場合にはこの種の文字化けが発生する。また、欧米圏のソフトウェアでは日本語などマルチバイト文字に対応していない場合があり、日本語などを入力すると化けて表示されることがある。

フォントの違い

文字コードが正しく認識できたとしても対応する文字を表示するためのフォントがシステム内に存在しない場合には、やはり正しく表示することはできない。日本語のWebページを日本語フォントの入っていない英語版のシステムで無理やり表示しようとした場合などに起きる。

また、同じ文字コードでも機種やOSによっては一部の領域に独自に拡張した文字群を当てはめている場合があり、このような機種依存文字を別のシステムで表示しようとした場合にも本来とは異なる表示になる。

Unicode 【ISO/IEC 10646】 ⭐⭐⭐

文字コードの国際的な標準規格の一つで、世界中の様々な言語の文字を収録して通し番号を割り当て、同じコード体系のもとで使用できるようにしたもの。

コンピュータで文字データを扱うには、文字や記号の一つ一つに対応する番号(符号)を与え、文字の列を番号の列に変換する必要がある。文字と番号の対応関係を定めたルールを「文字コード」(character code)と呼び、従来は国や言語圏ごとに自分たちの使う文字のコード体系を定めて使用していた。

Unicodeは世界中の様々な言語の文字を集め、すべての文字や記号に重複しないようそれぞれ固有の番号を与えた文字コード規格である。世界の主な言語のほとんどの文字を収録しており、通貨記号や約物など文字と共に使われる記号や絵文字なども登録されている。

米大手IT企業を中心とする業界団体「Unicodeコンソーシアム」(Unicode Consortium)が仕様を策定・改訂しており、ほぼ同じものがISO(国際標準化機構)とIEC(国際電気標準会議)の合同委員会によって「ISO/IEC 10646」として国際標準となっている。ISO/IEC側ではUnicodeに相当する文字集合の名称を「UCS」(Universal Coded Character Set)としている。

コードポイント

Unicodeでは、登録された文字のそれぞれについて「コードポイント」(code point:符号点、符号位置と訳される)と呼ばれる一意の通し番号を与えている。例えば、日本語のカタカナの「ア」には12450番が割り当てられており、説明文などでは16進数を用いて「U+30A2」のように表記する。

世界中のあらゆる言語の文字を収録するという目的のため、コードポイントは最長で21ビットの値(上限は1114111番、U+10FFFF)まで用意されている。初期の規格で世界の既存の文字コードに規定された文字の多くが収録されたが、独自の文字コードを持たなかった言語や、絵文字、古代文字、新設された通貨記号などを中心に、現在も毎年のように新しい文字が追加されている。

現在はコードポイント空間全体の約12%にあたる約15万文字が割り当て済みで、規格上は文字を規定しない「私用面」(企業などが独自に使用してよい)が約13万文字(約12%)分予約済みである。残りの約75%が未割り当てとなっている。

基本多言語面と追加多言語面

コードポイントの範囲のうち、16ビット(2バイト)の値で表現できる U+0000 から U+FFFF は「基本多言語面」(BMP:Basic Multilingual Plane)と呼ばれる。ラテンアルファベットやキリル文字、ギリシャ文字、ひらがな・カタカナ、ハングル、基本的な漢字など、主要な言語の文字のほとんどをカバーしている。

当初の規格はBMPのみの予定だったが、追加収録を希望する文字のすべてを登録しきれないことが明らかになり、後から U+10000~U+10FFFF の拡張領域が追加された。このうち、U+10000~U+1FFFF の範囲を「追加多言語面」(SMP:Supplementary Multilingual Plane/補助多言語面)と呼び、古代文字や絵文字などが収録されている。

日本語文字の扱い

日本語の文字は原則として日本語文字コードのJIS規格から収録されている。当初は「JIS X 0201」(いわゆる半角文字)、「JIS X 0208」(JIS基本漢字)、「JIS X 0212」(JIS補助漢字)に定められた文字を収録したが、後に「JIS X 0213」(JIS2000/JIS2004)のすべての漢字が収録された。

なお、JIS X 0213の一部の漢字についてはBMPには収まりきらず、東アジア各国・地域の追加漢字を収録する U+20000~U+2FFFF の領域(SIP:Supplementary Ideographic Plane/追加漢字面)に収録されている。

これら元になった規格の通り、半角カナも全角とは別に「HALFWIDTH KATAKANA LETTER A」(半角カタカナのア)等の名称で、全角英数字も「FULLWIDTH LATIN CAPITAL LETTER A」(全角ラテンアルファベット大文字A)等の名称でそれぞれ収録されている。

UTF (Unicode Transformation Format/UCS Transformation Format)

様々な事情から、文字をデータとして実際に記録・伝送する際には、文字集合で定められたコードポイントをそのままビット列で表すのではなく、一定の手順で特定の形式に変換する。この変換手順を「符号化方式」(文字エンコーディング)という。

Unicodeにも標準の符号化方式がいくつか定められており、用途や処理の都合に応じて使い分ける。全体を総称して「UTF」と呼び、Unicodeでは “Unicode Transformation Format” の略、ISO/IEC 10646では “UCS Transformation Format” の略とされる。

UTFには「UTF-8」「UTF-16」「UTF-32」の3種類があり(UTF-7もあるがIETF独自拡張)、同じUnicode文字列でも符号化が違えばまったく異なるバイト列として表現される。文字データの保存・交換用として最も一般的に使われるのはUTF-8で、単にUnicodeといえばUTF-8でエンコードされたデータを意味することが多い。

UnicodeとISO/IEC 10646

ISO(国際標準化機構)とIEC(国際電気標準会議)の合同委員会(JTC 1)は、1980年代後半に国際的な文字コード標準の策定を目指し、仕様の検討を始めた。当初の構想は4バイトのコードを用いて既存の各国の文字コードをほとんどそのまま収録・統合するというものだった。

1991年に民間の企業連合であるUnicodeコンソーシアムが設立され、Unicode規格が発表されると、公的な標準と業界標準の分裂を避けるためISO/IECとの間で一本化の調整が行われることになった。議論の末、Unicodeの仕様をほぼそのままISO/IEC標準として採用することになった。

同年に発行されたUnicode 1.0規格をほぼそのまま取り込む形で1993年にISO/IEC 10646-1規格の初版が標準化され、以降はUnicode側と仕様を擦り合わせながら改訂されていった。両者は用語法など細かな点に違いがあるものの、収録文字など仕様の実質は同一となっている。

JISコード 【ISO-2022-JP】 ⭐⭐

国際的な文字コード規格の一つであるISO/IEC 2022の枠組みに沿って定義された日本語の文字コードの一つ。文字コードを7ビット単位で符号化する方式を定めている。

文字コード規格で各文字に付けられた番号を一定の規則で符号化する方式を定めたもので、「エスケープシーケンス」(escape sequence)という特殊な制御文字を挿入することにより複数の文字集合(いわゆる半角文字と全角文字など)の切り替えを行う。同じコードでも直前のエスケープシーケンス次第で別の文字を指し示すことがあるため、文字列は先頭から順に読み込まなければならないという制約がある。

ASCII文字コードで定義された制御文字やラテン文字(いわゆる半角英数字・記号)に加え、JIS X 0208で定義された日本語文字(ひらがな、カタカナ、漢字)やギリシャ文字、キリル文字、全角記号などを記述できる。いわゆる半角カタカナは含まれていない。

最初の仕様は1993年にRFC 1468として標準化され、1997年にはJIS X 0208の改訂版に収録され国内の公的な標準規格となった。その後、JIS X 0212で定義された文字を扱えるようにしたISO-2022-JP-1(RFC 2237)などいくつかのバリエーションが策定された。

Unicodeの普及以前に、Shift JISコード、日本語EUCコード(EUC-JP)と並んで古くからよく用いられてきた有力な日本語文字コードの一つである。特に、1990年代後半のインターネットの一般への普及の初期に、8ビット単位の文字コードが欧米で開発された電子メールソフトウェアなどと相性が悪かった(7ビットコードしか想定していないものが多かった)ことなどから、電子メールで日本語を扱う際の事実上の標準として広まった。

ピクセル 【画素】 ⭐⭐⭐

デジタル画像や画面などを構成する最小単位である、色のついた微細な点のこと。また、その数を表す単位。単位を表す場合は “px” と略記されることもある。

コンピュータは画像をデジタルデータとして扱うため、固有の色情報を持つ点が縦横に規則正しく並んだ集合として表現する。この点のことをピクセルと呼び、それ以上小さな単位に分割することができない最小の要素となっている。

色深度 (color depth)

一つの画素にどのような色情報を持たせることができるかは画像形式やソフトウェア、表示・印刷媒体によって異なる。一画素を何ビットの色情報で表現するかを「色深度」(color depth)と呼び、「bpp」(bits per pixel:ビット毎ピクセル)という単位で表す。

最も単純で情報量が少ないのは各画素が1ビットの色情報を持つ方式(1bpp)で、各画素は2種類の色(ビットの0と1にそれぞれ対応)のいずれかとなる。通常はこれを白と黒に対応付け、白黒画像(2値画像、モノクロ2値)として扱う。

様々な色を扱う場合は色深度を大きく取り、8ビット(256色)や16ビット(65,536色)、24ビット(約1677万色)などが用いられる。24bppでは光の三原色(RGB:赤緑青)の各色を8ビット(256段階)で表すことができ、人間の目で識別できるほとんどの色を表現できるとされるため、「フルカラー」「トゥルーカラー」などと呼ばれる。

物理媒体におけるピクセルとドット

ディスプレイ装置などによる画面表示やプリンタによる印刷面も、色のついた微細な点を縦横に規則正しく並べた構造となっており、これもピクセルと呼ぶ。物理的な単位として「ドット」(dot)を用いる場合もある。

特に、プリンタではデジタル画像における一つのピクセルを複数の微小なインク滴やトナーの集合で表現する場合があり、ピクセルを構成する物理的な最小単位としてドットを用いることがある(ドットをピクセルと同義とする場合もある)。

物理的な媒体では表示・印刷面におけるピクセルの細かさが機器や機種によって異なり、幅1インチあたりに存在するピクセルの数である「ppi」(pixel per inch:ピクセル毎インチ)や隣り合うピクセルの中心間の距離である「画素ピッチ」(pixel pitch)などの単位で表す。

サブピクセル (subpixel)

物理媒体上では画素の色を原色の組み合わせで表現するため、ディスプレイなどの発光体では赤・緑・青の光の三原色(RGB)に対応する発光素子を、印刷物などの反射体ではシアン・マゼンタ・イエローの色の三原色(CMY)に対応するインク滴などを隣り合わせて一つの画素を表現する。

人間の目には三色が組み合わさって一つの色に見えるが、拡大すると各画素ごとに三色が規則正しく並んでいる様子が分かる。画素をこれらの三色に分解した構成単位を「サブピクセル」(subpixel:副画素)と呼ぶことがある。

ソフトウェアや機器によっては画像の表現をより精細にするため、サブピクセル単位で表示や印刷を制御する「サブピクセルレンダリング」(subpixel rendering)が行われる場合もある。

解像度 【レゾリューション】 ⭐⭐⭐

機器などの性能の尺度の一つで、対象をどこまで細かく観測あるいは描写できるかを表すもの。ITの分野では、画像や画面、紙面などを構成する画素(ピクセル/ドット)の密度を指すことが多い。

コンピュータは画像を色の付いた微細な点あるいは格子を縦横に規則正しく敷き詰めた集合として取り扱う。この点の細かさ、すなわち、物理的な単位長さあたりの点の数(画素密度)のことを一般に解像度という。

解像度が高いほど点は微細になり、より精細できめの細かい表現が可能となるが、データ量は点の数に比例して増大し、保存や伝送に大きな容量を必要とする。解像度が低くなると次第に個々の点や格子が視認できるようになり、モザイク状のぼやけた表現となる。

ディスプレイやプリンタなどの出力装置の場合には、画面に表示する像や、紙面へ印刷する像の微細さを表す。イメージスキャナやカメラなど画像・映像の入力装置の場合には、取り込んだ光学的な像を画素に分解する細かさ(分解能)を表す。

解像度の単位

単位は一般に幅1インチ(約2.54cm)あたりに並ぶ点の個数である「ピクセル毎インチ」(ppi:pixel per inch)あるいは「ドット毎インチ」(dpi:dot per inch)が用いられる。例えば、100ppiなら1インチを100の点に分解して扱うことを意味し、一つの画素は直径0.254mmの円か幅0.254mmの格子となる。

ppiとdpiはコンピュータ上での画像データの画素と装置の取り扱う微細な点が一対一に対応する場合には同一だが、装置の原理によっては複数のドットの集合によって一つのピクセルを表現する場合もあり、そのような機器では後者の方が数倍から十数倍大きくなる。

ディスプレイの画面解像度

ディスプレイ装置では本来の解像度の意味である画素密度(ppi)の他に、慣用的に画面の構成画素数(総画素数)のことを解像度ということがある。横方向の画素数を縦方向の画素数をかけ合わせたもので、1920×1080といったように記述する。

同じ総画素数の機種同士でも、画面の物理的なサイズが異なれば画素の大きさも異なるため、本来の意味での解像度(画素密度)は異なる。歴史的な経緯から、よく使われる画素数には通称がついており、例えば640×480は「VGA」、1024×768は「XGA」と呼ばれる。

dpi 【ドット毎インチ】

主にプリンタやイメージスキャナなどで使われる解像度の単位で、幅1インチ(約2.54cm)を何個の点(ドット)で表現できるかを表す値。この値が高いほど、より精細な印刷や読み取りが可能となる。

例えば300dpiのプリンタは、紙面上の1インチ幅あたりに300個、面積1平方インチあたりに9万個の微細な点を印刷することができ、100dpiの機種に比べ、長さあたりで3倍、面積あたりで9倍の密度で表現することができる。

ディスプレイなどの表示装置では、解像度の単位として幅1インチあたりの画素(ピクセル)数を表す「ppi」(pixels per inch:ピクセル毎インチ)が用いられることがあるが、表示装置ではドットとピクセルも同じであるためdpiとppiも同義である。

プリンタは印刷品質を安定させるため、コンピュータ上の一つの画素(ピクセル)を十数個のインクやトナーの微細な点(ドット)の集まりとして印刷することが多く、その際のdpi値はppi値の数倍となる。

例えば、1600dpiのプリンタが一つのピクセルを縦横4つずつ、16のドットの集まりとして表現する場合、そのピクセル密度はdpi値の1/4の400ppiとなる。イメージスキャナにはこのような事情はないため、ディスプレイなどと同じようにdpiはppiは同義である。

GIF 【Graphics Interchange Format】

画像データを圧縮して記録するファイル形式の一つ。256色までの画像を無劣化で圧縮することができ、図やイラストなどの画像に向いている。

データを圧縮符号化する方式と、ファイルに記録する形式(ファイルフォーマット)の両方を定めている。ファイル名の標準の拡張子は「.gif」。圧縮時に内容の改変や画質の劣化を伴わない可逆圧縮(ロスレス:lossless)方式を用い、モノクロ(白黒2色)から256色(フルカラー1677万7216色から画像ごとに必要な色を選択)までの色を扱うことができる。

写真などの圧縮に適したJPEG形式とともに、初期のWeb(ウェブ)で標準的に用いられる画像形式として広く普及したが、2000年代半ば以降は仕様や特徴の多くが重複する「PNG」(Portable Network Graphics)も同じ目的で広く用いられている。

画像中の色を一つ選んで透過色(背景が透けて見える)とすることができる「透過GIF」、一部のデータを受信するだけで画像の全体像を確認することができる「インターレースGIF」など様々な拡張仕様がある。

パラパラ漫画の要領で複数の静止画像を連結して簡易な動画とすることができる「アニメーションGIF」というユニークな拡張仕様があり、動画データの再生ソフトなどを組み込まなくてもWebブラウザなどで短時間の簡易な動画を表示できることから人気を博している。現在では「GIF」という用語をこのアニメーションGIFの意味で用いる例も増えている。

歴史と特許問題

最初の仕様は1987年に当時のパソコン通信大手、米コンピュサーブ(CompuServe)社によって開発・公開され、現在よく用いられるのは1990年に発表された改訂版(GIF89a)である。

圧縮アルゴリズムとして米ユニシス(Unisys)社が特許を所有していた「LZW」という方式を用いており、同社は当初、特許使用料の徴収などは行わない方針だったが、広く普及すると方針を一転させ、ソフトウェア開発者にライセンス料の請求などを始めた。

これを嫌って一部のソフトウェアがGIF対応を取りやめるなど混乱が起き、代替形式として考案された特許を使用しないPNG形式の開発・普及が進んだ。2003年から2004年に各国のLZW特許が失効したため、現在では再び自由に使うことができる形式となっている。

JPEG 【Joint Photographic Experts Group】 ⭐⭐

静止画像のデータ圧縮形式の一つ。フルカラーの画像を多少の劣化を伴いながら高い圧縮率で符号化できるのが特徴で、写真など自然画像の記録に向いている。

画像の一部の不可逆的な変化や画質の劣化、情報の欠損を許容する代わりに極めて小さなデータに圧縮することができる「非可逆圧縮」(lossy compression)方式を採用しているのが大きな特徴で、圧縮前の状態に完全に復元することはできない。ファイル名の標準の拡張子は「.jpg」あるいは「.jpeg」である。

非可逆圧縮では画質の劣化の度合いが大きくなるほど圧縮率を高められるため、保存時にどの程度の画質とするかを係数の形で利用者が指定することができる。人間の目にはほとんど見分けがつかない画質でも元のデータの数分の一程度には圧縮することができ、最も低い画質では数十分の一から百分の一以下になることもある。

圧縮方式の特性やノイズの発生などから、図やグラフ、イラストなど同じ色が連続するのっぺりした質感の画像には向いておらず、写真や絵画など画素の色味が細かく変化する画像の保存に適している。このため、インターネットなどでは写真などの画像にはJPEGを使い、図表やアイコン、イラストなどの画像にはGIFやPNGなどで保存するなど、特徴の異なる画像形式を使い分けることが多い。

ベースラインとプログレッシブ

JPEGでは画像を8×8ピクセルの正方形の領域(ブロック)に分け、ブロックごとに色情報を記録していく。通常のデータ形式では左上のブロックから右下に向かって一段ずつ記録され、表示時には上から順番に画像が表示される。この方式を「ベースラインJPEG」という。

一方、各ブロックの情報を細かく分割し、何回かに分けて記録する方式も規定されており「プログレッシブJPEG」という。表示時にはまず全体がぼやけた画像で表示され、読み込みが進むにつれて次第に鮮明になっていく。低速回線で大きな画像を表示する際に素早く全体像が分かるため、Webサイトなどで用いられる。

ロスレスJPEG (Lossless JPEG/JPEG-LS)

JPEGでは元の状態に完全に復元できる「可逆圧縮」(lossless compression/ロスレス圧縮)を行う符号化方式も拡張仕様として追加されている。圧縮率は通常の非可逆圧縮を行う方式よりも悪いが、圧縮前の完全な画像を取り出すことができる。

1993年に追加された「Lossless JPEG」と1999年に追加された「JPEG-LS」の二方式があり、符号化方式やデータ形式が異なっている。後者の方が圧縮率が高く、復号後データのゆがみをパラメータで指定された誤差の範囲内に収めることができる「準可逆圧縮」(near-lossless compression/ニアロスレス圧縮)を行うこともできる。

可逆圧縮を行う画像形式としてはPNGなどが一般的であまり馴染みがないが、医用画像の保管システムなどに採用例がある。JPEGの後継規格のJPEG 2000やJPEG XR(HD Photo/JXR)には当初から可逆圧縮モードが用意されている。

標準規格

JPEG規格はISO/IEC JTC 1(ISOとIECの情報分野の合同委員会)とITU-Tの合同作業部会であるJoint Photographic Experts Groupが1992年に策定したもので、この部会の名称がそのまま画像形式の名称として用いられている。

策定された規格はITU-TではT.81として1992年に、ISO/IECではISO/IEC 10918として1994年に、ぞれぞれ標準化された。日本でも両規格を参照して同内容のものがJIS X 4301として1995年に国内規格化されている。

ファイル形式

JPEG規格では当初は画像データの圧縮符号化方式のみを定め、標準のファイル形式(コンテナフォーマット)を規定しなかったため、「JFIF」(JPEG File Interchange Format)と呼ばれる形式が広く普及し事実上の標準となった。

JPEG画像が保存されているファイル(拡張子が「.jpg」のファイル)は一般的にはJFIF形式か、あるいはその拡張形式のExif形式(カメラの撮影時などに使用)であることが多い。JFIF形式は2011年にITU-Tによって、2013年にISO/IECによってJPEG規格の一部として標準化されている。

BMP 【Windows bitmap image】

Windowsが標準で対応している画像データのファイル形式の一つ。通常は無圧縮でデータを記録する。Windowsで使用されるアイコン画像などでよく利用される。

白黒2値画像から24ビットフルカラー(1677万7216色)までの色数に対応し、透過色やアルファチャンネルを利用することもできる。256色などのモードはインデックスカラー方式で、約1678万色の中から選択した色がカラーパレット領域に記録されている。

標準ではデータ圧縮を行わず元のサイズのまま保存するため、無圧縮の画像形式と説明されることが多いが、仕様上はランレングス圧縮で可逆圧縮を行う方式についても定めている。ただし、圧縮モードによる記録・読み込みに対応しているソフトウェアは多くはない。

個別の機器の仕様から独立した画像形式とするため、数学などで用いられる座標系(原点から上と右に正、下と左に負)を用いて画素データの並び順を規定しており、他の多くの形式とは異なり、画面上では最も下に表示される画素列がファイルの先頭に、最も上の列が末尾に来るように記録される(特殊な指定により上から下に記録することも可能)。

BMPファイルをプログラム上で取り扱うためメインメモリ上にそのまま展開したデータ集合を「DIB」(Device Independent Bitmap)という。データ形式自体は同一であるため、DIBとBMPはあまり区別されずほとんど同義語のように用いられることが多い。

なお、「ビットマップ画像」「ビットマップ形式」とは、ベクター形式などと対比して、各画素の色情報を端から順番に並べた画像データの表現形式全般を表す用語であり、BMP形式(Windowsビットマップ)はその具体的な仕様の一つにすぎない。文脈によってはビットマップという語がBMPを指す場合もあり紛らわしいため注意が必要である

ビットマップ画像 【ラスター画像】 ⭐⭐⭐

画像データの表現形式の一つで、画像を色のついた点(画素/ピクセル)が縦横に規則正しく並んだ矩形として表現したもの。画面表示や印刷の際には最終的にこの形式で出力する必要がある。

ディスプレイ画面への表示やプリンタによる印刷はビットマップ形式で行われるため、コンピュータでも基本的には画像をビットマップ画像として表現・保存・処理することが多い。ファイル形式としては無圧縮のBMP(Windows Bitmap)、可逆圧縮のGIFやPNG、不可逆圧縮のJPEGなどが有名である。

任意の画像を表現することができ、特に写真など図形の組み合わせでは表現できない画像の保存に適しているが、内容についての幾何学的な情報などは持たないため、拡大や縮小、変形、合成などの処理を行うと内容が不可逆に変質し、画質の劣化、不鮮明化の原因となる。

ビットマップ画像は縦横それぞれの画素数が決まっており、その積が画像を構成する総画素数となる。例えば横1024ピクセル×縦768ピクセルの画像ならば78万6432画素の色情報が並んだデータとして表現される。画像形式によっては解像度(単位長さあたりに並ぶ画素数)の情報を持つものがあり、表示や印刷の際の画像の実際の大きさに反映される。

色情報と色深度

個々の画素が持つ色情報の大きさを色深度(color depth)と呼び、色情報のビット数(bpp:bits per pixel)で表す。例えば、色深度が1bppの場合は各画素は0と1の二値の色情報を持ち、通常は0を黒、1を白に対応付けた白黒画像のことを意味する。

色情報はRGB(Red-Green-Blue)形式など色自体の属性を直接表記したものと、色に番号をつけ、番号と実際の色情報(RGB値など)の対応関係を別のデータとして与えるインデックスカラー(indexed color)方式がある。16~32bppの場合は前者の方式(RGBの各値を5~8ビットずつ並べる)であることが多く、8bppの場合は後者の場合が多い。8bpp(256色)はインデックスカラー以外にもモノクロ256階調のグレースケール形式(白黒と254段階の灰色)にも用いられる。

また、色情報として透明色を設定したり、各画素ごとに透明度(アルファ値)を設定できる形式もあり、他の画像と重ね合わせたときに背後の色が透ける表現ができる。32bppの場合はRGB各8ビットに透明度8ビット(256段階)とすることが多い。

ベクター画像

一方、画像を図形を表す数値情報の集合として表現した形式はベクター画像(ベクトルグラフィックス)と呼ばれる。画像を点や線分、面などの図形の描画情報の組み合わせとして表したもので、画質を劣化させることなく自由に拡大・縮小や変形ができる利点がある。表示や印刷を行う際には最終的に特定の画素数のビットマップ画像に変換(ラスタライズ)される。

ベクター画像 【ベクターデータ】 ⭐⭐⭐

画像データの表現形式の一つで、画像を図形を表す数値情報の集合として表現したもの。拡大・縮小・変形しても画質が劣化せず、サイズや解像度によらず同じ品質の出力結果を得ることができる。

画像を単純な図形の集合として表現する方式で、輪郭などを構成する点の位置や、それらを結ぶ直線や曲線を表す方程式のパラメータ、変形・回転など操作情報、線や面の色情報などの組み合わせとして記述する。“vector” の表記は「ベクター」「ベクタ」「ベクトル」の揺れがあるが、意味の違いはない。

一方、画像を最小単位の小さな点である画素(ピクセル)の集合として表し、各画素の色情報を端から順に縦横に規則正しく並べた形式の画像データは「ビットマップ画像」(bitmap image)あるいは「ラスター画像」(raster image)と呼ばれる。

コンピュータのディスプレイやプリンタなどの出力装置はビットマップ方式で画像を扱うため、ベクター画像はそのままでは表示・印刷することができない。表示する際には画像の縦横の画素数を決めて、その範囲の中で実際に各図形を描画してビットマップ画像を得る。この描画処理のことを「ラスタライズ」(rasterization)という。

ビットマップ形式はどのような画像でも同じように記録できるが、ベクター画像は原理的に写真のような像の表現には向かず、文字や図、イラスト、デザインなど図形の組み合わせで表現しやすい像の記録に向いている。実際、コンピュータで扱う文字の形状データを収録したフォントデータの多くはベクター画像で表現されたアウトラインフォント(outline font)である。

ベクター画像を作成・編集するソフトウェアもあり、米アドビ社の「Adobe Illustrator」(アドビ・イラストレーター)などが有名である。汎用のベクター画像記録用の画像ファイル形式もいくつかあり、Illustrator標準の「AI形式」(.aiファイル)や、Webページなどでベクター画像を扱えるXMLベースの「SVG」(Scalable Vector Graphics)形式などがよく知られる。

加法混色 ⭐⭐

光(光源、発光体)で様々な種類の色を表現するときの色の混合方法。最も一般的な方式は、赤(Red)、青(Blue)、緑(Green)のいわゆる「光の三原色」を混合してすべての色を表現する手法で、そのような系を三色の頭文字を取って「RGB」と呼ぶ。

RGBによる加法混色の系では、赤と緑を混ぜると黄色、オレンジ色、茶色を、青と緑を混ぜると水色を、赤と青を混ぜると紫色を、三色を同じ強度で混ぜると黒、灰色、白を、それぞれ表現することができる。

これに対し、光を反射する媒体で色を表現する場合の色の混合方法は「減法混色」という。コンピュータのディスプレイ装置などは加法混色の系で、印刷物などは減法混色の系(CMYやCMYKなど)であるため、コンピュータで作成した文書などを印刷するためには系の変換が必要になる。

RGB 【Red-Green-Blue color model】

色の表現方式の一つで、赤・緑・青をそれぞれ様々な強度で混合し、すべての色を表現する方式。コンピュータで図形や画像、動画などを扱う際の標準的な色表現の一つで、ディスプレイ装置など加法混色の系で利用される。

赤(Red)・緑(Green)・青(Blue)の3色は「光の三原色」と呼ばれ、頭文字を繋ぎ合わせて「RGB」と呼ばれる。発光体の色は強度を高めるほど明るくなっていき、3色を最大の強度で足し合わせると白色となる。このような混色系を「加法混色」という。

絵の具など光の反射体は発光体とは逆の「減法混色」となるため、RGBの各色の強度と出来上がる色の対応関係は我々が日常的に慣れ親しんできた色の感覚とはズレている部分もある。

例えば、赤と青を混ぜると明るい紫になるのは日常感覚に近いが、赤と緑を混ぜると黄色、青と緑を混ぜると水色となる。3色の強度が同じだと無彩色(灰色)となり、すべて最大の強度なら白、最低の強度なら黒となる。

色深度とアルファ値

RGBの各色について、その強度を何段階のきめ細かさで区別するかにより、表現できる色の数が決まる。機器やソフトウェア、画像形式などが対応する最大発色数を「色深度」(カラーデプス)と呼び、色情報のビット数を「bpp」(bits per pixel)という単位で表現する。

人間の目から見て自然の光景と遜色ない色表現を実現するには各色8ビット(256段階)、合わせて24bpp(1ピクセルあたり3バイトの色情報)程度の情報量が必要と言われ、これを「フルカラー」(full color)あるいは「トゥルーカラー」(true color)という。

RGBの色情報に透明度(A:Alpha、アルファ値)を追加し、半透明の色を表現する方式もあり、RGBAカラーモデルという。例えば、アルファ値が50%の半透明に指定された画素は、その画素自体のRGB値を50%、背景にある画素のRGB値を50%の割合で合成した色で描画される。

CMYKとの違い

印刷など減法混色の系では「シアン」(Cyan:水色)、「マゼンタ」(Magenta:明るい赤紫色)、「イエロー」(Yellow:黄色)の強度の組み合わせで色を表現するCMY方式が用いられる。光の反射体の色を表す方式であるため日常の色の感覚に近い。

印刷では黒を他の色のインクの混色できれいに表現するのが難しいため、実用上はCMYに黒(K:Key plate)の強度を追加したCMYK方式がよく用いられる。印刷関連のソフトウェアにはRGBとCMYKの相互変換機能が内蔵されていることが多い。

減法混色 ⭐⭐

光を反射する媒体で様々な種類の色を表現するときの色の混合方法。最も一般的な方式は、水色(Cyan:シアン)、赤紫色(Magenta:マゼンタ)、黄色(Yellow:イエロー)の三色を原色として、これらの混合によりすべての色を表現する手法で、そのような系を三色の頭文字を取って「CMY」と呼ぶ。

CMYによる減法混色の系では、シアンとマゼンタを混ぜると青を、マゼンタとイエローを混ぜると赤を、イエローとシアンを混ぜると緑を、三色を同じ強度で混ぜると黒、灰色、白を、それぞれ表現することができる。印刷などで用いる場合には、カラーインクの混合でモノトーンを表現するとくすんだ汚い色になりがちなため、灰色や黒のインクを別に用意することが多い。三原色に黒を追加した系を「CMYK」という。

これに対し、光(光源、発光体)で色を表現する場合の色の混合方法は「加法混色」という。コンピュータのディスプレイ装置などは加法混色の系(RGBなど)で、印刷物などは減法混色の系であるため、コンピュータで作成した文書などを印刷するためには系の変換が必要になる。

階調 【階調数】 ⭐⭐⭐

コンピュータが画像を扱う際に、色の濃さや明るさを何段階で表現することができるかを表す数。この数が大きいほど細かな色や明るさの違いを表現できるが、画素あたりのデータ量は増大する。

自然界では色は光の波長によって異なり、連続量の一種だが、コンピュータで画像を扱う際にはこれを離散量(有限桁の数値)に変換する必要がある。その際、ある色の最も明るい(濃い)状態と暗い(薄い)状態の間を何段階で識別・表現することができるかを表す値が階調である。

モノクロの階調

最も単純な階調は白黒画像(モノクロ2階調)であり、すべての画素が真っ白と真っ黒のいずれかで表現される。色は「0」(黒)と「1」(白)の2値で識別され、各画素につき1ビットで表現することができる。

一方、一般に「モノクロ画像」あるいは「グレースケール画像」と呼ばれるものは白と黒の中間に明るさ(濃さ)の異なる複数の灰色を表現することができるものを指すことが多い。よく用いられる256階調(各画素の情報量は8ビット)のモノクロ画像では、白、黒、254段階の灰色の計256色を表現できる。

カラーの階調

カラー画像の場合は色を複数の原色に分解し、各色の階調の組み合わせで表現できる色の数が決まる。コンピュータ上で画像データを扱う際には色を赤(Red:R)・緑(Green:G)、青(Blue:B)の「光の3原色」に分解し、それぞれを同じ階調で表現することが多い。

人間の目にとって自然の光景と区別がつかない表現は、この各色について256段階(8ビット)程度の階調が必要であると言われており、これを「フルカラー」(full color)あるいは「トゥルーカラー」(true color)という。256の3乗で1677万7216色を表現することができる。

通常の用途ではフルカラーで十分なことが多いが、赤外線暗視映像のように特定の色味しか現れない特殊な表現の場合は単色256階調では色の境界が階段状になってしまうなど表現力が不足する場合がある。そのような状況にも対応できるよう、業務用の機器などでは内部的に各色10ビット(1024階調)や12ビット(4096階調)で表現するものもある。

ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる