高校「情報Ⅰ」単語帳 - 実教出版「図説情報Ⅰ」 - メディアの特性とコミュニケーション手段
アナログ ⭐⭐
機械で情報を扱う際の表現方法の一つで、情報を電圧の変化など連続的な物理量の変化に対応付けて表現し、保存・伝送する方式のこと。元の情報を高精度に表現することができるが、伝送や複製の際に劣化・変質を避けられない。
対義語は「デジタル」(digital)で、情報を離散的な数値に変換し、段階的な物理量として表現する。アナログで情報を扱う利点として、デジタル化では避けられない離散化に伴なう本来の信号からのズレ(量子化誤差)が生じないという点があり、情報の発生時点では正確に表現して記録することができる。
一方、保存や伝送、再生、複製に際して劣化やノイズによる影響を受けやすく、変化した情報は復元することができないため、伝送・複製を繰り返したり長年に渡って保存すると内容が失われたり変質してしまう難点がある。
かつて音楽の販売に用いられたレコード盤は、樹脂表面に刻まれた溝の凹凸の変化が音声信号の変化に直接対応付けられたアナログ記録方式だったが、コンパクトディスク(CD)では音声信号をサンプリング(標本化)して離散的な数値の列に変換し、これを表面の溝の凹凸にデジタル信号として記録している。
機器などの内部的にはデジタル処理が行われていても、人間には連続的に感じられる多段階の値で量を識別するような方式を便宜上アナログと呼ぶ場合がある。例えば、ゲーム機のコントローラの種類の一つで、方向の指示を多段階に滑らかに変化させられるものをアナログコントローラという。
1990年代頃までは、コンピュータなどによる情報のデジタル処理は限られた用途にのみ用いられてきたが、半導体チップやデジタル機器の性能向上や低価格化により、現代では身近な情報の多くがデジタル方式で保存、加工、伝送されるようになってきている。
比喩や誤用
コンピュータやデジタル方式の情報機器、通信サービスなどが普及するに連れ、旧来の機器や仕組み、考え方などを比喩的にアナログと称するようになった。
そのような用例の多くは情報の表現形式のデジタル・アナログとは無関係で、単に「コンピュータやインターネットによらない」という意味だったり、さらには「電気機械を使わない」ことを表していたりする。
中には本来の語義では誤用と思われる用例もある。例えば、ビデオゲームと対比してカードゲームやボードゲームを「アナログゲーム」と呼んだり、パソコンや電卓と対比してそろばんを「アナログな計算方法」と評することがあるが、これらが扱う情報は離散的な数値であり、電気機械を使っていないだけで情報の取り扱い方自体はデジタル的である。
デジタル 【ディジタル】 ⭐⭐
機械で情報を扱う際の表現方法の一つで、情報をすべて整数のような離散的な値の集合として表現し、段階的な物理量に対応付けて記憶・伝送する方式のこと。特に、情報を2進数の「0」と「1」の組み合わせに置き換えて表現する方式。
現代のコンピュータはデータをすべて2進数の値の列に置き換え、これをスイッチのオン・オフや電圧の高低など明確に区別できる2状態の物理量に対応させて保存・伝送する。これに合わせて、通信回線や記憶媒体などもデジタル方式で情報を取り扱うようになっている。
対義語は「アナログ」(analog)で、情報を連続した物理量で表現する方式を意味する。初期の情報機器はアナログテレビ放送や音楽レコードのようにアナログ方式で情報を記録・伝送していたが、現代ではコンピュータの普及に合わせて動画配信やCDのようにデジタル方式への置き換えが進んでいる。
デジタルで情報を扱う利点として、保存や伝送、再生、複製などを行う際に劣化やノイズの影響を受けにくく、伝送・複製を何度繰り返しても内容が変化しない点や、様々な種類の情報を数値の集合として同じように扱うことができ、情報の種類によって媒体の選択に制限を受けない点などがある。ただし、連続的に変化する信号を離散値に変換する際に、必ず本来の信号からのズレ(量子化誤差/標本化誤差)が生じる。
機器などの内部的にはデジタル処理が行われていても、人間には連続的に感じられる多段階の値で量を識別するような方式を便宜上アナログと呼ぶ場合がある。例えば、ゲーム機のコントローラの種類の一つで、方向の指示を多段階に滑らかに変化させられるものをアナログコントローラという。
比喩や誤用
コンピュータやデータ通信、デジタル方式の記憶媒体などが普及するに連れ、「デジタル」という語をコンピュータやインターネットに関連するものの総称、「アナログ」をその逆、すなわち「電気・電子技術に依らないもの」とする比喩的な用法が広まった。
このような用例の多くは本来の情報の表現形式の違いとは無関係に用いられるため、カードゲームやボードゲームなどをビデオゲームに対比して「アナログゲーム」と呼んだり、そろばんを計算機と対比して「アナログな計算方法」と呼んだりするが、これらは離散的な数値しか扱わないため、情報の扱い方そのものはデジタル的である。
サンプリング 【標本化】 ⭐⭐⭐
対象全体の中から何らかの基準や規則に基いて一部を取り出すこと。統計調査などで少数の調査対象を選び出すことや、信号のデジタル化などで一定周期で強度を測定することなどを指す。
アナログ信号のサンプリング
信号処理の手法の一つで、アナログ信号などの連続量の強度を一定の時間間隔で測定し、観測された値(標本値)の列として離散的に記録することを標本化ということが多い。デジタルデータとして記録したい場合は、値を整数などの離散値で表す「量子化」(quantization)処理が連続して行われる。
測定の間隔を「標本化周期」(sampling cycle:標本化周期)、その逆数である測定の頻度(単位時間あたりの回数)を「標本化周波数」(sampling frequency:標本化周波数)という。頻度の多寡は通常標本化周波数で表現され、単位として1秒あたりの回数を表す「Hz」(ヘルツ)が用いられる。
例えば、音声を44.1kHz(キロヘルツ:Hzの1000倍)で標本化する場合、音声信号の強度を毎秒4万4100回記録し、音声データを1秒あたり4万4100個の数値の列として表現する。44.1kHzは人間の可聴音をほぼカバーする周波数とされ、CD(コンパクトディスク)などの音声記録に用いられている。
統計・調査におけるサンプリング
統計や調査などの分野では、調査したい母集団全体を対象とすることが困難な場合に、集団を代表する少数の標本を抽出して対象とし、その結果から統計的に母集団の性質を推計する手法を標本化という。製品の出荷時検査や社会調査などで広く用いられ、標本から母集団の推定値を算出する方法や偏りのない標本の抽出方法などについて様々な手法が提唱されている。
音楽におけるサンプリング
音楽の分野では、楽曲の制作手法の一つで、既存の楽曲や何らかの音源からメロディや歌詞、あるいは音声そのものの断片を抽出し、引用したり繋ぎ合わせる技法を標本化という。また、録音した楽器の音や環境音、人や動物の声などを短い単位に分解し、再構成して楽曲に仕上げる手法のことを標本化ということもある。
量子化 ⭐⭐⭐
アナログ信号などの連続量を整数などの離散値で近似的に表現すること。自然界から取り込んだ信号などをコンピュータで処理・保存できるようデジタルデータに置き換える際などによく行われる。
音や光、電気、電波など物理現象に伴う信号は本来連続量であるため、そのままではコンピュータなどの電子回路で取り扱うことができない。そこで、一定の決まった間隔で信号の強度を測定(標本化/サンプリング)し、決まった細かさの段階に当てはめて表していく。
例えば、4段階の値で量子化を行う系では、信号強度の測定値(標本)は0、1/3、2/3、1の中から最も近い値が選ばれる。0.1に近い標本は0、0.4に近い標本は1/3といった具合である。この段階の数が多いほど元の信号をより高い精度で忠実に表現することができるが、量子化後のデータ量はその分だけ増大する。
この細かさをビット数で表したものを「量子化ビット数」と呼び、これが1ビットであれば2段階(21)、8ビットならば256段階(28)、16ビットならば65,536段階(216)の細かさで強度を表現できる。
エンコード 【符号化】 ⭐⭐⭐
ある形式の情報を一定の規則に従って別の形式に変換すること。元の形式に復元可能な状態に変換することを指し、データ圧縮や暗号化、文字コードの変換などが該当する。
ある形式のアナログ信号やデジタルデータを特定の形式の符号(code)に置き換える操作を指す。得られた符号列に逆方向の変換を行って元の状態に戻す操作は「デコード」(decode)という。デコードによって符号化前の状態を復元することができるが、非可逆圧縮など完全に元の状態には戻せない方式もある。
例えば、動画データは極めてデータ量が大きいため、符号化処理によってデータの間引きや圧縮を行い、短い符号列に置き換えてから保存や伝送を行う。圧縮されたデータはそのままでは再生できないため、再生時にはデコード処理によって元のデータを取り出してから表示を行う。
ある方式の符号化処理を行う装置やソフトウェアを「エンコーダ」(encoder)、その方式でデコード処理を行うものを「デコーダ」(decoder)という。音声の録音と再生、映像の録画と再生など、状況に応じてどちらも行う可能性がある場合には、両者を一体化した「コーデック」(codec:encoder-decoder)を用いる。
ビット ⭐⭐⭐
情報量の最小単位で、二つの選択肢から一つを特定する情報の量。コンピュータなどでは0と1のいずれかを取る二進数の一桁として表される。
語源は “binary digit” (二進法の数字)を繋げて省略した表現と言われる。情報をすべてビット列に置き換えて扱うことを「デジタル」(digital)という。1ビットのデータが表す情報量は、投げたコインの表裏のように、二つの状態のいずれであるかを示すことができる。
複数のビットを連ねて一つのデータとすることで、2ビットなら4状態(22)、3ビットなら8状態(23)といったように、より多い選択肢を識別できる。一般に、nビットのデータは2のn乗個までの選択肢からなる情報を表現することができる。
例えば、大文字のラテンアルファベットは「A」から「Z」の26文字であるため、これを識別するのには4ビット(16値)では足りず、5ビット(32値)が必要となる。小文字を加えると52文字であるため、6ビット(64値)が必要となる。
派生単位
データの読み書きや伝送を行う場合、その速さを表す単位として1秒あたりの伝送ビット数であるビット毎秒(bps:bit per second)という派生単位が用いられる。
また、実用上はビットでは値が大きくなりすぎて不便なことも多いため、8ビットをまとめて一つのデータとした「バイト」(byte)という単位を用いる場面も多い。かつて何ビットを1バイトとするか機種により様々に分かれていた(7ビットバイトや9ビットバイトなどが存在した)名残りで、8ビットの集まりを「オクテット」(octet)とも呼ぶ。
倍量単位
大きな量を表す際には、SI単位系に則って接頭辞を付した倍量単位を用いる場合がある。
- 1000ビットを「キロビット」(kbit:kilobit)
- 100万ビットを「メガビット」(Mbit:megabit)
- 10億ビットを「ギガビット」(Gbit:gigabit)
- 1兆ビットを「テラビット」(Tbit:terabit)
- 1000兆ビットを「ペタビット」(Pbit:petabit)
- 100京ビットを「エクサビット」(Ebit:exabit)
という。また、コンピュータでは2の冪乗を区切りとするのが都合が良いことが多いため、独自の接頭辞を付した倍量単位が用いられることもある。
- 210(1024)ビットを「キビビット」(Kibit:kibibit)
- 220(約104万)ビットを「メビビット」あるいは「ミービビット」(Mibit:mebibit)
- 230(約10億7千万)ビットを「ギビビット」(Gibit:gibibit)
- 240(約1兆1千億)ビットを「テビビット」あるいは「ティービビット」(Tibit:tebibit)
- 250(約1126兆)ビットを「ペビビット」あるいは「ピービビット」(Pibit:pebibit)
- 260(約115京)ビットを「エクスビビット」あるいは「イクシビビット」(Eibit:exibibit)
という。この2進専用の接頭辞はIEC(国際電気標準会議)が標準化しており、一般にはあまり馴染みがないが記憶容量の表記などで用いられることがある。
バイト ⭐⭐⭐
情報量の単位の一つで、8ビットのこと。数としては2進数を8桁並べたものに相当し、2の8乗で256種類の異なる状態を表現することができる。
情報量の最小の単位である「ビット」(bit)は2つの状態(0と1、オンとオフなど)を識別できるが、バイトは8ビットをまとめて一つの単位としたもので、各ビットの状態の組み合わせで256の状態を識別することができる。
単位として数値の後に付ける際にはアルファベット大文字の「B」が用いられるが、ビットを小文字の「b」で表すことが多いため、両者の混同を避けるために「byte」あるいは「bytes」と省略せずに(同様にビットは「bit」「bits」)記すことも多い。通信速度を表す場合は1秒あたりに伝送可能なバイト数を「バイト毎秒」という単位で表す。記号は「B/s」または「Bytes/s」を用いる。
接頭辞付きの単位
大きな量を表す場合はSI単位系に定められた接頭辞を付加し、1,000倍あるいは1,024倍ごとにキロバイト(KB:kilobyte)、メガバイト(MB:megabyte)、ギガバイト(GB:gigabyte)、テラバイト(TB:terabyte)などの単位を用いる。接頭辞は他の物理量のように1,000の累乗倍を表す場合と、情報処理の分野で切りの良い1,024(2の10乗)の累乗倍を表す場合があり、混乱が生じている。
IEC(国際電気標準会議)では1,024倍を表す場合は「KiB」(kibibyte、キビバイト)、「MiB」(mebibyte、メビバイトまたはミービバイト)、「GiB」(gibibyte、ギビバイト)、「TiB」(tebibyte、テビバイトまたはティービバイト)など専用の接頭辞を用いるよう提唱しているが、現状ではあまり定着していない。
nビットバイトとオクテット
もともと1バイトが何ビットか明確な定義はなく、機種や処理系によって都合の良いビット数が割り当てられていた。1バイトをnビットで表すことを「nビットバイト」と呼び、1980年代頃までは「6ビットバイト」や「7ビットバイト」など、8ビット以外のバイトを単位とするコンピュータもあった。
このようなバイトの定義の曖昧さを避けるため、必ず8ビットを表す単位として「オクテット」(octet)が用いられることがある。通信プロトコルの仕様書のように、機種や処理系の違いを超えて共通して利用される可能性がある文脈では、古い時代の名残りで現在でもバイトと言わずにオクテットが好まれる場合がある。
なお、現代では歴史的な文脈以外で8ビット以外のバイトが用いられることはなくなったため、2008年に国際電気標準会議(IEC)がIEC 80000-13規格の改訂版で正式に1バイトを8ビットであると定義した。
10進数 【10進法】 ⭐⭐
数を書き表す方法(記数法)の一つで、基数を十とした表記法のこと。人間が普段最も一般的に利用している位取り記数法で、通常、アラビア数字の「0」から「9」までのすべての数字を用いて数を表現する。
10進法では桁が一つ左へ移動する毎に値の重みが十倍に、右へ移動するごとに十分の一になる。すなわち、整数の右端の桁は一(100)の位、その左は十(101)の位、その左は百(102)の位、その左は千(103)の位、といった具合に各桁の重みが決まる。
コンピュータでは二つの状態の組み合わせで数値を表現する2進数の方が都合が良いため、人間などが10進法で入力した値は内部でまず2進数による表現に変換されてから記録、伝送、計算などを行うようになっている。また、処理結果を人間などに提示する場合も、内部の2進数による表現から10進法の表記に変換して出力される。2進表現を「バイナリ」(binary)、十進表現を「デシマル」(decimal)と呼ぶことがある。
「10進」と「十進」
どのような基数の表記でも、右から2桁目が1で右端が0の値はすべて「10」となり、それらはすべての異なる値である(2進数の「10」は2、8進数の「10」は8、16進数の「10」は16である)ため、基数が十であることを示すために「10進数」「10進法」とするのは紛らわしく不適切であるとする考え方もあり、そのような場合は「十」 (同様に英語圏では “ten” あるいは “decimal” )という表記が好まれる。
2進数 【二進数】 ⭐⭐⭐
数を書き表す方法(記数法)の一つで、基数を2(二)とした表記法のこと。アラビア数字の「0」と「1」を用いてすべての数を表現する。情報を2進法の値の連なりとして表現する手法を「デジタル」(digital)という。
普段我々が日常的な数字の読み書きや算術に用いる位取り記数法は「10進数」(十進数)で、一つの桁の表現に「0」から「9」の10種類の数字を使い、各桁の左の桁が10倍、右の桁は1/10を表している。
一方、2進法は一つの桁の表現が「0」と「1」の二通りしか無い記数法で、桁が一つ左へ移動する毎に値の重みが2倍に、右へ移動するごとに1/2倍になる。整数の右端の桁は1(20)の位、その左は2(21)の位、その左は4(22)の位、その左は8(23)の位…といった具合に各桁の重みが決まる。
<$Fig:binarynumber|center|true>例えば、2進法の「1101」は左端から順に「8の位」が1、「4の位」が1、「2の位」が0、「1の位」が1であるため、10進数では 1×8 + 1×4 + 0×2 + 1×1 の「13」となる。逆に、10進数の「21」は、2のべき乗の足し算で表すと 16 + 4 + 1、すなわち 24×1 + 23×0 + 22×1 + 21×0 + 20×1 と表せるため、2進数では「10101」となる。
2進数とビット・バイト
2進法は二つの状態の組み合わせですべての数を表現することができるため、これをスイッチのオン・オフや電圧の高低、磁石のN極とS極、電荷の有無など、対となる物理的な状態に対応させることにより、機械による情報の記憶や伝達、演算を容易に取り扱うことができるようになる。
現代の電子式のコンピュータは原則としてすべての情報を2進法のデータに置き換えて処理を行い、2進法の1桁に相当するデータ量の最小単位を「ビット」(bit)という。実用上はある程度まとまった桁数のビット列を対象にデータの保存や操作を行うため、8ビットに相当する「バイト」(byte)という単位が用いられることが多い。1バイトは8桁の2進法に相当するため、28=256種類の状態を表現できる。
16進数 【16進法】 ⭐⭐⭐
数を書き表す方法(記数法)の一つで、基数を16(十六)とした表記法のこと。アラビア数字(算用数字)の「0」から「9」、およびアルファベットの「A」から「F」を用いてすべての数を表現する。
普段我々が日常的な数字の読み書きや算術に用いる位取り記数法は10進数(十進数/10進法)で、一つの桁の表現に「0」から「9」の10種類の数字を使い、各桁の左の桁が10倍、右の桁は10分の1を表している。
一方、16進法では1の位、16の位、256の位…というように桁の重みが16倍ずつ変化する。16進法における「10」は10進数における「16」を意味する。小数点以下も同様で、小数点の右隣から順に、16分の1の位、256分の1の位、4096分の1の位…というように続く。
コンピュータはすべてのデータを2進数で表しており、これを8桁(8ビット)ずつまとめた「バイト」という単位でデータを取り扱う。16進法は一桁で2進数の4桁分(4ビット)の値を書き記すことができるため、1バイトのデータを「00」から「FF」までの2桁の16進法として表記する慣習がある。
表記法
<$Fig:hexadecimal|right|true>10進数の表記には「0」から「9」まで10種類の数字が必要なように、16進法では一桁を16種類の数字で表す必要がある。我々が日常的に使う数字は10種類しかないため、10から15までの数を一桁で表現するために「A」から「F」までの6つのアルファベットで代用することが多い。
その場合、「0」から「9」までは10進数の値と同じで、10進数の10を「A」、11を「B」、12を「C」、13を「D」、14を「E」、15を「F」でそれぞれ表す。例えば、「A0」は10進数の「160」(16×10)、「FF」は「255」(16×15+15)を表す。言語や処理系によるが、大文字と小文字は区別しない(どちらでもよい)ことが多い。
なお、複数の位取り表記法が混在する文書などの場合、記された数値がそれぞれ何進法なのかを明示するため「(9ABC)16」「(1234)10」のように右下に小さく10進表記で基数を記す場合がある。
各言語における表記
プログラミング言語やマークアップ言語などの数値リテラルでは、日常的な文書などと同じように単に数字を並べた表記は10進数とみなす場合が多く、16進法を記述する場合は先頭に特定の接頭辞を付けるなど特別な表記法を用いる。
多くの言語ではC言語などにならって「0xDEAD」のように先頭に「0x」を付記する表記法を採用しており、文字列中のコード参照では「¥x0D¥x0A」のように「¥x」(日本語圏以外では¥はバックスラッシュ)を用いる。
言語によっては「#x」(Schemeなど)「&h」(BASICなど)などを用いたり、末尾に「h」を付ける(一部のアセンブリ言語など)場合もある。HTMLやXMLなどにおける数値文字参照では「♪」のように「&#x」と「;」で挟む。
補数 【余数】 ⭐⭐
ある自然数をn進数(n進法)で表現した時に、足し合わせるとちょうど「nのべき乗」か「nのべき乗-1」になる自然数のうち、最小のもの。前者は「足すとちょうど桁が一つ増える数」で「基数の補数」と呼ばれる。後者は「足しても桁が増えない最大の数」で「減基数の補数」と呼ばれる。
例えば、10進数の65という数に足し合わせるとちょうど一つ桁上りする自然数は、足すと100になる35であり、(10進数における)「65に対する10の補数」という。また、足しても桁が増えない最大の数は、足すと99になる34であり、(10進数における)「65に対する9の補数」という。
1の補数 (one's complement)
ある自然数を2進数(2進法)で表現したときに、足し合わせるとすべての桁が1になる最大の数のことを「1の補数」という。足してもギリギリ桁が増えない最も大きな数である。
たとえば、「10010110」に対する1の補数は「1101001」であり、両者を足し合わせると「11111111」(8桁すべてが1)となる。コンピュータで取り扱う際には、各桁の0を1に、1を0にするビット反転によって求めることができ、それに1を加えたものは2の補数となる。
2の補数 (two's complement)
ある自然数を2進数(2進法)で表現した時に、足し合わせると桁が増える最小の数を「2の補数」という。足すと一桁増えて先頭の桁が1、残りの桁が0となる数である。
例えば、「10010110」に対する2の補数は「1101010」であり、両者を足し合わせると「100000000」(桁が一つ増えて既存の8桁がすべて0)となる。コンピュータで取り扱う際には元の数のビット反転によって求められる1の補数に1を足せば2の補数となる。コンピュータ上での負の整数の表現や減算の実装などによく用いられる。
QRコード 【Quick Response code】 ⭐
データを平面上の正方形の領域に表された図形パターンで表すことができる2次元コードの方式の一つ。現在のデンソーウェーブが1994年に開発したもので、「QRコード」は同社の登録商標。1999年にJIS X 0510、2000年にISO/IEC 18004として標準化され、様々な分野で広く普及している。
小さな正方形の点を縦横同じ数だけ並べたマトリックス型2次元コードで、一辺に21個並べた「バージョン1」から、177個並べた「バージョン40」まで、40通りの仕様が用意されている。点の数が多いほうがたくさんの情報を記録できるが、必要な面積は大きくなっていく。
コード領域の三方の角には、中心が黒く塗りつぶされた大きな「回」の字型の「切り出しシンボル」(ファインダパターン)が配置されており、360度どの向きから読み取っても正確に情報が読み出せるようになっている。
記録できる情報量はバージョン40の場合で最大23,648ビットである。文字は独自のコード体系および符号化方式で表され、カナや漢字を含む文字列は最長1,817文字、アルファベットと数字だけなら4,296文字、数字だけなら7,089文字まで記録できる。
データには冗長性を持たせてあり、一部が汚損して読み取れなくてもデータを復元することができる。誤り訂正率は5段階から選択でき、最も低いもので約7%、最も高いもので約50%までの汚損に対応できる。誤り訂正率は高いほどより多くの冗長なデータが必要となるため、記録できるデータ量はその分少なくなる。
同社では自動車工場のカンバン(現品札)の自動読み取り、倉庫や配送の管理の効率化など、産業機器の自動化推進の一環としてQRコードを開発したが、汎用性の高さ、データ密度の高さ、高度な誤り訂正機能、読み取り向きが自由であるなど使い勝手の良さ、関連特許を開放して利用料を求めなかったことなどから、IT分野を中心に広く浸透している。
携帯電話のカメラ機能と組み合わせてインターネット上のURLやメールアドレス、サービス上のID情報などの告知や伝達に使われたり、乗り物の乗車券や搭乗券、イベントや施設のチケットレス入場、キャッシュレス決済などでよく用いられる。
パリティチェック 【奇偶検査】 ⭐
データの誤り検出方式の一つで、ビット列中に含まれる「1」の数が偶数か奇数かを表す符号を算出してデータに付加する手法。最も単純な誤り訂正符号で、1ビットの誤り検出しかできないが算出や検証が容易で高速なため広く普及している。
データはコンピュータ上では「0」と「1」が並んだビット列として表されるが、これを一定の長さのブロックごとに区切り、各ビットの値を足し合わせた値が奇数であるか偶数であるか(「1」の数が奇数か偶数か)を表す1ビットの値(パリティビット)を末尾に付加する。
パリティを含むデータを受け取った側は、各ブロックごとに同じようにパリティを算出し、付加されたものと比較する。両者が一致すれば、そのブロックには誤りが存在しないか偶数個あることが分かり、一致しなければ奇数個の誤りがあることが分かる。
実用上、短く区切られたブロック中に同時に複数の誤りが生じる確率は低いため、パリティが一致すれば誤りが無く、一致しなければ1ビットの誤りが生じたとみなしてデータの再送や破棄などの制御を行う。
偶数パリティと奇数パリティ
パリティビットの値は、ブロックの各ビットとパリティを足し合わせた時、その偶奇性が常に同じになるように設定される。
全体の和が偶数になるように決められる(ブロック中の1の数が奇数なら1、偶数なら0)ものを「偶数パリティ」(even parity)、奇数になるように決められる(1の数が奇数なら0、偶数なら1)ものを「奇数パリティ」(odd parity)という。
水平パリティと垂直パリティ
一定の長さのブロックごとにパリティを算出して末尾に付加する方式を「垂直パリティ」(vertical parity)と呼び、単にパリティチェックといった場合はこの方式を指すことが多い。
一方、連続する数ブロックごとに、各ブロックの同じ位置にあるビット群をグループ化してパリティを算出・付与する方式を「水平パリティ」(horizontal parity)という。
両者を併用した「垂直水平パリティ」が用いられる場合もあり、パリティ用の記憶容量は約2倍必要になるが、同じブロック中の偶数個の誤りを検出したり、1ビットの誤りの訂正を行うことができる。
パリティビット 【パリティデータ】 ⭐⭐
データの伝送や記録の際に生じる誤りを検知できるように算出・付加される符号の一つで、ビット列中に含まれる「1」の数が偶数か奇数かを表すもの。これを利用した誤り検出方式を「パリティチェック」(parity check)という。
データを0と1が並んだビット列で表したときに、各ビットの値を足し合わせた値が奇数であるか偶数であるか(「1」の数が奇数か偶数か)を1ビットの値として表す。
和が奇数のときに1とする(偶数なら0)ものを「偶数パリティ」(even parity)、偶数のときに1とするものを「奇数パリティ」(odd parity)という。パリティを足すことでどのビット列も偶奇性が同じになる(偶数パリティを含めた全ビットの和は常に偶数)という意味でこのように呼ばれる。
データの送り手(送信者や書き込み時)は元のデータに対して一定の長さごとにパリティビットを算出して付加する。受け手(受信者や読み込み時)は受け取ったデータから同じようにパリティビットを算出し、付加されたパリティビットと比較する。
両者のパリティビットが一致すれば、パリティを含めたビット列中には誤りが存在しないか偶数個存在し、一致しなければ奇数個の誤りが生じていることが分かる。一つのパリティビットだけではどの位置に誤りがあるかは分からず、正しい値に訂正することはできない。
バースト誤りのような特殊な状況を除き、通常の用途では短いビット列中に同時に複数の誤りが生じる可能性は低いため、実用上はパリティビットが一致しなければ1ビットの誤りが含まれ、一致すれば誤りが生じていないとみなすことが多い。
データ圧縮 【圧縮符号化】 ⭐⭐⭐
データを一定の計算手順で加工し、実質的な内容を損なわずにより短い符号列で表すこと。原則として得られた符号は逆の計算手順により元のデータに復元することができ、データの一部を損なって容量を減らす削減や間引きとは異なる。
同じ情報を短いデータ長で表現することで、記憶装置上で占有する領域を小さくすることができ、また、機器間をより短い時間や少ない回線の占有度で伝送することができる。ただし、圧縮後の符号列は元のデータを扱う処理系では利用できないため、使用前に必ず元の状態に戻す処理が必要となる。この復元処理は「解凍」「伸長」「展開」などと呼ばれる。
圧縮処理や解凍処理に費やされる計算量や計算時間などと引き換えにデータ量の縮減という成果を得ており、両者が見合わなければ圧縮を行う意義は失われる。例えば、データ伝送を高速化するためにデータ圧縮を導入したのに、圧縮、伝送、解凍の合計時間が元データの伝送時間を上回ってしまっては元も子もない。
圧縮の逆変換の呼称
圧縮(compress)後の符号列から元のデータを復元する逆方向の変換処理のことを英語では “decompress” (compressに否定の接頭辞de-を付したもの)というが、日本語では定まった訳がなく、解凍、伸長、展開などの用語が用いられる。
ファイルのアーカイバでは複数のファイルを一つの圧縮ファイルにまとめることが多いため、その中から指定されたものを取り出して元の状態に戻すことを「抽出」ということもある(英語でもこの文脈では “extract” を用いる)。
日本では1980年代にパソコン通信やファイル圧縮ソフトの付属文書などを通じて「解凍」という用語が広まった(対応して圧縮のことを凍結と呼ぶこともあったがこれは広まらなかった)ため、慣用的に解凍と呼ぶことが多いが、本来の語義として圧縮と解凍では意味が対応しておらず、解凍には容積の増減の意味はないことなどから批判も多い。
一方、伸長や展開は、伸ばす、広げるという意味は合っているが、圧縮の逆の動作としての元に戻すという意味合いは薄いとの批判もあり、あまり定着していない。
圧縮率と圧縮比
どのくらい圧縮できたかを圧縮率という用語で表すことがある。より小さい量に圧縮できたことを「圧縮率が高い」という。
実際には二つの異なる指標が圧縮率と呼ばれており、一つは圧縮後のデータ量の元のデータ量に対する比率、もう一つは削減量の元の量に対する比率である。いずれを指すのかは文脈により異なる。圧縮後にデータ量が元の10分の1になったことを、前者の指標では圧縮率10%、後者では90%と表現する。
一方、圧縮前と後のデータ量の比や倍率で圧縮の程度を表すこともあり、データ圧縮比と呼ばれる。10分の1に圧縮したことを10:1あるいは10倍と言い表す。
可逆圧縮と非可逆圧縮
完全に元のデータに戻せる符号列に変換する方式を「可逆圧縮」、元のデータの一部を削除・変形することで高い圧縮率を得る代わりに完全には元に戻せなくなる方式を「非可逆圧縮」あるいは「不可逆圧縮」という。
可逆圧縮はわずかでもデータの一部が異なれば元とはまったく違う意味になってしまう文字(テキスト)データやコンピュータプログラムの圧縮や汎用のファイル圧縮などで用いられ、通常単にデータ圧縮といえば可逆圧縮を指す。
非可逆圧縮は主に画像や音声、映像など元のデータに大きな情報の冗長性が含まれる対象に用いられる。人間の視覚や聴覚の特性を利用して、人間が気づきにくい形でデータの一部を改変・削除することで、劇的な高圧縮率を得ることができる。
元の情報を損なう変換を伴うため、非可逆圧縮は厳密にはデータ圧縮手法の一部ではないとする立場もある。また、非可逆圧縮アルゴリズムの中には、元データの形式変換や加工(この段階ではデータ長の縮減は伴わない)を行った後、データ圧縮自体は連長圧縮などの可逆圧縮により行う(すなわち、「非可逆」の工程では圧縮していない)ものも多い。
可逆圧縮 【ロスレス圧縮】 ⭐⭐⭐
データ圧縮方式のうち、圧縮符号化の過程で元のデータを一切毀損せず、完全に元通りに復元できるように圧縮する手法のこと。主にファイル圧縮や通信プロトコルなど、データの種類を特定しない汎用の保存形式や伝送方式で用いられる。
コンピュータプログラムや文字(テキスト)などのデータは、1ビットでも欠けたり変質するとその意味する内容自体が変わってしまうため、圧縮したデータを展開(解凍)したときに元のデータと完全に一致する可逆圧縮が行われる。
一方、画像や動画、音声などの場合には、人間の視聴覚が違いを感じ取りにくいように一部を省略・改変することで実質的な内容を維持しつつ劇的に圧縮率を高める「非可逆圧縮」(不可逆圧縮)が行われることがある。可逆圧縮は元のデータを完全に保存できるが、非可逆圧縮に比べ圧縮率は低い。
主な可逆圧縮アルゴリズムとしてはランレングス符号やハフマン符号、LZ77、LZSS、LZW、Deflateなどが知られる。ZIPやCAB、LZH、RAR、gzip、bzip2など汎用のファイル圧縮形式はすべて可逆圧縮を用いる。画像圧縮ではJPEGなどが非可逆圧縮、GIFやPNG、WebP、AVIF、Loassless JPEGなどが可逆圧縮である。
また、通常は非可逆圧縮が用いられることが多い音声圧縮でも、「ALAC」(Apple Lossless)や「FLAC」「WMA Lossless」など高音質のために可逆圧縮を用いるファイル形式があり、「ロスレス音源」と総称される。
なお、非可逆圧縮は実際には元のデータを圧縮しやすい状態に変換し、圧縮符号化自体は可逆圧縮アルゴリズムを用いて行うため、正確には圧縮方式そのものが可逆と非可逆に分かれているわけではないが、実用的にはこの変換処理も含めて圧縮方式や圧縮形式の仕様の一部とみなされるため、便宜上このような区分が常用されている。
非可逆圧縮 【不可逆圧縮】 ⭐⭐⭐
データ圧縮方式のうち、圧縮符号化の過程でデータの一部の欠落や改変を許容することで極めて効率よく圧縮する手法のこと。非可逆圧縮されたデータを伸長(解凍)しても元のデータには完全には一致しない。
コンピュータプログラムや文字などのデータは1ビットでも変化すればその意味する内容自体が変わってしまうが、画像や動画、音声などはデータ上は細部が僅かに異なっていても人間の視聴覚には違いが気付きにくい場合がある。
このような特性を活かし、人間が認識しにくい手法で元のデータの一部を省略・改変したり、別の表現形式へ変換するなどして、効率よく短い符号に圧縮する方式を非可逆圧縮という。
元のデータを一切毀損しない可逆圧縮とは異なり完全に元のデータを復元することはできないが、人間にほとんど違いがわからない程度の改変でも劇的に圧縮率を高めることができる利点がある。また、多くの方式では圧縮時に品質劣化の程度を指定することができ、品質を犠牲にして極端に小さな容量に圧縮することもできる。
画像や動画、音声の圧縮形式の多くが非可逆圧縮を採用しており、JPEG、MPEG-1、MPEG-2、MPEG-4、H.264、H.265、MP3、AAC、WMAなど主要なデータ形式のほとんどが非可逆となっている。用途に応じて使い分けられるよう、Lossless JPEGやWMA Losslessのように仕様の一部として可逆圧縮を用意している形式もある。
なお、実際には元のデータを効率良く圧縮できる状態に変換し、圧縮符号化自体は可逆圧縮アルゴリズムを用いて行うため、正確には圧縮方式そのものが可逆と非可逆に分かれているわけではないが、実用的にはこの変換処理も含めて圧縮方式や圧縮形式の仕様の一部とみなされるため、便宜上このような区分が常用されている。
ランレングス圧縮 【連長圧縮】 ⭐⭐
最も基本的な圧縮アルゴリズムの一つで、連続して現れる符号を、繰り返しの回数を表す値に置き換える方式。圧縮によって内容を損なわない可逆圧縮を行う。
例えば、「AAAABBBBCCCC」という文字列を圧縮する場合、「A」が4回、「B」が4回、「C」が4回それぞれ連続しているため、各文字とその繰り返し回数を組み合わせて「4A4B4C」のように表すことができる。
展開する場合は「4A」を「AAAA」のように戻していくことで元の文字列が得られる。この例では元のデータの半分のデータ長に圧縮することができた。
この単純な方法では同じ符号が連続する箇所が少ないか存在しない場合、圧縮どころか逆にデータ長が大きく伸びてしまう場合がある。例えば、「ABCABC」は「1A1B1C1A1B1C」となってしまい、元の倍の長さになってしまう。
こうした事態を防ぐための手法がいくつか考案されている。例えば、繰り返し回数を表す数字が負数の場合は、その絶対値の長さだけ元のデータがそのまま記載されている区間が出現するという規則を追加する方式がよく知られる(PackBits方式)。
例えば、「AAAABCDEBBBB」は、単純な符号化では「4A1B1C1D1E4B」と12文字で表されるが、PackBits方式では中間の繰り返しのない4文字の先頭に「-4」(説明のため負号を付けて2文字で表しているが実際のデータ上は1文字分)を付加した「4A-4BCDE4B」となり、9文字で表すことができる。
ランレングス圧縮は余白の多い白黒2値画像のように、符号の種類が少なく繰り返し箇所が多い性質のデータで効率よく圧縮でき、ファクシミリの伝送符号や一部のビットマップ画像形式(BMP形式やPICT形式など)などに採用例がある。
メディア ⭐⭐⭐
媒体、媒質、伝達手段、中間などの意味を持つ英単語。“medium” の複数形。情報の伝達や記録に用いられる物体や装置、およびこれを利用して人に情報を伝達・配布する仕組みや事業、組織などを指すことが多い。
一般の外来語としては、人が人に情報を伝えたり広く報じるのに用いるモノや仕組みを指し、広義には電話や手紙、書籍、テレビ、映画、電子メール、Webサイトなど様々な伝達手段が含まれる。
狭義には、社会の不特定多数の人々に向けて広く情報を発信する「マスメディア」(mass media)のことをメディアと呼ぶことが多い。現代では日常的に多くの人が接するテレビ放送、ラジオ放送、新聞、雑誌の4つを指し、これを「マス4媒体」「4大メディア」などという。
マスメディアと同じように、インターネットを通じて広く一般に情報を発信、公開するネットサービスやWebサイトなどのことを「ネットメディア」「Webメディア」「オンラインメディア」などと呼ぶ。Webサイトやブログ、メールマガジン、動画配信サービス、動画サービス上のチャンネルなどが含まれ、マスメディア企業がネットメディアも並行して運用する例も多く見られる。
記録メディア・伝送メディア
ITの分野では、一般の用法に加え、データの記録・保管に用いる物体や装置を「記録メディア」、信号やデータを伝送するケーブルや内部の信号線、あるいは電波など伝送の媒介となる物理現象を「伝送メディア」という。
記録メディア(記憶メディアとも呼ばれる)の例としては、磁気テープ、磁気ディスク(ハードディスクなど)、光学ディスク(CD/DVD/Blu-ray Discなど)、フラッシュメモリ(SSD/USBメモリなど/メモリーカード)などがある。伝送メディアの例としては金属線ケーブル(銅線ケーブル/メタルケーブル)、光ファイバーケーブル、電波、赤外線、電子基板上の金属配線などがある。
メディアリテラシー ⭐⭐⭐
情報を伝達する媒体(メディア)を使いこなす基礎的な素養のこと。メディアを通じて情報を取得・収集し、取捨選択および評価・判断する能力や、自らの持つ情報をメディアを通して適切に発信できる能力を指す。
現代人は生活や仕事に必要な情報の多くをテレビや新聞、雑誌などのマスメディアやインターネット上のサイトやサービスなどの情報媒体を通じて得ているが、媒体にはそれぞれ物理的・技術的・商業的な制約や、発信者の立場や意図、経済的・政治的・思想的な背景などから偏りや歪みを避けることはできず、時には誤りや意図的な誇張、改変、虚偽などが含まれることもある。
情報の偏りにも様々な背景があり、例えば、紙面や放送時間の制約から送り手が重要でないと判断した話題が取り上げられなかったり扱いが小さくなることがある。商業的に運営されている媒体が大口広告スポンサーの不祥事を意図的に無視したり、自社や業界が関連する制度を取り上げる際に自らに有利な情報や論調を流すといった媒体の利害に基づく歪みが生じることもある。
また、政治や経済についての話題では、思想的に政権党に親和的な媒体とそうでない媒体で同じ事実について肯定的な論調と否定的な論調に分かれたり、特定の勢力に有利な、あるいは不利な情報を多く流すと行った操作が行われることも珍しくない。
情報の受け手としてのメディアリテラシーは、このような媒体の特性や限界、送り手の意図や背景などを読み解き、メディアから得た情報を鵜呑みにしたり全否定するのではなく、可能な限り客観的かつ正確に評価して活用できるようにする基本的な知識や技能の総体を指す。
1990年代まではメディアリテラシーといえばマスメディアの情報を読み取る受け手としての能力のみを指したが、現代ではインターネットを通じて誰でも公共に情報を発信することができるようになり、自らの持つ情報を適切な手段で発信する基礎的な能力もメディアリテラシーの範疇に含まれるようになった。こうした送り手としての素養はいわゆる「ネットリテラシー」の一部でもある。
マスメディア 【マスコミュニケーション】 ⭐⭐
不特定多数の人に同時に同じ情報を伝達できる媒体(メディア)のこと。また、その運営機関。「メディア」と略されることもある。マスメディアによる情報の一斉伝達を「マスコミュニケーション」(mass communication、マスコミ)というが、媒体や運営機関のことをマスコミということもある。
現代社会では一般に新聞、雑誌、テレビ、ラジオの4つを指し、これらをマス4媒体(マスメディア4媒体、マスコミ4媒体)という。マスメディアに流れる情報が社会に大きな影響を与えることから、その影響力の大きさを国家権力になぞらえ、行政、立法、司法に並ぶ「第4の権力」と呼ばれることもある。
また、あまり一般的な用法ではないが、伝達する情報の種類が限られていたり、情報の発信主体が極めて細分化・専門化していたり、特定集団内や個人間のコミュニケーションに用いる情報媒体でも、全体としての普及率や接触率が高い場合にはマスメディアに含める場合がある。例えば、インターネット、書籍、映画、携帯電話、音楽・映像ソフト(CDやDVDなど)などをマスメディアの一部とする場合がある。
何がマスメディアとして機能するかは時代や科学技術、社会制度の変化によっても変遷し、例えば江戸時代の日本では立て札が一種のマスメディアであり、テレビ放送の開始前は映画館で時事の話題を映像で伝える「ニュース映画」を上映していた。現在ではインターネットがマスメディアの機能を持ち始めている。
多くの国で、マスメディアの運営や所有者について法制度によって一定の規制あるいは保護が行われている。特に、国民の共有財産である電波周波数を専有するテレビやラジオなどの放送事業については免許制とし、一定の要件を満たした事業者が当局の規制・監督のもと運営する制度となっていることが多い。
新聞や雑誌についても税制や郵便料金を優遇するといった措置が行われることがある。例えば、日本では新聞に消費税の軽減税率が適用され、郵便制度では定期刊行物向けの割安な「第三種郵便物」という区分が用意されている。統制主義的な国家ではマスメディアの運営を国が独占したり、報道内容の検閲など運営への国家の関与・介入が行われることが多い。
Web 【ウェブ】 ⭐⭐
インターネット上で標準的に用いられている文書の公開・閲覧システム。文字や図表、画像、動画などを組み合わせた文書を配布することができる。現代では様々なサービスやアプリケーションの運用基盤としても広く用いられる。
文書内の要素に別の文書を指し示す参照情報(ハイパーリンク)を埋め込むことができる「ハイパーテキスト」(hypertext)と呼ばれるシステムの一種である。“web” (ウェブ)とは「蜘蛛の巣」を意味する英単語で、多数の文書が互いにリンクを介して複雑に繋がり合っている様子を蜘蛛の巣の網目状の構造になぞらえている。
WebサーバとWebブラウザ
Webで情報を提供するコンピュータやソフトウェアを「Webサーバ」(web server)、利用者の操作によりサーバから情報を受信して表示や処理を行うコンピュータやソフトウェアを「Webクライアント」(web client)という。
Webクライアントのうち、受信したページの内容を整形して画面に表示し、人間が閲覧するために用いるものを特に「Webブラウザ」(web browser:ウェブブラウザ)という。サーバとクライアントの間の通信には「HTTP」(Hypertext Transfer Protocol)と呼ばれる通信規約(プロトコル)が標準的に用いられる。
Web上の情報資源の所在の指定には、「https://www.example.co.jp/index.html」といった形式の「URL」(Uniform Resource Locator)という表記法が用いられる。Webサーバを表すドメイン名(ホスト名)と、Webサーバ上での資源の位置を指し示すパス(階層的なディレクトリ名とファイル名の組み合わせ)を繋げた形式になっている。
WebページとWebサイト
Webにおける情報の基礎的な単位は「Webページ」(web page)で、見出しや文章などの文字情報をもとにHTML(Hypertext Markup Language)やCSS(Cascading Style Sheet)などのコンピュータ言語で構造や体裁、見栄えを記述する。
HTMLは記述された文字情報の中にソフトウェアへの制御情報を埋め込むことができる「マークアップ言語」(markup language)と呼ばれる言語で、「この部分が見出し」「本文はここからここまで」「段落の区切りはここ」といった指示を文書中に埋め込む形で記述することができる。
Webブラウザはこの制御情報に基づいて、タイトルを中央揃えにしたり、小見出しを太い大きな文字で表示したり、段落の間に空白を差し込むなど指定された整形や装飾を行い、閲覧者が文書の構造を把握しやすいように表示してくれる。
ページ内には文章だけでなく箇条書き(リスト)や表(テーブル)、図形、画像、動画、入力要素(フォーム)などを掲載することができる。画像や動画など文字で書き表せない要素は外部のファイルをURLで指定して埋め込むことができる。
要素のページ内での配置や大きさ、枠線や罫線、文字の字形(フォント)や色といった具体的な見栄えに関する指定項目(スタイルという)は、当初はHTMLで構造とともに記述していたが、CSSという専用の言語で構造とは別に指定する方式が主流となっている。
ページ内の要素には外部の他の資源(多くの場合は他のWebページ)のURLを指し示すリンクを設定することができ、ブラウザ画面に表示されたリンクを指定して開くよう指示(クリックやタップなど)すると、表示がリンク中のURLで指定されたページに切り替わる。簡単な操作でリンクをたどって次々に文書から文書へ表示を切り替えていくことができる。
このリンク機能を利用して、書籍のように複数のページ群をまとめた単位を「Webサイト」(web site)という。サイト内のページからは外部のサイトのページへリンクを張ることもでき、Web全体がリンクを介して連結された巨大な地球規模の文書データベースとなっている。
Webアプリケーション・Webサービス
Webサーバには静的なファイルの送信だけでなく、ブラウザからの要求に基づいて動的にコンピュータプログラムを実行し、何らかのデータ処理を行って結果をブラウザに応答することもできる。
また、Webブラウザにはページ上に記述された簡易なプログラム(スクリプトという)を実行し、サーバと任意のタイミングで通信したり、利用者の操作に応じて表示内容を変化させたりすることができる。
このような動的な仕組みを組み合わせ、サーバとブラウザが連携して利用者が対話的に操作することができるアプリケーションソフトを構築することができ、これを「Webアプリケーション」(web application)あるいは「Webサービス」(web service)という。著名な応用例として、ブラウザで買い物ができるオンラインショップ(ECサイト)や、利用者同士がコミュニケーションできるSNSなどのネットサービスがある。
歴史と名称
Webはインターネットがまだ学術機関を中心に利用されていた頃、1989年に欧州核物理学研究所(CERN)のティム・バーナーズ・リー(Tim Berners-Lee)氏が所内の論文公開・閲覧システムとして考案したものが基礎となっている。
1990年代にインターネットが一般に開放され普及していく過程で、電子メールなどと共にネットの代表的な応用システムとして広く利用されるようになった。2000年代中頃には主に日本を含む先進国で欠かすことのできない重要な情報インフラの一つに成長している。
もとは “World Wide Web”、略して “WWW” が正式名称で、現在も「https://www.example.jp/」のようにWebサーバのホスト名などにこの名が残っているもの。英語では次第に “the Web” (固有名詞のWeb)のように略されるようになり、さらに進んで現在では一般名詞の “web” がインターネットのWebを指すことが増えている。日本では当初「ホームページ」の名称で紹介され、現在も初心者向けの説明などで多用されるが、「ウェブ」「Web」の呼称が浸透しつつある。
Webブラウザ 【ウェブブラウザ】 ⭐⭐
Webページを閲覧するためのアプリケーションソフト。利用者の指定したWebページを管理するWebサーバへデータの送信を要求し、送られてきたHTMLファイルや画像ファイルなどを読み込んで指定されたレイアウトで表示する。
利用者の指定したアドレス(URL)にアクセスし、WebサーバからWebページを構成するHTMLファイルやスタイルシート(CSS)、スクリプト(JavaScript)、画像、音声、動画などのデータを受信して、一枚のページに組み立てて画面に表示する。
入力フォームを使用して利用者側からデータやファイルをWebサーバに送信したり、表示されたページの保存や印刷を行ったり、簡易なプログラム(スクリプト)の実行機能を利用して制作されたソフトウェアやアニメーションなどを再生・動作させることもできる。
主要なWebブラウザには、「プラグイン」「アドオン」「拡張機能」(エクステンション)などの名称で、第三者の開発した機能を追加する仕組みが備わっており、様々な企業や個人が開発した追加機能が公開されている。
読み込むWebページの指定は、URL(Webアドレス)を表示欄に利用者が直接入力するか、表示されたページ中にある他のページへのリンク(ハイパーリンク)を指定するか、利用者の保存したURLの一覧(ブックマーク/お気に入り)から選択するなどの方法で行う。
サーバとの通信はHTTP(Hypertext Transfer Protocol)と呼ばれる通信規約(プロトコル)によって行われ、その基盤としてインターネットなどで標準のTCP/IPが用いられる。SSL/TLSを用いて通信経路を暗号化(HTTPS)したり、ローカルファイルを読み込む機能も備えていることが多い。
Webブラウザの種類
一般的なフル機能のWebブラウザ製品の他に、画像や動画などメディアデータは無視して文字(テキスト)部分だけを抽出して表示する「テキストブラウザ」、文字情報を音声合成機能で読み上げる「音声ブラウザ」(読み上げブラウザ)などがある。
パソコン向けでは、米グーグル(Google)社の「Google Chrome」(グーグル・クローム)や米マイクロソフト(Microsoft)社の「Microsoft Edge」(マイクロソフト・エッジ)、米モジラ財団(Mozilla Foundation)の「Firefox」(ファイアーフォックス)が人気で、Mac(macOS)では開発元の米アップル(Apple)社の「Safari」(サファリ)が標準的に使われる。
スマートフォンやタブレット端末の場合、Androidでは標準で組み込まれるAndroid版Chromeが、iOS(iPhone/iPad)でもやはり標準で組み込まれるiOS版Safariが使われることが多い。また、これらの環境では標準ブラウザの機能を部品(モジュール)化したものをアプリケーションソフトに組み込む「WebView」(ウェブビュー)という仕組みがあり、多くのアプリがこの仕組みを利用してWebブラウザの機能を内蔵している。
ソーシャルメディア ⭐⭐
インターネット上で展開される情報メディアのあり方で、個人による情報発信や個人間のコミュニケーション、人の結びつきを利用した情報流通などといった社会的な要素を含んだメディアのこと。狭義にはいわゆる「SNS」(ソーシャルネットワーキングサービス)を指す。
利用者の発信した情報や利用者間の繋がりによってコンテンツを作り出す要素を持ったWebサイトやネットサービスなどを総称する用語である。電子掲示板(BBS)やブログ、ミニブログ、Wiki、SNS、動画共有サービス、動画配信サービス、ポッドキャスト、ソーシャルニュースサイト、ソーシャルブックマークサービス、レシピ共有サイト、各種レビューサイト、Q&Aサイトなどが含まれる。
メッセンジャーアプリやビデオ会議アプリなどのコミュニケーションツールもソーシャルメディアの一種とする場合がある。サイトやサービス自体はソーシャル的でない場合も、オンラインショップのレビュー投稿欄、フリマアプリの購入者評価欄などのようにソーシャルメディア的な要素が含まれる例がある。
従来のマスメディアは情報の発信に巨大な設備や組織、巨額の資金が必要だったため、情報の送り手の地位は少数の特権的な職業人によって占められていたが、ソーシャルメディアではメディアの閲覧者が同時に発信者としての資格を持ち、他の利用者に自身の責任で自由に情報を発信することができる。
また、大衆に画一的に同じ情報を複製して配信してきたマスメディアに対し、ソーシャルメディアでは多様な発信主体から閲覧者自身が必要とする情報源を選択したり、友人や同僚、同好の士などといった人間関係を利用して情報の流通を制御したりする仕組みが用意されていることが多い。
SNS 【Social Networking Service】 ⭐⭐⭐
人と人との社会的な繋がりを維持・促進する様々な機能を提供する、会員制のオンラインサービス。友人・知人間のコミュニケーションを円滑にする手段や場を提供したり、趣味や嗜好、居住地域、出身校、あるいは「友人の友人」といった共通点や繋がりを通じて新たな人間関係を構築する場を提供するサービスで、Webサイトや専用のスマートフォンアプリなどで閲覧・利用することができる。
主な特徴
サービスにより機能や特徴が大きく異なるが、多くのサービスに見られる典型的な機能としては、別の会員を「友人」や「購読者」「被購読者」などに登録する機能、自分のプロフィールや写真を公開する機能、同じサービス上の別の会員にメッセージを送る機能、自らのスペースに文章や写真、動画などを投稿して友人などに見せる機能がある。
サービスによっては、複数の会員でメッセージ交換や情報共有ができるコミュニティ機能、イベントの予定や友人の誕生日などを共有したり当日に知らせたりしてくれるカレンダーあるいはスケジュール機能などがある。
多くの商用サービスではサイト内に広告を掲載するなどして、登録や基本的なサービスの利用を無料としているが、一部の機能を有料で提供しているサービスもある。
SNSの種類
多くのサービスはメールアドレスなどがあれば誰でも登録できるが、普及し始めた当初は人の繋がりを重視して「既存の参加者からの招待がないと参加できない」というシステムになっているサービスが多かった。
現在でも、何らかの形で参加資格を限定し、登録時に紹介や審査などが必要なサービスがある。また、参加自体が自由でも、テーマや分野などがあらかじめ設定され、関係や関心のある人の参加を募っているサービスなどもある。
企業などが従業員を対象に運用する「社内SNS」や、大学が教職員や在学生、卒業生を対象に運用する「学内SNS」もあり、業務上の連絡や情報共有に使われたり、業務とは切り離して参加者間の交流の促進のために利用されたりする。「OpenPNE」や「Mastodon」など自らSNSを開設・運用することができるサーバ向けソフトウェアもあり、これを利用したプライベートな集団内のサービスも存在する。
歴史と著名なサービス
2003年頃アメリカを中心に相次いで誕生し、国内事業者によるサービスも2004年頃から普及し始めた。世界的には、初期に登録資格を有名大の学生に絞って人気を博し、後に世界最大のソーシャルネットワークに成長した「Facebook」(フェイスブック)や、短いつぶやきを投稿・共有するマイクロブログ型の「Twitter」(ツイッター:現X)、写真の投稿・共有を中心とする「Instagram」(インスタグラム)、ビジネス・職業上の繋がりに絞った「LinkedIn」(リンクトイン)などが有名である。
日本独自のサービスとしては一時会員数1000万人を超え社会現象ともなった「mixi」(ミクシィ)などが有名だが、近年ではFacebookなど海外事業者に押され利用が低迷しており、オンラインゲーム運営・提供に業態転換するなどしている。
SNS的なサービスの広がり
近年では様々なWebサイトやネットサービス、スマートフォンアプリなどに「ソーシャルな」機能が組み込まれる事例が増えており、何がSNSで何がそうでないか明確に区別することは難しくなりつつある。
例えば、料理レシピ投稿サイトの「クックパッド」(Cookpad)や、スマートフォン利用者間でチャットや音声通話などを提供する「LINE」(ライン)などにも、集団の形成を支援するコミュニティ機能や日記の投稿・共有機能などがあり、これらのサービスをSNSの一種に含める場合もある。
SNSの功罪
SNSによって、一度繋がりの途絶えた古い友人と交流を再開したり、現実に頻繁に会うことは難しい多人数と日常的な繋がりを保ったり、身の回りに同好の士がいなくてもSNSで発見してコミュニティを形成できるなど、SNSのおかげで人間関係が充実した利用者は数多くいる。
一方で、不用意に個人情報や顔写真などを公開してしまい悪意に晒されたり、素性のよくわからない人と交流を持ちトラブルに巻き込まれたり、自分の周囲では特に問題視されなかった話がネット上で拡散されるうちに非難の書き込みが殺到してしまう(「炎上」と呼ばれる現象)など、SNSによって新たに引き起こされる問題もある。
また、SNSが様々な人の間に普及し、継続して利用する期間が長くなるに連れ、上司や家族など「望まれざる」相手とのSNS上での関係や対応に苦慮したり、知り合いの(大抵は良いことしか書かれていない)書き込みを読んで自分の身上と比較してしまったり、興味が湧かない話題でも毎回反応を迫られているように感じて精神的に疲弊する「SNS疲れ」といった問題に直面し、SNSの利用を断って離れる人も増えている。
Twitter 【ツイッター】
今していること、感じたこと、他の利用者へのメッセージなどを「つぶやき」のような形式で280文字(日本語などは140文字)以内の短い文章にして投稿するスタイルのブログサービス。
短文を投稿していくスタイルのサイトは当初「ミニブログ」「マイクロブログ」などと分類されたが、現在ではFacebook(フェイスブック)などと同じSNSサービスの一種であるとみなされることが多い。“twitter”とは英語で、さえずる、ぺちゃくちゃ喋る、くすくす笑う、といった意味の英単語で、日本では「ツイッター」「トゥイッター」などと発音される。英語では “t” の音はあまり強調されず「トゥイラァ」に近い発音となる。
Twitterは2006年7月に米オブビアス(Obvious)社(現Twitter社)によって英語版のサービスが開始された。その後、日本国内での利用が米国内に次いで多かったことから、2008年4月に他言語版としては初となる日本語版のサービスが開始された。
2017年には全世界で3億2000万人以上、そのうち日本には4500万人以上のアクティブな利用者が存在すると発表されており、世界的に展開しているSNSサービスの中では日本で突出して人気の高いサービスとしても知られる。
Twitterはメールアドレスなどを登録すれば誰でも無料で利用できる。加入すると自分専用のWebページが作成され、そこに自分の発言を投稿する。Twitterにおける個々の発言は「ツイート」(tweet)と呼ばれる。
特定の他の利用者に向けて「あて先」を指定する書式も用意されており、文字通り「おしゃべり」に使うこともできる。公開アカウントの発言はWeb上に広く公開され、Twitter加入者以外も読むことができるが、アカウントを非公開設定にすれば、特別に関係を結んだ利用者以外は読むことができなくなる。
「フォロー」(follow)と呼ばれる機能で他の利用者を登録すると、その人の発言をリアルタイムに受信することができる。通常の操作画面では自分の発言とフォローした人の発言が(原則として)時系列に並んで次々に新しい発言が追加されていくようになっており、この発言の流れを「タイムライン」(TL:Time Line)という。他の利用者が自分をフォローして発言を受信することもあり、これを自分の「フォロワー」(follower)という。
他のSNSサービスの「友達」機能とは異なり、フォローは一方向の関係であり、フォローした相手が自分をフォローするとは限らない。友人・知人などの間柄では互いにフォローし合う「相互フォロー」の関係を結ぶことも多いが、有名人のアカウントなどは本人がフォローする人に比べフォロワーの方が桁違いに多い場合もある。
ツイート (tweet)
Twitterにおける一回分の書き込みを「ツイート」(tweet)と呼び、発言を投稿することを「ツイートする」(tweeting)という。日本語では「つぶやき」と呼ばれることもある。“tweet”の原義は「(小鳥の)さえずり」で、短い発言を頻繁に投稿する様子を鳥のさえずりになぞらえている。
当初はどの言語でも一回の発言は140文字以内に制限されていたが、現在では英語などは280文字までで、日本語や中国語、韓国語などの文字は2文字分にカウントされる(すべて日本語なら140文字まで)。発言内にいわゆるUnicode絵文字を混在させたり、画像や動画、GIFアニメーション、GPS位置情報などを添付して発言とともに表示させることもできる。
リツイート (RT/retweet)
Twitterで他の利用者の発言を転載すること。また、転載した発言。自分のフォロワーのタイムラインにその発言を知らせるために行なう。
当初は「RT @ユーザー名 当該発言」のような書式で、自分の発言としてつぶやく方式だったが、その後、Twitter社が公式の機能として実装し、自分の発言とは区別して元の発言をそのままフォロワーに流すことができるようになった。
また、単に発言をそのまま転載するだけでなく、自らの発言を添えてタイムラインに掲載することもでき、「引用リツイート」(引用RT)あるいは「QT」(Quoted Tweet)などと呼ばれる。
電子メール 【eメール】 ⭐⭐⭐
通信ネットワークを介してコンピュータなどの機器の間で文字を中心とするメッセージを送受信するシステム。郵便に似た仕組みを電子的な手段で実現したものであることからこのように呼ばれる。
広義には、電子的な手段でメッセージを交換するシステムやサービス、ソフトウェア全般を指し、携帯電話のSMSや、各種のネットサービスやアプリ内で提供される利用者間のメッセージ交換機能などを含む。
狭義には、SMTPやPOP3、IMAP4、MIMEなどインターネット標準の様々なプロトコル(通信規約)やデータ形式を組み合わせて構築されたメッセージ交換システムを指し、現代では単に電子メールといえば一般にこちらを表すことが多い。
メールアドレス
電子メールの送信元や宛先は住所や氏名の代わりに「メールアドレス」(email address)と呼ばれる統一された書式の文字列が用いられる。これは「JohnDoe@example.com」のように「アカウント名@ドメイン名」の形式で表され、ドメイン名の部分が利用者が所属・加入している組織の管理するネットワークの識別名を表し、アカウント名がその中での個人の識別名となる。
企業や行政機関、大学などがメールサーバを運用して所属者にメールアドレスを発行しているほか、インターネットサービスプロバイダ(ISP)や携帯電話事業者などがインターネット接続サービスの一環として加入者にメールアドレスを発行している。
また、ネットサービス事業者などが誰でも自由に無料でメールアドレスを取得して利用できる「フリーメール」(free email)サービスを提供している。一人の人物が立場ごとに複数のアドレスを使い分けたり、企業の代表アドレスのように特定の個人に紐付けられず組織や集団などで共有されるアドレスもある。
メールサーバとメールクライアント
インターネットに接続されたネットワークには「メールサーバ」(mail server)と呼ばれるコンピュータが設置され、利用者からの要請により外部のネットワークに向けてメールを送信したり、外部から利用者に宛てて送られてきたメールを受信し、本人の使うコンピュータに送り届ける。利用者や他のサーバに対する窓口であり、郵便制度における郵便局のような役割を果たす。
メールサーバ内には利用者ごとに私書箱に相当する受信メールの保管領域(メールボックス)が用意され、外部から着信したメールを一時的に保管する。利用者が手元で操作するメールソフト(メールクライアント、メーラーなどと呼ばれる)は通信回線を介してメールサーバに問い合わせ、メールボックス内のメールを受信して画面に表示する。
Webメール
利用者の操作画面をWebアプリケーションとして実装し、Webブラウザからアクセスしてメールの作成や送信、受信、閲覧、添付ファイルのダウンロードなどをできるようにしたシステムを「Webメール」(webmail)という。
フリーメールサービスの多くは標準の操作画面をWebメールの形で提供しており、メールクライアントなどを導入・設定しなくてもWebブラウザのみでメールの送受信を行うことができるようになっている。企業などの組織で運用されるメールシステムでもWebメールを提供する場合があり、自宅や出先のコンピュータなどからアクセスできるようになっている。
メッセージの形式
電子メールには原則として文字(テキスト)データのみを記載することができる。特別な記法や書式を用いずに素の状態の文字データのみが記されたメールを「テキストメール」という。WebページのようにHTMLやCSSなどの言語を用いて書式や装飾、レイアウトなどの指定が埋め込まれたものは「HTMLメール」という。
また、画像や音声、動画、データファイル、プログラムファイルなどテキスト形式ではないデータ(バイナリデータ)を一定の手順でテキストデータに変換して文字メッセージと一緒に送ることができる。こうしたデータをメッセージ中に埋め込む方式の標準として「MIME」(Multipurpose Internet Mail Extension/マイム)が規定されており、これを利用してメールに埋め込んだファイルを「添付ファイル」(attachment file)という。
電子メールの普及と応用
電子メールはWeb(WWW)と共にインターネットの主要な応用サービスとして広く普及し、情報機器間でメッセージを伝達する社会インフラとして機能している。現在ではパソコンやスマートフォン、タブレット端末などのオペレーティングシステム(OS)の多くは標準でメールクライアントを内蔵しており、誰でもすぐに利用できるようになっている。
電子メールシステムでは一通のメールを複数の宛先へ同時に送信する同報送信・一斉配信も容易なため、グループ共通のアドレスを用意してメンバー間の連絡や議論などに用いる「メーリングリスト」(mailing list)や、発行者が購読者に定期的にメールで情報を届ける「メールマガジン」(mail magazine)などの応用システムも活発に利用されている。
一方、広告メールを多数のメールアドレスに宛て無差別に送信する「スパムメール」(spam mail)や、添付ファイルの仕組みをコンピュータウイルスの感染経路に悪用する「ウイルスメール」(virus mail)、送信元を偽って受信者を騙し秘密の情報を詐取する「フィッシング」(phishing)など、電子メールを悪用した迷惑行為や犯罪なども起きており、社会問題ともなっている。
文字コード 【キャラクターコード】 ⭐⭐⭐
文字や記号をコンピュータ上でデータとして扱うために、一文字ずつ固有の識別番号を与えて区別できるようにした符号のこと。
コンピュータはすべての情報を「0」と「1」のを組み合わせたデジタルデータとして取り扱う。数値は2進数を用いることで容易に表現できるが、文字は字形そのものを画像や図形としてデータ化したものはデータ量が多く、これをそのまま繰り返し並べて文字データとすることは無駄が大きい。このため、各文字に短い識別番号(正確には0と1の並び:ビット列)を与えて数字の列として文字列を表現するようになった。この数字と文字の対応関係を定めた規約が文字コードである。
最も普及しているASCII文字コードは英数字や制御文字、記号などを収録した7ビット(7桁のビット列、十進数では0~127)のコード体系であり、例えばアルファベットの大文字の「A」は65番(ビット列で1000001)、小文字の「z」は122番(同1111010)などと定められている。あるデータ列がASCII文字列であることが分かっていれば、番号との対応関係を元に文字の並びを知ることができる。
文字集合と符号化方式
文字コードを定義するには、どの言語を対象にどの文字を収録するかを決めなければならず、まず収録する文字(の字形)を特定して列挙した文字集合(文字セット)を定める。その際、番号などは与えずにただ収録する文字群を定義したものをレパートリ、各文字に一意の番号を与えたものを符号化文字集合(CCS:Coded Character Set)という。
欧米圏の8ビット文字コード規格のように、符号化文字集合をそのまま文字コードとして利用することも多いが、漢字圏など収録文字数の多い言語では各文字に割り当てられた符号をどのようなビット列で表現するかについて、いくつかの異なる方式を定めている場合があり、これを文字符号化方式(CES:Character Encoding Scheme/文字エンコーディング)という。
例えば、代表的な日本語の符号化文字集合の一つであるJIS X 0208規格に定められた符号をそのまま文字コードとしたものを区点コードというが、この文字集合を対象とする符号化方式としてJISコードやShift JISコード、日本語EUC(EUC-JP)などが定められており、同じ文字でも符号化方式によってそれぞれ異なったビット列で表現される。世界中の文字を収録したUnicodeでも、同じ文字集合に対してUTF-8、UTF-16、UTF-32など複数の異なる符号化方式が定義されている。
文字化け ⭐⭐
コンピュータで文字が正しく表示・印刷されず、本来とは異なる不規則で意味不明な記号や文字の連なりとして現れること。
テキスト(文字)形式のデータを読み込んで表示しているのに、本来そのデータが表していた文字が表示されずに、まったく異なる文字や記号、制御文字、空白などが連なった意味をなさない文字に変質してしまっている現象を指す。
主な原因として、データ自体の破損(一部の欠落や変質)、文字コードの相違(元の文字コードとは異なるコードとして解釈しようとしている)、フォント環境の違い(その言語に対応するフォントが存在しない)などが挙げられる。
ちなみに、実行可能形式のプログラムや、画像や動画、音声を記録したデータなど、バイナリ形式のデータを何らかの理由でテキストとして表示しようとした場合にも、不規則な文字や記号の連なりが出現するが、元がテキスト形式ではないため文字化けとは呼ばない。
文字化けは主に2バイト以上の文字コードを用いる日中韓などの言語圏で起きるため、欧米圏ではあまり知られておらず、日本人がこの現象を欧米人に説明する際に用いていた “Mojibake” という単語がそのまま文字化けを表す専門用語として流通している。
文字コードの違い
ある文字コードや文字エンコーディングで表現された文字データを、別の文字コードとして解釈・表示しようとしてしまい、まったく異なる文字列に変わってしまう場合である。
そのデータがどのような文字コードで表現されているのか分からず、自動認識にも失敗して別のコードを選んでしまった場合や、そもそもソフトウェア側がその文字コードに最初から対応していない場合などに起きる。
日本語の電子メールやWebページなどでは、同じ言語でも異なる文字コードが併存しており、どれが使われているのか明確に指定がない場合にはこの種の文字化けが発生する。また、欧米圏のソフトウェアでは日本語などマルチバイト文字に対応していない場合があり、日本語などを入力すると化けて表示されることがある。
フォントの違い
文字コードが正しく認識できたとしても対応する文字を表示するためのフォントがシステム内に存在しない場合には、やはり正しく表示することはできない。日本語のWebページを日本語フォントの入っていない英語版のシステムで無理やり表示しようとした場合などに起きる。
また、同じ文字コードでも機種やOSによっては一部の領域に独自に拡張した文字群を当てはめている場合があり、このような機種依存文字を別のシステムで表示しようとした場合にも本来とは異なる表示になる。
UTF-8 【UCS Transformation Format 8】 ⭐
Unicodeで定義された文字集合を表現することができる文字コード(符号化方式)の一つ。一文字を1~4バイトの可変長で表現するもので、様々な言語の文字を扱える文字コードとしては世界的に最も普及している。
「Unicode」は国際的な業界団体であるUnicodeコンソーシアムが策定している多言語文字コードの規格で、ISO(国際標準化機構)およびIEC(国際電気標準会議)が策定した国際標準(ISO/IEC 10646)ではこれと実質的に同じものを「UCS」(Universal multi-octet Character Set)と呼んでいる。
Unicodeでは、収録されている文字にそれぞれ固有の識別番号である「コードポイント」(符号位置)を与えている。この値をビット列として表現する規則を「文字符号化方式」(符号化スキーム)と呼び、UTF-8やUTF-16、UTF-32などの方式がある。UTF-8は最も普及している方式で、Unicodeを用いるほとんどの場面で符号化方式としてUTF-8が用いられる。
UTF-8は最大で2097151番(U+1FFFFF)までのコードポイントを表現できるが、Unicode/UCSで定義される文字セットとして有効なのは1114111番(U+10FFFF)までであるため、これを超える値は無効とされる。初期の仕様では最大6バイト(U+7FFFFFFFまで)とされていたが、後に4バイトまでに縮小された。
ASCII文字と各国語の文字
英数字の文字コードとして世界的に普及しているASCIIで規定される7ビットの範囲(0~127番)の文字は、そのコードをそのまま用いるようにできている。ASCIIに収録された英数字や記号は1バイトで表現でき、かつ、各文字のコードもASCIIと同一になる。
一方、大陸欧州などで一般的なISO/IEC 8859などの文字コードは、ASCIIに1ビット追加して8ビット(1バイト)とし、拡張された後半128~255番にアクセント記号付きの文字などを収録していた。UTF-8ではこれらの文字の多くは2バイト(16ビット)で表現される。
日本語や中国語、韓国・朝鮮語など、従来から2バイトの文字コード体系を言語ごとに独自に定めていた言語圏では、UTF-8ではほとんどの文字が3バイト(24ビット)となる。従来コードに比べ英語圏は1文字1バイトのままだが、8ビット言語圏は2バイトに、2バイト言語圏は3バイトに増加するため不公平だとする声もある。
符号化の方法
128番以降の文字はコードポイントの上位ビット側から変換ルールに従って複数のバイト列に当てはめていき、得られたバイト列を順に並べる。処理はバイト単位で行われるため、16ビット単位の値を用いるUTF-16などと異なりエンディアンの識別が不要となっている。
1バイト表現の先頭は0から始まるが、複数バイト表現の場合、1バイト目は「11」から、2バイト目は「10」から始まる。これにより、文字列データ中のどの位置のバイトを取り出しても、それが1バイト表現(ASCII互換文字)なのか、複数バイト表現の先頭あるいは途中なのかを容易に判別できる。
長さが2バイトの場合の1バイト目は「110」から始まり、同様に3バイトの場合は「1110」、4バイトは「11110」から始まる。先頭バイトの1が連続する数を調べれば続く何バイトが同じ文字を表すのか知ることができる。
例えば、2バイトのUTF-8コードは1バイト目が「110xxxxx」、2バイト目が「10xxxxxx」という形式で、計11ビットあるxの部分の左から順にコードポイントの2進表現を上位ビット側から当てはめていく。最長の4バイト表現ではコードポイントを格納するビット列は合わせて21ビット分確保される。
長いバイト表現は短いバイト表現の文字を表すこともできるため、例えばASCII互換文字は1バイト表現から4バイト表現まで4通りのビットパターンが存在することになるが、規格上は最も短い表現以外は無効な表現とみなされる。すなわち、2バイト以上では表現可能なコードポイントの上限だけでなく下限(2バイトの場合はU+0080未満は無効)が存在する。
バイトオーダーマーク (BOM)
UTF-16やUTF-32では16ビット単位や32ビット単位の連続したビット列で1文字を表現するため、1バイト(8ビット)単位でデータを取り出したときに先頭側が上位ビットなのか下位ビットなのか識別しなければならない。この並び順(エンディアン)を区別するため、これらの形式ではテキストファイルなどの先頭に「バイトオーダーマーク」(BOM:Byte Order Mark)を記載する仕組みがあった。
UTF-8ではバイト順の認識が不要なためエンディアンを指示するBOMも存在しないが、代わりにエンコード形式がUTF-8であることを伝達する符号を先頭に記載してもよい(しなくてもよい)ことになっている。この符号は先頭から順に16進数で「EF BB BF」であり、バイト順を指定するものではないが他の方式との整合性から便宜上BOMと呼ばれている。
ピクセル 【画素】 ⭐⭐⭐
デジタル画像や画面などを構成する最小単位である、色のついた微細な点のこと。また、その数を表す単位。単位を表す場合は “px” と略記されることもある。
コンピュータは画像をデジタルデータとして扱うため、固有の色情報を持つ点が縦横に規則正しく並んだ集合として表現する。この点のことをピクセルと呼び、それ以上小さな単位に分割することができない最小の要素となっている。
色深度 (color depth)
一つの画素にどのような色情報を持たせることができるかは画像形式やソフトウェア、表示・印刷媒体によって異なる。一画素を何ビットの色情報で表現するかを「色深度」(color depth)と呼び、「bpp」(bits per pixel:ビット毎ピクセル)という単位で表す。
最も単純で情報量が少ないのは各画素が1ビットの色情報を持つ方式(1bpp)で、各画素は2種類の色(ビットの0と1にそれぞれ対応)のいずれかとなる。通常はこれを白と黒に対応付け、白黒画像(2値画像、モノクロ2値)として扱う。
様々な色を扱う場合は色深度を大きく取り、8ビット(256色)や16ビット(65,536色)、24ビット(約1677万色)などが用いられる。24bppでは光の三原色(RGB:赤緑青)の各色を8ビット(256段階)で表すことができ、人間の目で識別できるほとんどの色を表現できるとされるため、「フルカラー」「トゥルーカラー」などと呼ばれる。
物理媒体におけるピクセルとドット
ディスプレイ装置などによる画面表示やプリンタによる印刷面も、色のついた微細な点を縦横に規則正しく並べた構造となっており、これもピクセルと呼ぶ。物理的な単位として「ドット」(dot)を用いる場合もある。
特に、プリンタではデジタル画像における一つのピクセルを複数の微小なインク滴やトナーの集合で表現する場合があり、ピクセルを構成する物理的な最小単位としてドットを用いることがある(ドットをピクセルと同義とする場合もある)。
物理的な媒体では表示・印刷面におけるピクセルの細かさが機器や機種によって異なり、幅1インチあたりに存在するピクセルの数である「ppi」(pixel per inch:ピクセル毎インチ)や隣り合うピクセルの中心間の距離である「画素ピッチ」(pixel pitch)などの単位で表す。
サブピクセル (subpixel)
物理媒体上では画素の色を原色の組み合わせで表現するため、ディスプレイなどの発光体では赤・緑・青の光の三原色(RGB)に対応する発光素子を、印刷物などの反射体ではシアン・マゼンタ・イエローの色の三原色(CMY)に対応するインク滴などを隣り合わせて一つの画素を表現する。
人間の目には三色が組み合わさって一つの色に見えるが、拡大すると各画素ごとに三色が規則正しく並んでいる様子が分かる。画素をこれらの三色に分解した構成単位を「サブピクセル」(subpixel:副画素)と呼ぶことがある。
ソフトウェアや機器によっては画像の表現をより精細にするため、サブピクセル単位で表示や印刷を制御する「サブピクセルレンダリング」(subpixel rendering)が行われる場合もある。
解像度 【レゾリューション】 ⭐⭐⭐
機器などの性能の尺度の一つで、対象をどこまで細かく観測あるいは描写できるかを表すもの。ITの分野では、画像や画面、紙面などを構成する画素(ピクセル/ドット)の密度を指すことが多い。
コンピュータは画像を色の付いた微細な点あるいは格子を縦横に規則正しく敷き詰めた集合として取り扱う。この点の細かさ、すなわち、物理的な単位長さあたりの点の数(画素密度)のことを一般に解像度という。
解像度が高いほど点は微細になり、より精細できめの細かい表現が可能となるが、データ量は点の数に比例して増大し、保存や伝送に大きな容量を必要とする。解像度が低くなると次第に個々の点や格子が視認できるようになり、モザイク状のぼやけた表現となる。
ディスプレイやプリンタなどの出力装置の場合には、画面に表示する像や、紙面へ印刷する像の微細さを表す。イメージスキャナやカメラなど画像・映像の入力装置の場合には、取り込んだ光学的な像を画素に分解する細かさ(分解能)を表す。
解像度の単位
単位は一般に幅1インチ(約2.54cm)あたりに並ぶ点の個数である「ピクセル毎インチ」(ppi:pixel per inch)あるいは「ドット毎インチ」(dpi:dot per inch)が用いられる。例えば、100ppiなら1インチを100の点に分解して扱うことを意味し、一つの画素は直径0.254mmの円か幅0.254mmの格子となる。
ppiとdpiはコンピュータ上での画像データの画素と装置の取り扱う微細な点が一対一に対応する場合には同一だが、装置の原理によっては複数のドットの集合によって一つのピクセルを表現する場合もあり、そのような機器では後者の方が数倍から十数倍大きくなる。
ディスプレイの画面解像度
ディスプレイ装置では本来の解像度の意味である画素密度(ppi)の他に、慣用的に画面の構成画素数(総画素数)のことを解像度ということがある。横方向の画素数を縦方向の画素数をかけ合わせたもので、1920×1080といったように記述する。
同じ総画素数の機種同士でも、画面の物理的なサイズが異なれば画素の大きさも異なるため、本来の意味での解像度(画素密度)は異なる。歴史的な経緯から、よく使われる画素数には通称がついており、例えば640×480は「VGA」、1024×768は「XGA」と呼ばれる。
ビットマップ画像 【ラスター画像】 ⭐⭐⭐
画像データの表現形式の一つで、画像を色のついた点(画素/ピクセル)が縦横に規則正しく並んだ矩形として表現したもの。画面表示や印刷の際には最終的にこの形式で出力する必要がある。
ディスプレイ画面への表示やプリンタによる印刷はビットマップ形式で行われるため、コンピュータでも基本的には画像をビットマップ画像として表現・保存・処理することが多い。ファイル形式としては無圧縮のBMP(Windows Bitmap)、可逆圧縮のGIFやPNG、不可逆圧縮のJPEGなどが有名である。
任意の画像を表現することができ、特に写真など図形の組み合わせでは表現できない画像の保存に適しているが、内容についての幾何学的な情報などは持たないため、拡大や縮小、変形、合成などの処理を行うと内容が不可逆に変質し、画質の劣化、不鮮明化の原因となる。
ビットマップ画像は縦横それぞれの画素数が決まっており、その積が画像を構成する総画素数となる。例えば横1024ピクセル×縦768ピクセルの画像ならば78万6432画素の色情報が並んだデータとして表現される。画像形式によっては解像度(単位長さあたりに並ぶ画素数)の情報を持つものがあり、表示や印刷の際の画像の実際の大きさに反映される。
色情報と色深度
個々の画素が持つ色情報の大きさを色深度(color depth)と呼び、色情報のビット数(bpp:bits per pixel)で表す。例えば、色深度が1bppの場合は各画素は0と1の二値の色情報を持ち、通常は0を黒、1を白に対応付けた白黒画像のことを意味する。
色情報はRGB(Red-Green-Blue)形式など色自体の属性を直接表記したものと、色に番号をつけ、番号と実際の色情報(RGB値など)の対応関係を別のデータとして与えるインデックスカラー(indexed color)方式がある。16~32bppの場合は前者の方式(RGBの各値を5~8ビットずつ並べる)であることが多く、8bppの場合は後者の場合が多い。8bpp(256色)はインデックスカラー以外にもモノクロ256階調のグレースケール形式(白黒と254段階の灰色)にも用いられる。
また、色情報として透明色を設定したり、各画素ごとに透明度(アルファ値)を設定できる形式もあり、他の画像と重ね合わせたときに背後の色が透ける表現ができる。32bppの場合はRGB各8ビットに透明度8ビット(256段階)とすることが多い。
ベクター画像
一方、画像を図形を表す数値情報の集合として表現した形式はベクター画像(ベクトルグラフィックス)と呼ばれる。画像を点や線分、面などの図形の描画情報の組み合わせとして表したもので、画質を劣化させることなく自由に拡大・縮小や変形ができる利点がある。表示や印刷を行う際には最終的に特定の画素数のビットマップ画像に変換(ラスタライズ)される。
ペイントソフト 【ペインティングソフト】 ⭐⭐
グラフィックスソフトの一種で、紙やキャンバスにペンや絵筆で絵を描くように画像を描画できるソフトウェア。
マウスなどを使ってカーソルをペン先や筆先のように動かし、画面上に絵を描いていくことができる。タッチパネル操作の機種では指や専用のスタイラスペンで画面に直に触れて描くこともできる。できた画像はビットマップ画像として保存される。
筆先の質感やタッチを自由に選択できるほか、画像の一部あるいは全体にぼかしやモザイク、水面の波紋などの特殊効果をかけられるフィルター機能、画像の一部を切り抜いたり変形したりする編集機能、複数の画像を重ね合わせるレイヤー機能などを備えているものが多い。
近年では、アニメーション制作を支援する製品、マンガ原稿の制作を支援する製品、複数人で共同作業できる製品、ペンタブレットでの操作を重視した製品、ネットサービスとしてWebブラウザ上で操作する製品など、様々な特色ある製品が登場している。
描画機能よりも、写真など既存の画像にフィルターや色の調整などの編集を行うことに力点を置いたソフトもあり、「フォトレタッチソフト」(photo editting software)と呼ばれる。また、ペイントソフトとは異なり、点や曲線、領域の塗りつぶしなどを組み合わせて図形やイラストレーションを作成するソフトは「ドローソフト」という。
「ペイントソフト」「ドローソフト」といった呼称は和製英語で、英語ではペイントソフトを “raster graphics editor” (ラスター画像編集ソフト)、ドローソフトを “vector graphics editor” (ベクター画像編集ソフト)といったように編集対象の画像形式によって呼び分けることが多い。
トリミング 【トリム】 ⭐
刈り込む(こと)、切り取る(こと)、整頓(する)、仕上げ(る)、などの意味を持つ英単語。端から一定の長さや割合を切り取って小さく(短く)する操作などのことを意味する。
写真や画像、図版などでは、全体の中で必要な部分だけを取り出して強調するために、不要な周縁部を切り取って排除する処理や操作をトリミングという。
映像の場合は、主に縦横比(アスペクト比)の調整のために上下あるいは左右を一定の割合で切り落として調整することをトリミングという。映画をアナログテレビ放送する際に左右をカットしてアスペクト比を4:3にする処理などが該当する。一方、写真の場合ように被写体の強調のために一部を切り取って拡大する処理や作業のことは「クロッピング」(cropping)という。
プログラミングやデータベースの分野では、文字列データの先頭や末尾に含まれる空白文字などを削除する操作のことをトリミングという。また、ログなど時系列に蓄積されていくデータなどについて、一定の条件や基準に基づいて自動的に削除する処理のことをトリミングという場合もある。
ベクター画像 【ベクターデータ】 ⭐⭐⭐
画像データの表現形式の一つで、画像を図形を表す数値情報の集合として表現したもの。拡大・縮小・変形しても画質が劣化せず、サイズや解像度によらず同じ品質の出力結果を得ることができる。
画像を単純な図形の集合として表現する方式で、輪郭などを構成する点の位置や、それらを結ぶ直線や曲線を表す方程式のパラメータ、変形・回転など操作情報、線や面の色情報などの組み合わせとして記述する。“vector” の表記は「ベクター」「ベクタ」「ベクトル」の揺れがあるが、意味の違いはない。
一方、画像を最小単位の小さな点である画素(ピクセル)の集合として表し、各画素の色情報を端から順に縦横に規則正しく並べた形式の画像データは「ビットマップ画像」(bitmap image)あるいは「ラスター画像」(raster image)と呼ばれる。
コンピュータのディスプレイやプリンタなどの出力装置はビットマップ方式で画像を扱うため、ベクター画像はそのままでは表示・印刷することができない。表示する際には画像の縦横の画素数を決めて、その範囲の中で実際に各図形を描画してビットマップ画像を得る。この描画処理のことを「ラスタライズ」(rasterization)という。
ビットマップ形式はどのような画像でも同じように記録できるが、ベクター画像は原理的に写真のような像の表現には向かず、文字や図、イラスト、デザインなど図形の組み合わせで表現しやすい像の記録に向いている。実際、コンピュータで扱う文字の形状データを収録したフォントデータの多くはベクター画像で表現されたアウトラインフォント(outline font)である。
ベクター画像を作成・編集するソフトウェアもあり、米アドビ社の「Adobe Illustrator」(アドビ・イラストレーター)などが有名である。汎用のベクター画像記録用の画像ファイル形式もいくつかあり、Illustrator標準の「AI形式」(.aiファイル)や、Webページなどでベクター画像を扱えるXMLベースの「SVG」(Scalable Vector Graphics)形式などがよく知られる。
ドローソフト 【ドローイングソフト】 ⭐⭐
画像の描画や編集を行うソフトウェアの一種で、画像を図形を組み合わせとして構成するベクター形式のイラストやデザインを作成するためのもの。
画面上でマウス操作やペン操作、タッチ操作により位置を指定して図形を描画していくソフトで、点や直線、曲線、多角形、円などの図形、アウトラインフォントの文字などを配置していき、これらに描画色を設定したり、囲まれた領域を塗りつぶすなどの編集を行って画像を作成する。
作成された画像は構成要素の点の座標や曲線方程式のパラメータなどの集合として表されたベクター画像として記述・保存されるため、算術的な変換により容易に変形や拡大・縮小を行うことができる。そのような変形処理によって画質が劣化しないという特徴がある。
1988年に初版が発売された米アドビ(Adobe)社の「Adobe Illustrator」(アドビ・イラストレーター)が本格的なプロ向けのソフトウェアとして広く普及している。他に米コーレル(Corel)社の「CorelDRAW」や、日本ではジャストシステムの「花子」などが有名で、「Inkscape」などのフリーソフトウェアもある。
主にベクター形式の画像を扱うソフトウェアとしては「CAD」(Computer Aided Design)ソフトなどもあるが、こちらは工業製品や建築物の設計図面の作成のための機能が充実しており、主にイラストレーションやグラフィックスの作成、デザインのために用いられるドローソフトとは区別される。
「Microsoft Visio」のようにダイアグラムなどの作図に特化したソフトウェアも、機能的な重複は大きいが主目的が異なるため区別されることが多い。ワープロソフトなどDTPソフトの中にも、線分や多角形、円、吹き出しなどドローソフトに似た簡易な作図機能を有するものは多くあり、この機能を「ドローツール」などと呼ぶこともある。
一方、同じ画像編集ソフトでも、画像を微細な色の付いた点(画素/ピクセル)の集合として取り扱うものを「ペイントソフト」と呼ぶ。絵画のようなきめ細かい描写や、写真の編集、合成などを行うことができるが、拡大や縮小、変形を行うと画質が劣化する。ドローソフトとは必要な画像の種類に応じて使い分ける必要がある。
彩度 ⭐
色を表す属性の一つで、色の鮮やかさのこと。白・黒・灰色の無彩色で0となり、純色で最大値となる。彩度を用いる表色系では最大値を100とするパーセンテージで表すことが多い。
表色系によって詳細は異なるが、彩度が高いほど純粋で鮮やか、くっきりした色合いとなる。彩度を下げていくと白・黒・灰色に近づいていき、ぼんやりしたくすんだ色合いになる。一般に多くの種類の色を混ぜるほど彩度は下がっていく。
コンピュータ上の表色系でよく用いられるHLS(HSL)、HSV、HSBなどの色空間では「S」(Saturation)が彩度を表しており、0を最小として1あるいは100を最大とする尺度で表される。これらの体系では残りの二つの属性として、色味を表す「色相」(H:Hue)、明るさを表す「輝度」(L:Lightness)あるいは「明度」(B:Brightness)が用いられる。
明度 ⭐
色を表す属性の一つで、色の明るさのこと。実際に放たれる光の強さのことではなく、色から受ける印象が明るいか暗いかを表す心理的な尺度である。
人間は色について「明るい色」「暗い色」という感覚を持っており、その度合いを何らかの尺度を用いて表したものを明度という。色合い・色味を表す「色相」(hue)、色の鮮やかさを表す「彩度」(saturation)と合わせて「色の三属性」という。
例えば、無彩色で考えると白が最も明度が高く、黒が最も明度が低い。灰色はその濃さに応じて両者の中間に位置する。彩度の高い色の場合には、明度が高いときに最もくっきりした色合いとなり、明度が0で彩度も色相も失われ黒になる。
色を数値で表す表色系では、黒を0、白を1または100とする尺度で表される。HSV色空間では「V」(Value)が明度を示している。似た表色系のHLS色空間(HSL色空間)などでは、ほぼ同じ概念を「輝度」(L:LightnessあるいはLuminance)と呼んでいる。
色相 ⭐
色を表す要素の一つで、赤、青、緑などといった色合い、色味のこと。可視光線は波長の違いにより人の目にそれぞれ異なった色として映り、この色の違いや種類のことを色相という。
赤、青、緑、黄、橙、紫など、日常的によく用いられる色には名前がついているが、波長は連続量であり中間色は無数にある。色相の全体像は色味が連続的に変化する図で示され、帯状に表したものを「色相スケール」、円環状に表したものを「色相環」という。
色を表す要素には色相のほかに、色の明るさ(明度/輝度)と鮮やかさ(彩度)がある。これらを組み合わせて一つの色を表すことができ、こららを「色の三属性」または「色の三要素」という。例えば、同じ赤の色相でも、明度が低ければ「暗い赤」に、彩度が低ければ「くすんだ赤」になる。
コンピュータの表色系でも色相(H:Hue)を用いるものがあり、彩度(S:Saturation)、輝度(L:LightnessあるいはLuminance)と組み合わせたものを「HSL色空間」あるいは「HLS色空間」、輝度に替えて明度(V:ValueあるいはB:Brightness)を組み合わせたものを「HSV色空間」「あるいは「HSB色空間」という。
補色 ⭐
色相環でちょうど反対の位置にある色の組み合わせのこと。また、ある色の反対側にある色のこと。
様々な色味を、対応する光の波長の連続的な変化に応じて円環状に並べたものを「色相環」(color circle)という。波長が最長の赤の隣に最短の紫を繋いで環状としている。この中で、ちょうど環の反対側にある色同士を補色という。
色相環の色と位置の対応関係は色の表現方法(表色系)によって微妙に異なるため、系によって色の組み合わせも異なるが、絵の具や印刷物など減法混色の系でよく知られるRYB色相環やマンセル色相環では「赤-緑」「黄-紫」「青-橙」の組み合わせがよく知られる。
補色の組み合わせは互いがくっきりと際立つ効果があるため、目立たせたい場所などに使うと効果的であるとされる。ただし、明度の赤い補色同士を直接隣り合わせると目がチカチカしてかえって見にくい状態になることがある。
類似色 ⭐
色相環で隣や近くにある色の組み合わせのこと。また、ある色の近くにある別の色のこと。
様々な色味を、対応する光の波長の連続的な変化に応じて円環状に並べたものを「色相環」(color circle)という。波長が最長の赤の隣に最短の紫を繋いで環状としている。この中で、位置が近い色同士を類似色という。
色相環の色と位置の対応関係は色の表現方法(表色系)によって微妙に異なるが、おおむね赤-赤紫-紫-青紫-青-水色-エメラルドグリーン-緑-黄緑-黄-橙-赤の順に並んでいる。この中で、例えば、「黄-橙-赤」や「緑-水色-青」、「青紫-赤紫-赤」といった組み合わせが類似色となる。
配色で類似色の組み合わせを用いると統一感や安定感が増し、暖色の組み合わせであれば明るさや優しさ、寒色の組み合わせであれば落ち着きや涼しさなどを演出することができる。一方、色相環で反対側にある色同士の組み合わせは「補色」と呼ばれ、対照的で目立つ組み合わせとされる。
色相環 ⭐⭐
様々な色味を、対応する光の波長の連続的な変化に応じて円環状に並べたもの。波長が最長の赤の隣に最短の紫を繋いで環状としている。
光は波長の違いにより人の目にそれぞれ異なった色として映り、赤、青、緑といった人間が感じる色の種類(色味)のことを「色相」(hue)という。波長の変化に応じて連続的に色味が変化する様子を円環状に表したものを色相環という。
色と位置の対応関係は色の表現方法(表色系)によって微妙に異なるが、名前のある主な色で言うと赤-赤紫-紫-青紫-青-水色-エメラルドグリーン-緑-黄緑-黄-橙-赤の順に並ぶ。いわゆる「光の三原色」(赤・緑・青)や「色の三原色」(水色・薄紫・黄)は、概ね各色が120度ずつ離れた配置となる。
色相環で隣や近くにある色同士を「類似色」、中心を挟んでちょうど反対側にある色同士を「補色」という。補色については表色系によって色の組み合わせも微妙に異なるが、絵の具や印刷物など減法混色の系でよく知られるRYB色相環やマンセル色相環では「赤-緑」「黄-紫」「青-橙」などが補色となる。
光の三原色 ⭐⭐
発光体の色のうち、組み合わせることで様々な色を合成することができる、赤・緑・青の三つの原色のこと。各色の頭文字を取って「RGB」(Red-Green-Blue)という略号で表される。
人間の視覚は主に赤・緑・青の各色の光に強く反応する色覚受容体で構成されているため、この三色の光を様々な強さで組み合わせることで、任意の色を構成することができる。実際には、緑は明るい黄緑に近い色、青はわずかに紫がかった群青に近い色が用いられる。
テレビやディスプレイ装置など発光して像を映し出す装置では、表示面にこの三色に対応する微細な発光素子が敷き詰められており、それぞれの強さを制御して各点の色を表現している。各色の強度を高めるほど色が明るくなっていき、三色とも最大の強度で足し合わせると白色、最低の強度で黒色となる。このような混色系を「加法混色」という。
一方、絵の具や印刷物のインクなど光の反射体の色は、シアン(cyan:濃い水色)、マゼンタ(magenta:薄紫)、イエロー(yellow:黄色)の三色の組み合わせによって表現することができる。この三色を「色の三原色」と呼び、各色の頭文字を取って「CMY」(Cyan-Magenta-Yellow)の略号で表される。
加法混色 ⭐⭐
光(光源、発光体)で様々な種類の色を表現するときの色の混合方法。最も一般的な方式は、赤(Red)、青(Blue)、緑(Green)のいわゆる「光の三原色」を混合してすべての色を表現する手法で、そのような系を三色の頭文字を取って「RGB」と呼ぶ。
RGBによる加法混色の系では、赤と緑を混ぜると黄色、オレンジ色、茶色を、青と緑を混ぜると水色を、赤と青を混ぜると紫色を、三色を同じ強度で混ぜると黒、灰色、白を、それぞれ表現することができる。
これに対し、光を反射する媒体で色を表現する場合の色の混合方法は「減法混色」という。コンピュータのディスプレイ装置などは加法混色の系で、印刷物などは減法混色の系(CMYやCMYKなど)であるため、コンピュータで作成した文書などを印刷するためには系の変換が必要になる。
階調 【階調数】 ⭐⭐⭐
コンピュータが画像を扱う際に、色の濃さや明るさを何段階で表現することができるかを表す数。この数が大きいほど細かな色や明るさの違いを表現できるが、画素あたりのデータ量は増大する。
自然界では色は光の波長によって異なり、連続量の一種だが、コンピュータで画像を扱う際にはこれを離散量(有限桁の数値)に変換する必要がある。その際、ある色の最も明るい(濃い)状態と暗い(薄い)状態の間を何段階で識別・表現することができるかを表す値が階調である。
モノクロの階調
最も単純な階調は白黒画像(モノクロ2階調)であり、すべての画素が真っ白と真っ黒のいずれかで表現される。色は「0」(黒)と「1」(白)の2値で識別され、各画素につき1ビットで表現することができる。
一方、一般に「モノクロ画像」あるいは「グレースケール画像」と呼ばれるものは白と黒の中間に明るさ(濃さ)の異なる複数の灰色を表現することができるものを指すことが多い。よく用いられる256階調(各画素の情報量は8ビット)のモノクロ画像では、白、黒、254段階の灰色の計256色を表現できる。
カラーの階調
カラー画像の場合は色を複数の原色に分解し、各色の階調の組み合わせで表現できる色の数が決まる。コンピュータ上で画像データを扱う際には色を赤(Red:R)・緑(Green:G)、青(Blue:B)の「光の3原色」に分解し、それぞれを同じ階調で表現することが多い。
人間の目にとって自然の光景と区別がつかない表現は、この各色について256段階(8ビット)程度の階調が必要であると言われており、これを「フルカラー」(full color)あるいは「トゥルーカラー」(true color)という。256の3乗で1677万7216色を表現することができる。
通常の用途ではフルカラーで十分なことが多いが、赤外線暗視映像のように特定の色味しか現れない特殊な表現の場合は単色256階調では色の境界が階段状になってしまうなど表現力が不足する場合がある。そのような状況にも対応できるよう、業務用の機器などでは内部的に各色10ビット(1024階調)や12ビット(4096階調)で表現するものもある。
Webセーフカラー 【ウェブセーフカラー】 ⭐
Webページを多色表示が困難な環境で閲覧する場合でも最低限確保されるべきとされた216色の集合。8ビット256色のインデックスカラー(パレットカラー)しか利用できない環境でも様々な色味が利用できるように定められたもので、事実上の業界標準として広まっている。
RGB(赤緑青)各色を16進数の「00」から「FF」まで均等に6段階の「00」「33」「66」「99」「CC」「FF」に分割し、「#336699」「#FF66CC」といったようにこれらの値の任意の組み合わせで色を定義する。「#000000」(黒)から「#FFFFFF」(白)までの間に、赤(R)6段階×緑(G)6段階×青(B)6段階の計216色が定義される。
値を等間隔に区切って機械的に組み合わせたものであるため、視覚的に区別する必要が薄い暗色側が豊富な一方、明色側は逆に大雑把すぎてデザインに用いるには難しい配色となっている。フルカラー表示が一般的になった現在はほとんど意識されることはない。
周波数 ⭐
規則正しく繰り返される現象の、単位時間あたりの繰り返し回数のこと。1秒あたりの繰り返し数を「Hz」(ヘルツ)という単位で表す。
音や光、電波、電気信号などの性質の記述によく用いられ、1秒間に1回繰り返す現象は1Hzとなる。1回の繰り返しにかかる時間の長さを「周期」(cycle)というが、これは周波数の逆数となる。
クロック周波数
コンピュータ内部の回路間や装置間の通信、デジタル伝送方式による機器間の通信などでは、信号を伝送するタイミングを揃えるためにクロック信号と呼ばれる周期的な電気信号を利用する。
このクロック信号の周波数が高ければ高いほど、単位時間あたりに多数の伝送や処理を行うことができ、伝送速度や処理性能を高めることができる。
1970年代の初期のマイクロプロセッサは数百kHz(キロヘルツ:1kHzは1000Hz)で動作していたが、半導体技術の急速な発展により現代では数GHz(ギガヘルツ:1GHzは10億Hz)で動作するチップが一般的になっている。
電磁波の周波数
電磁波は周波数により大きく特性が異なり、周波数の範囲によって呼び名が代わる。真空中では光速を周波数で割ると波長に、波長で割ると周波数になるという関係にある。
概ね3THz(テラヘルツ:1THzは1兆Hz)以下のものは「電波」(radiowave)と呼ばれ、放送や通信、レーダーなど様々な用途で広く活用されている。
概ね400~800THzは人間の目に光として認識される「可視光線」(visible light)で、単に光とも呼ばれる。人間の視覚は光の周波数の違いを色の違いとして知覚し、例えば最も低い領域は赤く、最も高い領域は紫に見える。可視光と電波の中間は「赤外線」(infrared:「赤い光より低い」の意)、可視光より高い周波数は「紫外線」(ultraviolet:「紫の光より高い」の意)である。
紫外線より高く、概ね30PHz(ペタヘルツ:1PHzは1000兆Hz)以上の領域は「X線」(エックス線)、さらに高い3EHz(エクサヘルツ:1EHzは100京Hz)程度より上の領域は「γ線」(ガンマ線)と呼ばれ、両者は放射線の一種に分類される。
音波の周波数
音は周波数によって高さが決まり、小さい周波数の音は低く、大きな周波数の音は高く聞こえる。人間の聴覚で聞き取れる可聴周波数は概ね20~20000Hz(20kHz)程度と言われ、それより低い低周波音や高い超音波は聞くことができない。
この範囲には個人差があるほか、加齢により高音(上限に近い周波数の音)が次第に聞こえなくなっていくことが知られている。動物の中にはこのような人間には聞こえない低いあるいは高い音を利用してコミュニケーションや反響定位(エコーロケーション)を行うものもいる。
Hz 【Hertz】 ⭐
周期的な現象の頻度を表す単位で、1秒あたりの生起回数(毎秒何回起きるか)を示したもの。1ヘルツは毎秒1回を意味し、周波数や振動数の単位として用いられる。
国際単位系(SI)に定められた単位で、19世紀に電磁波の研究をしていたドイツの物理学者、ハインリヒ・ヘルツ(Heinrich Rudolf Hertz)の名に由来する。基本単位の組み合わせ(組立単位)としては秒(s:second)を用いてその逆数「/s」「s-1」で表される。
ヘルツは周期が一定の現象についてのみ用いられ、同じ1秒あたりの数を表していても、ランダムに起きる事象の頻度などには「/s」(毎秒)が、1秒あたりの原子核の崩壊数については「Bq」(ベクレル)が用いられる。
ITの分野では、無線電波の周波数や電子回路の同期信号(クロック信号)の周波数、音声のサンプリング周波数などの単位としてなじみ深い。値が大きい場合は接頭辞をつけて、1000倍を「kHz」(キロヘルツ)、100万倍を「MHz」(メガヘルツ)、10億倍を「GHz」(ギガヘルツ)、1兆倍を「THz」(テラヘルツ)のように呼ぶ。
サンプリング周波数 【標本化周波数】 ⭐⭐
アナログ信号をデジタルデータに変換する際に、信号の変位を測定するサンプリング(標本化)を行う頻度。1秒間に何回サンプリングを行うかをHz(ヘルツ)で表す。
音声など連続的に変化する物理量をデジタルデータとして記録するには、ある瞬間の信号の変位量を測定するサンプリングを行い、得られた測定値を一定の桁数の離散値で表す量子化を行う。
この変換処理の頻度が標本化周波数で、周波数が高いほど短いサンプリング周期で頻繁に標本を得るため、もとの信号をより忠実に記録することができるが、その分だけ変換後の単位時間あたりのデータ量は増大する。
サンプリング定理により、標本化周波数の半分の周波数の信号まで正しく再現できるとされる。例えば、音声信号の場合、人間の耳に聞こえる最も高い音は20kHz(キロヘルツ)程度とされるため、音楽CDなどの標本化周波数は44.1kHzに設定されている。
サンプリング周期 【サンプリング間隔】 ⭐
アナログ信号をデジタルデータに変換する際に、信号の変位を測定するサンプリング(標本化)を行う周期。ある瞬間に信号の標本を得てから次の標本を得るまでの間隔を秒で表す。サンプリング周波数の逆数。
音声など連続的に変化する物理量をデジタルデータとして記録するには、ある瞬間の信号の強度や変位量を測定するサンプリングを行い、得られた測定値を一定の桁数の離散値で表す量子化を行う。
この標本化処理は一定の周期で行われ、その間隔を標本化周期という。周期が短ければ短いほど高頻度で標本を得るため、もとの信号をより忠実に記録することができるが、その分だけ変換後の単位時間あたりのデータ量は増大する。
通常、標本化の頻度は周期の逆数であるサンプリング周波数で表される。例えば、周期が0.01秒であれば、周波数は100Hz(ヘルツ)で表される。音楽CDなどに記録されている音声信号は人間の耳が聞き取れる可聴音(約20kHzまでの音波)を収録するため44.1kHz(44100Hz)でサンプリングされているが、これは標本化周期で表すと1/44100で約0.0000227秒、22.7マイクロ秒となる。
フレーム ⭐⭐
骨組み(を作る)、枠、縁、額縁、台、骨格、枠組み、背景、構造物、構成、組み立てる、枠にはめる、立案する、でっち上げる、などの意味を持つ英単語。IT分野では動画の各瞬間の画像(コマ)や、通信回線でやり取りするデータの送受信単位などを指すことが多い。
一般の外来語としては、絵画や写真などを入れる額縁や、画像の周囲を囲む飾り枠、機械などの骨組み、物事の理解の枠組みや共通の考え方などを意味することが多い。IT関連では主に以下の意味で用いられる。
動画のフレーム
動画を構成する一枚一枚の静止画(コマ)のことをフレームという。コンピュータで動画を表示する際は、数十分の1秒といった極めて短い一定の時間間隔で次々に静止画像を切り替えて表示することで人間の目に動いているように見せている。
この一枚ずつの静止画像をフレームという。動画の滑らかさの指標として、1秒間に書き換えるフレームの数を表す「fps」(frames per second:フレーム毎秒)という単位がよく用いられる。例えば、60fpsの動画といった場合は毎秒60枚の画像を切り替えて表示している。
データの送受信単位としてのフレーム
イーサネット(Ethernet)などいくつかの通信方式や通信プロトコル(通信規約)では、データの送受信単位をフレームと呼ぶ。送りたいデータを一定の大きさに分割し、先頭に宛先アドレスなどの制御情報を付加したもので、最大長や制御情報の形式は各規格ごとに定められている。
一般に、物理層における信号の送受信を一定のまとまりのデータ単位ごとの送受信に編成する「リンク層」あるいは「データリンク層」における送受信単位をフレームと呼ぶことが多い。有線LANの標準であるイーサネットの送受信単位は「MACフレーム」あるいは「イーサネットフレーム」と呼ばれる。
Webページ/HTMLのフレーム表示
Webページの表示手法の一つで、Webブラウザの表示領域を縦または横に複数の領域に分割して、それぞれに別のページを表示できるようにしたものをフレームという。HTMLではframeset要素(タグ)およびframe要素で定義する。
また、ページ内に矩形(箱型)の領域を設けて元のページから分離し、別のページの内容を埋め込んで表示する方式もあり、「インラインフレーム」(inline frame)という。広告の表示などに応用されており、HTMLではiframe要素で定義する。
フレームレート ⭐⭐⭐
動画像の表示の滑らかさを表す指標の一つで、動画が1秒あたり何枚の(静止)画像によって構成されるかを表す数。1秒あたりのコマ数。単位は「フレーム毎秒」(fps:frames per second)で、1fpsは動画が1秒あたり1枚の画像で構成されている(1秒あたり1回書き換えられる)ことを表す。
動画やゲームなど表示内容が時系列に変化する像をコンピュータで表示する場合、静止画像を高速に切り替えて表示することで動いているように見せている。動画像を構成する静止画像を「フレーム」(frame)と呼び、単位時間あたりのフレーム数が多ければ多いほど自然に近い滑らかな動画像となる。
動画データなどの属性としてフレームレートという場合は、その動画が毎秒何枚の画像を繋ぎあわせてできたものなのかを表している。人間の目に自然な動画として映るのは概ね30fps程度かそれ以上と言われており、これを下回るとカクカクとぎこちなく動く印象を与えるとされる。
コンピュータや映像機器などの処理能力についてフレームレートという場合は、動画を撮影、記録、圧縮、再生などする際に、1秒あたりに処理可能な画像の枚数や画面の書き換え回数の上限を表す。動画の処理能力が高いほどフレームレートも高くなり、より滑らかな動画を作成したり再生したりできる。
一方、ディスプレイ装置の画面書き換え頻度を「リフレッシュレート」(refresh rate)と呼び、1秒あたりの書き換え回数を「Hz」(ヘルツ)で表す。60Hzなら毎秒60回再描画される。動画データやゲームのフレームレートが高くても、表示側のリフレッシュレートが低ければその上限がフレームレートの上限となる。
fps 【フレーム毎秒】 ⭐⭐
動画のなめらかさを表す単位の一つで、画像や画面を1秒間に何回書き換えているかを表したもの。30fpsの動画は1秒あたり30枚の静止画で構成され、約0.033秒(33ミリ秒)ごとに画像を切り替えて再生される。
コンピュータや映像機器が動画像の録画や再生を行う際、毎秒数十枚の静止画像を撮影あるいは描画することで連続的な動画を構成している。この静止画を「フレーム」(frame)と呼び、単位時間あたりの密度を「フレームレート」(frame rate)という。1秒あたりの画像数を表す単位としてfpsが用いられる。
fpsの値が小さいと一枚の画像が表示される時間が長くなるため、動きのカクカクとした不自然で低品質な動画となる。大きいと高頻度で書き換えが行われるため、滑らかで高品質な動画となる。アナログテレビ放送が25~30fps程度だったことから、概ねこれ以上の大きさであれば自然で高品質な動画であるとみなされるが、近年では60fpsの高品質な動画に対応した機器が増えている。
フィールド毎秒
インターレース方式の動画や表示装置では、一度の書き換えで上から奇数番目と偶数番目のラインを交互に書き換えるため、2回の書き換えで全体が入れ替わるようになっている。この半分の画像を「フィールド」と呼び、フィールドを書き換える頻度として「フィールド毎秒」(fields per second)という単位が用いられることがある。この値は一般にfpsの2倍となる。
リフレッシュレートとの関係
ディスプレイ装置は高速で画面を書き換えることで表示内容の変化を表現する。1秒あたりの書き換え頻度を「リフレッシュレート」(refresh rate)と呼び、「Hz」(ヘルツ)という単位で表す。30Hzであれば毎秒30回画面を書き換えることを意味する。
動画やゲームが60fpsで書き換えを行っていても、ディスプレイが30Hzで動作していれば、表示内容は毎秒30回しか書き換わらない。逆に、ディスプレイが60Hzで動作していても、コンピュータ側の動画像の表示が30fpsであれば、やはり書き換え頻度は毎秒30回となる。
動画もディスプレイも同じ頻度で再描画していても、描画のタイミングがずれると表示が乱れることがある。例えば、60fpsの動画を60Hzのディスプレイで映す際、フレーム描画が始まるタイミングと画面リフレッシュが始まるタイミングが1/120秒ずれていると、毎回のリフレッシュで上半分が最新のフレームの内容、下半分が1コマ前のフレームの内容となってしまい、上下が繋がらず微妙にズレた表示となってしまう。この現象を「ティアリング」(screen tearing)あるいは「テアリング」という。