高校「情報Ⅰ」単語帳 - 全用語 - メディアの特性とコミュニケーション手段

アナログ ⭐⭐

機械で情報を扱う際の表現方法の一つで、情報を電圧の変化など連続的な物理量の変化に対応付けて表現し、保存・伝送する方式のこと。元の情報を高精度に表現することができるが、伝送や複製の際に劣化・変質を避けられない。

対義語は「デジタル」(digital)で、情報を離散的な数値に変換し、段階的な物理量として表現する。アナログで情報を扱う利点として、デジタル化では避けられない離散化に伴なう本来の信号からのズレ(量子化誤差)が生じないという点があり、情報の発生時点では正確に表現して記録することができる。

一方、保存や伝送、再生、複製に際して劣化やノイズによる影響を受けやすく、変化した情報は復元することができないため、伝送・複製を繰り返したり長年に渡って保存すると内容が失われたり変質してしまう難点がある。

かつて音楽の販売に用いられたレコード盤は、樹脂表面に刻まれた溝の凹凸の変化が音声信号の変化に直接対応付けられたアナログ記録方式だったが、コンパクトディスク(CD)では音声信号をサンプリング(標本化)して離散的な数値の列に変換し、これを表面の溝の凹凸にデジタル信号として記録している。

機器などの内部的にはデジタル処理が行われていても、人間には連続的に感じられる多段階の値で量を識別するような方式を便宜上アナログと呼ぶ場合がある。例えば、ゲーム機のコントローラの種類の一つで、方向の指示を多段階に滑らかに変化させられるものをアナログコントローラという。

1990年代頃までは、コンピュータなどによる情報のデジタル処理は限られた用途にのみ用いられてきたが、半導体チップやデジタル機器の性能向上や低価格化により、現代では身近な情報の多くがデジタル方式で保存、加工、伝送されるようになってきている。

比喩や誤用

コンピュータやデジタル方式の情報機器、通信サービスなどが普及するに連れ、旧来の機器や仕組み、考え方などを比喩的にアナログと称するようになった。

そのような用例の多くは情報の表現形式のデジタル・アナログとは無関係で、単に「コンピュータやインターネットによらない」という意味だったり、さらには「電気機械を使わない」ことを表していたりする。

中には本来の語義では誤用と思われる用例もある。例えば、ビデオゲームと対比してカードゲームやボードゲームを「アナログゲーム」と呼んだり、パソコンや電卓と対比してそろばんを「アナログな計算方法」と評することがあるが、これらが扱う情報は離散的な数値であり、電気機械を使っていないだけで情報の取り扱い方自体はデジタル的である。

アナログ量 【連続量】

大きさや強さが連続的に変化するような量のこと。実数で表されるような量で、物理量の多くが含まれる。最小量を単位に段階的に表される「デジタル量」(離散量/分離量)と対比される。

長さや重さ、面積、体積、時間、電流、電圧など物理量の多くは連続的に変化し、どんな小さな値もそれより小さな値に分割することができる。このような量をアナログ量あるいは連続量と呼び、ある連続量を別の連続量で表す情報の表現方式を「アナログ」(analog)という。

一方、個数や人数、金額のように、最小単位が決まっている段階的な量を「デジタル量」あるいは「離散量」「分離量」と呼ぶ。整数で表されるような量で、中間のない等間隔の飛び飛びの値を取る。情報を離散量として表す方式を「デジタル」(digital)という。

例えば、時間の流れは本来的には連続的であり連続量として表されるが、日常的には年、月、日、時、分、秒といった整数を組み合わせて段階的な量として取り扱うことがある。針が滑らかに動く時計は時間という連続量を針の角度(の変化)という別の連続量に写し取って表現した「アナログ時計」である。一方、液晶画面に時、分、秒を表示する時計は、時間を段階的に推移する離散量に近似して表現した「デジタル時計」である。

アナログ

機械で情報を扱う際の表現方法の一つで、情報を電圧の変化など連続的な物理量の変化に対応付けて表現し、保存・伝送する方式のこと。元の情報を高精度に表現することができるが、伝送や複製の際に劣化・変質を避けられない。

対義語は「デジタル」(digital)で、情報を離散的な数値に変換し、段階的な物理量として表現する。アナログ情報で情報を扱う利点として、デジタル化では避けられない離散化に伴なう本来の信号からのズレ(量子化誤差)が生じないという点があり、情報の発生時点では正確に表現して記録することができる。

一方、保存や伝送、再生、複製に際して劣化やノイズによる影響を受けやすく、変化した情報は復元することができないため、伝送・複製を繰り返したり長年に渡って保存すると内容が失われたり変質してしまう難点がある。

かつて音楽の販売に用いられたレコード盤は、樹脂表面に刻まれた溝の凹凸の変化が音声信号の変化に直接対応付けられたアナログ記録方式だったが、コンパクトディスク(CD)では音声信号をサンプリング(標本化)して離散的な数値の列に変換し、これを表面の溝の凹凸にデジタル信号として記録している。

機器などの内部的にはデジタル処理が行われていても、人間には連続的に感じられる多段階の値で量を識別するような方式を便宜上アナログ情報と呼ぶ場合がある。例えば、ゲーム機のコントローラの種類の一つで、方向の指示を多段階に滑らかに変化させられるものをアナログコントローラという。

1990年代頃までは、コンピュータなどによる情報のデジタル処理は限られた用途にのみ用いられてきたが、半導体チップやデジタル機器の性能向上や低価格化により、現代では身近な情報の多くがデジタル方式で保存、加工、伝送されるようになってきている。

比喩や誤用

コンピュータやデジタル方式の情報機器、通信サービスなどが普及するに連れ、旧来の機器や仕組み、考え方などを比喩的にアナログ情報と称するようになった。

そのような用例の多くは情報の表現形式のデジタル・アナログ情報とは無関係で、単に「コンピュータやインターネットによらない」という意味だったり、さらには「電気機械を使わない」ことを表していたりする。

中には本来の語義では誤用と思われる用例もある。例えば、ビデオゲームと対比してカードゲームやボードゲームを「アナログゲーム」と呼んだり、パソコンや電卓と対比してそろばんを「アナログ情報な計算方法」と評することがあるが、これらが扱う情報は離散的な数値であり、電気機械を使っていないだけで情報の取り扱い方自体はデジタル的である。

デジタル 【ディジタル】 ⭐⭐

機械で情報を扱う際の表現方法の一つで、情報をすべて整数のような離散的な値の集合として表現し、段階的な物理量に対応付けて記憶・伝送する方式のこと。特に、情報を2進数の「0」と「1」の組み合わせに置き換えて表現する方式。

現代のコンピュータはデータをすべて2進数の値の列に置き換え、これをスイッチのオン・オフや電圧の高低など明確に区別できる2状態の物理量に対応させて保存・伝送する。これに合わせて、通信回線や記憶媒体などもデジタル方式で情報を取り扱うようになっている。

対義語は「アナログ」(analog)で、情報を連続した物理量で表現する方式を意味する。初期の情報機器はアナログテレビ放送や音楽レコードのようにアナログ方式で情報を記録・伝送していたが、現代ではコンピュータの普及に合わせて動画配信やCDのようにデジタル方式への置き換えが進んでいる。

デジタルで情報を扱う利点として、保存や伝送、再生、複製などを行う際に劣化やノイズの影響を受けにくく、伝送・複製を何度繰り返しても内容が変化しない点や、様々な種類の情報を数値の集合として同じように扱うことができ、情報の種類によって媒体の選択に制限を受けない点などがある。ただし、連続的に変化する信号を離散値に変換する際に、必ず本来の信号からのズレ(量子化誤差/標本化誤差)が生じる。

機器などの内部的にはデジタル処理が行われていても、人間には連続的に感じられる多段階の値で量を識別するような方式を便宜上アナログと呼ぶ場合がある。例えば、ゲーム機のコントローラの種類の一つで、方向の指示を多段階に滑らかに変化させられるものをアナログコントローラという。

比喩や誤用

コンピュータやデータ通信、デジタル方式の記憶媒体などが普及するに連れ、「デジタル」という語をコンピュータやインターネットに関連するものの総称、「アナログ」をその逆、すなわち「電気・電子技術に依らないもの」とする比喩的な用法が広まった。

このような用例の多くは本来の情報の表現形式の違いとは無関係に用いられるため、カードゲームやボードゲームなどをビデオゲームに対比して「アナログゲーム」と呼んだり、そろばんを計算機と対比して「アナログな計算方法」と呼んだりするが、これらは離散的な数値しか扱わないため、情報の扱い方そのものはデジタル的である。

デジタル量 【離散量】

大きさや強さが段階的に変化するような量のこと。整数で表されるような量で、個数や金額などが該当する。無段階で連続的に変化する「アナログ量」(連続量)と対比される。

個数や人数、金額などは、それ以上分割できない最小単位が決まっており、中間のない等間隔の飛び飛びの値を取る。すべての量は最小単位の整数倍として表すことができる。このような量をデジタル量あるいは離散量、分離量と呼び、量を離散量として表す情報の表現方式を「デジタル」(digital)という。

一方、長さや重さ、時間、電流など物理量の多くは連続的に変化し、どんな小さな値もそれより小さな値に分割することができる。このような量を「アナログ量」あるいは「連続量」と呼び、ある連続量を別の連続量で表す情報の表現方式を「アナログ」(analog)という。

例えば、時間の流れは本来的には連続的であり連続量として表されるが、日常的には年、月、日、時、分、秒といった整数を組み合わせて段階的な量として取り扱うことがある。液晶画面に時、分、秒を表示する時計は、時間を段階的に推移する離散量に近似して表現した「デジタル時計」である。一方、針が滑らかに動く時計は時間という連続量を針の角度(の変化)という別の連続量に写し取って表現した「アナログ時計」である。

デジタル量 【離散量】

大きさや強さが段階的に変化するような量のこと。整数で表されるような量で、個数や金額などが該当する。無段階で連続的に変化する「アナログ量」(連続量)と対比される。

個数や人数、金額などは、それ以上分割できない最小単位が決まっており、中間のない等間隔の飛び飛びの値を取る。すべての量は最小単位の整数倍として表すことができる。このような量を離散量あるいは離散量、分離量と呼び、量を離散量として表す情報の表現方式を「デジタル」(digital)という。

一方、長さや重さ、時間、電流など物理量の多くは連続的に変化し、どんな小さな値もそれより小さな値に分割することができる。このような量を「アナログ量」あるいは「連続量」と呼び、ある連続量を別の連続量で表す情報の表現方式を「アナログ」(analog)という。

例えば、時間の流れは本来的には連続的であり連続量として表されるが、日常的には年、月、日、時、分、秒といった整数を組み合わせて段階的な量として取り扱うことがある。液晶画面に時、分、秒を表示する時計は、時間を段階的に推移する離散量に近似して表現した「デジタル時計」である。一方、針が滑らかに動く時計は時間という連続量を針の角度(の変化)という別の連続量に写し取って表現した「アナログ時計」である。

閾値 【しきい値】

その値を境に、上下で意味や条件、判定などが異なるような値のこと。境界となる値。ITの分野では、電子回路の高電位と低電位の区別や、プログラミングの条件分岐などで用いられる。

もとは生物学や物理学などで、ある現象や反応などが誘起される最低限の量などを指す概念だが、IT分野では「警告を表示する残り容量のしきい値を10%に設定する」といったように人為的に設定された境界値などを指す場合もある。

コンピュータはすべての情報を「0」と「1」を組み合わせた2進数で表すが、内部のデジタル回路では電圧の高低を0と1に対応付けて表す。電圧の高低の判断の境目となる値がしきい値で、明確に区別できるように「1.5V以下は0、3.5V以上は1」といったように中間に幅を持たせることが多い。

なお、「閾値」の「閾」の文字は音読みが「イキ」、訓読みが「しきい」とされ、心理学や生理学などでは「いきち」、物理学や工学などでは「しきいち」と読むことが多いようである。工学系では「しきい値」というひらがな表記が定着している。

デジタル 【ディジタル】

機械で情報を扱う際の表現方法の一つで、情報をすべて整数のような離散的な値の集合として表現し、段階的な物理量に対応付けて記憶・伝送する方式のこと。特に、情報を2進数の「0」と「1」の組み合わせに置き換えて表現する方式。

現代のコンピュータはデータをすべて2進数の値の列に置き換え、これをスイッチのオン・オフや電圧の高低など明確に区別できる2状態の物理量に対応させて保存・伝送する。これに合わせて、通信回線や記憶媒体などもデジタル情報方式で情報を取り扱うようになっている。

対義語は「アナログ」(analog)で、情報を連続した物理量で表現する方式を意味する。初期の情報機器はアナログテレビ放送や音楽レコードのようにアナログ方式で情報を記録・伝送していたが、現代ではコンピュータの普及に合わせて動画配信やCDのようにデジタル情報方式への置き換えが進んでいる。

デジタル情報で情報を扱う利点として、保存や伝送、再生、複製などを行う際に劣化やノイズの影響を受けにくく、伝送・複製を何度繰り返しても内容が変化しない点や、様々な種類の情報を数値の集合として同じように扱うことができ、情報の種類によって媒体の選択に制限を受けない点などがある。ただし、連続的に変化する信号を離散値に変換する際に、必ず本来の信号からのズレ(量子化誤差/標本化誤差)が生じる。

機器などの内部的にはデジタル処理が行われていても、人間には連続的に感じられる多段階の値で量を識別するような方式を便宜上アナログと呼ぶ場合がある。例えば、ゲーム機のコントローラの種類の一つで、方向の指示を多段階に滑らかに変化させられるものをアナログコントローラという。

比喩や誤用

コンピュータやデータ通信、デジタル方式の記憶媒体などが普及するに連れ、「デジタル情報」という語をコンピュータやインターネットに関連するものの総称、「アナログ」をその逆、すなわち「電気・電子技術に依らないもの」とする比喩的な用法が広まった。

このような用例の多くは本来の情報の表現形式の違いとは無関係に用いられるため、カードゲームやボードゲームなどをビデオゲームに対比して「アナログゲーム」と呼んだり、そろばんを計算機と対比して「アナログな計算方法」と呼んだりするが、これらは離散的な数値しか扱わないため、情報の扱い方そのものはデジタル情報的である。

デジタル 【ディジタル】

機械で情報を扱う際の表現方法の一つで、情報をすべて整数のような離散的な値の集合として表現し、段階的な物理量に対応付けて記憶・伝送する方式のこと。特に、情報を2進数の「0」と「1」の組み合わせに置き換えて表現する方式。

現代のコンピュータはデータをすべて2進数の値の列に置き換え、これをスイッチのオン・オフや電圧の高低など明確に区別できる2状態の物理量に対応させて保存・伝送する。これに合わせて、通信回線や記憶媒体などもデジタルデータ方式で情報を取り扱うようになっている。

対義語は「アナログ」(analog)で、情報を連続した物理量で表現する方式を意味する。初期の情報機器はアナログテレビ放送や音楽レコードのようにアナログ方式で情報を記録・伝送していたが、現代ではコンピュータの普及に合わせて動画配信やCDのようにデジタルデータ方式への置き換えが進んでいる。

デジタルデータで情報を扱う利点として、保存や伝送、再生、複製などを行う際に劣化やノイズの影響を受けにくく、伝送・複製を何度繰り返しても内容が変化しない点や、様々な種類の情報を数値の集合として同じように扱うことができ、情報の種類によって媒体の選択に制限を受けない点などがある。ただし、連続的に変化する信号を離散値に変換する際に、必ず本来の信号からのズレ(量子化誤差/標本化誤差)が生じる。

機器などの内部的にはデジタル処理が行われていても、人間には連続的に感じられる多段階の値で量を識別するような方式を便宜上アナログと呼ぶ場合がある。例えば、ゲーム機のコントローラの種類の一つで、方向の指示を多段階に滑らかに変化させられるものをアナログコントローラという。

比喩や誤用

コンピュータやデータ通信、デジタル方式の記憶媒体などが普及するに連れ、「デジタルデータ」という語をコンピュータやインターネットに関連するものの総称、「アナログ」をその逆、すなわち「電気・電子技術に依らないもの」とする比喩的な用法が広まった。

このような用例の多くは本来の情報の表現形式の違いとは無関係に用いられるため、カードゲームやボードゲームなどをビデオゲームに対比して「アナログゲーム」と呼んだり、そろばんを計算機と対比して「アナログな計算方法」と呼んだりするが、これらは離散的な数値しか扱わないため、情報の扱い方そのものはデジタルデータ的である。

デジタル化

物事の仕組みや手段にコンピュータや通信ネットワークなどのデジタル技術を取り入れること。または、アナログ信号をデジタルデータに変換すること(A/D変換)。

パソコンやスマートフォンなどの電子機器、構内ネットワーク(LAN)やインターネットなどのコンピュータネットワーク、Webサイトやネットサービスなどを駆使し、情報の作成や取得、保管、加工、伝送をデジタルデータの状態で行うようにする。

ビジネスや何らかの組織的な活動についてデジタル化という場合、その目的やデジタル技術の活用度合いなどに応じて何段階かに分類される。一般的にはアナログに近い方から順に「デジタイゼーション」(digitization)、「デジタライゼーション」(digitalization)、「デジタルトランスフォーメーション」(digital transformation)の3段階に整理することが多い。

デジタイゼーション (digitization)

情報の形態や形式を紙面などの物体やアナログ形式からコンピュータ上のファイルなどデジタル形式に置き換えることを「デジタイゼーション」(digitization)という。

例えば、書類をイメージスキャナで取り込んで画像ファイルやPDF文書などに変換して保存したり、FAXや郵便の代わりに電子メールを導入することなどが該当する。情報の保管や伝送がデジタル技術に置き換わり効率化やコスト削減などを進める効果はあるが、ビジネスの仕組みや業務手順などはアナログ時代と特に変わらない。

デジタライゼーション (digitalization)

単なるデジタルへの置き換えに留まらず、業務プロセスをデジタル技術を前提としたものに変革することを「デジタライゼーション」(digitalization)という。

例えば、製品をECサイトで販売したり、書類の伝票を挟まずにシステム間の通信で受発注を行ったり、蓄積したデータを解析ツールなどで分析し、企画や意思決定などに反映させることなどが該当する。アナログ時代には不可能だったようなこともできるようになり、事業や製品の様態も大きく変革される。

デジタルトランスフォーメーション (DX)

デジタライゼーションを更に推し進め、業務手順などに留まらず事業の仕組みや製品、組織の在り方などをデジタルに合わせて根本的に作り直すことを「デジタルトランスフォーメーション」(DX:Digital Transformation)という。

例えば、映画やテレビ番組のような動画コンテンツを制作して定額でネット配信する動画配信サービス、CDやダウンロード販売に代わって楽曲を定額聴き放題で提供する音楽ストリーミングサービス、通信端末で利用するキャッシュレス決済サービスなどは、既存のビジネスの仕組みやインフラを前提とせず、デジタルで完結する新しいモデルで事業を展開している。

A/Dコンバータ 【ADC】 ⭐⭐

アナログ信号をデジタル信号に変換する電子回路。連続量であるアナログ信号の強度を一定時間ごとに記録(標本化/サンプリング)し、その値を一定のビット数の値で表現(量子化)する。

単位時間あたりの標本化の回数をサンプリング周波数(サンプリングレート)と呼び、毎回の標本データを表現する値のビット数を量子化ビット数という。これらの値が大きいほどアナログ波形をより正確にデジタルデータの集合として記録できるが、単位時間あたりの記録に必要なデータ量は増大する。

音声や光(画像・映像)、電気信号、電波などを電子機器に取り込んでデジタル処理するためには、センサーやアンテナなどが得たアナログ信号をA/D変換でデジタルデータに変換する必要があり、様々な機器の内部に内蔵されている。

A/D変換とは逆に、デジタル信号を元にアナログ信号を生成する電子回路のことをDAC(D/Aコンバータ、デジタルアナログ変換器)という。

D/Aコンバータ 【DAC】

デジタル信号をアナログ信号に変換する電子回路。離散値で表現されたデジタル電気信号を入力すると、対応する連続量のアナログ信号を出力する。

コンピュータでは、メモリ上でデジタルデータとして管理されている画面の表示情報をアナログ信号に変換してディスプレイ装置に送出したり、音声データをアナログ信号としてスピーカーに送出したりといった用途で主に用いられている。

アナログ信号を何段階のデジタル値で近似するかを分解能と呼び、ビット単位で表す。8ビットなら256段階、10ビットなら1024段階で波形を表現できる。また、1秒間に何回変換を行うことができるかをサンプリング速度(サンプリングレート/サンプリング周波数)と呼び、ヘルツ(Hz)単位で表す。1MHzなら毎秒100万回、1GHzなら10億回の変換を行う。

いずれの値も大きければ大きいほど元の波形に近い滑らかなアナログ信号を再現できる。ただし、両者はいずれかを向上させるともう一方の性能を高めるのが難しいトレードオフの関係にあるため、用途に応じてどちらを重視するか考えて方式や製品の選択などを行う必要がある。

D/A変換には原理が異なる複数の方式があり、得意な分野や用途が異なっている。よく知られるのは多数の抵抗を並べた抵抗ラダー型や抵抗ストリング型、キャパシタ(コンデンサ)を用いる容量アレイ型、オーバーサンプリングという手法を応用したΔΣ(デルタシグマ)型、電流の大きさを変化させて信号を出力する電流出力型などがある。

D/A変換とは逆に、アナログ信号をデジタル信号に変換する電子回路のことを「A/Dコンバータ」(ADC:デジタルアナログ変換器)という。電波や電気信号の受信、写真や映像の撮影、音声の録音など、自然界の物理状態をデジタル値の列に変換してコンピュータで利用するために必要となる。

D/Aコンバータ 【DAC】

デジタル信号をアナログ信号に変換する電子回路。離散値で表現されたデジタル電気信号を入力すると、対応する連続量のアナログ信号を出力する。

コンピュータでは、メモリ上でデジタルデータとして管理されている画面の表示情報をアナログ信号に変換してディスプレイ装置に送出したり、音声データをアナログ信号としてスピーカーに送出したりといった用途で主に用いられている。

アナログ信号を何段階のデジタル値で近似するかを分解能と呼び、ビット単位で表す。8ビットなら256段階、10ビットなら1024段階で波形を表現できる。また、1秒間に何回変換を行うことができるかをサンプリング速度(サンプリングレート/サンプリング周波数)と呼び、ヘルツ(Hz)単位で表す。1MHzなら毎秒100万回、1GHzなら10億回の変換を行う。

いずれの値も大きければ大きいほど元の波形に近い滑らかなアナログ信号を再現できる。ただし、両者はいずれかを向上させるともう一方の性能を高めるのが難しいトレードオフの関係にあるため、用途に応じてどちらを重視するか考えて方式や製品の選択などを行う必要がある。

D/Aコンバータには原理が異なる複数の方式があり、得意な分野や用途が異なっている。よく知られるのは多数の抵抗を並べた抵抗ラダー型や抵抗ストリング型、キャパシタ(コンデンサ)を用いる容量アレイ型、オーバーサンプリングという手法を応用したΔΣ(デルタシグマ)型、電流の大きさを変化させて信号を出力する電流出力型などがある。

D/Aコンバータとは逆に、アナログ信号をデジタル信号に変換する電子回路のことを「A/Dコンバータ」(ADC:デジタルアナログ変換器)という。電波や電気信号の受信、写真や映像の撮影、音声の録音など、自然界の物理状態をデジタル値の列に変換してコンピュータで利用するために必要となる。

A/Dコンバータ 【ADC】

アナログ信号をデジタル信号に変換する電子回路。連続量であるアナログ信号の強度を一定時間ごとに記録(標本化/サンプリング)し、その値を一定のビット数の値で表現(量子化)する。

単位時間あたりの標本化の回数をサンプリング周波数(サンプリングレート)と呼び、毎回の標本データを表現する値のビット数を量子化ビット数という。これらの値が大きいほどアナログ波形をより正確にデジタルデータの集合として記録できるが、単位時間あたりの記録に必要なデータ量は増大する。

音声や光(画像・映像)、電気信号、電波などを電子機器に取り込んでデジタル処理するためには、センサーやアンテナなどが得たアナログ信号をA/Dコンバータでデジタルデータに変換する必要があり、様々な機器の内部に内蔵されている。

A/Dコンバータとは逆に、デジタル信号を元にアナログ信号を生成する電子回路のことをDAC(D/Aコンバータ、デジタルアナログ変換器)という。

サンプリング 【標本化】 ⭐⭐⭐

対象全体の中から何らかの基準や規則に基いて一部を取り出すこと。統計調査などで少数の調査対象を選び出すことや、信号のデジタル化などで一定周期で強度を測定することなどを指す。

アナログ信号のサンプリング

信号処理の手法の一つで、アナログ信号などの連続量の強度を一定の時間間隔で測定し、観測された値(標本値)の列として離散的に記録することを標本化ということが多い。デジタルデータとして記録したい場合は、値を整数などの離散値で表す「量子化」(quantization)処理が連続して行われる。

測定の間隔を「標本化周期」(sampling cycle:標本化周期)、その逆数である測定の頻度(単位時間あたりの回数)を「標本化周波数」(sampling frequency:標本化周波数)という。頻度の多寡は通常標本化周波数で表現され、単位として1秒あたりの回数を表す「Hz」(ヘルツ)が用いられる。

例えば、音声を44.1kHz(キロヘルツ:Hzの1000倍)で標本化する場合、音声信号の強度を毎秒4万4100回記録し、音声データを1秒あたり4万4100個の数値の列として表現する。44.1kHzは人間の可聴音をほぼカバーする周波数とされ、CD(コンパクトディスク)などの音声記録に用いられている。

統計・調査におけるサンプリング

統計や調査などの分野では、調査したい母集団全体を対象とすることが困難な場合に、集団を代表する少数の標本を抽出して対象とし、その結果から統計的に母集団の性質を推計する手法を標本化という。製品の出荷時検査や社会調査などで広く用いられ、標本から母集団の推定値を算出する方法や偏りのない標本の抽出方法などについて様々な手法が提唱されている。

音楽におけるサンプリング

音楽の分野では、楽曲の制作手法の一つで、既存の楽曲や何らかの音源からメロディや歌詞、あるいは音声そのものの断片を抽出し、引用したり繋ぎ合わせる技法を標本化という。また、録音した楽器の音や環境音、人や動物の声などを短い単位に分解し、再構成して楽曲に仕上げる手法のことを標本化ということもある。

サンプリング 【標本化】 ⭐⭐

対象全体の中から何らかの基準や規則に基いて一部を取り出すこと。統計調査などで少数の調査対象を選び出すことや、信号のデジタル化などで一定周期で強度を測定することなどを指す。

アナログ信号のサンプリング

信号処理の手法の一つで、アナログ信号などの連続量の強度を一定の時間間隔で測定し、観測された値(標本値)の列として離散的に記録することをサンプリングということが多い。デジタルデータとして記録したい場合は、値を整数などの離散値で表す「量子化」(quantization)処理が連続して行われる。

測定の間隔を「サンプリング周期」(sampling cycle:標本化周期)、その逆数である測定の頻度(単位時間あたりの回数)を「サンプリング周波数」(sampling frequency:標本化周波数)という。頻度の多寡は通常サンプリング周波数で表現され、単位として1秒あたりの回数を表す「Hz」(ヘルツ)が用いられる。

例えば、音声を44.1kHz(キロヘルツ:Hzの1000倍)でサンプリングする場合、音声信号の強度を毎秒4万4100回記録し、音声データを1秒あたり4万4100個の数値の列として表現する。44.1kHzは人間の可聴音をほぼカバーする周波数とされ、CD(コンパクトディスク)などの音声記録に用いられている。

統計・調査におけるサンプリング

統計や調査などの分野では、調査したい母集団全体を対象とすることが困難な場合に、集団を代表する少数の標本を抽出して対象とし、その結果から統計的に母集団の性質を推計する手法をサンプリングという。製品の出荷時検査や社会調査などで広く用いられ、標本から母集団の推定値を算出する方法や偏りのない標本の抽出方法などについて様々な手法が提唱されている。

音楽におけるサンプリング

音楽の分野では、楽曲の制作手法の一つで、既存の楽曲や何らかの音源からメロディや歌詞、あるいは音声そのものの断片を抽出し、引用したり繋ぎ合わせる技法をサンプリングという。また、録音した楽器の音や環境音、人や動物の声などを短い単位に分解し、再構成して楽曲に仕上げる手法のことをサンプリングということもある。

量子化 ⭐⭐⭐

アナログ信号などの連続量を整数などの離散値で近似的に表現すること。自然界から取り込んだ信号などをコンピュータで処理・保存できるようデジタルデータに置き換える際などによく行われる。

音や光、電気、電波など物理現象に伴う信号は本来連続量であるため、そのままではコンピュータなどの電子回路で取り扱うことができない。そこで、一定の決まった間隔で信号の強度を測定(標本化/サンプリング)し、決まった細かさの段階に当てはめて表していく。

例えば、4段階の値で量子化を行う系では、信号強度の測定値(標本)は0、1/3、2/3、1の中から最も近い値が選ばれる。0.1に近い標本は0、0.4に近い標本は1/3といった具合である。この段階の数が多いほど元の信号をより高い精度で忠実に表現することができるが、量子化後のデータ量はその分だけ増大する。

この細かさをビット数で表したものを「量子化ビット数」と呼び、これが1ビットであれば2段階(21)、8ビットならば256段階(28)、16ビットならば65,536段階(216)の細かさで強度を表現できる。

量子化ビット数 【サンプリングビット数】 ⭐⭐

アナログ信号からデジタル信号への変換(A/D変換)の際に、信号を何段階の数値で表現するかを示す値。この値が大きいほど元の信号に忠実なデータが得られるが、データ量はその分増大する。

例えば、量子化ビット数が8ビットの場合は、毎回のサンプリングで得られた信号強度を28、すなわち256段階の数で表現することができる。これが16ビットになると、216の65,536段階で表すことができるようになり、8ビットの場合より細かな違いを表現できる。

A/D変換後のデータ量はサンプリング周波数に量子化ビット数を掛け合わせた数となる。例えば、サンプリング周波数44.1kHz、量子化16ビットで音声を記録すると、1秒間の44,100回のサンプリングを行い、各回16ビット(2バイト)のデータを得るため、705.6kbps(キロビット毎秒)あるいは88.1KB/s(キロバイト毎秒)のデータ量となる。

オーディオCD(CD-DA)の仕様では量子化ビット数は16ビットと規定されており、音声を65,536段階のレベルで記録するが、DVD-Videoは24ビットまで対応しており、約1677万段階となる。

イメージスキャナなどで画像を取り込む場合、表示装置や画像形式などが対応している各色8ビット256段階の24ビットカラー(トゥルーカラー)で取り込む機器が多いが、各色256段階では単色の画像などの場合に表現力が低いため、上位機種などでは各色12ビット(4,096段階)や16ビットの量子化ビット数に対応しているものもある。

量子化誤差 【量子化歪み】

アナログ信号をデジタル信号に変換する際に生じる誤差の一種で、元の信号レベルとデジタル化した後の数値の間に生じる誤差のこと。

アナログ信号は無段階に滑らかに変化する連続量だが、これをデジタル化する際には一定の周期で信号レベルを測定する「標本化」を行い、得られた標本を整数などの離散値で表す「量子化」(quantization)という操作が必要になる。

量子化では、本来連続量である信号レベルを有限段階の飛び飛びの値である離散値(デジタル値)で近似する。何段階の数値で表すかは「量子化ビット数」で示され、例えば8ビットで量子化を行う場合は信号を0から255の256段階の数値に置き換えて表現する。

例えば、ある瞬間の信号レベルを測定したら最大値の256分の128と129の間であったとき、量子化によってこれを「128」に決定すると、真の値から切り捨てられる値が生じる。各測定点ごとにこのような量子化誤差が少しずつ生じ、得られたデジタル信号は元の波形とはわずかずつ異なるものとなる。

量子化誤差によって生じた歪みはある種のノイズであるとも捉えられるため、「量子化雑音」(量子化ノイズ)と呼ぶこともある。ノイズとして見た場合、切り捨てられる値の大きさには規則性がなく、ランダムノイズに近い性質を持っていることが知られている。

エンコード 【符号化】 ⭐⭐⭐

ある形式の情報を一定の規則に従って別の形式に変換すること。元の形式に復元可能な状態に変換することを指し、データ圧縮や暗号化、文字コードの変換などが該当する。

ある形式のアナログ信号やデジタルデータを特定の形式の符号(code)に置き換える操作を指す。得られた符号列に逆方向の変換を行って元の状態に戻す操作は「デコード」(decode)という。デコードによって符号化前の状態を復元することができるが、非可逆圧縮など完全に元の状態には戻せない方式もある。

例えば、動画データは極めてデータ量が大きいため、符号化処理によってデータの間引きや圧縮を行い、短い符号列に置き換えてから保存や伝送を行う。圧縮されたデータはそのままでは再生できないため、再生時にはデコード処理によって元のデータを取り出してから表示を行う。

ある方式の符号化処理を行う装置やソフトウェアを「エンコーダ」(encoder)、その方式でデコード処理を行うものを「デコーダ」(decoder)という。音声の録音と再生、映像の録画と再生など、状況に応じてどちらも行う可能性がある場合には、両者を一体化した「コーデック」(codec:encoder-decoder)を用いる。

データ

何かを文字や符号、数値などのまとまりとして表現したもの。人間にとって意味のあるものや、データ量を人間が解釈した結果のことを情報と呼ぶ。

ITの分野でデータといった場合には、コンピュータで保存や加工、伝送などが可能なデジタルデータ(digital data)を指す。これは信号や情報をすべて「0」あるいは「1」のいずれかを取る「ビット」(bit)と呼ばれる情報の最小単位を並べて表現したもので、情報の種類や形式によらず同じ装置や処理によって扱うことが可能となる。

また、文脈によっては、コンピュータが扱うデータ量全体のうち、コンピュータプログラム以外のものをデータ量と呼ぶことがある。プログラムが取り扱う対象となる情報や信号などを特定の形式で表したものを指す。

英語の “data” はもともと “datum” (データム)の複数形だったが、現在では不可算名詞として扱うことが多い。

データ量/データ長

データ量にも量(data quantity)の概念があり、多いほどたくさんの情報や信号を表現することができる。デジタル化されたデータ量の量は、データ量を表現するビット列の長さで表されるため、データ量長(data length)とも呼ばれる。量の単位としてはビットをそのまま用いる。

実用上は8ビットを一つの単位とした「バイト」(byte)を用いることが多く、また、大きな数を表すときは物理量と同じようにキロ(kilo/1000倍)、メガ(mega/100万倍)、ギガ(giga/10億倍)、テラ(tera/1兆倍)などの接頭辞を先頭につける。

情報エントロピー 【平均情報量】

ある事象の組み合わせで表される系で、各事象の情報量の平均のこと。統計力学における無秩序さの指標であるエントロピーに似た概念であるためこのように呼ばれ、事象の不確かさの程度を表している。

情報理論における情報量は事象の生起確率によって定義され、例えばコインを投げて表が出る確率は1/2(50%)であるため、「コインを投げたら表が出た」という情報の情報量は-log2(1/2)で1ビットとなる。

コイントスの全事象は「表が出る」「裏が出る」の2つで、生起確率はどちらも1/2、情報量は1ビットである。よって、全事象の平均情報量も(1+1)/2で1ビットであり、これがコイントスの情報エントロピーである。

一方、必ず表しか出ないよう細工したコインを投げる場合、表が出る確率は100%、裏が出る確率は0%で、どちらも情報量は0ビットである。エントロピーは(0+0)/2で0ビットとなり、通常のコイントスに比べ事象の不確かさが失われていることがわかる。

ビット ⭐⭐⭐

情報量の最小単位で、二つの選択肢から一つを特定する情報の量。コンピュータなどでは0と1のいずれかを取る二進数の一桁として表される。

語源は “binary digit” (二進法の数字)を繋げて省略した表現と言われる。情報をすべてビット列に置き換えて扱うことを「デジタル」(digital)という。1ビットのデータが表す情報量は、投げたコインの表裏のように、二つの状態のいずれであるかを示すことができる。

複数のビットを連ねて一つのデータとすることで、2ビットなら4状態(22)、3ビットなら8状態(23)といったように、より多い選択肢を識別できる。一般に、nビットのデータは2のn乗個までの選択肢からなる情報を表現することができる。

例えば、大文字のラテンアルファベットは「A」から「Z」の26文字であるため、これを識別するのには4ビット(16値)では足りず、5ビット(32値)が必要となる。小文字を加えると52文字であるため、6ビット(64値)が必要となる。

派生単位

データの読み書きや伝送を行う場合、その速さを表す単位として1秒あたりの伝送ビット数であるビット毎秒(bps:bit per second)という派生単位が用いられる。

また、実用上はビットでは値が大きくなりすぎて不便なことも多いため、8ビットをまとめて一つのデータとした「バイト」(byte)という単位を用いる場面も多い。かつて何ビットを1バイトとするか機種により様々に分かれていた(7ビットバイトや9ビットバイトなどが存在した)名残りで、8ビットの集まりを「オクテット」(octet)とも呼ぶ。

倍量単位

大きな量を表す際には、SI単位系に則って接頭辞を付した倍量単位を用いる場合がある。

  • 1000ビットを「キロビット」(kbit:kilobit)
  • 100万ビットを「メガビット」(Mbit:megabit)
  • 10億ビットを「ギガビット」(Gbit:gigabit)
  • 1兆ビットを「テラビット」(Tbit:terabit)
  • 1000兆ビットを「ペタビット」(Pbit:petabit)
  • 100京ビットを「エクサビット」(Ebit:exabit)

という。また、コンピュータでは2の冪乗を区切りとするのが都合が良いことが多いため、独自の接頭辞を付した倍量単位が用いられることもある。

  • 210(1024)ビットを「キビビット」(Kibit:kibibit)
  • 220(約104万)ビットを「メビビット」あるいは「ミービビット」(Mibit:mebibit)
  • 230(約10億7千万)ビットを「ギビビット」(Gibit:gibibit)
  • 240(約1兆1千億)ビットを「テビビット」あるいは「ティービビット」(Tibit:tebibit)
  • 250(約1126兆)ビットを「ペビビット」あるいは「ピービビット」(Pibit:pebibit)
  • 260(約115京)ビットを「エクスビビット」あるいは「イクシビビット」(Eibit:exibibit)

という。この2進専用の接頭辞はIEC(国際電気標準会議)が標準化しており、一般にはあまり馴染みがないが記憶容量の表記などで用いられることがある。

バイト ⭐⭐⭐

情報量の単位の一つで、8ビットのこと。数としては2進数を8桁並べたものに相当し、2の8乗で256種類の異なる状態を表現することができる。

情報量の最小の単位である「ビット」(bit)は2つの状態(0と1、オンとオフなど)を識別できるが、バイトは8ビットをまとめて一つの単位としたもので、各ビットの状態の組み合わせで256の状態を識別することができる。

単位として数値の後に付ける際にはアルファベット大文字の「B」が用いられるが、ビットを小文字の「b」で表すことが多いため、両者の混同を避けるために「byte」あるいは「bytes」と省略せずに(同様にビットは「bit」「bits」)記すことも多い。通信速度を表す場合は1秒あたりに伝送可能なバイト数を「バイト毎秒」という単位で表す。記号は「B/s」または「Bytes/s」を用いる。

接頭辞付きの単位

大きな量を表す場合はSI単位系に定められた接頭辞を付加し、1,000倍あるいは1,024倍ごとにキロバイト(KB:kilobyte)、メガバイト(MB:megabyte)、ギガバイト(GB:gigabyte)、テラバイト(TB:terabyte)などの単位を用いる。接頭辞は他の物理量のように1,000の累乗倍を表す場合と、情報処理の分野で切りの良い1,024(2の10乗)の累乗倍を表す場合があり、混乱が生じている。

IEC(国際電気標準会議)では1,024倍を表す場合は「KiB」(kibibyte、キビバイト)、「MiB」(mebibyte、メビバイトまたはミービバイト)、「GiB」(gibibyte、ギビバイト)、「TiB」(tebibyte、テビバイトまたはティービバイト)など専用の接頭辞を用いるよう提唱しているが、現状ではあまり定着していない。

nビットバイトとオクテット

もともと1バイトが何ビットか明確な定義はなく、機種や処理系によって都合の良いビット数が割り当てられていた。1バイトをnビットで表すことを「nビットバイト」と呼び、1980年代頃までは「6ビットバイト」や「7ビットバイト」など、8ビット以外のバイトを単位とするコンピュータもあった。

このようなバイトの定義の曖昧さを避けるため、必ず8ビットを表す単位として「オクテット」(octet)が用いられることがある。通信プロトコルの仕様書のように、機種や処理系の違いを超えて共通して利用される可能性がある文脈では、古い時代の名残りで現在でもバイトと言わずにオクテットが好まれる場合がある。

なお、現代では歴史的な文脈以外で8ビット以外のバイトが用いられることはなくなったため、2008年に国際電気標準会議(IEC)がIEC 80000-13規格の改訂版で正式に1バイトを8ビットであると定義した。

キロバイト 【KB】

データ量の単位の一つで、1000バイトまたは1024バイト。「kB」「KB」「KByte」等の略号で示される。

SI単位系の接頭辞は1000(103)倍ごとに規定される(1キロメートルは1000メートル等)ため、この定義によれば1キロバイトは1000バイトとなるが、情報技術の分野では2の倍数や2のべき乗の方が取り扱う上で都合が良いことが多いため、慣用的に1024倍(210)ごとに接頭辞を切り替えることがあり、その場合は1キロバイトが1024バイトとなる。小文字の「k」を1000倍、大文字の「K」を1024倍の意味で使い分ける例もあるが、あまり浸透していない。

キロビットとの関係

1キロバイトはビットに換算すると8キロビット(kilobit)に相当する。「kB」「KB」のように大文字の「B」をバイト、「kb」「Kb」のように小文字の「b」をビットとして書き分ける場合もあるが、データ量の単位としてはバイトの方が使う機会が多いため、キロビットを「kbit」とすることが多い。

キロバイト毎秒

1秒あたり何キロバイト伝送できるかを表す通信速度の単位を「キロバイト毎秒」と呼び、「KB/s」(Kilobyte per second)と表す。通信速度はビット毎秒で表す機会が多いため、「キロビット毎秒」(kbps:kilobit per second)との混同を避けるためキロバイト毎秒を「KByte/s」のように表記することも多い。

キビバイト (KiB:kibibyte)

バイトの1024倍を表す単位として「キビバイト」(KiB:kibibyte)がある。「キビ」(kibi)は “kilo-binary” (キロバイナリ)の略で1024倍(210)を表す接頭辞。

IT分野で「キロ」は1000倍と1024倍の意味が混在して混乱していたため、IEC(国際電気標準会議)が1024倍のみを意味する接頭辞としてキビを制定し、キロは本来の定義通り1000倍のみを表すよう勧告した。ビットの1024倍は「キビビット」(kibibit)、バイトの1024倍は「キビバイト」(kibibyte)となる。

メガバイト 【MB】

データ量の単位の一つで、100万バイトまたは104万8576(220)バイト。「MB」「MByte」等の略号で示される。

SI単位系の接頭辞は1000(103)倍ごとに規定される(1メガヘルツは100万ヘルツ等)ため、この定義によれば1メガバイトは100万(106)バイトとなるが、情報技術の分野では2の倍数や2のべき乗の方が取り扱う上で都合が良いことが多いため、慣用的に1024倍(210)ごとに接頭辞を切り替えることがあり、その場合は1メガバイトが220バイトとなる。

メガビットとの関係

1メガバイトはビットに換算すると8メガビット(megabit)に相当する。「MB」のように大文字の「B」をバイト、「Mb」のように小文字の「b」をビットとして書き分ける場合もあるが、データ量の単位としてはバイトの方が使う機会が多いため、メガビットを「Mbit」とすることが多い。

メガバイト毎秒

1秒あたり何メガバイト伝送できるかを表す通信速度の単位を「メガバイト毎秒」と呼び、「MB/s」(Megabyte per second)と表す。通信速度はビット毎秒で表す機会が多いため、「メガビット毎秒」(Mbps:Megabit per second)との混同を避けるためメガバイト毎秒を「MByte/s」のように表記することも多い。

メビバイト (MiB:mebibyte)

バイトの220倍を表す単位として「メビバイト」(MiB:mebibyte)がある。「メビ」(mebi)は “mega-binary” (メガバイナリ)の略で220倍を表す接頭辞。

IT分野で「メガ」は106倍と220倍の意味が混在して混乱していたため、IEC(国際電気標準会議)が220倍のみを意味する接頭辞としてメビを制定し、メガは本来の定義通り106倍のみを表すよう勧告した。ビットの220倍は「メビビット」(mebibit)、バイトの220倍は「メビバイト」(mebibyte)となる。

ギガバイト 【GB】

データ量の単位の一つで、10億バイトまたは10億7374万1824(230)バイト。「GB」「GByte」等の略号で示される。

SI単位系の接頭辞は1000(103)倍ごとに規定される(1ギガヘルツは10億ヘルツ等)ため、この定義によれば1ギガバイトは10億(109)バイトとなるが、情報技術の分野では2の倍数や2のべき乗の方が取り扱う上で都合が良いことが多いため、慣用的に1024倍(210)ごとに接頭辞を切り替えることがあり、その場合は1ギガバイトが230バイトとなる。

ギガビットとの関係

1ギガバイトはビットに換算すると8ギガビット(gigabit)に相当する。「GB」のように大文字の「B」をバイト、「Gb」のように小文字の「b」をビットとして書き分ける場合もあるが、データ量の単位としてはバイトの方が使う機会が多いため、ギガビットを「Gbit」とすることが多い。

ギガバイト毎秒

1秒あたり何ギガバイト伝送できるかを表す通信速度の単位を「ギガバイト毎秒」と呼び、「GB/s」(Gigabyte per second)と表す。通信速度はビット毎秒で表す機会が多いため、「ギガビット毎秒」(Gbps:Gigabit per second)との混同を避けるためギガバイト毎秒を「GByte/s」のように表記することもある。

ギビバイト (GiB:gibibyte)

バイトの230倍を表す単位として「ギビバイト」(GiB:gibibyte)がある。「ギビ」(gibi)は “giga-binary” (ギガバイナリ)の略で230倍を表す接頭辞。

IT分野で「ギガ」は109倍と230倍の意味が混在して混乱していたため、IEC(国際電気標準会議)が230倍のみを意味する接頭辞としてギビを制定し、ギガは本来の定義通り109倍のみを表すよう勧告した。ビットの230倍は「ギビビット」(gibibit)、バイトの230倍は「ギビバイト」(gibibyte)となる。

テラバイト 【TB】

データ量の単位の一つで、1兆バイトまたは1兆0995億1162万7776(240)バイト。「TB」「TByte」等の略号で示される。

SI単位系の接頭辞は1000(103)倍ごとに規定される(1テラヘルツは1兆ヘルツ等)ため、この定義によれば1テラバイトは1兆(1012)バイトとなるが、情報技術の分野では2の倍数や2のべき乗の方が取り扱う上で都合が良いことが多いため、慣用的に1024倍(210)ごとに接頭辞を切り替えることがあり、その場合は1テラバイトが240バイトとなる。

テラビットとの関係

1テラバイトはビットに換算すると8テラビット(terabit)に相当する。「TB」のように大文字の「B」をバイト、「Tb」のように小文字の「b」をビットとして書き分ける場合もあるが、データ量の単位としてはバイトの方が使う機会が多いため、テラビットを「Tbit」とすることが多い。

テラバイト毎秒

1秒あたり何テラバイト伝送できるかを表す通信速度の単位を「テラバイト毎秒」と呼び、「TB/s」(terabyte per second)と表す。通信速度はビット毎秒で表す機会が多いため、「テラビット毎秒」(Tbps:terabit per second)との混同を避けるためテラバイト毎秒を「TByte/s」のように表記することもある。

テビバイト (TiB:tebibyte)

バイトの240倍を表す単位として「テビバイト」(TiB:tebibyte)がある。「テビ」(tebi)は “tera-binary” (テラバイナリ)の略で240倍を表す接頭辞。

IT分野で「テラ」は1012倍と240倍の意味が混在して混乱していたため、IEC(国際電気標準会議)が240倍のみを意味する接頭辞としてテビを制定し、テラは本来の定義通り1012倍のみを表すよう勧告した。ビットの240倍は「テビビット」(tebibit)、バイトの240倍は「テビバイト」(tebibyte)となる。

ペタバイト 【PB】

データ量の単位の一つで、1000兆バイトまたは1125兆8999億0684万2624(250)バイト。「PB」「PByte」等の略号で示される。

SI単位系の接頭辞は1000(103)倍ごとに規定されるため、この定義によれば1ペタバイトは1000兆(1015)バイトとなるが、情報技術の分野では2の倍数や2のべき乗の方が取り扱う上で都合が良いことが多いため、慣用的に1024倍(210)ごとに接頭辞を切り替えることがあり、その場合は1ペタバイトが250バイトとなる。

ペタビットとの関係

1ペタバイトはビットに換算すると8ペタビット(petabit)に相当する。「PB」のように大文字の「B」をバイト、「Pb」のように小文字の「b」をビットとして書き分ける場合もあるが、データ量の単位としてはバイトの方が使う機会が多いため、ペタビットを「Pbit」とすることが多い。

ペタバイト毎秒

1秒あたり何ペタバイト伝送できるかを表す通信速度の単位を「ペタバイト毎秒」と呼び、「PB/s」(petabyte per second)と表す。通信速度はビット毎秒で表す機会が多いため、「ペタビット毎秒」(Pbps:petabit per second)との混同を避けるためペタバイト毎秒を「PByte/s」のように表記することもある。

ペビバイト (PiB:pebibyte)

バイトの250倍を表す単位として「ペビバイト」(PiB:pebibyte)がある。「ペビ」(pebi)は “peta-binary” (ペタバイナリ)の略で250倍を表す接頭辞。

IT分野で「ペタ」は1015倍と250倍の意味が混在して混乱していたため、IEC(国際電気標準会議)が250倍のみを意味する接頭辞としてペビを制定し、ペタは本来の定義通り1015倍のみを表すよう勧告した。ビットの250倍は「ペビビット」(pebibit)、バイトの250倍は「ぺビバイト」(pebibyte)となる。

エクサバイト 【EB】

データ量の単位の一つで、100京バイトまたは115京2921兆5046億0684万6976(260)バイト。「EB」「EByte」等の略号で示される。

SI単位系の接頭辞は1000(103)倍ごとに規定されるため、この定義によれば1エクサバイトは100京(1018)バイトとなるが、情報技術の分野では2の倍数や2のべき乗の方が取り扱う上で都合が良いことが多いため、慣用的に1024倍(210)ごとに接頭辞を切り替えることがあり、その場合は1エクサバイトが260バイトとなる。

エクサビットとの関係

1エクサバイトはビットに換算すると8エクサビット(exabit)に相当する。「EB」のように大文字の「B」をバイト、「Eb」のように小文字の「b」をビットとして書き分ける場合もあるが、データ量の単位としてはバイトの方が使う機会が多いため、エクサビットを「Ebit」とすることが多い。

エクサバイト毎秒

1秒あたり何エクサバイト伝送できるかを表す通信速度の単位を「エクサバイト毎秒」と呼び、「EB/s」(exabyte per second)と表す。通信速度はビット毎秒で表す機会が多いため、「エクサビット毎秒」(Ebps:exabit per second)との混同を避けるためエクサバイト毎秒を「EByte/s」のように表記することもある。

エクスビバイト (EiB:exbibyte)

バイトの260倍を表す単位として「エクスビバイト」(EiB:exbibyte)がある。「エクスビ」(exbi)は “exa-binary” (エクサバイナリ)の略で260倍を表す接頭辞。

IT分野で「エクサ」は1018倍と260倍の意味が混在して混乱していたため、IEC(国際電気標準会議)が260倍のみを意味する接頭辞としてエクスビを制定し、エクサは本来の定義通り1018倍のみを表すよう勧告した。ビットの260倍は「エクスビビット」(exbibit)、バイトの260倍は「エクスビバイト」(exbibyte)となる。

SI接頭語 【SI prefix】

国際的な単位の標準体系であるSI単位系で、桁数の長い大きな数や小さな数を簡潔に書き記すため、単位名の先頭に付け加える語。「センチメートル」の「センチ」などのことで、元の単位を何倍したものかを表す。

100倍、100分の1倍など10の累乗倍を表しており、1000倍と1000分の1倍までは1桁ごとに、以降は3桁ごとに定められている。「キロ」(kilo-)のような接頭語そのものと、「k」のように単位として記載するときに使う記号(接頭語記号)が定められている。

日常生活で馴染み深いのは、1000倍の「キロ」(kilo-/記号k)、100分の1倍の「センチ」(centi-/記号c)、1000分の1倍の「ミリ」(milli-/記号m)、100倍の「ヘクト」(hecto-/記号h)などである。10倍の「デカ」(deca-/記号da)、10分の1倍の「デシ」(deci-/記号d)などは省略できる桁数が少ないため日常的にはあまり用いられない。

工業や科学技術などでは、周波数のような巨大な数を扱うために、100万倍の「メガ」(mega-/記号M)、10億倍の「ギガ」(giga-/記号G)、1兆倍の「テラ」(tera-/記号T)などを、微小な世界の現象を扱うために100万分の1倍の「マイクロ」(micro-/記号μ)、10億分の1倍の「ナノ」(nano-/記号n)、1兆分の1倍の「ピコ」(pico-/記号p)などを用いることがある。

IT分野の接頭語

IT分野ではデータ量(ビットやバイト)やデータ伝送速度(ビット毎秒やバイト毎秒)で大きな数を扱うことが多く、「メガビット毎秒」(Mbps)や「テラバイト」(Tbytes)のようにキロ、メガ、ギガ、テラなどのSI接頭辞を頻繁に用いる。

コンピュータは数値を2進数で扱うため、数の区切りとして2の累乗の方が都合が良いことが多く、かつては1024(210)倍をキロと呼ぶなど、210倍ごとに接頭語を運用することがあった。

しかし、本来の接頭語とどちらの大きさを表しているのか分からず、正確に値を伝えるのが困難になってしまうことから、IEC(国際電気標準会議)では1024倍ごとの接頭語に独自の名前と記号を定義し、SI接頭辞は10の累乗以外の意味では使わないよう求めている。

新たに定められた2の累乗ごとの接頭語は、最も近いSI接頭辞の名前と「binary」(バイナリ:2進数の)を組み合わせた名前となっており、記号には「i」を追加する。例えば、210倍は「キロバイナリ」を略した「キビ」(kibi-/記号ki)、220倍は「メガバイナリ」を略した「メビ」あるいは「ミービ」(mebi-/記号Mi)、230倍は「ギガバイナリ」を略した「ギビ」(gibi-/記号Gi)といった具合である。

ビットパターン

ある長さのビット列が取りうる各ビットの「0」と「1」の組み合わせ。また、組み合わせの数。

コンピュータではすべての情報を「0」と「1」を並べた2進数で表し、2進数の1桁に相当するデータの最小単位を「ビット」(bit)という。すべてのデータはこのビットを一列に並べたビット列として表現される。

ある長さのビット列があるとき、各ビットは「0」または「1」の値を取ることができ、各ビットの値の組み合わせをビットパターンという。例えば、ビットが2つ並んだ2ビットのデータがあるとき、考えられるビットパターンは「00」「01」「10」「11」の4通り、3ビットなら「000」「001」「010」「011」「100」「101」「110」「111」の8通りである。

ビットパターンの数は1ビットで2通り(「0」または「1」)、2ビットで4通り、3ビットで8通り、4ビットで16通り…とビットが1つ増えるごとに2倍に増えていく。一般にnビットのデータが取り得るビットパターンの数は2n個となる。

また、いくつかの決まった種類の選択肢からなる情報をビットパターンに対応付けて表現したい場合、2nの中で選択肢の数より多い最小の値のnが必要なビット数となる。例えば、26個あるアルファベット大文字に一つずつビットパターンを対応付けた文字コードを作りたければ、24<26<25 であるため4ビット(16パターン)では足りず、最低でも5ビット(32パターン)が必要となる。

デコード 【デコーディング】

一定の規則や方式に基づいて符号(コード)の集まりに変換されたデータに対し、符号化時とは逆方向の変換を行い、元のデータを復元すること。

音声などアナログ信号から生成されたデジタルデータを本来のアナログ信号に戻す処理や、元のデータからデータ圧縮や暗号化などによって別の形式に変換されたデータに対して、逆方向の変換処理を行って元のデータに復元する処理などを指す。

また、CPU(マイクロプロセッサ)では、プログラムを構成する機械語の命令コード(インストラクション)を解釈し、プロセッサ内の回路を制御する単純な命令であるマイクロコードの集合に変換することを「命令デコード」(instruction decode)あるいは略してデコードという。

デコード処理を行う装置や電子回路、ソフトウェア、システムなどのことは「デコーダ」(decoder)という。デコードとは逆に、データを一定の規則に基づいて特定の形式の符号に変換することを「符号化」あるいは「エンコード」(encode、encoding)という。また、そのような処理を行う装置やソフトウェアなどのことは「エンコーダ」(encoder)という。エンコードとデコードの両方の機能を持つソフトウェアや装置は「コーデック」(codec:coder/decoder)と呼ばれる。

エンコード 【符号化】

ある形式の情報を一定の規則に従って別の形式に変換すること。元の形式に復元可能な状態に変換することを指し、データ圧縮や暗号化、文字コードの変換などが該当する。

ある形式のアナログ信号やデジタルデータを特定の形式の符号(code)に置き換える操作を指す。得られた符号列に逆方向の変換を行って元の状態に戻す操作は「デコード」(decode)という。デコードによってエンコード前の状態を復元することができるが、非可逆圧縮など完全に元の状態には戻せない方式もある。

例えば、動画データは極めてデータ量が大きいため、エンコード処理によってデータの間引きや圧縮を行い、短い符号列に置き換えてから保存や伝送を行う。圧縮されたデータはそのままでは再生できないため、再生時にはデコード処理によって元のデータを取り出してから表示を行う。

ある方式のエンコード処理を行う装置やソフトウェアを「エンコーダ」(encoder)、その方式でデコード処理を行うものを「デコーダ」(decoder)という。音声の録音と再生、映像の録画と再生など、状況に応じてどちらも行う可能性がある場合には、両者を一体化した「コーデック」(codec:encoder-decoder)を用いる。

10進数 【10進法】 ⭐⭐

数を書き表す方法(記数法)の一つで、基数を十とした表記法のこと。人間が普段最も一般的に利用している位取り記数法で、通常、アラビア数字の「0」から「9」までのすべての数字を用いて数を表現する。

10進法では桁が一つ左へ移動する毎に値の重みが十倍に、右へ移動するごとに十分の一になる。すなわち、整数の右端の桁は一(100)の位、その左は十(101)の位、その左は百(102)の位、その左は千(103)の位、といった具合に各桁の重みが決まる。

コンピュータでは二つの状態の組み合わせで数値を表現する2進数の方が都合が良いため、人間などが10進法で入力した値は内部でまず2進数による表現に変換されてから記録、伝送、計算などを行うようになっている。また、処理結果を人間などに提示する場合も、内部の2進数による表現から10進法の表記に変換して出力される。2進表現を「バイナリ」(binary)、十進表現を「デシマル」(decimal)と呼ぶことがある。

「10進」と「十進」

どのような基数の表記でも、右から2桁目が1で右端が0の値はすべて「10」となり、それらはすべての異なる値である(2進数の「10」は2、8進数の「10」は8、16進数の「10」は16である)ため、基数が十であることを示すために「10進数」「10進法」とするのは紛らわしく不適切であるとする考え方もあり、そのような場合は「十」 (同様に英語圏では “ten” あるいは “decimal” )という表記が好まれる。

2進数 【二進数】 ⭐⭐⭐

数を書き表す方法(記数法)の一つで、基数を2(二)とした表記法のこと。アラビア数字の「0」と「1」を用いてすべての数を表現する。情報を2進法の値の連なりとして表現する手法を「デジタル」(digital)という。

普段我々が日常的な数字の読み書きや算術に用いる位取り記数法は「10進数」(十進数)で、一つの桁の表現に「0」から「9」の10種類の数字を使い、各桁の左の桁が10倍、右の桁は1/10を表している。

一方、2進法は一つの桁の表現が「0」と「1」の二通りしか無い記数法で、桁が一つ左へ移動する毎に値の重みが2倍に、右へ移動するごとに1/2倍になる。整数の右端の桁は1(20)の位、その左は2(21)の位、その左は4(22)の位、その左は8(23)の位…といった具合に各桁の重みが決まる。

<$Fig:binarynumber|center|true>

例えば、2進法の「1101」は左端から順に「8の位」が1、「4の位」が1、「2の位」が0、「1の位」が1であるため、10進数では 1×8 + 1×4 + 0×2 + 1×1 の「13」となる。逆に、10進数の「21」は、2のべき乗の足し算で表すと 16 + 4 + 1、すなわち 24×1 + 23×0 + 22×1 + 21×0 + 20×1 と表せるため、2進数では「10101」となる。

2進数とビット・バイト

2進法は二つの状態の組み合わせですべての数を表現することができるため、これをスイッチのオン・オフや電圧の高低、磁石のN極とS極、電荷の有無など、対となる物理的な状態に対応させることにより、機械による情報の記憶や伝達、演算を容易に取り扱うことができるようになる。

現代の電子式のコンピュータは原則としてすべての情報を2進法のデータに置き換えて処理を行い、2進法の1桁に相当するデータ量の最小単位を「ビット」(bit)という。実用上はある程度まとまった桁数のビット列を対象にデータの保存や操作を行うため、8ビットに相当する「バイト」(byte)という単位が用いられることが多い。1バイトは8桁の2進法に相当するため、28=256種類の状態を表現できる。

16進数 【16進法】 ⭐⭐⭐

数を書き表す方法(記数法)の一つで、基数を16(十六)とした表記法のこと。アラビア数字(算用数字)の「0」から「9」、およびアルファベットの「A」から「F」を用いてすべての数を表現する。

普段我々が日常的な数字の読み書きや算術に用いる位取り記数法は10進数(十進数/10進法)で、一つの桁の表現に「0」から「9」の10種類の数字を使い、各桁の左の桁が10倍、右の桁は10分の1を表している。

一方、16進法では1の位、16の位、256の位…というように桁の重みが16倍ずつ変化する。16進法における「10」は10進数における「16」を意味する。小数点以下も同様で、小数点の右隣から順に、16分の1の位、256分の1の位、4096分の1の位…というように続く。

コンピュータはすべてのデータを2進数で表しており、これを8桁(8ビット)ずつまとめた「バイト」という単位でデータを取り扱う。16進法は一桁で2進数の4桁分(4ビット)の値を書き記すことができるため、1バイトのデータを「00」から「FF」までの2桁の16進法として表記する慣習がある。

表記法

<$Fig:hexadecimal|right|true>

10進数の表記には「0」から「9」まで10種類の数字が必要なように、16進法では一桁を16種類の数字で表す必要がある。我々が日常的に使う数字は10種類しかないため、10から15までの数を一桁で表現するために「A」から「F」までの6つのアルファベットで代用することが多い。

その場合、「0」から「9」までは10進数の値と同じで、10進数の10を「A」、11を「B」、12を「C」、13を「D」、14を「E」、15を「F」でそれぞれ表す。例えば、「A0」は10進数の「160」(16×10)、「FF」は「255」(16×15+15)を表す。言語や処理系によるが、大文字と小文字は区別しない(どちらでもよい)ことが多い。

なお、複数の位取り表記法が混在する文書などの場合、記された数値がそれぞれ何進法なのかを明示するため「(9ABC)16」「(1234)10」のように右下に小さく10進表記で基数を記す場合がある。

各言語における表記

プログラミング言語やマークアップ言語などの数値リテラルでは、日常的な文書などと同じように単に数字を並べた表記は10進数とみなす場合が多く、16進法を記述する場合は先頭に特定の接頭辞を付けるなど特別な表記法を用いる。

多くの言語ではC言語などにならって「0xDEAD」のように先頭に「0x」を付記する表記法を採用しており、文字列中のコード参照では「¥x0D¥x0A」のように「¥x」(日本語圏以外では¥はバックスラッシュ)を用いる。

言語によっては「#x」(Schemeなど)「&h」(BASICなど)などを用いたり、末尾に「h」を付ける(一部のアセンブリ言語など)場合もある。HTMLやXMLなどにおける数値文字参照では「&#x266A;」のように「&#x」と「;」で挟む。

補数 【余数】 ⭐⭐

ある自然数をn進数(n進法)で表現した時に、足し合わせるとちょうど「nのべき乗」か「nのべき乗-1」になる自然数のうち、最小のもの。前者は「足すとちょうど桁が一つ増える数」で「基数の補数」と呼ばれる。後者は「足しても桁が増えない最大の数」で「減基数の補数」と呼ばれる。

例えば、10進数の65という数に足し合わせるとちょうど一つ桁上りする自然数は、足すと100になる35であり、(10進数における)「65に対する10の補数」という。また、足しても桁が増えない最大の数は、足すと99になる34であり、(10進数における)「65に対する9の補数」という。

1の補数 (one's complement)

ある自然数を2進数(2進法)で表現したときに、足し合わせるとすべての桁が1になる最大の数のことを「1の補数」という。足してもギリギリ桁が増えない最も大きな数である。

たとえば、「10010110」に対する1の補数は「1101001」であり、両者を足し合わせると「11111111」(8桁すべてが1)となる。コンピュータで取り扱う際には、各桁の0を1に、1を0にするビット反転によって求めることができ、それに1を加えたものは2の補数となる。

2の補数 (two's complement)

ある自然数を2進数(2進法)で表現した時に、足し合わせると桁が増える最小の数を「2の補数」という。足すと一桁増えて先頭の桁が1、残りの桁が0となる数である。

例えば、「10010110」に対する2の補数は「1101010」であり、両者を足し合わせると「100000000」(桁が一つ増えて既存の8桁がすべて0)となる。コンピュータで取り扱う際には元の数のビット反転によって求められる1の補数に1を足せば2の補数となる。コンピュータ上での負の整数の表現や減算の実装などによく用いられる。

2の補数

ある自然数を2進数(2進法)で表現した時に、足し合わせるとちょうど桁が一つ増える最小の数のこと。コンピュータにおける負の整数の表現や数値演算などに応用される。

2進数における「基数の補数」と呼ばれる数で、ある数に足し合わせることで桁が一つ増え、最上位桁(値は「1」となる)以外はすべて「0」となるような数を指す。例えば、8桁の2進数「10010110」に対する2の補数は「1101010」であり、両者を足し合わせるとちょうど9桁の「100000000」となる。

これに対し、元の数に足し合わせると桁上りせず最も大きな数(「1111…」とすべての桁が1になる)となる補数は「1の補数」(2進数における減基数の補数)と呼ばれる。コンピュータでは1の補数はビット反転(NOT演算)によって求めることができ、これに1を加えると2の補数となる。

なお、2進数に限定せず2の補数という場合は、3進数における減基数の補数を指す場合もある。元の数に足し合わせると桁上りせず「2222…」とすべての桁が2になる数のことである。

浮動小数点数

コンピュータにおける数値の表現形式の一つで、数値を桁の並びを表す仮数部と小数点の位置を表す指数部に分割して表現する方式。小数点以下の値を含む数値の表現法として最も広く利用されている。

一つの数値を符号部(正負)、仮数部、指数部の3つのデータの組み合わせで表現(データ形式としては符号-指数-仮数の順に格納することが多い)する。仮数に基数(通常は2)を指数乗した値を乗じ、符号を付け加えたものが表現する数値となる。

例えば、「-4.375」は2進数では「-100.011」であり、仮数と指数に分離すると「-1.00011×1010」(値はすべて2進表記)となる。符号は正を0、負を1とすることが多いため、符号部の値は「1」、仮数部の値は「100011」、指数部の値は「10」となる。数値が0の場合は符号と指数は不定となるが、便宜上各部をすべて0としたもの(+0.0×100)を0の表現として扱うことが多い。

IEEE 754形式

浮動小数点数は全体のデータ長や仮数部と指数部のビット数の配分などで様々な形式が存在するが、広く普及している標準規格としてIEEE 754形式が知られる。

全体で16ビット(符号1+指数5+仮数10)の「半精度浮動小数点数」、32ビット(符号1+指数8+仮数23)の「単精度浮動小数点数」、64ビット(符号1+指数11+仮数52)の「倍精度浮動小数点数」、128ビット(符号1+指数15+仮数112)の「四倍精度浮動小数点数」の4つの形式が定められており、それぞれ表現できる数値の幅の異なる。実用上は単精度と倍精度がよく用いられ、プログラミング言語や論理回路などでもこの2つに標準で対応しているものが多い。

仮数の2進数表現は先頭が必ず1になる(2以上の数字は使わない)ため、これを省略して代わりに下位の桁の表現に回す手法(俗にケチ表現という)が用いられる。また、指数部を符号なし整数とするため、本来の値に最大値の半分-1を足した表現(俗にゲタ履き表現という)を用いる。例えば指数部が8ビットの場合は127を加え、128が1を、126が-1を表す。

単精度浮動小数点数 (single precision floating point number)

数値を仮数部と指数部に分けて表現する浮動小数点数の形式の一つで、一つの数値を32ビットのデータで表現する方式のこと。多くのプログラミング言語などでは単に浮動小数点といえば単精度を意味し、“float” などの名称で表されるデータ型が用意されている。

IEEE 754標準で規定された形式では32ビットのうち先頭1ビットが正負の符号部(0が正、1が負)、続く7ビットが指数部(基数は2)、残り24ビットが仮数部となる。表現できる値の大きさの範囲は十進表記で約1.2×10-38~約3.4×1038であり、精度は十進7桁程度となる。

倍精度浮動小数点数 (double precision floating point number)

数値を仮数部と指数部に分けて表現する浮動小数点数の形式の一つで、一つの数値を64ビットのデータで表現する方式のこと。多くのプログラミング言語などが高精度な数値計算のために組み込みデータ型として用意しており、 “double” などの名称で表される。

IEEE 754標準で規定された形式では64ビットのうち先頭1ビットが正負の符号部(0が正、1が負)、続く11ビットが指数部(基数は2)、残り52ビットが仮数部となる。表現できる値の大きさの範囲は十進表記で約2.2×10-308~約1.8×10308であり、精度は十進16桁程度となる。

ファイル形式 【ファイルフォーマット】

ある特定の種類のデータを、コンピュータの外部記憶装置(ストレージ)のファイルにどのような形式や順序で記録するかを定義したもの。

ひとまとまりのデータをコンピュータの記憶装置に保存する形式を定めたもので、機種やソフトウェアが異なっても、同じファイル形式に対応していればその形式のデータを同じように読み書き、編集などすることができる。

ファイル形式の種類

コンピュータプログラム、文書、画像、動画、音声など様々な種類のデータについてファイル形式が定義されているが、同じ種類のデータについて多種多様な異なる形式が存在し、データの表現方法や保存できるデータの仕様などがそれぞれ異なる。

広く普及している著名なファイル形式の多くはその仕様が標準化されたり公開されており、誰でも対応するソフトウェアを開発することができる。仕様が非公開で開発元企業のソフトウェアでしか扱えないものや、データの生成に特許技術が必要で対応ソフトウェアの開発や販売、利用に料金が課されるものもある。

ファイル内でのデータの表現形式として、大きく分けて「テキスト形式」と「バイナリ形式」の2種類がある。テキストファイルは文字コードで規定される範囲のデータを並べたもので、内容を文字の並びとして表示・編集することができる。バイナリファイルはテキスト以外の形式で、任意のバイト列で表される。

コンテナ形式

画像や動画、音声などのファイル形式の中には、具体的なデータの圧縮符号化方式を定めず、符号化されたデータのファイル内での格納方法や、データについての情報(メタデータ)の記述形式のみを定めているものがある。このような形式を「コンテナフォーマット」(コンテナ形式)という。

例えば、Windowsなどで標準的に用いられる動画コンテナの「AVI」形式は、具体的な動画の圧縮方式としてMPEG-1やMPEG-2、MPEG-4、H.264などに対応し、音声の圧縮方式としてはPCM、MP3、AACなどに対応する。具体的なデータの読み書きには、その圧縮方式に対応する「コーデック」と呼ばれるソフトウェアが必要となる。

形式の識別

ファイルはコンピュータのストレージ内ではファイル名(file name)によって識別される。あるファイルがどんなファイル形式なのかを識別するために、Windowsなどではファイル名の末尾を「.」(ドット/ピリオド)で区切って「拡張子」(extension)と呼ばれる3文字前後の英数字を付与することがある。

Webや電子メールにおけるデータ伝送では、「MIMEタイプ」あるいは「メディアタイプ」という文字列でデータ形式を伝達することができる。「主形式名/副形式名」という記法で表され、例えば「text/html」であればテキスト形式のHTMLファイルという意味になる。

形式によっては、ファイルの先頭を必ず「マジックナンバー」と呼ばれる識別用の短い符号で始めるよう規定しているものもある。その場合、読み込み時に先頭の数文字(テキスト形式の場合)あるいは数バイト(バイナリ形式の場合)を照合することで、どのファイル形式か(あるいは、対応している形式か否か)を知ることができる。例えば、画像形式のJPEGは先頭2バイトを16進数で「ff d8」とするよう定めており、ファイルの先頭2バイトがこの値であればJPEG画像であると分かる。

バーコード

文字や数字などのデータを、太さの異なる直線の並んだ縞模様のような図形パターンとして物体の表面や紙面に刻印・印刷したもの。流通業や小売業での商品の識別などに用いられている。

太さの異なる複数の縦棒(バー)と隙間(スペース)を交互に並べてデータを表現したもので、表現できる文字の種類やパターンとの対応ルールにはいくつかの規格が存在する。バーとスペースの太さの相対的な比率を読み取っているため、図形全体の大きさは(機械が読み取れる範囲であれば)任意で構わない。

バーコードを読み取る装置を「バーコードリーダー」(barcode reader)あるいは「バーコードスキャナー」(barcode scanner)という。光源と光センサーで構成され、光源の光がバーコードに当たって反射したものを読み取って符号に変換する。専用の装置は小売店のレジなどによく設置されているほか、スマートフォンにもカメラによるバーコード読み取りアプリが提供されている。

バーコードは流通業や小売業における商品の機械的な識別の仕組みとして広く普及しているほか、製造業での部品の識別、図書館での蔵書の管理、宅配・郵便事業での荷物の識別などにも使われている。商品コードの標準規格として「JANコード」(日本)、「EANコード」(ヨーロッパ他)、「UPCコード」(北米)などがよく知られている。

バーコードは情報を1次元的に表現するが、文字や数字を2次元の図形パターンとして表現するものを「2次元コード」(2D code)という。「QRコード」などがよく知られており、情報量がバーコードの数十倍あるためWebサイトのURLなど様々な情報を表すのに用いられている。広義には2次元コードを含めバーコードと呼ぶ場合もある。

2次元コード 【2D code】

文字や数字などのデータを2次元の図形パターンとして物体の表面や紙面に刻印・印刷する技術。また、その方式を定めた規格。バーコードを拡張して2次元の図形で表現したもので、従来よりも多くの情報を正確に刻印することができる。

数字を図形パターンとして刻印する技術としては様々な太さの棒が並んだ「バーコード」(barcode)が馴染み深いが、2次元コードは縦方向と横方向の2次元に展開する図形を用いるコードで、同じ面積により多くの情報を刻印することができる。「2次元バーコード」と呼ばれることもあるが、規格によっては図形が棒状とは限らない。

2次元コードは記録密度(面積あたりの情報量)がバーコードの20~100倍もあり、小さなパターンで多くの情報を表現することができる。バーコードは英数字20文字程度を記録できるが、2次元コードは方式によっては最大数千文字を記録できる。

アルファベットや数字だけでなく、カナや漢字などを表現することができる方式もある。データに冗長性を持たせて多少の汚損があっても正確にデータを復元できるようにした方式や、360度どの向きからも読み取れるようにした方式もある。

2次元コードは大きく分けて、従来のバーコードを積み上げた形の「スタック型2次元コード」と、パターンが格子状になっている「マトリックス型2次元コード」の2種類がある。スタック型としては「PDF417」が、マトリックス型としては「QRコード」「Data Matrix」「Maxi Code」の3つがISO標準として採用されている。

事実上の標準として広く普及しているのはデンソーウェーブの開発した「QRコード」で、製品パッケージ表面のコード印刷など従来用途に留まらず、社会の様々な場面で用いられている。特に、スマートフォンにはQRコードの読み取り機能が標準で内蔵されており、WebサイトのURLの掲示や、サービスやアプリのユーザーIDの交換などで馴染み深い。

QRコード 【Quick Response code】

データを平面上の正方形の領域に表された図形パターンで表すことができる2次元コードの方式の一つ。現在のデンソーウェーブが1994年に開発したもので、「QRコード」は同社の登録商標。1999年にJIS X 0510、2000年にISO/IEC 18004として標準化され、様々な分野で広く普及している。

小さな正方形の点を縦横同じ数だけ並べたマトリックス型2次元コードで、一辺に21個並べた「バージョン1」から、177個並べた「バージョン40」まで、40通りの仕様が用意されている。点の数が多いほうがたくさんの情報を記録できるが、必要な面積は大きくなっていく。

コード領域の三方の角には、中心が黒く塗りつぶされた大きな「回」の字型の「切り出しシンボル」(ファインダパターン)が配置されており、360度どの向きから読み取っても正確に情報が読み出せるようになっている。

記録できる情報量はバージョン40の場合で最大23,648ビットである。文字は独自のコード体系および符号化方式で表され、カナや漢字を含む文字列は最長1,817文字、アルファベットと数字だけなら4,296文字、数字だけなら7,089文字まで記録できる。

データには冗長性を持たせてあり、一部が汚損して読み取れなくてもデータを復元することができる。誤り訂正率は5段階から選択でき、最も低いもので約7%、最も高いもので約50%までの汚損に対応できる。誤り訂正率は高いほどより多くの冗長なデータが必要となるため、記録できるデータ量はその分少なくなる。

同社では自動車工場のカンバン(現品札)の自動読み取り、倉庫や配送の管理の効率化など、産業機器の自動化推進の一環としてQRコードを開発したが、汎用性の高さ、データ密度の高さ、高度な誤り訂正機能、読み取り向きが自由であるなど使い勝手の良さ、関連特許を開放して利用料を求めなかったことなどから、IT分野を中心に広く浸透している。

携帯電話のカメラ機能と組み合わせてインターネット上のURLやメールアドレス、サービス上のID情報などの告知や伝達に使われたり、乗り物の乗車券や搭乗券、イベントや施設のチケットレス入場、キャッシュレス決済などでよく用いられる。

チェックデジット 【チェックディジット】

数字列の誤りを検知するために付加される検査用の数字のこと。また、そのような数字を用いた誤り検出方式。バーコードや銀行の口座番号などに利用されている。

番号を伝達したり記録する際に誤りが生じたり、悪意の攻撃者が番号の改竄や偽造を試みると正規に発行した番号ではなくなるが、チェックディジットによる検査を行うことで簡単に誤った番号であることを検知することができる。

最もよく用いられる方式は、各桁の値に一定の規則に従った係数を乗じた値の和を求め、それを定められた係数で割った余りを末尾に付加する方法である。元の番号の数字が少しでも違っているとチェックディジットが全く異なる値になるため、誤りを検出することができる。

偶発的な誤りを検知することが主目的の場合は算出方法は簡易なものにして公開されるが、偽造の防止などが必要とされる場合は適合する番号が簡単に逆算できないような複雑な計算方法を採用したり、算出方法を非公開とすることもある。

パリティチェック 【奇偶検査】

データの誤り検出方式の一つで、ビット列中に含まれる「1」の数が偶数か奇数かを表す符号を算出してデータに付加する手法。最も単純な誤り訂正符号で、1ビットの誤り検出しかできないが算出や検証が容易で高速なため広く普及している。

データはコンピュータ上では「0」と「1」が並んだビット列として表されるが、これを一定の長さのブロックごとに区切り、各ビットの値を足し合わせた値が奇数であるか偶数であるか(「1」の数が奇数か偶数か)を表す1ビットの値(パリティビット)を末尾に付加する。

パリティを含むデータを受け取った側は、各ブロックごとに同じようにパリティを算出し、付加されたものと比較する。両者が一致すれば、そのブロックには誤りが存在しないか偶数個あることが分かり、一致しなければ奇数個の誤りがあることが分かる。

実用上、短く区切られたブロック中に同時に複数の誤りが生じる確率は低いため、パリティが一致すれば誤りが無く、一致しなければ1ビットの誤りが生じたとみなしてデータの再送や破棄などの制御を行う。

偶数パリティと奇数パリティ

パリティビットの値は、ブロックの各ビットとパリティを足し合わせた時、その偶奇性が常に同じになるように設定される。

全体の和が偶数になるように決められる(ブロック中の1の数が奇数なら1、偶数なら0)ものを「偶数パリティ」(even parity)、奇数になるように決められる(1の数が奇数なら0、偶数なら1)ものを「奇数パリティ」(odd parity)という。

水平パリティと垂直パリティ

一定の長さのブロックごとにパリティを算出して末尾に付加する方式を「垂直パリティ」(vertical parity)と呼び、単にパリティチェックといった場合はこの方式を指すことが多い。

一方、連続する数ブロックごとに、各ブロックの同じ位置にあるビット群をグループ化してパリティを算出・付与する方式を「水平パリティ」(horizontal parity)という。

両者を併用した「垂直水平パリティ」が用いられる場合もあり、パリティ用の記憶容量は約2倍必要になるが、同じブロック中の偶数個の誤りを検出したり、1ビットの誤りの訂正を行うことができる。

パリティビット 【パリティデータ】 ⭐⭐

データの伝送や記録の際に生じる誤りを検知できるように算出・付加される符号の一つで、ビット列中に含まれる「1」の数が偶数か奇数かを表すもの。これを利用した誤り検出方式を「パリティチェック」(parity check)という。

データを0と1が並んだビット列で表したときに、各ビットの値を足し合わせた値が奇数であるか偶数であるか(「1」の数が奇数か偶数か)を1ビットの値として表す。

和が奇数のときに1とする(偶数なら0)ものを「偶数パリティ」(even parity)、偶数のときに1とするものを「奇数パリティ」(odd parity)という。パリティを足すことでどのビット列も偶奇性が同じになる(偶数パリティを含めた全ビットの和は常に偶数)という意味でこのように呼ばれる。

データの送り手(送信者や書き込み時)は元のデータに対して一定の長さごとにパリティビットを算出して付加する。受け手(受信者や読み込み時)は受け取ったデータから同じようにパリティビットを算出し、付加されたパリティビットと比較する。

両者のパリティビットが一致すれば、パリティを含めたビット列中には誤りが存在しないか偶数個存在し、一致しなければ奇数個の誤りが生じていることが分かる。一つのパリティビットだけではどの位置に誤りがあるかは分からず、正しい値に訂正することはできない。

バースト誤りのような特殊な状況を除き、通常の用途では短いビット列中に同時に複数の誤りが生じる可能性は低いため、実用上はパリティビットが一致しなければ1ビットの誤りが含まれ、一致すれば誤りが生じていないとみなすことが多い。

奇数パリティ 【奇数パリティチェック】

誤り検出方式の一種であるパリティチェックで、ビット列中に含まれる「1」の個数が偶数個ならパリティビットを「1」に、奇数個なら「0」にする方式。

パリティを含めたデータ全体で常に「1」の数が奇数になるようにパリティビットを決定することからこのように呼ばれる。例えば、もとのビット列が「0001」(「1」の数が1個)や「1110」(3個)などの場合にパリティビットが「0」に、「0000」(0個)や「1010」(2個)、「1111」(4個)などの場合に「1」にセットされる。

一方、これとは逆に、ビット列の「1」の個数が奇数個ならパリティビットを「1」に、偶数個なら「0」に設定する方式を「偶数パリティ」(even parity)という。一般的には奇数パリティより偶数パリティの方がよく利用される。

偶数パリティ

誤り検出方式の一種であるパリティチェックで、ビット列中に含まれる「1」の個数が奇数個ならパリティビットを「1」に、偶数個なら「0」にする方式。

パリティを含めたデータ全体で常に「1」の数が偶数になるようにパリティビットを決定することからこのように呼ばれる。例えば、もとのビット列が「0000」(「1」が0個)や「1010」(2個)、「1111」(4個)など場合にパリティビットが「0」に、「0001」(1個)や「1110」(3個)などの場合に「1」にセットされる。

一方、これとは逆に、ビット列の「1」の個数が偶数個ならパリティビットを「1」に、奇数個なら「0」に設定する方式を「奇数パリティ」(odd parity)という。一般的には奇数パリティより偶数パリティの方がよく利用される。

データ圧縮 【圧縮符号化】 ⭐⭐⭐

データを一定の計算手順で加工し、実質的な内容を損なわずにより短い符号列で表すこと。原則として得られた符号は逆の計算手順により元のデータに復元することができ、データの一部を損なって容量を減らす削減や間引きとは異なる。

同じ情報を短いデータ長で表現することで、記憶装置上で占有する領域を小さくすることができ、また、機器間をより短い時間や少ない回線の占有度で伝送することができる。ただし、圧縮後の符号列は元のデータを扱う処理系では利用できないため、使用前に必ず元の状態に戻す処理が必要となる。この復元処理は「解凍」「伸長」「展開」などと呼ばれる。

圧縮処理や解凍処理に費やされる計算量や計算時間などと引き換えにデータ量の縮減という成果を得ており、両者が見合わなければ圧縮を行う意義は失われる。例えば、データ伝送を高速化するためにデータ圧縮を導入したのに、圧縮、伝送、解凍の合計時間が元データの伝送時間を上回ってしまっては元も子もない。

圧縮の逆変換の呼称

圧縮(compress)後の符号列から元のデータを復元する逆方向の変換処理のことを英語では “decompress” (compressに否定の接頭辞de-を付したもの)というが、日本語では定まった訳がなく、解凍、伸長、展開などの用語が用いられる。

ファイルのアーカイバでは複数のファイルを一つの圧縮ファイルにまとめることが多いため、その中から指定されたものを取り出して元の状態に戻すことを「抽出」ということもある(英語でもこの文脈では “extract” を用いる)。

日本では1980年代にパソコン通信やファイル圧縮ソフトの付属文書などを通じて「解凍」という用語が広まった(対応して圧縮のことを凍結と呼ぶこともあったがこれは広まらなかった)ため、慣用的に解凍と呼ぶことが多いが、本来の語義として圧縮と解凍では意味が対応しておらず、解凍には容積の増減の意味はないことなどから批判も多い。

一方、伸長や展開は、伸ばす、広げるという意味は合っているが、圧縮の逆の動作としての元に戻すという意味合いは薄いとの批判もあり、あまり定着していない。

圧縮率と圧縮比

どのくらい圧縮できたかを圧縮率という用語で表すことがある。より小さい量に圧縮できたことを「圧縮率が高い」という。

実際には二つの異なる指標が圧縮率と呼ばれており、一つは圧縮後のデータ量の元のデータ量に対する比率、もう一つは削減量の元の量に対する比率である。いずれを指すのかは文脈により異なる。圧縮後にデータ量が元の10分の1になったことを、前者の指標では圧縮率10%、後者では90%と表現する。

一方、圧縮前と後のデータ量の比や倍率で圧縮の程度を表すこともあり、データ圧縮比と呼ばれる。10分の1に圧縮したことを10:1あるいは10倍と言い表す。

可逆圧縮と非可逆圧縮

完全に元のデータに戻せる符号列に変換する方式を「可逆圧縮」、元のデータの一部を削除・変形することで高い圧縮率を得る代わりに完全には元に戻せなくなる方式を「非可逆圧縮」あるいは「不可逆圧縮」という。

可逆圧縮はわずかでもデータの一部が異なれば元とはまったく違う意味になってしまう文字(テキスト)データやコンピュータプログラムの圧縮や汎用のファイル圧縮などで用いられ、通常単にデータ圧縮といえば可逆圧縮を指す。

非可逆圧縮は主に画像や音声、映像など元のデータに大きな情報の冗長性が含まれる対象に用いられる。人間の視覚や聴覚の特性を利用して、人間が気づきにくい形でデータの一部を改変・削除することで、劇的な高圧縮率を得ることができる。

元の情報を損なう変換を伴うため、非可逆圧縮は厳密にはデータ圧縮手法の一部ではないとする立場もある。また、非可逆圧縮アルゴリズムの中には、元データの形式変換や加工(この段階ではデータ長の縮減は伴わない)を行った後、データ圧縮自体は連長圧縮などの可逆圧縮により行う(すなわち、「非可逆」の工程では圧縮していない)ものも多い。

伸張 【解凍】 ⭐⭐⭐

データ圧縮されたファイルなどに逆変換を行い、圧縮前の状態に戻すこと。圧縮されたデータを処理する際には、原則として必ず伸張して元のデータ形式に戻す必要がある。

信号やデータを実質的な意味を保ったまま、一定の手順で変換してより短い符号列に置き換えることを「圧縮」(compress)という。これとは逆に、圧縮データを元に戻す操作・処理を英語では否定の接頭辞 “de-” をつけて “decompress” というが、日本語では定まった訳語がなく、「伸長」「展開」「解凍」「減圧」「抽出」などが用いられる。

日本では1980年代にパソコン通信やファイル圧縮ソフトの付属文書などを通じて「解凍」という用語が広まった。対応して圧縮のことを「凍結」と呼ぶこともあったが、これは広まらなかった。年配の人などは現在でも慣用的に解凍と呼ぶことが多いが、本来の語義として「圧縮」と「解凍」では意味が対応しておらず、解凍には容積の増減の意味はないことから批判も多い。

一方、「伸長」や「展開」は、伸ばす、広げるという意味は合っているが、圧縮の逆の動作としての元に戻すという意味合いは薄いとの批判もあり、あまり定着していない。また、ファイルのアーカイバでは複数のファイルを一つの圧縮ファイルにまとめることが多いため、その中から指定されたものを取り出して元の状態に戻すことを「抽出」ということもある。英語でもこの文脈では “decompress” ではなく “extract” を用いる。

伸張 【解凍】

データ圧縮されたファイルなどに逆変換を行い、圧縮前の状態に戻すこと。圧縮されたデータを処理する際には、原則として必ず解凍して元のデータ形式に戻す必要がある。

信号やデータを実質的な意味を保ったまま、一定の手順で変換してより短い符号列に置き換えることを「圧縮」(compress)という。これとは逆に、圧縮データを元に戻す操作・処理を英語では否定の接頭辞 “de-” をつけて “decompress” というが、日本語では定まった訳語がなく、「伸長」「展開」「解凍」「減圧」「抽出」などが用いられる。

日本では1980年代にパソコン通信やファイル圧縮ソフトの付属文書などを通じて「解凍」という用語が広まった。対応して圧縮のことを「凍結」と呼ぶこともあったが、これは広まらなかった。年配の人などは現在でも慣用的に解凍と呼ぶことが多いが、本来の語義として「圧縮」と「解凍」では意味が対応しておらず、解凍には容積の増減の意味はないことから批判も多い。

一方、「伸長」や「展開」は、伸ばす、広げるという意味は合っているが、圧縮の逆の動作としての元に戻すという意味合いは薄いとの批判もあり、あまり定着していない。また、ファイルのアーカイバでは複数のファイルを一つの圧縮ファイルにまとめることが多いため、その中から指定されたものを取り出して元の状態に戻すことを「抽出」ということもある。英語でもこの文脈では “decompress” ではなく “extract” を用いる。

データ圧縮率

データを圧縮した際に、圧縮後のデータが元のデータのどのくらいの情報量に減ったかを表す割合。圧縮後の量の元の量に対する割合を100倍したパーセンテージで表すことが多いが、削減された量の元の量に対する割合とすることもある。

データ圧縮はデータを一定の規則で変換する処理の一つで、実質的な内容を損なわずにより短いデータに置き換えることができる。逆変換により元の状態に復元することができる。記憶装置の容量や通信回線の伝送量を節約したり、データの記録や伝送の性能を向上することができる。

データ圧縮によりどの程度圧縮することができたかを、圧縮前後のデータ量の割合で表したものを圧縮率という。例えば、100MBのファイルが10MBに圧縮された場合、圧縮後の容量に着目して10/100で「0.1」あるいはパーセンテージで「10%」を圧縮率とする。

もう一つ別の考え方として、圧縮によって削減できた容量に着目し、(100-10)/100の「0.9」または「90%」を圧縮率とする場合がある。前者は値が小さいほどより少ない量に圧縮できていることを表し、後者はその逆である。

通常は前者の圧縮前後の容量の比によって表す方法が用いられる。いずれの場合も、慣例として、より少ない量に圧縮された(よく圧縮できた)状態を「圧縮率が高い」、多い量に圧縮された(あまり圧縮できなかった)状態を「圧縮率が低い」と言い表す。

データ圧縮比

圧縮前と圧縮後のデータ量を比で表したものを「データ圧縮比」ということがある。100MBを10MBに圧縮した場合はこれを10:1、あるいは比の値である10倍と表す。この値が高いほどより小さく圧縮できていることになる。数値で表す場合は、(圧縮前後のデータ量の比とした場合の)圧縮率の逆数となるが、圧縮率と同じ値(この例では10%)を圧縮比としている例も見られる。

コーデック 【CODEC】

信号やデータを一定の規則にしたがって符号化したり、逆に、符号化されたデータを元の状態に復号したりする装置やソフトウェアなどのこと。符号化のみを行うものは「エンコーダ」(encoder)、復号のみを行うものは「デコーダ」(decoder)という。

最もよく知られるのは、画像、音声、動画など大容量のメディアデータを圧縮したり、圧縮データを元通りに復元(伸張)する装置やソフトウェアで、単にコーデックといった場合はこれを指すことが多い。半導体チップや基板、装置などによって処理を行うものを「ハードウェアコーデック」、コンピュータプログラムとして実装したものを「ソフトウェアコーデック」という。

より一般的には、汎用のデータ圧縮・伸張ソフトウェアのことや、複数の圧縮形式の間で相互に変換するシステム(「コンバータ」「トランスコーダ」とも呼ばれる)、データを(圧縮とは別の目的で)内容を変えずに別の形式に変換したり元に戻したりするシステム、暗号化・復号を行うシステムなどが含まれる。

また、半導体や電子機器の分野では、音声や映像などのアナログ信号を取り込んでデジタルデータに変換したり、データをアナログ信号に変換して出力したりする回路や部品、装置のことをコーデックという場合がある。これらは「A/Dコンバータ」(ADC:Analog/Digital converter)あるいは「D/Aコンバータ」(DAC:Digital/Analog converter)とも呼ばれる。

メディアデータのコーデック

画像や音声、動画などのデータを圧縮・展開するコーデックは、それぞれ対応するデータ形式(圧縮符号化形式)が決まっている。データ形式とコーデックが一対一に対応することが多いため、コーデックのことをデータ形式の名称で呼ぶ(例:「MP3コーデック」→「MP3」)ことも多い。

主な画像形式のコーデックとしてはJPEGやPNG、GIFなどが、音声形式のコーデックとしてはMP3やWMA、AC-3、AAC、aptX、Apple Lossless、FLACなどが、画像形式のコーデックとしてはMPEG-1、MPEG-2、MPEG-4、H.264、H.265、AV1などがよく知られる。音声データのPCM形式のように無圧縮の形式を扱うソフトウェアなどは変換や圧縮・展開などを行わないが、他の形式に合わせて便宜上コーデックと呼ぶ。

ハードウェアコーデック (hardware codec)

動画や音声の符号化・データ圧縮やその逆の解凍・再生などの処理を行う専用の機器や装置をハードウェアコーデックという。

特定の処理に特化したICチップなどの形で提供され、パソコンの場合はこれが実装された拡張カードの形で利用される。符号化・圧縮のみを行うものは「ハードウェアエンコーダ」(hardware encoder)、復号・再生のみを行うものは「ハードウェアデコーダ」(hardware decoder)という。

ソフトウェアで処理するのに比べ速度は勝るが、あらかじめ処理手順の実装された特定の形式にしか対応できない。一つの形式にしか対応できない製品もあるが、複数のICチップを実装するなどして複数の形式に対応している製品もある。

パソコンで動画データを作成したり再生する場合、かつてはCPUが非力だったためハードウェアコーデックを利用することが多かったが、最近では圧縮形式が多様化したことやCPUの処理性能が向上したことから、ソフトウェアコーデックが用いられることが多い。一般に圧縮の方が処理能力が必要なため、圧縮のみ専用のハードウェアを使い、再生はソフトウェアで行うという形も多い。

ソフトウェアコーデック (software codec)

動画や音声の符号化・データ圧縮やその逆の解凍・再生などの処理を行うコンピュータプログラムをソフトウェアコーデックという。

動画や音声のデータ形式ごとに、動画編集ソフトやメディアプレーヤーのアドオンなどの形で提供される。符号化・圧縮のみを行うものは「ソフトウェアエンコーダ」(software encoder)、復号・再生のみを行うものは「ソフトウェアデコーダ」(software decoder)という。

専用のハードウェア(ハードウェアコーデック)に比べ処理速度では劣るが、ソフトウェアを切り替えれば様々な形式に対応できる。かつては専用のハードウェアを利用してた場面でも、形式の多様化やCPU性能の向上などからソフトウェアコーデックを用いることが増えている。

一般に、メディアデータの再生処理は同じ内容の圧縮処理より負荷が軽く、再生側では圧縮側(制作側)よりも多様な形式に対応する必要があることが多いため、再生環境向けにソフトウェア実装されたデコーダのみが配布されることも多い。

可逆圧縮 【ロスレス圧縮】 ⭐⭐⭐

データ圧縮方式のうち、圧縮符号化の過程で元のデータを一切毀損せず、完全に元通りに復元できるように圧縮する手法のこと。主にファイル圧縮や通信プロトコルなど、データの種類を特定しない汎用の保存形式や伝送方式で用いられる。

コンピュータプログラムや文字(テキスト)などのデータは、1ビットでも欠けたり変質するとその意味する内容自体が変わってしまうため、圧縮したデータを展開(解凍)したときに元のデータと完全に一致する可逆圧縮が行われる。

一方、画像や動画、音声などの場合には、人間の視聴覚が違いを感じ取りにくいように一部を省略・改変することで実質的な内容を維持しつつ劇的に圧縮率を高める「非可逆圧縮」(不可逆圧縮)が行われることがある。可逆圧縮は元のデータを完全に保存できるが、非可逆圧縮に比べ圧縮率は低い。

主な可逆圧縮アルゴリズムとしてはランレングス符号やハフマン符号、LZ77、LZSS、LZW、Deflateなどが知られる。ZIPやCAB、LZH、RAR、gzip、bzip2など汎用のファイル圧縮形式はすべて可逆圧縮を用いる。画像圧縮ではJPEGなどが非可逆圧縮、GIFやPNG、WebP、AVIF、Loassless JPEGなどが可逆圧縮である。

また、通常は非可逆圧縮が用いられることが多い音声圧縮でも、「ALAC」(Apple Lossless)や「FLAC」「WMA Lossless」など高音質のために可逆圧縮を用いるファイル形式があり、「ロスレス音源」と総称される。

なお、非可逆圧縮は実際には元のデータを圧縮しやすい状態に変換し、圧縮符号化自体は可逆圧縮アルゴリズムを用いて行うため、正確には圧縮方式そのものが可逆と非可逆に分かれているわけではないが、実用的にはこの変換処理も含めて圧縮方式や圧縮形式の仕様の一部とみなされるため、便宜上このような区分が常用されている。

非可逆圧縮 【不可逆圧縮】 ⭐⭐⭐

データ圧縮方式のうち、圧縮符号化の過程でデータの一部の欠落や改変を許容することで極めて効率よく圧縮する手法のこと。非可逆圧縮されたデータを伸長(解凍)しても元のデータには完全には一致しない。

コンピュータプログラムや文字などのデータは1ビットでも変化すればその意味する内容自体が変わってしまうが、画像や動画、音声などはデータ上は細部が僅かに異なっていても人間の視聴覚には違いが気付きにくい場合がある。

このような特性を活かし、人間が認識しにくい手法で元のデータの一部を省略・改変したり、別の表現形式へ変換するなどして、効率よく短い符号に圧縮する方式を非可逆圧縮という。

元のデータを一切毀損しない可逆圧縮とは異なり完全に元のデータを復元することはできないが、人間にほとんど違いがわからない程度の改変でも劇的に圧縮率を高めることができる利点がある。また、多くの方式では圧縮時に品質劣化の程度を指定することができ、品質を犠牲にして極端に小さな容量に圧縮することもできる。

画像や動画、音声の圧縮形式の多くが非可逆圧縮を採用しており、JPEG、MPEG-1、MPEG-2、MPEG-4、H.264、H.265、MP3、AAC、WMAなど主要なデータ形式のほとんどが非可逆となっている。用途に応じて使い分けられるよう、Lossless JPEGやWMA Losslessのように仕様の一部として可逆圧縮を用意している形式もある。

なお、実際には元のデータを効率良く圧縮できる状態に変換し、圧縮符号化自体は可逆圧縮アルゴリズムを用いて行うため、正確には圧縮方式そのものが可逆と非可逆に分かれているわけではないが、実用的にはこの変換処理も含めて圧縮方式や圧縮形式の仕様の一部とみなされるため、便宜上このような区分が常用されている。

ランレングス圧縮 【連長圧縮】 ⭐⭐

最も基本的な圧縮アルゴリズムの一つで、連続して現れる符号を、繰り返しの回数を表す値に置き換える方式。圧縮によって内容を損なわない可逆圧縮を行う。

例えば、「AAAABBBBCCCC」という文字列を圧縮する場合、「A」が4回、「B」が4回、「C」が4回それぞれ連続しているため、各文字とその繰り返し回数を組み合わせて「4A4B4C」のように表すことができる。

展開する場合は「4A」を「AAAA」のように戻していくことで元の文字列が得られる。この例では元のデータの半分のデータ長に圧縮することができた。

この単純な方法では同じ符号が連続する箇所が少ないか存在しない場合、圧縮どころか逆にデータ長が大きく伸びてしまう場合がある。例えば、「ABCABC」は「1A1B1C1A1B1C」となってしまい、元の倍の長さになってしまう。

こうした事態を防ぐための手法がいくつか考案されている。例えば、繰り返し回数を表す数字が負数の場合は、その絶対値の長さだけ元のデータがそのまま記載されている区間が出現するという規則を追加する方式がよく知られる(PackBits方式)。

例えば、「AAAABCDEBBBB」は、単純な符号化では「4A1B1C1D1E4B」と12文字で表されるが、PackBits方式では中間の繰り返しのない4文字の先頭に「-4」(説明のため負号を付けて2文字で表しているが実際のデータ上は1文字分)を付加した「4A-4BCDE4B」となり、9文字で表すことができる。

ランレングス圧縮は余白の多い白黒2値画像のように、符号の種類が少なく繰り返し箇所が多い性質のデータで効率よく圧縮でき、ファクシミリの伝送符号や一部のビットマップ画像形式(BMP形式やPICT形式など)などに採用例がある。

ハフマン符号 【Huffman code】

データの内容を損なわずに短い符号列に変換する圧縮アルゴリズムの一つで、元のデータに高頻度で現れるパターンに短い符号を、低頻度で現れるパターンに長い符号を与えて置き換える方式。

1952年にデビット・ハフマン(David Albert Huffman)氏が考案した。符号化方式を「ハフマン符号化」(Huffman coding)、得られる圧縮符号を「ハフマン符号」(Huffman code)という。圧縮符号を展開すると完全に元通りのデータを復元することができる可逆圧縮の代表例で、現代でもファイル圧縮や画像ファイル形式など様々な場面で応用されている。

基本的な考え方は、対象データ列に出現する各パターンの頻度を調べ、高頻度で現れるパターンには短い符号(ビット列)を、低頻度のパターンには長い符号を割り当てることで全体のデータ長を短縮する。このような圧縮符号を「エントロピー符号」という。

ハフマン圧縮ではデータ全体を一定の長さの断片ごとに区切り、同じパターンの断片の出現回数を数え上げる。最も頻出するものから順に短い符号を割り当て、パターンを符号に置き換える。置換後の符号列中で各符号を一意に識別できるようにするため、「ハフマン木」と呼ばれる二分木でパターンと符号の対応関係を管理する。

符号化のためにはパターンの出現頻度を調べる必要があるが、最初に出現頻度をすべて調べて符号の割り当てを決めてから符号化を行う方式(データ全体を2回走査する)を「静的ハフマン圧縮」(static Huffman coding)、出現頻度を調べ符号の割り当てを変更しながら同時に符号化を進めていく方式(一度の走査で済む)を「適応的ハフマン圧縮」(adaptive Huffman coding)という。

実装が難しく、かつては特許で保護されていた「算術符号」(arithmetic coding)を除けば、理論上最も圧縮率が高いエントロピー符号化アルゴリズムとして知られる。実装も比較的容易であることから、Zip(Deflate)やJPEG、MP3など様々な圧縮形式の仕様の一部に採用され、広く普及している。

Zip 【.zipファイル】

複数のファイルを一つにまとめるアーカイブファイル形式、および、データを圧縮して容量を削減することができる圧縮ファイル形式の一つ。Windowsなどで標準的に用いられる。

Zip形式のファイルは内部に複数のファイルを格納でき、必要なものだけを展開して取り出すことができる。オペレーティングシステム(OS)のファイルシステムのように階層型(入れ子型)のディレクトリ(フォルダ)構造をそのまま取り込むことができる。ファイル名の標準の拡張子は「.zip」である。

ファイルの格納時にデータ圧縮を行うことができ、内容を維持したままファイルサイズを縮減することができる。この機能は本来はオプションで、圧縮せずにアーカイブすることもできるが、ほとんどの場合に圧縮機能が用いられるためZip形式は圧縮形式であると説明されることもある。

32ビットCRC方式の誤り検出符号を付与し、展開時にデータが破損していないか確かめることができる。ファイル作成時にパスワードを設定し、DES、3DES、RC2、RC4などの暗号アルゴリズムで内容を暗号化して格納する拡張仕様があり、展開時にはパスワード入力が必要となる。

圧縮方式

Zipのバージョン2.0からLZ77圧縮アルゴリズムとハフマン符号化を組み合わせたDeflateデフレート方式のデータ圧縮を利用することができるようになり、ファイル単位で圧縮を行い容量を削減することができる。これは内容を損なわない可逆圧縮(ロスレス圧縮)方式であり、どのような種類のデータも圧縮できる。

似た名称の圧縮ファイル形式に「gzip」や「bzip2」、「7z」(7-Zip)などがあるが、gzipはDeflate圧縮を用いるが記録形式としては別物で互換性がなく、bzip2は名前が似ているだけで特に共通点はない。7zはDeflateやbzip2を含む様々な圧縮形式に対応しているが記録形式はZipと異なる。

他のファイル形式での利用

データファイルに様々な種類の複合的なデータを収める必要があるアプリケーションソフトでは、特定のデータ形式やディレクトリ構造で複数のファイルを生成・配置し、これをまとめてZipで圧縮して一つのファイルにまとめたものを標準のファイル形式とする場合がある。

このようなファイルは格納されるデータ形式自体はZipファイルそのものだが、内容を展開するとそのアプリケーション固有のデータの集合体となるため、固有のファイル形式として独自の名称とファイル拡張子によって識別されることが多い。

このような方式を採用したフォーマットとして著名なものとして、Javaのソフトウェア配布に用いられるJAR形式(.jarファイル)、オフィスソフトの標準ファイル形式である「Open Office XML」(DOCXファイル、XLSXファイル、PPTXファイルなど)や「OpenDocument Format」(.odtファイル、.odsファイル、.odpファイルなど)がある。

歴史

Zipは1989年に米PKWARE社のフィル・カッツ(Phil Katz)氏が考案したもので、同社のMS-DOS向けのファイルアーカイブソフトウェア「PKZIP」の標準ファイル形式として発表された。同氏はZipの仕様を公表し、一切の権利を放棄したため、誰でも自由に利用できるようになり、主にMS-DOSやWindowsなどのプラットフォームで標準的なアーカイブ形式および圧縮形式として普及した。2015年にISO/IEC 21320として国際標準となっている。

RAR 【Roshal Archive】

汎用の可逆データ圧縮方式および圧縮ファイルの保存形式の一つ。ファイルの標準の拡張子は「.rar」。

Zip形式など他の著名な圧縮方式に比べ圧縮率が高く、ファイル分割機能や誤り訂正符号によるエラーの自動訂正機能を標準で備えるといった特徴から、通信回線が低速だったインターネット普及の初期に特に好まれた。

ファイル分割機能は圧縮後のデータを任意のサイズの複数のファイルに分割して保存する方式で、分割されたファイル群はファイル名の末尾が「.part01.rar」「.part02.rar」…といった規則で命名される(初期には拡張子が「.r00」「.r01」「.r02」のように変化する方式だった)。

他にも、解凍プログラムを圧縮ファイル自身に内蔵した自己解凍書庫の作成や、電子署名(デジタル署名)による改竄やすり替えの防止、パスワードにより保護された暗号化圧縮ファイルの作成などの仕様が規定されている。

もとはロシアのユージン・ローシャル(Eugene Roshal)氏とアレクサンダー・ローシャル(Alexander Roshal)氏の兄弟がMS-DOS向けに開発していた同名(RAR.EXE)の圧縮ソフト(およびWindows向けに移植されたWinRAR)で採用されていた形式で、のちに圧縮アルゴリズムとファイル形式の仕様が公開され他のソフトウェアにも広まった。

メディア ⭐⭐⭐

媒体、媒質、伝達手段、中間などの意味を持つ英単語。“medium” の複数形。情報の伝達や記録に用いられる物体や装置、およびこれを利用して人に情報を伝達・配布する仕組みや事業、組織などを指すことが多い。

一般の外来語としては、人が人に情報を伝えたり広く報じるのに用いるモノや仕組みを指し、広義には電話や手紙、書籍、テレビ、映画、電子メール、Webサイトなど様々な伝達手段が含まれる。

狭義には、社会の不特定多数の人々に向けて広く情報を発信する「マスメディア」(mass media)のことをメディアと呼ぶことが多い。現代では日常的に多くの人が接するテレビ放送、ラジオ放送、新聞、雑誌の4つを指し、これを「マス4媒体」「4大メディア」などという。

マスメディアと同じように、インターネットを通じて広く一般に情報を発信、公開するネットサービスやWebサイトなどのことを「ネットメディア」「Webメディア」「オンラインメディア」などと呼ぶ。Webサイトやブログ、メールマガジン、動画配信サービス、動画サービス上のチャンネルなどが含まれ、マスメディア企業がネットメディアも並行して運用する例も多く見られる。

記録メディア・伝送メディア

ITの分野では、一般の用法に加え、データの記録・保管に用いる物体や装置を「記録メディア」、信号やデータを伝送するケーブルや内部の信号線、あるいは電波など伝送の媒介となる物理現象を「伝送メディア」という。

記録メディア(記憶メディアとも呼ばれる)の例としては、磁気テープ、磁気ディスク(ハードディスクなど)、光学ディスク(CD/DVD/Blu-ray Discなど)、フラッシュメモリ(SSD/USBメモリなど/メモリーカード)などがある。伝送メディアの例としては金属線ケーブル(銅線ケーブル/メタルケーブル)、光ファイバーケーブル、電波、赤外線、電子基板上の金属配線などがある。

記録メディア 【記憶媒体】

信号やデータを何らかの物理状態に置き換えて記録することができる装置や部品のこと。磁気ディスクや磁気テープ、光学ディスク、フラッシュメモリなどが該当し、文脈によっては単にメディア、媒体と呼ばれることもある。

コンピュータなどの情報機器でデータの永続的な保管に用いられるストレージ(外部記憶装置)は、データを何らかの微細な物理的パターンに置き換えて記録・保持するメディアと、これを駆動して読み書き操作を行なう「ドライブ」(drive)と呼ばれる装置からなる。

記録メディアがディスク(円盤)やカセット、カートリッジ式になっており、ドライブ装置から着脱・交換可能(リムーバブル)になっている装置と、装置内部にメディアが封入・固定されていて入れ替えられない機器がある。フロッピーディスクや光学ディスク(CD/DVD/Blu-ray Discなど)などは前者、ハードディスクやSSD、USBメモリは後者に分類される。

メディアリテラシー ⭐⭐⭐

情報を伝達する媒体(メディア)を使いこなす基礎的な素養のこと。メディアを通じて情報を取得・収集し、取捨選択および評価・判断する能力や、自らの持つ情報をメディアを通して適切に発信できる能力を指す。

現代人は生活や仕事に必要な情報の多くをテレビや新聞、雑誌などのマスメディアやインターネット上のサイトやサービスなどの情報媒体を通じて得ているが、媒体にはそれぞれ物理的・技術的・商業的な制約や、発信者の立場や意図、経済的・政治的・思想的な背景などから偏りや歪みを避けることはできず、時には誤りや意図的な誇張、改変、虚偽などが含まれることもある。

情報の偏りにも様々な背景があり、例えば、紙面や放送時間の制約から送り手が重要でないと判断した話題が取り上げられなかったり扱いが小さくなることがある。商業的に運営されている媒体が大口広告スポンサーの不祥事を意図的に無視したり、自社や業界が関連する制度を取り上げる際に自らに有利な情報や論調を流すといった媒体の利害に基づく歪みが生じることもある。

また、政治や経済についての話題では、思想的に政権党に親和的な媒体とそうでない媒体で同じ事実について肯定的な論調と否定的な論調に分かれたり、特定の勢力に有利な、あるいは不利な情報を多く流すと行った操作が行われることも珍しくない。

情報の受け手としてのメディアリテラシーは、このような媒体の特性や限界、送り手の意図や背景などを読み解き、メディアから得た情報を鵜呑みにしたり全否定するのではなく、可能な限り客観的かつ正確に評価して活用できるようにする基本的な知識や技能の総体を指す。

1990年代まではメディアリテラシーといえばマスメディアの情報を読み取る受け手としての能力のみを指したが、現代ではインターネットを通じて誰でも公共に情報を発信することができるようになり、自らの持つ情報を適切な手段で発信する基礎的な能力もメディアリテラシーの範疇に含まれるようになった。こうした送り手としての素養はいわゆる「ネットリテラシー」の一部でもある。

マスメディア 【マスコミュニケーション】

不特定多数の人に同時に同じ情報を伝達できる媒体(メディア)のこと。また、その運営機関。「メディア」と略されることもある。マスコミによる情報の一斉伝達を「マスコミュニケーション」(mass communication、マスコミ)というが、媒体や運営機関のことをマスコミということもある。

現代社会では一般に新聞、雑誌、テレビ、ラジオの4つを指し、これらをマス4媒体(マスメディア4媒体、マスコミ4媒体)という。マスコミに流れる情報が社会に大きな影響を与えることから、その影響力の大きさを国家権力になぞらえ、行政、立法、司法に並ぶ「第4の権力」と呼ばれることもある。

また、あまり一般的な用法ではないが、伝達する情報の種類が限られていたり、情報の発信主体が極めて細分化・専門化していたり、特定集団内や個人間のコミュニケーションに用いる情報媒体でも、全体としての普及率や接触率が高い場合にはマスコミに含める場合がある。例えば、インターネット、書籍、映画、携帯電話、音楽・映像ソフト(CDやDVDなど)などをマスコミの一部とする場合がある。

何がマスコミとして機能するかは時代や科学技術、社会制度の変化によっても変遷し、例えば江戸時代の日本では立て札が一種のマスコミであり、テレビ放送の開始前は映画館で時事の話題を映像で伝える「ニュース映画」を上映していた。現在ではインターネットがマスコミの機能を持ち始めている。

多くの国で、マスコミの運営や所有者について法制度によって一定の規制あるいは保護が行われている。特に、国民の共有財産である電波周波数を専有するテレビやラジオなどの放送事業については免許制とし、一定の要件を満たした事業者が当局の規制・監督のもと運営する制度となっていることが多い。

新聞や雑誌についても税制や郵便料金を優遇するといった措置が行われることがある。例えば、日本では新聞に消費税の軽減税率が適用され、郵便制度では定期刊行物向けの割安な「第三種郵便物」という区分が用意されている。統制主義的な国家ではマスコミの運営を国が独占したり、報道内容の検閲など運営への国家の関与・介入が行われることが多い。

マスメディア 【マスコミュニケーション】 ⭐⭐

不特定多数の人に同時に同じ情報を伝達できる媒体(メディア)のこと。また、その運営機関。「メディア」と略されることもある。マスメディアによる情報の一斉伝達を「マスコミュニケーション」(mass communication、マスコミ)というが、媒体や運営機関のことをマスコミということもある。

現代社会では一般に新聞、雑誌、テレビ、ラジオの4つを指し、これらをマス4媒体(マスメディア4媒体、マスコミ4媒体)という。マスメディアに流れる情報が社会に大きな影響を与えることから、その影響力の大きさを国家権力になぞらえ、行政、立法、司法に並ぶ「第4の権力」と呼ばれることもある。

また、あまり一般的な用法ではないが、伝達する情報の種類が限られていたり、情報の発信主体が極めて細分化・専門化していたり、特定集団内や個人間のコミュニケーションに用いる情報媒体でも、全体としての普及率や接触率が高い場合にはマスメディアに含める場合がある。例えば、インターネット、書籍、映画、携帯電話、音楽・映像ソフト(CDやDVDなど)などをマスメディアの一部とする場合がある。

何がマスメディアとして機能するかは時代や科学技術、社会制度の変化によっても変遷し、例えば江戸時代の日本では立て札が一種のマスメディアであり、テレビ放送の開始前は映画館で時事の話題を映像で伝える「ニュース映画」を上映していた。現在ではインターネットがマスメディアの機能を持ち始めている。

多くの国で、マスメディアの運営や所有者について法制度によって一定の規制あるいは保護が行われている。特に、国民の共有財産である電波周波数を専有するテレビやラジオなどの放送事業については免許制とし、一定の要件を満たした事業者が当局の規制・監督のもと運営する制度となっていることが多い。

新聞や雑誌についても税制や郵便料金を優遇するといった措置が行われることがある。例えば、日本では新聞に消費税の軽減税率が適用され、郵便制度では定期刊行物向けの割安な「第三種郵便物」という区分が用意されている。統制主義的な国家ではマスメディアの運営を国が独占したり、報道内容の検閲など運営への国家の関与・介入が行われることが多い。

LANケーブル 【LAN cable】

構内ネットワーク(LAN)を構成する機器間をつなぐ通信ケーブル。広義には光ファイバーケーブルや同軸ケーブル、電話線なども含まれる場合もあるが、単にLANケーブルという場合はイーサネット(Ethernet)などに用いられるツイストペアケーブルを指す。

信号を伝達する芯材をプラスチックやゴムなどで覆って保護した線状の部品で、両端に機器に接続するためのコネクタ(端子)がついている。

最も普及しているのは2本の銅線を撚り合わせて信号線(芯線)とするツイストペアケーブル(twisted-pair cable:より対線)で、信号線が4本の2対4芯、8本の4対8芯のものが規格化されている。コネクタには簡単に脱着できるモジュラー型のRJ45(8P8C)が用いられ、多くのコンピュータやネットワーク機器が対応している。

外部からの電磁ノイズや内部からの信号の漏洩を防止する金属シールドで全体を覆った構造のものを「STPケーブル」(Shielded Twisted pair cable:シールド付きより対線)、このようなシールドのないものを「UTPケーブル」(Unshielded Twisted pair cable:非シールドより対線)という。

STP型は極めて高速な通信規格やノイズの多い工場内の配線など特殊な用途で主に用いられ、通常の使用環境では主にUTP型が用いられる。

ツイストペアケーブルは伝送可能な信号の周波数などの違いにより「カテゴリ」と呼ばれる仕様が定められている。100MHzまで対応するカテゴリ5(100BASE-TXなどで使用)や、250MHzまで対応するカテゴリ6(1000BASE-TXなどで使用)がよく知られる。

ハードディスク 【HDD】 ⭐⭐

コンピュータなどの代表的なストレージ(外部記憶装置)の一つで、薄くて硬い円盤(ディスク)の表面に塗布した磁性体の磁化状態を変化させてデータを記録するもの。一台あたりの容量が大きく容量あたりの単価が安いため、パソコンなどに内蔵されるストレージとして標準的な存在となっている。

構造・原理

装置内にはガラスや金属でできたプラッタ(platter)と呼ばれる円盤型の記憶媒体が数枚封入されており、表面には磁性体が塗布されている。これを回転軸で高速(毎分数千回)で回転させ、アームの先端に取り付けられた磁気ヘッドを近接させる。特定の箇所の磁化状態を変化させることでデータを書き込むことができ、状態を読み取ることでデータを読み出すことができる。

プラッタの直径は主流の製品で3.5インチ(約8.9cm)だが、小型の機器向けに2.5インチや1インチの製品も存在する。一台の装置にプラッタが1~8枚程度備え付けられ、通常はその両面を記録に用いる。内部的な制御や区画分けはプラッタごとに行われるが、外部から見た記憶領域としては全体で一つとなる。

他媒体との比較

「ハードディスク」とは硬い円盤という意味だが、これはフロッピーディスクなどのようにプラッタの素材に柔らかいプラスチックフィルムなどを用いる装置と対比した表現である。フロッピーディスクなどは記憶媒体と駆動装置(ドライブ)が分離していてディスクだけを取り外して交換したり持ち運べるが、ハードディスクはディスクとドライブが一体化しているため、「ハードディスクドライブ」(HDD:Hard Disk Drive)とも呼ばれる。

磁気ディスクや光学ディスクなどの中では最も記録密度が高く、同じ世代で比較すると装置(媒体)一台あたりの記憶容量は飛び抜けて大きい。読み書きも高速で、パソコンやサーバなどのコンピュータ製品では基幹的な記憶媒体として広く普及している。ドライブ一体型なこともあり一台あたりの価格が高いことや、振動に弱いという難点もある。

SSDへの置き換え

装置の寸法や接続仕様をハードディスクに揃え、内部の記憶媒体をフラッシュメモリに置き換えた製品はSSD(Solid State Drive)と呼ばれ、ハードディスクの代替として近年急速に浸透している。

読み書き速度が桁違いに速く衝撃にも強いという長所があるが、半導体メモリのため価格が高く一台あたりの容量も少ないという欠点があった。近年では低価格化と記憶容量の向上が劇的に進み、従来のハードディスクの用途を置き換える形で普及が加速している。

接続方式

コンピュータ本体に内蔵されるハードディスクの場合、接続インターフェースとして初期にはIDE/ATA(パソコン向け)やSCSI(サーバ・ワークステーション向け)が、2000年代以降はSATA(Serial ATA)が主に用いられている。独自の筐体を持ちケーブルでコンピュータと繋ぐ外付けの装置もあり、USBやIEEE 1394、eSATAなどの規格で接続される。

SSD 【Solid State Drive】

外部記憶装置(ストレージ)の一つで、記憶媒体にフラッシュメモリを用いる固定型の装置。ハードディスクと同じようにコンピュータに接続し、プログラムやデータの永続的な保存に用いる。

ハードディスクなどの磁気ディスク装置は磁気的に、DVDなどの光学ディスク装置は光学的に信号の読み書きを行うが、SSDは半導体素子に電気的にデータの記録、読み出しを行うため、極めて高速に読み書きすることができる。

また、高速で回転する円盤(ディスク)やモーター、盤上を移動する読み書き装置(ヘッド)といった機械部品がないため、消費電力が少なく、耐衝撃性に優れ、振動や駆動音もなく、装置の形状を小型、薄型、軽量にすることができる。

ただし、フラッシュメモリは書き込みを行うごとに素子が劣化するため、同じ容量なら磁気ディスクより書き換え寿命が短い。この欠点を補うため、多くのSSD製品では、なるべく満遍なく各素子に書き込み動作が分散するよう制御装置が記録位置の選択を行う「ウェアレベリング」と呼ばれる制御を行っている。

また、現在のところ容量あたりの単価は磁気ディスクや光学ディスクよりフラッシュメモリのほうが高額なため、同世代の同じ容量の製品の中では割高となる。コンピュータにSSDとハードディスクを両方搭載し、システムファイルや頻繁にアクセスされるプログラムやデータをSSDに保存して、それ以外はハードディスクに保存するといった使い分けが行われることも多い。

筐体仕様(フォームファクタ)やコンピュータ本体との接続インターフェースは、当初は既存の機器と置き換えられるよう3.5インチ筐体やSATA(シリアルATA)などハードディスクと同じ規格が流用されたが、SSDの高速な読み書き性能や省スペース性を最大限活用すべく、mSATAやM.2、NVMe、SATA ExpressなどSSDにより適した規格も策定され、普及しつつある。

SLC/MLC/TLC/QLC

SSDの記憶媒体に用いられるNAND型フラッシュメモリのうち、一つの記憶素子(メモリセル)に2値(1ビット)のデータを格納する方式を「SLC」(Single Level Cell)、3値以上からなる多ビットのデータを格納する方式を「MLC」(Multi-Level Cell)という。

初期のMLC型は4値(2ビット)を記録する方式だったため、狭義にはこれを指してMLCと呼ぶ。これを3ビット以上と区別する場合は「DLC」(Double Level Cell)と呼ぶこともあるが、この呼称は普及していない。3ビット(8値)記録できるものは「TLC」(Triple Level Cell)、4ビット(16値)のものは「QLC」(Quad-Level Cell)、5ビット(32値)のものは「PLC」(Penta-Level Cell)と呼ばれる。

セルに記録できるビット数が少ない方が動作が高速で信頼性、耐久性(書き換え寿命)も高いが、容量あたりの単価が高くつく。SLC型は記録密度が低すぎるためほぼ廃止されており、多値記録セルで記録密度を高める方向に発展している。

フラッシュメモリ

半導体素子を利用した記憶装置の一つで、何度も繰り返し書き込みができ、通電をやめても記憶内容が維持されるもの。近年、データを永続的に保存するストレージ(外部記憶装置)製品の記憶素子として急激に普及している。

フラッシュメモリは半導体メモリのうち、電源を落としても記録されたデータが消えない不揮発性メモリ(nonvolatile memory)に分類される。電気的に繰り返し自由に消去や再書き込みができる特徴はRAMと同じだが、技術的にはROM(の一種であるEEPROM)に由来するため「フラッシュROM」とも呼ばれる。

素子の構造や動作方式により大きくNAND型とNOR型の二種類に分かれる。最初に開発されたのはNOR型で、バイト単位で高速に読み出しができ、信頼性が高いが、後に開発されたNAND型の方が集積度を高めやすく、書き込みが高速であるという特徴の違いがある。

SLCとMLC

初期のフラッシュメモリはメモリセル(記憶素子)の電荷の有無にデジタル信号の「0」と「1」を対応付ける1ビット記録の素子(SLC:Single Level Cell/シングルレベルセル)が用いられた。後に、セルに投入した電荷量を段階的に識別することで1セルに複数ビットを保存できる素子(MLC:Multi-Level Cell/マルチレベルセル)が開発された。

初期のMLCは4段階識別・2ビット記録だったため、現在でもこれを指してMLCと呼ぶことが多いが、8段階識別・3ビット記録の「TLC」(Triple Level Cell/トリプルレベルセル)や、16段階識別・4ビット記録の「QLC」(Quad-Level Cell/クアッドレベルセル)も開発されており、MLCはこれら多値記録方式全体の総称を指すこともある。

特徴と用途

フラッシュメモリは磁気ディスクや光学ディスクなどに比べ、半導体素子に電気的にアクセスするためデータの読み書き速度が桁違いに速く、ドライブ装置に可動部がないため動作音もなく衝撃や振動にも強い。

ただし、素子の構造上劣化の進みが速く、初期には数百回程度、近年でも数万回程度の再書き込みによって素子が破損することが知られている。この点をカバーするため、制御回路により書き込み回数を各素子に均等に分散させる「ウェアレベリング」(wear leveling)と呼ばれる処理が行われる。

他方式のメディアに比べ価格も桁違いに高く小容量の製品しかなかったが、2000年代半ば頃からは量産効果や技術の進歩により飛躍的に低コスト化され、磁気ディスクなどの用途を奪う形で普及が拡大している。

主な用途としては、スマートフォンなどの携帯情報端末の内蔵ストレージや、数cm角の薄いプラスチックケースに収めたカード型の記憶媒体である「メモリーカード」、指先大の短い棒型や角型のケースに収めUSB端子でコンピュータに接続する「USBメモリ」などがある。

CD 【Compact Disc】

薄い樹脂製の円盤(ディスク)の表面に微細な加工を施し、高速で回転させてレーザー光を照射することで信号の読み書きを行う光ディスクの一つ。1980年にソニーと蘭フィリップス(Philips)社が開発した。

音楽ソフトを販売するための記録媒体として開発され、アナログレコードやカセットテープに代わって標準的な音楽販売メディアとして再生機器が広く普及した。後に利用者側の機器でデータを記録できる追記型(CD-R)や書き換え型(CD-RW)の仕様も策定され、コンピュータの補助的なデータ記憶メディア、ソフトウェア販売メディア、配布・交換用メディアとしても広まった。

CDは直径8cmあるいは12cmの中心に穴の空いたプラスチック製の薄いディスクで、ドライブ装置に挿入して高速で回転させる。近接させた光ピックアップから回転する記録面上の特定の位置にレーザー光を照射し、反射した光をセンサーで検知して記録されたデータを読み取る。書き込み型の場合はレーザー光で記録面を加熱して光の反射率を変化させることによりデータを書き込む。

記憶容量は一般的な12cmディスクの場合、データ650MB(メガバイト)または音声74分を記録できる製品と、700MBまたは80分の製品、800MBまたは90分の製品がある。8cmディスクは155MB/18分から300MB/34分まで数種類がある。標準のデータ転送速度は1.2Mbps(メガビット毎秒)で、これを「等速」「1倍速」などと呼び、その整数倍に高速化された機器が一般的となっている(最高は48倍速)。

ディスクへデータ記録する標準形式もいくつか定められており、音声を記録するCD-DA(CD Digital Audio)とコンピュータのファイルを記録するCD-ROM(CD Read Only Memory)が最も一般的に用いられる。動画を記録できるVideo CDやCDV、画像を記録するCD-GやPhoro CD、マルチメディアタイトルを記録できるCD-IやCD-ROM XAなどの規格も策定されたが、いずれもあまり普及しなかった。

CDの仕様や技術を踏襲しながら容量やアクセス速度を高速化した光ディスク規格がいくつかあり、主に動画の記録に用いられるDVDや、DVDをさらに大容量化したBlu-ray Disc(BD/ブルーレイディスク)などがある。DVD機器のほとんどはCDも読み込むことができ、BD機器はDVDに対応するが、BD機器の中にはCDのサポートを打ち切るものも現れている。

商標および規格名としての「CD」は “Compact Disc” の略で、イギリス英語の “disc” の綴りが用いられる。CD以降、光学ディスクの商標や規格名には “disc” 表記が好んで用いられる傾向にある一方、磁気ディスク系では “disk” 表記(アメリカ英語に由来)が一般的であり、あたかも意味上の違いや使い分けがあるように見えるが、単に慣例的なもので深い意味はない。

DVD

コンピュータや映像機器などでデータ記録メディアとして利用される光学ディスクの一種。細かい溝の彫られた樹脂製の円盤で、ドライブ装置内で高速回転させて溝に沿ってレーザー光を照射し、データの読み取りや書き込みを行う。規格の策定は業界団体のDVDフォーラムが行なっている。

サイズは直径8cmあるいは12cmで、中心にドライブ装置の回転軸を挿入する穴が空いている。両面記録、2層記録に対応しており、12cmディスクの記憶容量は片面1層で4.7GB、片面2層で8.54GB、両面1層で9.4GB、両面2層で17.04GBとなっている。

<$Fig:dvdmedia|center|true>

コンテンツやソフトウェアの販売などに用いられる読み出し専用の「DVD-ROM」の他に、一度だけ書き込める(消去・上書きできない)「DVD-R」、書き換え可能な「DVD-RW」「DVD-RAM」がある。記録型メディアを巡って業界内で規格の分裂があり、別の業界団体DVD+RWアライアンスが独自に規格を定めた「DVD+R」「DVD+RW」もある。

映像や音声を記録するための標準のディスクフォーマットやファイル形式のセットなども定められており、映像とそれに付随する音声・字幕を記録するための「DVD-Video」が映像ソフトの流通などに、「DVD-VR」がHDDレコーダーなどでよく利用される。商品としての「DVD」の呼称はDVD-Video形式の映像ソフトを指す場合がある。

<$Fig:dvdapplication|center|true>

Blu-ray Disc 【ブルーレイディスク】

DVDに次ぐ第3世代となる大容量の光ディスクの標準規格の一つ。CDやDVDと同じ直径12cmの樹脂製ディスクを用い、片面一層あたり25GB(ギガバイト)の高密度なデータの記録が可能。

ディスクをドライブ装置内で高速で回転させながら近接させた光ピックアップからレーザー光を照射して信号の読み書きを行う。片面一層あたり25GBを記録でき、両面記録や複層記録にも対応する。標準(1倍速)のデータ伝送速度は4.5MB/s(メガバイト毎秒)。

名称の由来は波長405nm(ナノメートル)の青色レーザー(正確には青紫色)を用いる点で、記録面上のトラックピッチ(隣接するトラック間の距離)をDVDの約半分の320nmに、最短ピット長を140nm程度に微細化している。

<$Fig:bluraymedia|center|true>

DVDより高画質・長時間収録が可能な民生機器での映像記録を主な用途と見込んでおり、動画・音声の記録形式(BDMV/BDAV)や著作権保護機能(DRM)が標準で盛り込まれている。

CDやDVDと同様、工場でのディスク製造時にデータが記録され利用者側で追記・書き換えできない読み出し専用の「BD-ROM」と、利用者が一度だけ記録することができる追記型の「BD-R」(BD Recordable)、何度も繰り返し消去・再書き込みが可能な書き換え型の「BD-RE」(BD Rewritable)の3種類のディスク仕様が規定されている。

<$Fig:blurayvideo|center|true>

主に映像ソフトやゲームソフトの販売、デジタル家電での録画、コンピュータのストレージ(外部記憶装置)などの用途で標準的に用いられ、パソコンやハードディスクレコーダー(ビデオレコーダー)、家庭用ゲーム機などの多くが対応しているが、機器側のほとんどがDVDとの両対応であることもあり、同じ用途でDVDも根強く使われ続け、置き換えはあまり進んでいない。

Blu-ray Disc Association (BDA/ブルーレイディスクアソシエーション)

Blu-ray Discの規格策定や普及促進を行う業界団体。ソニー、松下電器産業(現パナソニック)、シャープ、パイオニア、日立製作所、蘭フィリップス(Philips)社、韓LG電子、韓サムスン電子、仏トムソン・マルチメディア(Thomson Multimedia/現Technicolor)社らが2002年に設立したBlu-ray Disc Foundersが2004年に改称されて発足したもの。

現在では対応機器メーカーや映像産業から約140社が加盟しており、規格策定・更新の他に会員企業への技術情報の提供や、「Blu-ray Disc」の名称や「b」をかたどったロゴなどの商標について利用許諾などを行っている。

マルチメディア

情報媒体(メディア)の様態の一種で、文字や画像、動画、音声など、様々な種類・形式の情報を組み合わせて複合的に扱うことができるもの。特に、コンピュータなどの情報機器を用いて、デジタル化されたそれら多様な種類の情報を統合したもの。

単に複数の形態の情報を統合して提示するだけでなく、利用者の操作に応じて表示や再生の仕方に変化が生まれる双方向性(インタラクティブ性)をその構成要件に挙げる考え方もある。

1990年代に個人用小型コンピュータの処理性能や記憶容量、操作性などが大きく進歩すると、それまでは制約されていた様々な種類の表現を複合的に扱うことが容易になり、新しい情報メディアのあり方としてマルチメディアが大きく注目を集めた。

しかし、その指し表す内容が不明確で具体性を欠いたまま流行語のように消費されたことや、コンピュータ上でのメディア技術の利用が一般化し、マルチメディア的な表現が特に新しくも珍しくもなくなったことなどから、2000年代にはほとんど用いられなくなった。

Web 【ウェブ】 ⭐⭐

インターネット上で標準的に用いられている文書の公開・閲覧システム。文字や図表、画像、動画などを組み合わせた文書を配布することができる。現代では様々なサービスやアプリケーションの運用基盤としても広く用いられる。

文書内の要素に別の文書を指し示す参照情報(ハイパーリンク)を埋め込むことができる「ハイパーテキスト」(hypertext)と呼ばれるシステムの一種である。“web” (ウェブ)とは「蜘蛛の巣」を意味する英単語で、多数の文書が互いにリンクを介して複雑に繋がり合っている様子を蜘蛛の巣の網目状の構造になぞらえている。

WebサーバとWebブラウザ

Webで情報を提供するコンピュータやソフトウェアを「Webサーバ」(web server)、利用者の操作によりサーバから情報を受信して表示や処理を行うコンピュータやソフトウェアを「Webクライアント」(web client)という。

Webクライアントのうち、受信したページの内容を整形して画面に表示し、人間が閲覧するために用いるものを特に「Webブラウザ」(web browser:ウェブブラウザ)という。サーバとクライアントの間の通信には「HTTPエイチティーティーピー」(Hypertext Transfer Protocol)と呼ばれる通信規約(プロトコル)が標準的に用いられる。

Web上の情報資源の所在の指定には、「https://www.example.co.jp/index.html」といった形式の「URLユーアールエル」(Uniform Resource Locator)という表記法が用いられる。Webサーバを表すドメイン名(ホスト名)と、Webサーバ上での資源の位置を指し示すパス(階層的なディレクトリ名とファイル名の組み合わせ)を繋げた形式になっている。

WebページとWebサイト

Webにおける情報の基礎的な単位は「Webページ」(web page)で、見出しや文章などの文字情報をもとにHTMLエイチティーエムエル(Hypertext Markup Language)やCSSシーエスエス(Cascading Style Sheet)などのコンピュータ言語で構造や体裁、見栄えを記述する。

HTMLは記述された文字情報の中にソフトウェアへの制御情報を埋め込むことができる「マークアップ言語」(markup language)と呼ばれる言語で、「この部分が見出し」「本文はここからここまで」「段落の区切りはここ」といった指示を文書中に埋め込む形で記述することができる。

Webブラウザはこの制御情報に基づいて、タイトルを中央揃えにしたり、小見出しを太い大きな文字で表示したり、段落の間に空白を差し込むなど指定された整形や装飾を行い、閲覧者が文書の構造を把握しやすいように表示してくれる。

ページ内には文章だけでなく箇条書き(リスト)や表(テーブル)、図形、画像、動画、入力要素(フォーム)などを掲載することができる。画像や動画など文字で書き表せない要素は外部のファイルをURLで指定して埋め込むことができる。

要素のページ内での配置や大きさ、枠線や罫線、文字の字形(フォント)や色といった具体的な見栄えに関する指定項目(スタイルという)は、当初はHTMLで構造とともに記述していたが、CSSという専用の言語で構造とは別に指定する方式が主流となっている。

ページ内の要素には外部の他の資源(多くの場合は他のWebページ)のURLを指し示すリンクを設定することができ、ブラウザ画面に表示されたリンクを指定して開くよう指示(クリックやタップなど)すると、表示がリンク中のURLで指定されたページに切り替わる。簡単な操作でリンクをたどって次々に文書から文書へ表示を切り替えていくことができる。

このリンク機能を利用して、書籍のように複数のページ群をまとめた単位を「Webサイト」(web site)という。サイト内のページからは外部のサイトのページへリンクを張ることもでき、Web全体がリンクを介して連結された巨大な地球規模の文書データベースとなっている。

Webアプリケーション・Webサービス

Webサーバには静的なファイルの送信だけでなく、ブラウザからの要求に基づいて動的にコンピュータプログラムを実行し、何らかのデータ処理を行って結果をブラウザに応答することもできる。

また、Webブラウザにはページ上に記述された簡易なプログラム(スクリプトという)を実行し、サーバと任意のタイミングで通信したり、利用者の操作に応じて表示内容を変化させたりすることができる。

このような動的な仕組みを組み合わせ、サーバとブラウザが連携して利用者が対話的に操作することができるアプリケーションソフトを構築することができ、これを「Webアプリケーション」(web application)あるいは「Webサービス」(web service)という。著名な応用例として、ブラウザで買い物ができるオンラインショップ(ECサイト)や、利用者同士がコミュニケーションできるSNSなどのネットサービスがある。

歴史と名称

Webはインターネットがまだ学術機関を中心に利用されていた頃、1989年に欧州核物理学研究所(CERN)のティム・バーナーズ・リー(Tim Berners-Lee)氏が所内の論文公開・閲覧システムとして考案したものが基礎となっている。

1990年代にインターネットが一般に開放され普及していく過程で、電子メールなどと共にネットの代表的な応用システムとして広く利用されるようになった。2000年代中頃には主に日本を含む先進国で欠かすことのできない重要な情報インフラの一つに成長している。

もとは “World Wide Webワールドワイドウェブ”、略して “WWWダブリューダブリューダブリュー” が正式名称で、現在も「https://www.example.jp/」のようにWebサーバのホスト名などにこの名が残っているもの。英語では次第に “the Webザ・ウェブ” (固有名詞のWeb)のように略されるようになり、さらに進んで現在では一般名詞の “web” がインターネットのWebを指すことが増えている。日本では当初「ホームページ」の名称で紹介され、現在も初心者向けの説明などで多用されるが、「ウェブ」「Web」の呼称が浸透しつつある。

Webブラウザ 【ウェブブラウザ】 ⭐⭐

Webページを閲覧するためのアプリケーションソフト。利用者の指定したWebページを管理するWebサーバへデータの送信を要求し、送られてきたHTMLファイルや画像ファイルなどを読み込んで指定されたレイアウトで表示する。

利用者の指定したアドレス(URL)にアクセスし、WebサーバからWebページを構成するHTMLファイルやスタイルシート(CSS)、スクリプト(JavaScript)、画像、音声、動画などのデータを受信して、一枚のページに組み立てて画面に表示する。

入力フォームを使用して利用者側からデータやファイルをWebサーバに送信したり、表示されたページの保存や印刷を行ったり、簡易なプログラム(スクリプト)の実行機能を利用して制作されたソフトウェアやアニメーションなどを再生・動作させることもできる。

主要なWebブラウザには、「プラグイン」「アドオン」「拡張機能」(エクステンション)などの名称で、第三者の開発した機能を追加する仕組みが備わっており、様々な企業や個人が開発した追加機能が公開されている。

読み込むWebページの指定は、URL(Webアドレス)を表示欄に利用者が直接入力するか、表示されたページ中にある他のページへのリンク(ハイパーリンク)を指定するか、利用者の保存したURLの一覧(ブックマーク/お気に入り)から選択するなどの方法で行う。

サーバとの通信はHTTP(Hypertext Transfer Protocol)と呼ばれる通信規約(プロトコル)によって行われ、その基盤としてインターネットなどで標準のTCP/IPが用いられる。SSL/TLSを用いて通信経路を暗号化(HTTPS)したり、ローカルファイルを読み込む機能も備えていることが多い。

Webブラウザの種類

一般的なフル機能のWebブラウザ製品の他に、画像や動画などメディアデータは無視して文字(テキスト)部分だけを抽出して表示する「テキストブラウザ」、文字情報を音声合成機能で読み上げる「音声ブラウザ」(読み上げブラウザ)などがある。

パソコン向けでは、米グーグル(Google)社の「Google Chrome」(グーグル・クローム)や米マイクロソフト(Microsoft)社の「Microsoft Edge」(マイクロソフト・エッジ)、米モジラ財団(Mozilla Foundation)の「Firefox」(ファイアーフォックス)が人気で、Mac(macOS)では開発元の米アップル(Apple)社の「Safari」(サファリ)が標準的に使われる。

スマートフォンやタブレット端末の場合、Androidでは標準で組み込まれるAndroid版Chromeが、iOS(iPhone/iPad)でもやはり標準で組み込まれるiOS版Safariが使われることが多い。また、これらの環境では標準ブラウザの機能を部品(モジュール)化したものをアプリケーションソフトに組み込む「WebView」(ウェブビュー)という仕組みがあり、多くのアプリがこの仕組みを利用してWebブラウザの機能を内蔵している。

ブログ

投稿された記事を時系列に表示する日記的なWebサイトの総称。もとは個人や数人のグループが私的に運営するものが主だったが、現在では企業などの組織が事業や業務の一環として運営するものも多く見られる。

個人の私的な行動記録や身辺雑記などの日記的な内容を掲載する場合と、自らの社会的地位や専門分野などに根ざして時事の事柄などについてコメントしたり分析したりする内容を掲載する場合がある。

企業や公的機関などが情報の告知手段として利用することもあり(公式ブログ)、その場合はその機関が広く周知したい情報や公式見解などが掲載内容となる。「ブログ」という名称は “web” と “log” (日誌)を一語に綴った“weblog” (ウェブログ)を略したもので、運営者のことは「ブロガー」(blogger)という。

主な機能

開設・運営は専門のソフトウェアやネットサービス(ブログサービス)によって行なうことが多い。記事を執筆・編集・投稿するための機能や、投稿された文章や画像などを雛形(テンプレート)に流し込んでWebページとして生成・公開する機能、時系列や分類ごとに記事一覧を自動生成する機能、記事に一意の永続的なURL(パーマリンク)を割り当てる機能などを提供する。

また、多くのブログには読者が記事にコメントを投稿して掲載できる掲示板的な機能が用意されており、読者との対話や読者間の交流が可能となっている。別のブログの関連記事へリンクして相手の記事に自分の記事への逆リンクを掲載する「トラックバック」(trackback)という機能もあり、興味や話題ごとに著者同士や著者と読者によるコミュニティが形成されている。

主な内容

芸能人や著名人のブログは従来の日記のように個人の行動の記録や仕事に関する告知や宣伝、日々感じたことなどが掲載されることが多いが、無名の一般人が時事問題や専門的な話題に関して独自の情報や分析、議論などを掲載するブログもある。トラックバックなどの機能を利用してブログ間で特定の話題で議論や論争が生じることもある。

また、身の回りで見つけた珍しい物や、自身や周囲に起こった珍しいできごと、体験談を紹介するといった記事も多い。大きな事件や事故が起こった際に、地元の人や関係者、目撃者などが自分のブログに知っている情報を掲載することで、メディアを介さずに「生の」情報が流通するという事例も見られる。

派生システム

携帯電話などから利用するものを「モブログ」(moblog/mobile blog)、主に写真などの画像を投稿するものを「フォトログ」(photo blog)、主に動画を投稿するものを「ブイログ」(vlog/videolog)などと呼ぶこともあったが、現在ではこうした細かい区分はほとんど用いられていない。

また、X(旧Twitter)のように数十文字から百数十文字程度の短い文章を頻繁に投稿するスタイルのサービスを「ミニブログ」あるいは「マイクロブログ」(microblog)と呼んでいたが、こうしたサービスは現在ではSNSの一種に分類されるようになっている。

トラックバック 【TB】

ブログの機能の一つで、別のウェブログへリンクを張った際に、リンク先の相手に対してリンクを張ったことを通知する仕組みのこと。

ブログ作者が別のブログの記事を参照して自身のサイトにコメントを掲載するような場合、元の記事へのリンクを張るのが一般的だが、単にリンクしただけでは元の記事の作者はどこからどうリンクされているのか容易に知ることはできない。

トラックバックはリンク元サイトに「このような記事からリンクを張った」という情報を通知する仕組みで、リンク元記事のURLやタイトル、内容の要約などが送信される。トラックバックされたサイトはこの情報を元に「この記事を参照している記事一覧」を自動的に生成することができる。

トラックバックping (トラックバック通知)

トラックバックする相手のサーバに送信する通知のことを「トラックバックping」(トラックバックピング)と呼び、通知の送信先を「トラックバックURL」(trackback URL)という。多くのウェブログの記事には隅に「この記事へのトラックバックURL」が記載されている。

pingのデータ形式にはXMLベースのメッセージが用いられており、Webページからのフォーム送信にも用いられるHTTPのPOSTメソッドで通知を送信する。データ形式や送信手順は統一されており、ブログツールやサービスが異なっていても相互にpingを送受信することができる。

トラックバックスパム

受信したトラックバックを自動で一覧表示するブログに対して、宣伝などを目的に記事とは無関係な内容を無差別にトラックバックするスパム行為が横行している。対策として

トラックバックスパム (TBスパム)

他人のブログに記事とは無関係な内容のトラックバックを送信し、広告目的などで設置された自らのブログサイトに読者を誘導する迷惑行為を「トラックバックスパム」(trackback spam/TBスパム)という。

トラックバック記事一覧を自動的に表示するブログでは、誰でも自由に自分のサイトへのリンクを掲載できるため、記事の内容とは無関係な宣伝や検索エンジン対策(SEO)のリンク獲得などを目的に、無差別にトラックバック通知を送信するスパム行為が横行するようになった。

ブログツールやブログサービスでは受信したトラックバックをすぐに表示せず、オーナーが承認したものだけ掲載する承認制とするなどの対策が行われるようになったが、トラックバック機能の利用自体が下火になったこともあり、日本の大手ブログサービスではトラックバック機能自体が廃止される流れが強まっている。

BBS 【Bulletin Board System】

ネットワーク上で運用されるシステムの一つで、閲覧者が文字メッセージなどを書き込んだり、他の閲覧者の投稿を読むことができるシステム。現代ではWebサイト上で構築・運用されることが多い。

主な機能

Web上の掲示板は、Webサイトに動的に実行可能なプログラム(スクリプト)を設置し、訪問者がこれを起動して記事の投稿や表示を行う。単純なテキスト(文字)のみが投稿可能なものと、画像ファイルなどを添付できるもの、アバターやアイコン、顔文字、絵文字、文字飾りなどが利用できるものなどの種類がある。

投稿の一覧は新しいものから順に時系列に表示されることが多いが、記事間に参照関係を設定して、互いに関連する記事同士をまとめて表示できるようにしたものもある。一つの掲示板の中に作成された複数の投稿の流れを「スレッド」(thread)、「トピック」(topic)などという。

各投稿には投稿者名やタイトル、本文、投稿日時などが表示され、これに加えて投稿者のIPアドレスやホスト名などが表示されたり、投稿者のなりすましを防ぐ固有の符号などが表示されることもある。簡易なシステムではタイトル欄がなく本文のみの場合もある。

実名と匿名

企業内の情報システムやイントラネット上のWebサイトなどに構築されたものはアクセス可能な参加者が限られており、身分や氏名を明かして連絡や情報交換などが行われる。一方、インターネット上に開設する場合はパスワードなどでアクセス制限などを設けて同じように特定の集団内で利用する場合と、誰でも投稿や閲覧が可能なオープンな形で運営される場合がある。

オープンな掲示板ではプライバシー保護などのため実名を名乗らず、代わりに投稿者が自分で決めたあだ名のような名前を名乗ることが多く、これを「ハンドル」(handle)あるいはハンドルネームなどという。ハンドルを設定する必要がなく、また、実際にほとんどの投稿者が特定のハンドルを名乗らず「名無し」状態で投稿するのが慣習となっている掲示板サイトもあり、「匿名掲示板」と呼ばれる。

歴史

BBSはインターネットの一般への本格的な普及が始まる以前の1980年代から、パソコン通信の主要な機能として一部の人々の間で利用されていた。掲示板以外の電子メールやチャット、ファイルライブラリなどの機能を含め、「草の根BBS」などのようにパソコン通信サービス自体のことを「BBS」と呼ぶこともあった。

チャット

雑談(する)、おしゃべり(する)などの意味を持つ英単語で、コンピュータネットワークを通じてリアルタイムにメッセージのやり取りをするシステムのこと。通常は文字による会話を行う「テキストチャット」のことを単にチャットという。

ある程度まとまった内容を非同期にやり取りする電子メールや電子掲示板(BBS)などとは異なり、電話や相対で会話するように短い文章をリアルタイムにやり取りしてコミュニケーションを行うシステムやサービス指す。

主に文字によるやり取りを行うものをテキストチャット、音声通話を行うものをボイスチャット、ビデオ通話を行うものをビデオチャットという。単にチャットという場合は文字ベースのものを指すことが多いが、複数の方式に対応し選択できるシステムも増えている。

メッセンジャーとの違い

一般的なチャットシステムはインターネット上に設けられた仮想的な会議室であるチャットルームに参加者が集まり、主に三人以上の集団でメッセージ交換する。主に二者間の連絡や対話のために用いられるものはメッセンジャー(インスタントメッセージング)と呼ばれ、チャットの一種とする場合と、チャットとは異なるシステムに分類する場合がある。

近年では、チャットシステムにチャットルームの別の参加者と二人で話す秘話機能(ダイレクトメッセージ)が設けられたり、メッセンジャーに三人以上で会話するグループチャット機能が設けられるようになり、両者の区別は曖昧になっている。

主な機能

チャットルームにログインすると、参加者の発言が発言者名、発言内容、発言時刻などとともに流れてくる。掲示板などと異なり、誰かが発言すると他の参加者の画面に即座に反映され、リアルタイムにやり取りが行われる。

顔文字や絵文字を付け加えたり、発言が吹き出し型の図形に括られたり、それぞれの参加者が選んだ代理キャラクター(アバター)が発言者名と一緒に表示されるといった工夫を凝らしたサービスもある。

インターネット上のチャットルームは誰でも入れるオープンなものと、パスワードなどでアクセスが制限され、限られた顔見知りの仲間だけで利用するものがある。オープンな場では発言者名にハンドル(あだ名)を用いるのが慣習となっている。

ソーシャルメディア ⭐⭐

インターネット上で展開される情報メディアのあり方で、個人による情報発信や個人間のコミュニケーション、人の結びつきを利用した情報流通などといった社会的な要素を含んだメディアのこと。狭義にはいわゆる「SNS」(ソーシャルネットワーキングサービス)を指す。

利用者の発信した情報や利用者間の繋がりによってコンテンツを作り出す要素を持ったWebサイトやネットサービスなどを総称する用語である。電子掲示板(BBS)やブログ、ミニブログ、Wiki、SNS、動画共有サービス、動画配信サービス、ポッドキャスト、ソーシャルニュースサイト、ソーシャルブックマークサービス、レシピ共有サイト、各種レビューサイト、Q&Aサイトなどが含まれる。

メッセンジャーアプリやビデオ会議アプリなどのコミュニケーションツールもソーシャルメディアの一種とする場合がある。サイトやサービス自体はソーシャル的でない場合も、オンラインショップのレビュー投稿欄、フリマアプリの購入者評価欄などのようにソーシャルメディア的な要素が含まれる例がある。

従来のマスメディアは情報の発信に巨大な設備や組織、巨額の資金が必要だったため、情報の送り手の地位は少数の特権的な職業人によって占められていたが、ソーシャルメディアではメディアの閲覧者が同時に発信者としての資格を持ち、他の利用者に自身の責任で自由に情報を発信することができる。

また、大衆に画一的に同じ情報を複製して配信してきたマスメディアに対し、ソーシャルメディアでは多様な発信主体から閲覧者自身が必要とする情報源を選択したり、友人や同僚、同好の士などといった人間関係を利用して情報の流通を制御したりする仕組みが用意されていることが多い。

SNS 【Social Networking Service】 ⭐⭐⭐

人と人との社会的な繋がりを維持・促進する様々な機能を提供する、会員制のオンラインサービス。友人・知人間のコミュニケーションを円滑にする手段や場を提供したり、趣味や嗜好、居住地域、出身校、あるいは「友人の友人」といった共通点や繋がりを通じて新たな人間関係を構築する場を提供するサービスで、Webサイトや専用のスマートフォンアプリなどで閲覧・利用することができる。

主な特徴

サービスにより機能や特徴が大きく異なるが、多くのサービスに見られる典型的な機能としては、別の会員を「友人」や「購読者」「被購読者」などに登録する機能、自分のプロフィールや写真を公開する機能、同じサービス上の別の会員にメッセージを送る機能、自らのスペースに文章や写真、動画などを投稿して友人などに見せる機能がある。

サービスによっては、複数の会員でメッセージ交換や情報共有ができるコミュニティ機能、イベントの予定や友人の誕生日などを共有したり当日に知らせたりしてくれるカレンダーあるいはスケジュール機能などがある。

多くの商用サービスではサイト内に広告を掲載するなどして、登録や基本的なサービスの利用を無料としているが、一部の機能を有料で提供しているサービスもある。

SNSの種類

多くのサービスはメールアドレスなどがあれば誰でも登録できるが、普及し始めた当初は人の繋がりを重視して「既存の参加者からの招待がないと参加できない」というシステムになっているサービスが多かった。

現在でも、何らかの形で参加資格を限定し、登録時に紹介や審査などが必要なサービスがある。また、参加自体が自由でも、テーマや分野などがあらかじめ設定され、関係や関心のある人の参加を募っているサービスなどもある。

企業などが従業員を対象に運用する「社内SNS」や、大学が教職員や在学生、卒業生を対象に運用する「学内SNS」もあり、業務上の連絡や情報共有に使われたり、業務とは切り離して参加者間の交流の促進のために利用されたりする。「OpenPNE」や「Mastodon」など自らSNSを開設・運用することができるサーバ向けソフトウェアもあり、これを利用したプライベートな集団内のサービスも存在する。

歴史と著名なサービス

2003年頃アメリカを中心に相次いで誕生し、国内事業者によるサービスも2004年頃から普及し始めた。世界的には、初期に登録資格を有名大の学生に絞って人気を博し、後に世界最大のソーシャルネットワークに成長した「Facebook」(フェイスブック)や、短いつぶやきを投稿・共有するマイクロブログ型の「Twitter」(ツイッター:現X)、写真の投稿・共有を中心とする「Instagram」(インスタグラム)、ビジネス・職業上の繋がりに絞った「LinkedIn」(リンクトイン)などが有名である。

日本独自のサービスとしては一時会員数1000万人を超え社会現象ともなった「mixi」(ミクシィ)などが有名だが、近年ではFacebookなど海外事業者に押され利用が低迷しており、オンラインゲーム運営・提供に業態転換するなどしている。

SNS的なサービスの広がり

近年では様々なWebサイトやネットサービス、スマートフォンアプリなどに「ソーシャルな」機能が組み込まれる事例が増えており、何がSNSで何がそうでないか明確に区別することは難しくなりつつある。

例えば、料理レシピ投稿サイトの「クックパッド」(Cookpad)や、スマートフォン利用者間でチャットや音声通話などを提供する「LINE」(ライン)などにも、集団の形成を支援するコミュニティ機能や日記の投稿・共有機能などがあり、これらのサービスをSNSの一種に含める場合もある。

SNSの功罪

SNSによって、一度繋がりの途絶えた古い友人と交流を再開したり、現実に頻繁に会うことは難しい多人数と日常的な繋がりを保ったり、身の回りに同好の士がいなくてもSNSで発見してコミュニティを形成できるなど、SNSのおかげで人間関係が充実した利用者は数多くいる。

一方で、不用意に個人情報や顔写真などを公開してしまい悪意に晒されたり、素性のよくわからない人と交流を持ちトラブルに巻き込まれたり、自分の周囲では特に問題視されなかった話がネット上で拡散されるうちに非難の書き込みが殺到してしまう(「炎上」と呼ばれる現象)など、SNSによって新たに引き起こされる問題もある。

また、SNSが様々な人の間に普及し、継続して利用する期間が長くなるに連れ、上司や家族など「望まれざる」相手とのSNS上での関係や対応に苦慮したり、知り合いの(大抵は良いことしか書かれていない)書き込みを読んで自分の身上と比較してしまったり、興味が湧かない話題でも毎回反応を迫られているように感じて精神的に疲弊する「SNS疲れ」といった問題に直面し、SNSの利用を断って離れる人も増えている。

Twitter 【ツイッター】

今していること、感じたこと、他の利用者へのメッセージなどを「つぶやき」のような形式で280文字(日本語などは140文字)以内の短い文章にして投稿するスタイルのブログサービス。

短文を投稿していくスタイルのサイトは当初「ミニブログ」「マイクロブログ」などと分類されたが、現在ではFacebook(フェイスブック)などと同じSNSサービスの一種であるとみなされることが多い。“twitter”とは英語で、さえずる、ぺちゃくちゃ喋る、くすくす笑う、といった意味の英単語で、日本では「ツイッター」「トゥイッター」などと発音される。英語では “t” の音はあまり強調されず「トゥイラァ」に近い発音となる。

Twitterは2006年7月に米オブビアス(Obvious)社(現Twitter社)によって英語版のサービスが開始された。その後、日本国内での利用が米国内に次いで多かったことから、2008年4月に他言語版としては初となる日本語版のサービスが開始された。

2017年には全世界で3億2000万人以上、そのうち日本には4500万人以上のアクティブな利用者が存在すると発表されており、世界的に展開しているSNSサービスの中では日本で突出して人気の高いサービスとしても知られる。

Twitterはメールアドレスなどを登録すれば誰でも無料で利用できる。加入すると自分専用のWebページが作成され、そこに自分の発言を投稿する。Twitterにおける個々の発言は「ツイート」(tweet)と呼ばれる。

特定の他の利用者に向けて「あて先」を指定する書式も用意されており、文字通り「おしゃべり」に使うこともできる。公開アカウントの発言はWeb上に広く公開され、Twitter加入者以外も読むことができるが、アカウントを非公開設定にすれば、特別に関係を結んだ利用者以外は読むことができなくなる。

「フォロー」(follow)と呼ばれる機能で他の利用者を登録すると、その人の発言をリアルタイムに受信することができる。通常の操作画面では自分の発言とフォローした人の発言が(原則として)時系列に並んで次々に新しい発言が追加されていくようになっており、この発言の流れを「タイムライン」(TL:Time Line)という。他の利用者が自分をフォローして発言を受信することもあり、これを自分の「フォロワー」(follower)という。

他のSNSサービスの「友達」機能とは異なり、フォローは一方向の関係であり、フォローした相手が自分をフォローするとは限らない。友人・知人などの間柄では互いにフォローし合う「相互フォロー」の関係を結ぶことも多いが、有名人のアカウントなどは本人がフォローする人に比べフォロワーの方が桁違いに多い場合もある。

ツイート (tweet)

Twitterにおける一回分の書き込みを「ツイート」(tweet)と呼び、発言を投稿することを「ツイートする」(tweeting)という。日本語では「つぶやき」と呼ばれることもある。“tweet”の原義は「(小鳥の)さえずり」で、短い発言を頻繁に投稿する様子を鳥のさえずりになぞらえている。

当初はどの言語でも一回の発言は140文字以内に制限されていたが、現在では英語などは280文字までで、日本語や中国語、韓国語などの文字は2文字分にカウントされる(すべて日本語なら140文字まで)。発言内にいわゆるUnicode絵文字を混在させたり、画像や動画、GIFアニメーション、GPS位置情報などを添付して発言とともに表示させることもできる。

リツイート (RT/retweet)

Twitterで他の利用者の発言を転載すること。また、転載した発言。自分のフォロワーのタイムラインにその発言を知らせるために行なう。

当初は「RT @ユーザー名 当該発言」のような書式で、自分の発言としてつぶやく方式だったが、その後、Twitter社が公式の機能として実装し、自分の発言とは区別して元の発言をそのままフォロワーに流すことができるようになった。

また、単に発言をそのまま転載するだけでなく、自らの発言を添えてタイムラインに掲載することもでき、「引用リツイート」(引用RT)あるいは「QT」(Quoted Tweet)などと呼ばれる。

CGM 【Consumer Generated Media】

インターネットを通じて利用者からの情報提供や投稿を集めて内容が形成されるWebサイトやネットサービスなどのこと。SNSやブログ、Q&Aサイト、口コミサイト、レシピ投稿サイト、グルメサイト、写真共有サイト、動画共有サイト、イラスト投稿サイト、ウィキ(Wiki)などが該当する。

1990年代後半のWeb普及初期から電子掲示板(BBS)や個人運営の趣味的なWebサイトなどは存在したが、2000年代中頃になり、様々なテーマや形態で利用者の投稿を受け付け、主要なコンテンツとして提供するWebサイトが勃興した。これらを企業などから一方的に情報を配信する従来型のメディアと対比してCGMと総称する。

また、主要なコンテンツが企業などの制作・提供するものであっても、ページの一部に利用者から投稿された内容を表示する機能を備えたサイトも増え、CGMと合わせてUGC(User-Generated Content:ユーザー生成コンテンツ)という。追加的なUGCとしてはニュース記事などのコメント欄、オンラインショップなどのレビュー(購入者による評価)などがある。

UGC 【User-Generated Content】

Webサイトやオンラインサービス上で提供されるコンテンツのうち、利用者によって制作・生成されたもの。利用者の投稿した文章や画像などが含まれる。

典型的なUGCとして、電子掲示板(BBS)やソーシャルネットワーキングサービス(SNS)、ウィキ(Wiki)、ブログなどへの書き込み、写真共有サイトへの画像の投稿、動画共有サイトへのビデオの投稿や配信、ソーシャルブックマークへのURLの登録などが該当する。

文章や画像のように利用者が端末上で作成・編集して送信したコンテンツ以外にも、サービス上の機能を利用して作成される利用者プロフィールやお気に入りリスト、欲しいものリスト、再生リストなども含まれる。

また、サービスやページ上の主な内容が運営者側の用意したものでも、ブログやニュース記事のコメント欄、オンラインショップの商品レビューなどは利用者が生成しているためUGCの一種である。

飲食店の口コミサイトや料理のレシピ投稿サイト、イラスト投稿サイトのように、利用者からの情報提供や投稿を集めて整理したものが主な提供内容となっているWebサイトやネットサービスなどのことを「CGM」(Consumer Generated Media)という。

ハンドルネーム 【ハンドル名】

インターネット上の電子掲示板(BBS)やSNS、オンラインゲームなどで名乗るニックネームのこと。英語では “handle” 単体でこの意味になるため、「ハンドル名」「ハンドルネーム」は和製英語である。

ハンドルネームはプライバシーを守りつつ個人を簡単に識別する手段として、電子掲示板(BBS)、チャット、オンラインゲーム、SNS、メッセンジャーなどのサービスで定着している。本名を公開することに抵抗がない人でも、カジュアルで親しみやすい印象を与えるハンドルネームで日常的な活動を行う例は多い。

システムにハンドルネームを登録する仕組みのサービスでは、利用できる文字種や長さなどが決まっている。ログインなどに使用するシステム側の識別子であるユーザー名(アカウント名)とハンドルネームが別になっているサービスでは比較的自由にハンドルネームを設定・変更できる場合がある。「†漆黒の堕天使†」のように飾りとして記号文字を加えたり、「ルシフェル@C102二日目東A99a」のように宣伝や告知を付け加える人もいる。

固定ハンドルと捨てハンドル

インターネットなどで用いるハンドル名のうち、ある人物が自らの識別名として継続的に使用するものを俗に「固定ハンドル」という。俗に「コテハン」と略されることもある。Webサイトの運営やSNSでの継続的な発信、ブログの執筆など、自らの責任である程度継続的にネット上で活動する際に用いられる傾向が強く、メッセンジャーやメーリングリストなど様々な場で同じ名前が使われる。

その人のプライバシーや実社会での地位などが秘匿されるという意味では「匿名」だが、個人の同定が可能であり、活動の履歴や他者からの評価が蓄積されるという意味では芸能人の芸名や作家のペンネームに近い。このため、まったくの匿名とは区別して「特名」「顕名」などと呼ぶ試みもあるが、あまり広まっていない。

一方、ある場面でハンドル名を名乗りながら、その名を名乗るのはその場限りで継続的に使われない「使い捨て」の名前を「捨てハンドル」という。俗に「捨てハン」と略されることもある。匿名の一種だが、一部のBBSにある、ハンドルそのものが無く話者を識別しない(できない)「名無し」状態とは異なり、その場面での話者の識別には用いられる。

ポータルサイト 【Webポータル】

Web上の様々なサービスや情報を集約して簡単にアクセスできるようにまとめた、Web利用の起点となるWebサイトのこと。「ポータル」(portal)は「門」「扉」などの意。

提供される情報やサービスはサイトにより異なるが、Web検索エンジンや、ニュース、天気予報、株価などの経済情報、辞書・辞典、Webメール、地図、鉄道乗り換え案内、電子掲示板、オンラインモール、オンラインゲームなど、一般消費者が日常生活で必要としたり、あると便利な情報やサービスで構成される。

Web上で一般に公開され広くネットユーザー全般を対象に運営されているサイトと、インターネットサービスプロバイダ(ISP)などが会員向けに提供しているサイトがある。「育児ポータル」といったように、特定の分野や対象に特化した専門的なサイトも多い。

多くのサービスは誰でも無料で利用できるが、一部の機能が要会員登録あるいは有料の場合もある。情報やサービスは運営元が自社で提供する場合と、新聞社から記事を購入して掲載するなど、その分野の専門的な企業と提携して供給を受ける場合がある。

1990年代後半にインターネットが一般に開放され急激に普及する際に、Web利用を補助するサービスとして広まった。当初は様々なWebサイトへのリンクを収集・分類し、容易に探索・一覧できるようまとめたリンク集(Webディレクトリ)を中心に発展してきたため、Webへの玄関口という意味合いでポータルサイトと呼ばれるようになった。現在ではWebサイトのディレクトリは歴史的な役割を終え、提供すサイトはほとんどなくなっている。

転じて、組織内の複数のWebサイトや情報資源のデータやサービスを集約・整理して一覧できるようにした玄関口となるサイトをポータルサイトということがある。大学などが学生や教職員向けに運営しているものや、行政機関が住民や国民、特定分野の事業者向けに運営しているものなど様々な種類がある。企業が従業員向けに提供するものは「社内ポータル」「企業内ポータル」「エンタープライズポータル」などと呼ばれる。

Wiki 【ウィキ】

Webサイトのコンテンツ管理システム(CMS)の種類の一つで、簡便な記法を用いて文書の整形や装飾が可能なもの。Webサーバ側にソフトウェアを導入すれば、Webブラウザで簡単にWebページの発行、編集、削除ができる。

複数人が共同でWebサイトを構築していく利用法を想定しており、サイト閲覧者が簡単にページを修正したり、新しいページを追加したりできるようになっている。誰でも編集できるようオープンに運用することも、アカウント登録やパスワード設定で編集権限を特定の利用者に制限することもできる。

Wiki記法

Webページは通常、HTMLなどのマークアップ言語やCSSなどのスタイル言語で内容や見栄えの記述を行うが、利用者側にこれらの言語の知識がなくても編集ができるよう、「ウィキ記法」と総称される記号を組み合わせた簡易な整形書式が用意されている。これを文章中に埋め込むことでレイアウトやスタイルの指定ができる。

具体的な記法の種類や用法はウィキのシステムごとに異なるが、例えばHTMLで見出し設定のタグを用いて「<h1>大見出し</h1>」のように記述する箇所を「= 大見出し =」のように書いたり、リンク設定のタグを用いて「<a href=“http://www.example.com/”>外部リンク</a>」のように記述する箇所を「[http://www.example.com/ 外部リンク]」のように書くなど、簡単に覚えて書くことができるよう配慮されている。

主な用途と事例

Webブラウザで開いたページをそのまま簡単に編集できる手軽さと、サイトの構成が柔軟で内部リンクでページ間を容易に関連付けられる特徴から、様々な閲覧者が参加して情報や資料を集積していく情報収集型サイトとして運用されることが多い。

最もよく知られた成功例は誰でも閲覧・編集が可能なオープンなオンライン百科事典プロジェクトの「Wikipedia」(ウィキペディア)で、あまりにも有名なためにこれを略して「Wiki」(ウィキ)と呼ぶ人が多くいるほどである。他にも、何らかのテーマや対象について閲覧者に広く情報提供を呼びかけるオープンなウィキサイトのことを俗に「まとめWiki」などという。

歴史

1995年にアメリカの著名なソフトウェア開発者ウォード・カニンガム(Ward Cunningham)氏が「WikiWikiWeb」というWebサイトで使っていたプログラムがウィキの原型となった。同氏がこれを公開したことから、多くのウィキクローンプログラムが作成され、様々な環境に移植された。

多くの著名なウィキソフトウェアはオープンソースソフトウェアとして公開・配布されており、簡単に入手して導入することができる。ちなみ、「Wiki」という言葉はハワイ語の「Wikiwiki」が語源で、「速い」「急ぐ」「形式張らない」といった意味がある。

Wikipedia 【ウィキペディア】

非営利団体のウィキメディア財団(Wikimedia Foundation)が主催している、誰でも自由に閲覧・執筆・編集できるインターネット上のフリー百科事典。

広告や有料サービスなどは無く、運営に必要な資金は寄付によってまかない、編集は世界中の無償のボランティアの手によって行われている。掲載内容はCC BY-SA(クリエイティブ・コモンズ 表示・継承)あるいはGFDL(GNU Free Documentation License)というライセンス(利用許諾)に基づいて公開されており、誰でも自由に利用(複製・改変・頒布・販売など)することができる。

2001年1月15日に英語で開始され、現在では世界の約300言語の版が作成されている。2018年4月現在の記事数(総項目数はその数倍)は英語560万、ドイツ語217万、フランス語197万、オランダ語193万、ロシア語146万、イタリア語143万、スペイン語140万、日本語110万、中国語100万、アラビア語56万、韓国語(朝鮮語)41万などとなっている。

Wiki(ウィキ)と呼ばれるWebサイトの共同執筆・編集システムの一つ(独自開発のMediaWiki)を利用して作られており、「Wikipedia」の名称は、Wikiと “encyclopedia” (百科事典)の造語である。登録などしなくても誰でも内容を編集できるが、利用者の登録制度もあり、登録利用者しか使用できない機能もある。登録利用者の中には管理者がおり、一般の利用者より強い権限を持っている。

誰でも編集できるという環境でも内容を検証可能にするため、記述内容には原則として出典・典拠を明らかにすることが求められる。他の著作物からの剽窃や疑義のある内容については利用者間での議論が行われ、合意に基づいて修正・削除が行われることもある。

変更履歴はすべて記録・公開され、いつ、誰(非登録利用者は発信元IPアドレス)が、どこを、どのように編集したのか誰でも時系列に遡ってすべて知ることができる。これにより、明らかに虚偽の内容や商業的な広告、政治的な宣伝、いたずら的な書き込みなどについては、閲覧した他の利用者が発見し、修正されることが期待されている。

同財団ではいくつかのWikipedia姉妹プロジェクトを推進しており、Wikiによる辞書・シソーラス(類義語辞典)の「Wiktionary」(ウィクショナリー)、電子書籍・教科書「Wikibooks」(ウィキブックス)、引用句事典「Wikiquote」(ウィキクォート)、著作権フリーな文章のコレクション「Wikisource」(ウィキソース)、生物種についての情報を集める「Wikispecies」(ウィキスピーシーズ)、ニュースサイト「Wikinews」(ウィキニュース)、著作権フリーな画像や音声のコレクション「Wikimedia Commons」(ウィキメディア・コモンズ)などがある。

電子メール 【eメール】 ⭐⭐⭐

通信ネットワークを介してコンピュータなどの機器の間で文字を中心とするメッセージを送受信するシステム。郵便に似た仕組みを電子的な手段で実現したものであることからこのように呼ばれる。

広義には、電子的な手段でメッセージを交換するシステムやサービス、ソフトウェア全般を指し、携帯電話のSMSや、各種のネットサービスやアプリ内で提供される利用者間のメッセージ交換機能などを含む。

狭義には、SMTPやPOP3、IMAP4、MIMEなどインターネット標準の様々なプロトコル(通信規約)やデータ形式を組み合わせて構築されたメッセージ交換システムを指し、現代では単に電子メールといえば一般にこちらを表すことが多い。

メールアドレス

電子メールの送信元や宛先は住所や氏名の代わりに「メールアドレス」(email address)と呼ばれる統一された書式の文字列が用いられる。これは「JohnDoe@example.com」のように「アカウント名@ドメイン名」の形式で表され、ドメイン名の部分が利用者が所属・加入している組織の管理するネットワークの識別名を表し、アカウント名がその中での個人の識別名となる。

企業や行政機関、大学などがメールサーバを運用して所属者にメールアドレスを発行しているほか、インターネットサービスプロバイダ(ISP)や携帯電話事業者などがインターネット接続サービスの一環として加入者にメールアドレスを発行している。

また、ネットサービス事業者などが誰でも自由に無料でメールアドレスを取得して利用できる「フリーメール」(free email)サービスを提供している。一人の人物が立場ごとに複数のアドレスを使い分けたり、企業の代表アドレスのように特定の個人に紐付けられず組織や集団などで共有されるアドレスもある。

メールサーバとメールクライアント

インターネットに接続されたネットワークには「メールサーバ」(mail server)と呼ばれるコンピュータが設置され、利用者からの要請により外部のネットワークに向けてメールを送信したり、外部から利用者に宛てて送られてきたメールを受信し、本人の使うコンピュータに送り届ける。利用者や他のサーバに対する窓口であり、郵便制度における郵便局のような役割を果たす。

メールサーバ内には利用者ごとに私書箱に相当する受信メールの保管領域(メールボックス)が用意され、外部から着信したメールを一時的に保管する。利用者が手元で操作するメールソフト(メールクライアント、メーラーなどと呼ばれる)は通信回線を介してメールサーバに問い合わせ、メールボックス内のメールを受信して画面に表示する。

Webメール

利用者の操作画面をWebアプリケーションとして実装し、Webブラウザからアクセスしてメールの作成や送信、受信、閲覧、添付ファイルのダウンロードなどをできるようにしたシステムを「Webメール」(webmail)という。

フリーメールサービスの多くは標準の操作画面をWebメールの形で提供しており、メールクライアントなどを導入・設定しなくてもWebブラウザのみでメールの送受信を行うことができるようになっている。企業などの組織で運用されるメールシステムでもWebメールを提供する場合があり、自宅や出先のコンピュータなどからアクセスできるようになっている。

メッセージの形式

電子メールには原則として文字(テキスト)データのみを記載することができる。特別な記法や書式を用いずに素の状態の文字データのみが記されたメールを「テキストメール」という。WebページのようにHTMLやCSSなどの言語を用いて書式や装飾、レイアウトなどの指定が埋め込まれたものは「HTMLメール」という。

また、画像や音声、動画、データファイル、プログラムファイルなどテキスト形式ではないデータ(バイナリデータ)を一定の手順でテキストデータに変換して文字メッセージと一緒に送ることができる。こうしたデータをメッセージ中に埋め込む方式の標準として「MIME」(Multipurpose Internet Mail Extension/マイム)が規定されており、これを利用してメールに埋め込んだファイルを「添付ファイル」(attachment file)という。

電子メールの普及と応用

電子メールはWeb(WWW)と共にインターネットの主要な応用サービスとして広く普及し、情報機器間でメッセージを伝達する社会インフラとして機能している。現在ではパソコンやスマートフォン、タブレット端末などのオペレーティングシステム(OS)の多くは標準でメールクライアントを内蔵しており、誰でもすぐに利用できるようになっている。

電子メールシステムでは一通のメールを複数の宛先へ同時に送信する同報送信・一斉配信も容易なため、グループ共通のアドレスを用意してメンバー間の連絡や議論などに用いる「メーリングリスト」(mailing list)や、発行者が購読者に定期的にメールで情報を届ける「メールマガジン」(mail magazine)などの応用システムも活発に利用されている。

一方、広告メールを多数のメールアドレスに宛て無差別に送信する「スパムメール」(spam mail)や、添付ファイルの仕組みをコンピュータウイルスの感染経路に悪用する「ウイルスメール」(virus mail)、送信元を偽って受信者を騙し秘密の情報を詐取する「フィッシング」(phishing)など、電子メールを悪用した迷惑行為や犯罪なども起きており、社会問題ともなっている。

Webメール 【ウェブメール】

Webブラウザで電子メールの閲覧や送受信ができるシステムやサービス。メールソフト(メールクライアント)に相当する機能をWebアプリケーションとして実装したもので、Webブラウザがあればどんな環境からでもメールが利用できる。

Webブラウザで管理画面のURLを開き、メールアドレス(メールアカウント)やパスワードなどで本人確認(ユーザー認証)を行うことにより、自分のアドレスの利用環境を呼び出すことができる。受信したメールの一覧や検索、本文の表示や添付ファイルの取得、新規メールの作成・送信、連絡先の管理などができる。

一般的なメールソフト(メールクライアント)がどのようなメールサーバで利用できるのに対し、Webメールシステムは通常、メールサーバの管理主体が付加サービスとして当該サーバの利用者に提供しており、他のサーバに接続して利用することはできない。

企業や公的機関、大学などが構成員向けに運用する場合と、インターネットサービスプロバイダ(ISP)やネットサービス事業者が契約者向けに運用している場合がある。また、米グーグル(Google)社のGmailのように、ポータルサイトなどが提供している無料で取得・利用できるフリーメールサービスの多くはWebメールの形で運用されている。

CC 【Carbon Copy】 ⭐⭐

電子メールの宛先を表す設定情報の一つで、複製を送信するメールアドレスを指定することができるもの。本来の宛先以外に一つまたは複数のメールアドレスを指定することができる。

通常、主な宛先を指定するのは「To」(「~へ」の意味)と呼ばれる項目だが、「Cc」という項目にアドレスを記載すると、メールサーバ側で同じ内容を複製してそちらへも届けてくれる。CCに指定されたアドレスは受信者全員が見ることができる。

“carbon copy” とは帳票の作成などで利用される「カーボン複写」のことで、台紙にカーボン紙を重ねて上から硬い筆記具で書き込むと、台紙側に同じ内容が転写される仕組みのことを指す。同じメールが自動的に複製されて配信される様子をこれに例えている。

一方、同じように複製を送信するアドレス指定には「BCC」(Blind Carbon Copy)もあり、こちらはアドレスが他の受信者には分からないように配送途中で削除される。互いに知らない相手に同じ告知内容を一斉送信したい場合などに用いるが、CCとBCCを取り違えて他の受信者のアドレスを知らせてしまう事故があとを絶たない。

BCC 【Blind Carbon Copy】 ⭐⭐

電子メールの宛先指定の一種で、他の受信者に知らせずに複製を送信する先を指定できるもの。送信者がメールの作成・送信時に指定し、複数のアドレスを指定することもできる。

通常、電子メールで宛先を指定するには「To」(「~へ」の意味)と呼ばれる項目に相手のメールアドレスを記載するが、BCC欄にもアドレスを記入することができ、同じメッセージが複製されてそちらにも届けられる。

CCとの違い

複製が送信されるという意味では「CC」(Carbon Copy)欄も同じ機能だが、CC欄に記載したアドレスがすべての受信メッセージにそのまま掲載されるのに対し、BCC欄の内容は受信直前にメールサーバ側で削除され、受信者側には誰をBCCに指定したかは分からないようになる。

主な用途と難点

BCCによるアドレスの指定は、複数の受信者が互いに無関係な場合など、受信者に他の受信者のアドレスを知らせたくない場合や、顧客への返信を上司に報告する場合など、複製を別のアドレスに送っていることを相手が知る必要がない、または知られたくない場合に用いられる。

名称や操作画面上での記入欄の近さなどから、CC欄と取り違える記入ミスが起こりやすく、同じ文面を複数の関係者に送ろうとして誤ってアドレスをCCに指定してしまいメールアドレスを漏洩させてしまう事故が後を絶たない。

また、受信者は送信者が告げない限りBCCで第三者に複製が送られていること自体に気付かない。個人的な内容のやり取りや対話的な内容の場合は後で第三者にも送信されていたことが露見すると人間関係上のトラブルに発展することがあるため、事前に断っておくなどの配慮が必要になることがある。

語源

“Blind Carbon Copy” とは「目に見えないカーボン複写」を意味する。カーボン複写とは、記入用紙の裏がカーボン紙になっており、ペン先を強く押し当てるように書き入れることで下に重ねられたもう一枚の用紙に複写される仕組みを指す。このような自動的な複写を、受信者に見えないよう行うという意味でこのように呼ばれる。

添付ファイル 【アタッチメントファイル】

電子メールなどで本文と共にメッセージの一部として送られるファイルのこと。画像や文書など様々な種類のデータを相手方に送ることができる。

メールの本文には原則として文字しか書くことができないが、添付ファイルを利用することにより、画像や動画、音声、文書ファイルなど、文字以外の形式のデータを相手に送ることができる。インスタントメッセンジャーなどメール以外のメッセージ交換システムでも、コンピュータ上のファイルを相手に送信する機能のことを添付ファイルということがある。

電子メールの場合、添付するファイルの種類や数に仕様上の制限はないが、受信側のコンピュータが対応していない(対応ソフトが入っていない)形式のデータを添付しても、受信者がファイルを開いて中身を見ることはできない。

また、メールサーバなどは一通のメッセージの最大サイズや受信箱(メールボックス)の総容量に制限を課していることが多く、制限を超える巨大なサイズのファイルを添付したメッセージを送ろうとしても送信または受信を拒否される。

データ形式

一通のメッセージに複数の異なるデータを混在させることができるデータ形式は「MIMEマイム」(Multipurpose Internet Mail Extension)と呼ばれる。本文の文字データに添付ファイルのデータを連結して一つのメッセージにまとめる方式を定めている。

ファイルの内容は一定の規則に基いて文字データへ変換(エンコード)され、受信側で元のデータに復元(デコード)される。この変換方式には「Base64ベースろくじゅうよん」や「uuencodeユーユーエンコード」などいくつかの規格があり、受信側が対応していない形式のデータは正しく復元することができない。

受信側での動作

多くのメールソフトは利用者の利便性のために、受信したメールの添付ファイルの種類を識別し、画像なら表示する、音声なら再生する、実行ファイルなら起動するなど、種類に応じて期待される処理・動作を行う機能を持っている。

一部のコンピュータウイルス開発者はこの仕組みを悪用し、ウイルスの仕込まれた実行可能ファイルや圧縮ファイル、文書ファイルなどをメールに添付して送信し、受信者に巧みにファイルを開くよう促して感染を試みることがある。

文字コード 【キャラクターコード】 ⭐⭐⭐

文字や記号をコンピュータ上でデータとして扱うために、一文字ずつ固有の識別番号を与えて区別できるようにした符号のこと。

コンピュータはすべての情報を「0」と「1」のを組み合わせたデジタルデータとして取り扱う。数値は2進数を用いることで容易に表現できるが、文字は字形そのものを画像や図形としてデータ化したものはデータ量が多く、これをそのまま繰り返し並べて文字データとすることは無駄が大きい。このため、各文字に短い識別番号(正確には0と1の並び:ビット列)を与えて数字の列として文字列を表現するようになった。この数字と文字の対応関係を定めた規約が文字コードである。

最も普及しているASCII文字コードは英数字や制御文字、記号などを収録した7ビット(7桁のビット列、十進数では0~127)のコード体系であり、例えばアルファベットの大文字の「A」は65番(ビット列で1000001)、小文字の「z」は122番(同1111010)などと定められている。あるデータ列がASCII文字列であることが分かっていれば、番号との対応関係を元に文字の並びを知ることができる。

文字集合と符号化方式

文字コードを定義するには、どの言語を対象にどの文字を収録するかを決めなければならず、まず収録する文字(の字形)を特定して列挙した文字集合(文字セット)を定める。その際、番号などは与えずにただ収録する文字群を定義したものをレパートリ、各文字に一意の番号を与えたものを符号化文字集合(CCS:Coded Character Set)という。

欧米圏の8ビット文字コード規格のように、符号化文字集合をそのまま文字コードとして利用することも多いが、漢字圏など収録文字数の多い言語では各文字に割り当てられた符号をどのようなビット列で表現するかについて、いくつかの異なる方式を定めている場合があり、これを文字符号化方式(CES:Character Encoding Scheme/文字エンコーディング)という。

例えば、代表的な日本語の符号化文字集合の一つであるJIS X 0208規格に定められた符号をそのまま文字コードとしたものを区点コードというが、この文字集合を対象とする符号化方式としてJISコードやShift JISコード、日本語EUC(EUC-JP)などが定められており、同じ文字でも符号化方式によってそれぞれ異なったビット列で表現される。世界中の文字を収録したUnicodeでも、同じ文字集合に対してUTF-8、UTF-16、UTF-32など複数の異なる符号化方式が定義されている。

テキストファイル 【TXTファイル】

ある文字コードで文字として規定できる範囲のデータのみを含むファイルのこと。内容全体を文字として表示、編集でき、人間が容易に読み書きできる。

コンピュータではすべてのデータを2進数のビット列(0と1の連なり)として表現するが、このうち、ASCIIなど何らかの文字コード規約に基いて自然言語の文字や少数の制御文字(改行や空白、タブ文字など)を表すビット列のみを含むものをテキストファイルという。

これに対し、コンピュータプログラムや画像、動画、音声などを表現するため、文字コード体系とは無関係に任意のビット列が含まれる形式のデータが記録されたファイルのことを「バイナリファイル」(binary file)という。

広義には、HTMLファイルやプログラムのソースコードのように文字表現でコンピュータへの指示などを表記したものを含むが、狭義には、特定の人工言語などによる記述を含まず単純に人間にとって意味のある文章などだけを記したものを指す。ファイル名の拡張子が「.txt」となっているものは後者を指すことが多く、前者と区別するために「プレーンテキスト」(plain text)形式と呼ぶこともある。

文字コードと文字化け

テキストファイルは特定の文字コードに基づいて記述されているが、文字コードには様々な種類があるため、どの文字コードで書かれたものかが分かり、そのコードに対応したソフトウェアで開かなければ正しく表示や編集を行うことはできない。間違ったコード指定で開いてしまうと意味のない文字の並びとなってしまう。これを文字化けという。

テキストファイルそのものには文字コードを指定する仕組みがないため、利用者側で把握・管理を行う必要がある。特定のコードにしか使われないビットパターンや多用されるパターンなどの特徴があるため、近年のソフトウェアの中にはある程度の精度で自動判別できるようになっているものもある。

文字化け ⭐⭐

コンピュータで文字が正しく表示・印刷されず、本来とは異なる不規則で意味不明な記号や文字の連なりとして現れること。

テキスト(文字)形式のデータを読み込んで表示しているのに、本来そのデータが表していた文字が表示されずに、まったく異なる文字や記号、制御文字、空白などが連なった意味をなさない文字に変質してしまっている現象を指す。

主な原因として、データ自体の破損(一部の欠落や変質)、文字コードの相違(元の文字コードとは異なるコードとして解釈しようとしている)、フォント環境の違い(その言語に対応するフォントが存在しない)などが挙げられる。

ちなみに、実行可能形式のプログラムや、画像や動画、音声を記録したデータなど、バイナリ形式のデータを何らかの理由でテキストとして表示しようとした場合にも、不規則な文字や記号の連なりが出現するが、元がテキスト形式ではないため文字化けとは呼ばない。

文字化けは主に2バイト以上の文字コードを用いる日中韓などの言語圏で起きるため、欧米圏ではあまり知られておらず、日本人がこの現象を欧米人に説明する際に用いていた “Mojibake” という単語がそのまま文字化けを表す専門用語として流通している。

文字コードの違い

ある文字コードや文字エンコーディングで表現された文字データを、別の文字コードとして解釈・表示しようとしてしまい、まったく異なる文字列に変わってしまう場合である。

そのデータがどのような文字コードで表現されているのか分からず、自動認識にも失敗して別のコードを選んでしまった場合や、そもそもソフトウェア側がその文字コードに最初から対応していない場合などに起きる。

日本語の電子メールやWebページなどでは、同じ言語でも異なる文字コードが併存しており、どれが使われているのか明確に指定がない場合にはこの種の文字化けが発生する。また、欧米圏のソフトウェアでは日本語などマルチバイト文字に対応していない場合があり、日本語などを入力すると化けて表示されることがある。

フォントの違い

文字コードが正しく認識できたとしても対応する文字を表示するためのフォントがシステム内に存在しない場合には、やはり正しく表示することはできない。日本語のWebページを日本語フォントの入っていない英語版のシステムで無理やり表示しようとした場合などに起きる。

また、同じ文字コードでも機種やOSによっては一部の領域に独自に拡張した文字群を当てはめている場合があり、このような機種依存文字を別のシステムで表示しようとした場合にも本来とは異なる表示になる。

機種依存文字 【環境依存文字】

コンピュータの機種やオペレーティングシステム(OS)などの環境が変わると正しく表示されないことがある文字のこと。よく言われるものとして丸囲み数字や括弧囲み文字、ローマ数字、元号、単位、通貨記号、数学記号、半角カタカナ、一部の使用頻度の低い漢字などがある。

文字コードの規格の中には一部のコード領域に企業などが独自の記号や文字などを割り当てることを許容しているものがあり、大手コンピュータメーカーやソフトウェアメーカーが同じコードにそれぞれ違う文字を割り当てたことから環境によって表示が変わってしまう文字が生まれた。

正しく表示できない場合には、コードを共有する別の文字に置き換わってしまう場合と、表示環境側で未定義な文字が、空白や「〓」(俗にゲタと呼ばれる)や「□」(俗にトウフと呼ばれる)、「・」など、表示できないことを示す記号に置き換えて表示される場合がある。

1980年代から機種依存状態にある有名な文字として、

  • ○や●、( )に数字を入れたもの
  • ○に「上」「下」「左」「右」の文字を入れたもの、
  • (株) (月) のように括弧で囲んだ漢字(を一文字に収めた文字)、
  • 「TEL」「No.」などの略号、
  • 「カロリー」「センチ」「トン」「ドル」などを小さな文字で2段に渡って収めた文字、
  • 「kg」「m2」などの単位記号(を一文字に収めた文字)、
  • 「VIII」のようなローマ数字を一文字に収めた文字、
  • 「平成」のような元号二文字を一文字に収めた文字、
  • Σや√など一部の数学記号、
  • JIS第1水準・第2水準に含まれない漢字

などがある。昔はコンピュータのハードウェアが文字表示の処理を行っており、メーカーによって一部の文字コードの表す文字が異なることから「機種依存文字」と呼ばれるようになったが、現代では文字の処理はソフトウェアが行うため、実態にそぐわない名称となっている。

近年では文字コードが国際的な標準規格の「Unicodeユニコード」に(文字エンコーディングはUTF-8に)収束しつつあり、また、Unicodeにかつての機種依存文字の多くが収録されているため、長期的には解消していくものと見られている。

全角文字

コンピュータが扱う文字の分類の一つで、(等幅フォントで表示・印刷した際に)幅と高さが等しい正方形の領域に収まる形の文字のこと。漢字やひらがなが該当し、幅が高さの半分の「半角文字」と対比される。

「漢」「あ」「ア」「。」など、正方形の枠に収まるようデザインされた文字群を指す。一方、「A」「a」「1」「.」など、全角文字の半分の縦長の長方形に収まるデザインの文字は半角文字と呼ばれ、欧米で一般的に用いられるアルファベットやアラビア数字、記号文字などが含まれる。

全角文字は歴史的に日本語の文字コード体系(JIS漢字コードなど)に由来する文字種で、日本語の表記に用いられる文字の他にも、「Ω」「Д」などのギリシャ文字やキリル文字、「◇」「※」など、半角文字には含まれない独自の記号文字、「┬」などの罫線が含まれる。

また、「A」と「A」、「1」と「1」、「$」と「$」のように、半角英数字・記号の各文字には対応する全角文字が用意されている。逆に、日本語文字のほとんどには半角文字は無いが、カタカナと句読点だけは初期の日本語文字コードに半角文字が収録されたことから「ア」と「ア」、「。」と「。」のように全角と半角の両方がある。

現在のようにグラフィック表示が一般的になる前のコンピュータの文字表示機能では、すべての文字が同じ大きさの四角形に収まる形状の等幅フォントしかなかったため、正方形に収まる文字を全角、全角の半分の幅の長方形に収まる文字を半角と呼ぶようになった。現代では文字ごとに幅が異なるプロポーショナルフォントが一般的であるため、実態にそぐわない分類となっている。

国際的な文字コード標準のUnicodeにも日本語文字コードに由来する全角文字の大半がそのまま収録されており、半角文字の全角版はその名の通り「FULLWIDTH ~」の名称で、半角カタカナは「HALFWIDTH KATAKANA LETTER ~」の名称で収録されている。

半角文字 【ANK文字】

コンピュータが扱う文字の分類の一つで、(等幅フォントで表示・印刷した際に)幅が高さの半分の縦長の長方形の領域に収まる形の文字のこと。アルファベットやアラビア数字、記号文字などがあり、幅と高さが等しい「全角文字」と対比される。

「A」「a」「1」「.」など、縦長の長方形の枠に収まるようデザインされた文字群を指す。一方、「漢」「あ」「ア」「。」など、正方形に収まるデザインの文字は全角文字と呼ばれ、漢字やひらがななど日本語の表記に用いられる文字が含まれる。

半角英数字は歴史的には欧米の1バイト文字コード体系(ASCIIやその拡張規格など)に由来する文字種で、ASCIIに収録されているラテンアルファベット大文字・小文字、0~9の数字、欧文の表記に用いられる記号が含まれる。日本では馴染みが薄いが、欧州の諸言語で用いられるラテン文字以外の文字やアクセント記号などが付いた文字、特定の言語でのみ用いる記号などを含める場合もある。

日本語の文字の大半は全角文字しか用意されていないが、カタカナと句読点だけは初期の日本語文字コードにASCII拡張仕様として収録された「ア」「゙」「゚」「。」などの「半角カタカナ」が用意されている。国際的な文字コード標準のUnicodeにも「HALFWIDTH KATAKANA」の名称でそのまま収録されている。

現在のようにグラフィック表示が一般的になる前のコンピュータの文字表示機能では、すべての文字が同じ大きさの四角形に収まる形状の等幅フォントしかなかったため、正方形に収まる文字を全角、全角の半分の幅の長方形に収まる文字を半角と呼ぶようになった。現代では文字ごとに幅が異なるプロポーショナルフォントが一般的であるため、実態にそぐわない分類となっている。

制御文字 【制御コード】

文字コードで規定された文字のうち、外部との通信の制御や周辺機器の制御などに用いる特殊な文字のこと。制御コードに割り当てられたコード(番号)のことを「制御コード」(control code)という。

機器に対する命令文などを発行する際に、通常の文字などと合わせて用いられるもので、状態の通知や動作の指示を表現することができる。多くの文字は通常の方法では利用者が直に入力したり画面に表示したりすることはできない。

制御コードの種類や各文字に割り当てられたコードは文字コード体系ごとに異なる。最もよく用いられているASCII(アスキー)及びその互換コードでは、「HT」(Horizontal Tabulation:水平タブ、コードは9番/16進数で09)、「LF」(Line Feed:改行、10番/同0A)、「CR」(Carriage Return:行頭復帰、13番/同0D)、「ESC」(Escape:特殊文字開始、27番/同1B)、「SPC」(Space:空白文字、32番/同20)などが有名である。

かつては機器間の通信回線が貧弱で、少しでも短いデータで制御情報を伝達する必要があったため、機能ごとに専用の制御コードが用意されていた。現代ではそのような制約はなくなり、周辺機器の機能も格段に複雑化し単純なコードで動作を指示すること自体が不可能になったため、改行、空白、タブなどテキストデータの記述にも用いる数文字を除いて、本来の用途で用いられることはほぼなくなっている。

空文字 【ヌル文字】

文字コード0番の制御文字。データや文字列の終端を示す特殊な文字として使用されることがある。

コンピュータ上では文字に番号を対応付けた文字コードを用いて文字や文字列を表現するが、ASCIIコードなどのコード体系では0番の文字を空文字(null character)という。「NUL」「NULL」などの略号で示されることもある。

文字としての形を持たない制御文字(制御コード)の一種で、コンピュータプログラムの動作の制御などに用いられる。画面に表示することはできず、キーボードに直に対応するキーも存在しないが、一部のシステムでは「Ctrl+@」などの特殊なキー操作で送信できる場合がある。

ヌル文字が何を意味するかはシステムによって異なるが、昔のコンピュータではプリンタなどとの通信で「何もしない」「何の文字も無い」などを表すために用いられるのが一般的だった。

プログラミングの分野では、C言語などが文字列の終端を表すコードとしてヌル文字を使用する。Cでは文字列は文字型(char型など)の配列として表され、配列の要素としてヌル文字('\0')が出現するとそこが文字列の終端であるとみなされる。何の文字も含まない空文字列は空文字のみを要素として持つ配列(要素数は1)となる。

一方、文字列型を組み込みデータ型として持っている言語ではこのような事情は無く、空文字列は文字通り文字数0の文字列型の値("")となる。通常の文字列操作でヌル文字の存在を意識することはほとんどないため、空文字列のことを指してヌル文字と呼ぶ人もいる。

若干紛らわしいが、「内容が空である」(null)という概念は文字列以外にも用いられ、C言語では何も参照していないポインタを表すマクロとして「NULL」が定義されており、言語によっては値が存在しないこと表す特殊な値として「null」が用意されていることもある。これらは文字列操作における空文字や空文字列とは異なるため注意が必要である。

ASCII 【American Standard Code for Information Interchange】 ⭐⭐⭐

アルファベットや数字、記号などを収録した文字コードの一つ。最も基本的な文字コードとして世界的に普及しており、他の多くの文字コードがASCIIの拡張になるよう実装されている。文字を7ビットの値(0~127)で表し、128文字が収録されている。

主に英語で必要な文字を収録したコード規格で、0番から127番までの番号(正確には2進数で0000000から1111111まで)について、各番号がどの文字を意味するかという対応関係を定めている。例えば英大文字の「A」はASCIIコードでは65番(16進数で41、2進数で1000001)で表される。

収録されているのはA~Z、a~zのラテンアルファベット(ローマ字)、0~9のアラビア数字、約物(引用符や括弧、疑問符、感嘆符、カンマ、ピリオドなど)、記号(数学記号やドルマーク、アットマークなど)、空白文字、制御文字(改行文字やタブ文字、古い通信制御文字など)などである。

1963年にASA(アメリカ規格協会、現在のANSI)が定めた規格で、1967年に国際標準化機構(ISO)がほぼ同じ内容をISO/IEC 646として標準化した。1970年代以降ほとんどのコンピュータやソフトウェアが標準の文字コードの一つとして対応しており、英文の文字情報の記述やコンピュータ言語の表記などに用いられている。一般的なキーボードにはASCII文字に対応するキーが配されている。

8ビット目を利用した拡張規格

ASCIIでは1文字を7ビットで表すが、現代のコンピュータのほとんどはデータの基本的な管理単位が1バイト(8ビット)であるため、実際には1文字を8ビットで表している。

残りの1ビットはもともとデータ伝送時の誤り検出符号(パリティビット)などとして用いられてきたが、電子回路や通信システムの信頼性向上などを受け、この1ビットを活用してASCIIを拡張する試みが行われるようになった。

ASCIIを拡張したコード体系では、0から127まではASCIIと同じで、ASCIIに規定の無い128~255の領域に独自の文字を割り当てている。例えば、日本国内で用いられたJIS X 0201では、この領域にカタカナ(いわゆる半角カナ)や句読点(。、)、鉤括弧(「」)を配置して限定的ながら日本語を使えるようにしている。

後にASCII拡張についても標準化の動きが起こり、8ビットコードや複数バイトコードの扱い、各国の拡張コードの切り替え方式などを定めたISO/IEC 2022や、これに基づいて具体的な8ビットの文字コードを規定したISO/IEC 8859などの規格が策定された。追加の文字を含めても1バイトで十分なヨーロッパ各国の言語などではISO/IEC 8859が標準的な文字コードとして普及している。

<$Fig:ascii|center|false>

Unicode 【ISO/IEC 10646】 ⭐⭐⭐

文字コードの国際的な標準規格の一つで、世界中の様々な言語の文字を収録して通し番号を割り当て、同じコード体系のもとで使用できるようにしたもの。

コンピュータで文字データを扱うには、文字や記号の一つ一つに対応する番号(符号)を与え、文字の列を番号の列に変換する必要がある。文字と番号の対応関係を定めたルールを「文字コード」(character code)と呼び、従来は国や言語圏ごとに自分たちの使う文字のコード体系を定めて使用していた。

Unicodeは世界中の様々な言語の文字を集め、すべての文字や記号に重複しないようそれぞれ固有の番号を与えた文字コード規格である。世界の主な言語のほとんどの文字を収録しており、通貨記号や約物など文字と共に使われる記号や絵文字なども登録されている。

米大手IT企業を中心とする業界団体「Unicodeコンソーシアム」(Unicode Consortium)が仕様を策定・改訂しており、ほぼ同じものがISO(国際標準化機構)とIEC(国際電気標準会議)の合同委員会によって「ISO/IEC 10646」として国際標準となっている。ISO/IEC側ではUnicodeに相当する文字集合の名称を「UCS」(Universal Coded Character Set)としている。

コードポイント

Unicodeでは、登録された文字のそれぞれについて「コードポイント」(code point:符号点、符号位置と訳される)と呼ばれる一意の通し番号を与えている。例えば、日本語のカタカナの「ア」には12450番が割り当てられており、説明文などでは16進数を用いて「U+30A2」のように表記する。

世界中のあらゆる言語の文字を収録するという目的のため、コードポイントは最長で21ビットの値(上限は1114111番、U+10FFFF)まで用意されている。初期の規格で世界の既存の文字コードに規定された文字の多くが収録されたが、独自の文字コードを持たなかった言語や、絵文字、古代文字、新設された通貨記号などを中心に、現在も毎年のように新しい文字が追加されている。

現在はコードポイント空間全体の約12%にあたる約15万文字が割り当て済みで、規格上は文字を規定しない「私用面」(企業などが独自に使用してよい)が約13万文字(約12%)分予約済みである。残りの約75%が未割り当てとなっている。

基本多言語面と追加多言語面

コードポイントの範囲のうち、16ビット(2バイト)の値で表現できる U+0000 から U+FFFF は「基本多言語面」(BMP:Basic Multilingual Plane)と呼ばれる。ラテンアルファベットやキリル文字、ギリシャ文字、ひらがな・カタカナ、ハングル、基本的な漢字など、主要な言語の文字のほとんどをカバーしている。

当初の規格はBMPのみの予定だったが、追加収録を希望する文字のすべてを登録しきれないことが明らかになり、後から U+10000~U+10FFFF の拡張領域が追加された。このうち、U+10000~U+1FFFF の範囲を「追加多言語面」(SMP:Supplementary Multilingual Plane/補助多言語面)と呼び、古代文字や絵文字などが収録されている。

日本語文字の扱い

日本語の文字は原則として日本語文字コードのJIS規格から収録されている。当初は「JIS X 0201」(いわゆる半角文字)、「JIS X 0208」(JIS基本漢字)、「JIS X 0212」(JIS補助漢字)に定められた文字を収録したが、後に「JIS X 0213」(JIS2000/JIS2004)のすべての漢字が収録された。

なお、JIS X 0213の一部の漢字についてはBMPには収まりきらず、東アジア各国・地域の追加漢字を収録する U+20000~U+2FFFF の領域(SIP:Supplementary Ideographic Plane/追加漢字面)に収録されている。

これら元になった規格の通り、半角カナも全角とは別に「HALFWIDTH KATAKANA LETTER A」(半角カタカナのア)等の名称で、全角英数字も「FULLWIDTH LATIN CAPITAL LETTER A」(全角ラテンアルファベット大文字A)等の名称でそれぞれ収録されている。

UTF (Unicode Transformation Format/UCS Transformation Format)

様々な事情から、文字をデータとして実際に記録・伝送する際には、文字集合で定められたコードポイントをそのままビット列で表すのではなく、一定の手順で特定の形式に変換する。この変換手順を「符号化方式」(文字エンコーディング)という。

Unicodeにも標準の符号化方式がいくつか定められており、用途や処理の都合に応じて使い分ける。全体を総称して「UTF」と呼び、Unicodeでは “Unicode Transformation Format” の略、ISO/IEC 10646では “UCS Transformation Format” の略とされる。

UTFには「UTF-8」「UTF-16」「UTF-32」の3種類があり(UTF-7もあるがIETF独自拡張)、同じUnicode文字列でも符号化が違えばまったく異なるバイト列として表現される。文字データの保存・交換用として最も一般的に使われるのはUTF-8で、単にUnicodeといえばUTF-8でエンコードされたデータを意味することが多い。

UnicodeとISO/IEC 10646

ISO(国際標準化機構)とIEC(国際電気標準会議)の合同委員会(JTC 1)は、1980年代後半に国際的な文字コード標準の策定を目指し、仕様の検討を始めた。当初の構想は4バイトのコードを用いて既存の各国の文字コードをほとんどそのまま収録・統合するというものだった。

1991年に民間の企業連合であるUnicodeコンソーシアムが設立され、Unicode規格が発表されると、公的な標準と業界標準の分裂を避けるためISO/IECとの間で一本化の調整が行われることになった。議論の末、Unicodeの仕様をほぼそのままISO/IEC標準として採用することになった。

同年に発行されたUnicode 1.0規格をほぼそのまま取り込む形で1993年にISO/IEC 10646-1規格の初版が標準化され、以降はUnicode側と仕様を擦り合わせながら改訂されていった。両者は用語法など細かな点に違いがあるものの、収録文字など仕様の実質は同一となっている。

UTF-8 【UCS Transformation Format 8】

Unicodeで定義された文字集合を表現することができる文字コード(符号化方式)の一つ。一文字を1~4バイトの可変長で表現するもので、様々な言語の文字を扱える文字コードとしては世界的に最も普及している。

Unicodeユニコード」は国際的な業界団体であるUnicodeコンソーシアムが策定している多言語文字コードの規格で、ISO(国際標準化機構)およびIEC(国際電気標準会議)が策定した国際標準(ISO/IEC 10646)ではこれと実質的に同じものを「UCS」(Universal multi-octet Character Set)と呼んでいる。

Unicodeでは、収録されている文字にそれぞれ固有の識別番号である「コードポイント」(符号位置)を与えている。この値をビット列として表現する規則を「文字符号化方式」(符号化スキーム)と呼び、UTF-8やUTF-16、UTF-32などの方式がある。UTF-8は最も普及している方式で、Unicodeを用いるほとんどの場面で符号化方式としてUTF-8が用いられる。

UTF-8は最大で2097151番(U+1FFFFF)までのコードポイントを表現できるが、Unicode/UCSで定義される文字セットとして有効なのは1114111番(U+10FFFF)までであるため、これを超える値は無効とされる。初期の仕様では最大6バイト(U+7FFFFFFFまで)とされていたが、後に4バイトまでに縮小された。

ASCII文字と各国語の文字

英数字の文字コードとして世界的に普及しているASCIIで規定される7ビットの範囲(0~127番)の文字は、そのコードをそのまま用いるようにできている。ASCIIに収録された英数字や記号は1バイトで表現でき、かつ、各文字のコードもASCIIと同一になる。

一方、大陸欧州などで一般的なISO/IEC 8859などの文字コードは、ASCIIに1ビット追加して8ビット(1バイト)とし、拡張された後半128~255番にアクセント記号付きの文字などを収録していた。UTF-8ではこれらの文字の多くは2バイト(16ビット)で表現される。

日本語や中国語、韓国・朝鮮語など、従来から2バイトの文字コード体系を言語ごとに独自に定めていた言語圏では、UTF-8ではほとんどの文字が3バイト(24ビット)となる。従来コードに比べ英語圏は1文字1バイトのままだが、8ビット言語圏は2バイトに、2バイト言語圏は3バイトに増加するため不公平だとする声もある。

符号化の方法

128番以降の文字はコードポイントの上位ビット側から変換ルールに従って複数のバイト列に当てはめていき、得られたバイト列を順に並べる。処理はバイト単位で行われるため、16ビット単位の値を用いるUTF-16などと異なりエンディアンの識別が不要となっている。

1バイト表現の先頭は0から始まるが、複数バイト表現の場合、1バイト目は「11」から、2バイト目は「10」から始まる。これにより、文字列データ中のどの位置のバイトを取り出しても、それが1バイト表現(ASCII互換文字)なのか、複数バイト表現の先頭あるいは途中なのかを容易に判別できる。

長さが2バイトの場合の1バイト目は「110」から始まり、同様に3バイトの場合は「1110」、4バイトは「11110」から始まる。先頭バイトの1が連続する数を調べれば続く何バイトが同じ文字を表すのか知ることができる。

例えば、2バイトのUTF-8コードは1バイト目が「110xxxxx」、2バイト目が「10xxxxxx」という形式で、計11ビットあるxの部分の左から順にコードポイントの2進表現を上位ビット側から当てはめていく。最長の4バイト表現ではコードポイントを格納するビット列は合わせて21ビット分確保される。

長いバイト表現は短いバイト表現の文字を表すこともできるため、例えばASCII互換文字は1バイト表現から4バイト表現まで4通りのビットパターンが存在することになるが、規格上は最も短い表現以外は無効な表現とみなされる。すなわち、2バイト以上では表現可能なコードポイントの上限だけでなく下限(2バイトの場合はU+0080未満は無効)が存在する。

バイトオーダーマーク (BOM)

UTF-16やUTF-32では16ビット単位や32ビット単位の連続したビット列で1文字を表現するため、1バイト(8ビット)単位でデータを取り出したときに先頭側が上位ビットなのか下位ビットなのか識別しなければならない。この並び順(エンディアン)を区別するため、これらの形式ではテキストファイルなどの先頭に「バイトオーダーマーク」(BOM:Byte Order Mark)を記載する仕組みがあった。

UTF-8ではバイト順の認識が不要なためエンディアンを指示するBOMも存在しないが、代わりにエンコード形式がUTF-8であることを伝達する符号を先頭に記載してもよい(しなくてもよい)ことになっている。この符号は先頭から順に16進数で「EF BB BF」であり、バイト順を指定するものではないが他の方式との整合性から便宜上BOMと呼ばれている。

UTF-16 【UCS/Unicode Transformation Format 16】

UnicodeおよびISO/IEC 10646で規定された文字符号化方式(文字エンコーディング)の一つで、2バイト(16ビット)の固定長でコードを表現する符号化方式。

U+0000からU+FFFFの基本多言語面(BMP)収録文字についてはコードポイントをそのまま文字符号とする。U+10000以降の拡張領域に収録された文字はサロゲートペアの仕組みを用い、U+D800~U+DBFFから一つ、U+DC00~U+DFFFから一つを選んで組み合わせ、4バイトで表現する。

一文字を連続した複数バイトの整数値で表現するため、上位バイトが先頭側か末尾側かによって異なるバイト列となる。上位バイトが先頭側になるように並べる方式をUTF-16BE(Big Endian)、上位バイトが末尾側になるように並べる方式をUTF-16LE(Little Endian)という。

文字コードの指定などでバイト順を伝達できない場合、文書やデータの先頭にバイト順を示すBOM(Byte Order Mark)と呼ばれる符号を記載して指定するよう規定されており、UTF-16BEの場合は16進数4桁で「FE FF」、UTF-16LEの場合は「FF FE」と記載する。

UTF-32

一文字あたり4バイト(32ビット)の固定長でコードを表現する符号化方式で、単純にU+0000からU+10FFFFまでの各文字のコードポイントをそのまま文字符号とする方式を「UTF-32」という。

最も単純な表現形式で、文字よって長さが異なることがないためソフトウェアで処理しやすい。しかし、どんな文字でも4バイトで表現するためデータ量が多く、特にASCIIなら1バイトで収まる英数字が多い場合には不利となる。

UTF-16同様、文字コードの指定などでバイト順を伝達できない場合はデータの先頭に4バイトのBOMを記す。BOMが「FF FE 00 00」ならリトルエンディアン、「00 00 FE FF」ならビッグエンディアンである。

は主にデータ量の多さが敬遠され、データの保存・交換用としてはほとんど用いられることはないが、ソフトウェアが文字データの処理のために用いる内部表現として利用されることがある。入出力がUTF-8など他の形式でも内部的にはUTF-32に変換して扱っている場合もある。

なお、Unicodeの文字集合であるUCS-2を拡張した文字集合として31ビットのUCS-4を策定する構想があり、UTF-32はその符号化方式として有力だった。UCS-4はコードポイントを先頭が0に固定された32ビット(4バイト)の値で表すもので、UCS-2を丸々取り込んで更に多くの文字を収録する予定だったが、UCS-2を超える範囲への拡張は断念され、UTF-32の存在意義も低下した。

UTF-16 【UCS/Unicode Transformation Format 16】

UnicodeおよびISO/IEC 10646で規定された文字符号化方式(文字エンコーディング)の一つで、2バイト(16ビット)の固定長でコードを表現する符号化方式。

U+0000からU+FFFFの基本多言語面(BMP)収録文字についてはコードポイントをそのまま文字符号とする。U+10000以降の拡張領域に収録された文字はサロゲートペアの仕組みを用い、U+D800~U+DBFFから一つ、U+DC00~U+DFFFから一つを選んで組み合わせ、4バイトで表現する。

一文字を連続した複数バイトの整数値で表現するため、上位バイトが先頭側か末尾側かによって異なるバイト列となる。上位バイトが先頭側になるように並べる方式をUTF-16BE(Big Endian)、上位バイトが末尾側になるように並べる方式をUTF-16LE(Little Endian)という。

文字コードの指定などでバイト順を伝達できない場合、文書やデータの先頭にバイト順を示すBOM(Byte Order Mark)と呼ばれる符号を記載して指定するよう規定されており、UTF-16BEの場合は16進数4桁で「FE FF」、UTF-16LEの場合は「FF FE」と記載する。

UTF-32

一文字あたり4バイト(32ビット)の固定長でコードを表現する符号化方式で、単純にU+0000からU+10FFFFまでの各文字のコードポイントをそのまま文字符号とする方式を「UTF-32」という。

最も単純な表現形式で、文字よって長さが異なることがないためソフトウェアで処理しやすい。しかし、どんな文字でも4バイトで表現するためデータ量が多く、特にASCIIなら1バイトで収まる英数字が多い場合には不利となる。

UTF-16同様、文字コードの指定などでバイト順を伝達できない場合はデータの先頭に4バイトのBOMを記す。BOMが「FF FE 00 00」ならリトルエンディアン、「00 00 FE FF」ならビッグエンディアンである。

は主にデータ量の多さが敬遠され、データの保存・交換用としてはほとんど用いられることはないが、ソフトウェアが文字データの処理のために用いる内部表現として利用されることがある。入出力がUTF-8など他の形式でも内部的にはUTF-32に変換して扱っている場合もある。

なお、Unicodeの文字集合であるUCS-2を拡張した文字集合として31ビットのUCS-4を策定する構想があり、UTF-32はその符号化方式として有力だった。UCS-4はコードポイントを先頭が0に固定された32ビット(4バイト)の値で表すもので、UCS-2を丸々取り込んで更に多くの文字を収録する予定だったが、UCS-2を超える範囲への拡張は断念され、UTF-32の存在意義も低下した。

JISコード 【ISO-2022-JP】 ⭐⭐

国際的な文字コード規格の一つであるISO/IEC 2022の枠組みに沿って定義された日本語の文字コードの一つ。文字コードを7ビット単位で符号化する方式を定めている。

文字コード規格で各文字に付けられた番号を一定の規則で符号化する方式を定めたもので、「エスケープシーケンス」(escape sequence)という特殊な制御文字を挿入することにより複数の文字集合(いわゆる半角文字と全角文字など)の切り替えを行う。同じコードでも直前のエスケープシーケンス次第で別の文字を指し示すことがあるため、文字列は先頭から順に読み込まなければならないという制約がある。

ASCII文字コードで定義された制御文字やラテン文字(いわゆる半角英数字・記号)に加え、JIS X 0208で定義された日本語文字(ひらがな、カタカナ、漢字)やギリシャ文字、キリル文字、全角記号などを記述できる。いわゆる半角カタカナは含まれていない。

最初の仕様は1993年にRFC 1468として標準化され、1997年にはJIS X 0208の改訂版に収録され国内の公的な標準規格となった。その後、JIS X 0212で定義された文字を扱えるようにしたISO-2022-JP-1(RFC 2237)などいくつかのバリエーションが策定された。

Unicodeの普及以前に、Shift JISコード、日本語EUCコード(EUC-JP)と並んで古くからよく用いられてきた有力な日本語文字コードの一つである。特に、1990年代後半のインターネットの一般への普及の初期に、8ビット単位の文字コードが欧米で開発された電子メールソフトウェアなどと相性が悪かった(7ビットコードしか想定していないものが多かった)ことなどから、電子メールで日本語を扱う際の事実上の標準として広まった。

EUC 【End-User Computing】

企業などで情報システムを利用して現場で業務を行う従業員や部門(エンドユーザー、ユーザー部門)が、自らシステムやソフトウェアの開発・構築や運用・管理に携わること。

初期のEUC

1970年代後半にこの用語が使われだした頃のコンピュータは操作に専門的な技術を要する大型コンピュータで、業務部門の利用者は電算部門の専門の技術者やオペレータに端末の操作やデータの入出力の依頼をしてシステムを利用していた。

当時のEUCのコンセプトは、コンピュータに扱いやすい表示・操作システムを実装し、データ処理を必要とする利用者自身が端末を操作して様々な処理を実行するというもので、経営者や上級管理職向けのDSS(意思決定支援システム)などの形で結実した。

現在のEUC

1990年代後半頃になるとオフィスで一人一台パソコンが与えられ、従業員が自分で操作するのが次第に当たり前になっていき、通常のシステムの使用に関しては技術部門の仲介は不要になった。当初の意味でのEUCは浸透したと言える。

この頃からEUCの指す意味は徐々に変容していき、情報部門の用意したソフトウェアやパッケージ製品をそのまま利用するのに留まらず、業務に必要な個別のアプリケーションなどを利用者が自ら開発・運用することを指すようになっていった。

業務に必要なITシステムをゼロから構築することという極端な事例は少なく、パッケージソフトのマクロ機能(Excelマクロ等)やスクリプト機能(VBA等)などを利用して簡易な自動処理プログラムを開発したり、最新のIT機器を部署内で独自に導入して既存システムに接続するといった事例が多い。近年では既存システムの定型的・反復的な作業を自動化するRPA(Robotics Process Automation)が注目されている。

この意味でのEUCが無秩序に行われるとIT部門や管理部門の統制が及ばず、思わぬトラブルや多重投資などの問題を引き起こす(シャドーIT問題)ことがあるため、ガイドラインを定めるなど一定のルールのもとで実施する必要がある。

Shift JIS 【シフトJIS】 ⭐⭐

コンピュータで日本語を含む文字データを扱うために用いられる文字コード標準の一つ。Windowsなどが標準の日本語文字コードとして採用したことから広く普及した。

コンピュータで文字データを扱うには、文字や記号の一つ一つに対応する番号(符号)を与え、文字の列を番号の列に変換する必要がある。文字と番号の対応関係を定めた仕様を「符号化文字集合」、番号を具体的なビット列として表す変換ルールを「文字エンコーディング」という。

Shift JISは「JIS X 0201」や「JIS X 0208」などの標準規格で定められた符号化文字集合を対象とする文字エンコーディング仕様の一つで、JIS X 0201の半角英数字や制御文字、半角カタカナを1バイトで、JIS X 0208の全角文字を2バイトで表すことができる。

主な特徴

JIS漢字コードを対象としたエンコーディング方式には、いわゆる「JISコード」の通称で知られる「ISO-2022-JP」や、UNIX系OS向けに策定された「EUC-JP」(日本語EUC)もある。これらが連続したコード領域で文字を表すのに対し、Shift JISでは文字集合をいくつかに分割し、それぞれ異なる離れた領域へ移動(shift)させている。

これは、2バイト表現の1バイト目(先頭バイト)の値として、既存のいわゆる半角文字のコード領域、すなわち、ASCIIコード由来の英数字・記号文字・制御文字やJIS X 0201で追加された記号・半角カナ文字などの使用している値が出現するのを避けるためである。

ISO-2022-JPなどは1バイト目に8ビット文字コードと共通する値を使用しているため、どの文字コードの文字であるかをシステムに知らせるためにコード切り替えの印(エスケープシーケンス)をその都度挿入しなければならない。

一方、Shift JISは1バイト目に8ビット文字と重ならないようコードを配置しているため、1バイト目を読み込んだ時点ですぐにShift JISの文字であると判定でき、ASCII文字と漢字などが混在する文字列でもエスケープシーケンスを付加しなくてよいという利点がある。

ただし、2バイト目にASCII領域のコードが現れることは避けられないため、文字列データ中の任意の位置のバイトが半角文字なのかShift JIS文字の2バイト目なのかを他の手掛かりを用いずに知ることはできない。

また、2バイト目に16進数「5C」(92番、欧米ではバックスラッシュ、日本では円記号)が現れる文字があり、バックスラッシュや円記号にエスケープ文字などの特別な意味を与えているシステム(特に、日本語コードを考慮しない欧米製のソフトウェアなど)でうまく動作しないことがある。

歴史

Shift JISは1982年に日米のコンピュータ業界数社が共同で考案したとされ、米マイクロソフト(Microsoft)社が自社のパソコン向けオペレーティングシステム(OS)製品の「MS-DOS」や「Windows」に「CP932」(コードページ932)あるいは「MS漢字コード」として実装したことで広く普及した。

メーカー独自仕様だったことから長らく公的な規格とはなっていなかったが、1997年の「JIS X 0208」改訂版の附属書として仕様が掲載された。その後、2000年の「JIS X 0213」で「Shift_JISX0213」の名称で記載され、2004年のJIS X 0213改訂版では「Shift_JIS-2004」に改名されている。正式には「Shift_JIS」と間にアンダーバーを挟んで表記する。

JIS 【Japanese Industrial Standards】

産業標準化法に基づいて、産業分野の技術仕様などについて定められた日本の国家標準。日本産業標準調査会での審議、答申を経て、各分野の主務大臣により制定される。

各規格はAからZの部門記号により分類され、規格番号により識別される。これを「JIS X 0201」のように表記する。規模の大きな規格は部(part)に分割され、「JIS X 8341-3」のようにハイフン(-)に続いて枝番号を示して識別する。規格は制定後に改訂されることがあり、どの年度の版なのかを示すには「JIS X 0208:1997」のようにコロン(:)に続けて制定年を表記する。

IT関連の規格はX部門(情報処理)やQ部門(管理システム)に多く存在する。1987年にX部門が新設される前はC部門(電子機器及び電子機械)に分類されていた。

JISC (日本産業標準調査会/日本工業標準調査会)

工業製品などに関する日本の国家規格を検討する標準化機関をJISC(Japanese Industrial Standards Committee)という。産業標準化法に基いて経済産業省に設置された審議会で、標準規格案の調査、審議を行い、主務大臣に答申する。

JISに含まれる各規格分野を所管する主務大臣(多くは経産大臣)はJISCからの答申、建議を受けて規格を制定する。2019年までは「日本工業標準調査会」という名称だったが、制度改定で「日本産業標準調査会」に改称した。

ピクセル 【画素】 ⭐⭐⭐

デジタル画像や画面などを構成する最小単位である、色のついた微細な点のこと。また、その数を表す単位。単位を表す場合は “px” と略記されることもある。

コンピュータは画像をデジタルデータとして扱うため、固有の色情報を持つ点が縦横に規則正しく並んだ集合として表現する。この点のことをピクセルと呼び、それ以上小さな単位に分割することができない最小の要素となっている。

色深度 (color depth)

一つの画素にどのような色情報を持たせることができるかは画像形式やソフトウェア、表示・印刷媒体によって異なる。一画素を何ビットの色情報で表現するかを「色深度」(color depth)と呼び、「bpp」(bits per pixel:ビット毎ピクセル)という単位で表す。

最も単純で情報量が少ないのは各画素が1ビットの色情報を持つ方式(1bpp)で、各画素は2種類の色(ビットの0と1にそれぞれ対応)のいずれかとなる。通常はこれを白と黒に対応付け、白黒画像(2値画像、モノクロ2値)として扱う。

様々な色を扱う場合は色深度を大きく取り、8ビット(256色)や16ビット(65,536色)、24ビット(約1677万色)などが用いられる。24bppでは光の三原色(RGB:赤緑青)の各色を8ビット(256段階)で表すことができ、人間の目で識別できるほとんどの色を表現できるとされるため、「フルカラー」「トゥルーカラー」などと呼ばれる。

物理媒体におけるピクセルとドット

ディスプレイ装置などによる画面表示やプリンタによる印刷面も、色のついた微細な点を縦横に規則正しく並べた構造となっており、これもピクセルと呼ぶ。物理的な単位として「ドット」(dot)を用いる場合もある。

特に、プリンタではデジタル画像における一つのピクセルを複数の微小なインク滴やトナーの集合で表現する場合があり、ピクセルを構成する物理的な最小単位としてドットを用いることがある(ドットをピクセルと同義とする場合もある)。

物理的な媒体では表示・印刷面におけるピクセルの細かさが機器や機種によって異なり、幅1インチあたりに存在するピクセルの数である「ppi」(pixel per inch:ピクセル毎インチ)や隣り合うピクセルの中心間の距離である「画素ピッチ」(pixel pitch)などの単位で表す。

サブピクセル (subpixel)

物理媒体上では画素の色を原色の組み合わせで表現するため、ディスプレイなどの発光体では赤・緑・青の光の三原色(RGB)に対応する発光素子を、印刷物などの反射体ではシアン・マゼンタ・イエローの色の三原色(CMY)に対応するインク滴などを隣り合わせて一つの画素を表現する。

人間の目には三色が組み合わさって一つの色に見えるが、拡大すると各画素ごとに三色が規則正しく並んでいる様子が分かる。画素をこれらの三色に分解した構成単位を「サブピクセル」(subpixel:副画素)と呼ぶことがある。

ソフトウェアや機器によっては画像の表現をより精細にするため、サブピクセル単位で表示や印刷を制御する「サブピクセルレンダリング」(subpixel rendering)が行われる場合もある。

ドット

点、点を打つ、などの意味を持つ英単語。IT分野では、「.」などの点一つの記号文字のことや、画面を構成する画素(ピクセル)などのことをドットということが多い。

画像や画面、印刷におけるドット

画像データやディスプレイ画面、印刷装置などでは、色の付いた微細な点を縦横に規則正しく敷き詰めて像を構成している。この画像の構成単位となる一つ一つの点のことを「ドット」あるいは「画素」「ピクセル」(pixel)などという。

ドットと画素、ピクセルは通常同じ意味であることが多いが、プリンタなどではトナーやインクの微細な点を極近い場所に複数(多数)射出して一つの識別可能な画素を構成する方式のものもあり、その場合は前者をドット、後者をピクセルという。

文字、記号のドット

「・」(中黒)や「.」(ピリオド)など、点が一つだけ打たれた記号文字のことをドットということがある。日本語では「.」のことはピリオドと呼ぶのが一般的だが、ドメイン名のラベルの区切りで「.com」を「ドットコム」と読むように、符号の区切り記号としてピリオドを用いる場合は英語表現にならってドットと読むことが多い。

「・」は日本語では「中黒なかぐろ」と呼ばれ、単語の併置や外来語の単語の区切りを表す約物として用いられるが、数学では「a・b」のように乗算を表す記号としてよく知られる。数の計算では乗算記号「×」と同じ意味だが、ベクトルなど分野によっては「×」と「・」が異なる計算を表すことがある。

また、日本ではあまり馴染みがないが、一部の言語で用いるアルファベットの修飾記号(ダイアクリティカルマーク)として、「ė」のように文字の近傍に点を一つ打ったものがあり、これをドット符号ということがある。

解像度 【レゾリューション】 ⭐⭐⭐

機器などの性能の尺度の一つで、対象をどこまで細かく観測あるいは描写できるかを表すもの。ITの分野では、画像や画面、紙面などを構成する画素(ピクセル/ドット)の密度を指すことが多い。

コンピュータは画像を色の付いた微細な点あるいは格子を縦横に規則正しく敷き詰めた集合として取り扱う。この点の細かさ、すなわち、物理的な単位長さあたりの点の数(画素密度)のことを一般に解像度という。

解像度が高いほど点は微細になり、より精細できめの細かい表現が可能となるが、データ量は点の数に比例して増大し、保存や伝送に大きな容量を必要とする。解像度が低くなると次第に個々の点や格子が視認できるようになり、モザイク状のぼやけた表現となる。

ディスプレイやプリンタなどの出力装置の場合には、画面に表示する像や、紙面へ印刷する像の微細さを表す。イメージスキャナやカメラなど画像・映像の入力装置の場合には、取り込んだ光学的な像を画素に分解する細かさ(分解能)を表す。

解像度の単位

単位は一般に幅1インチ(約2.54cm)あたりに並ぶ点の個数である「ピクセル毎インチ」(ppi:pixel per inch)あるいは「ドット毎インチ」(dpi:dot per inch)が用いられる。例えば、100ppiなら1インチを100の点に分解して扱うことを意味し、一つの画素は直径0.254mmの円か幅0.254mmの格子となる。

ppiとdpiはコンピュータ上での画像データの画素と装置の取り扱う微細な点が一対一に対応する場合には同一だが、装置の原理によっては複数のドットの集合によって一つのピクセルを表現する場合もあり、そのような機器では後者の方が数倍から十数倍大きくなる。

ディスプレイの画面解像度

ディスプレイ装置では本来の解像度の意味である画素密度(ppi)の他に、慣用的に画面の構成画素数(総画素数)のことを解像度ということがある。横方向の画素数を縦方向の画素数をかけ合わせたもので、1920×1080といったように記述する。

同じ総画素数の機種同士でも、画面の物理的なサイズが異なれば画素の大きさも異なるため、本来の意味での解像度(画素密度)は異なる。歴史的な経緯から、よく使われる画素数には通称がついており、例えば640×480は「VGA」、1024×768は「XGA」と呼ばれる。

dpi 【ドット毎インチ】

主にプリンタやイメージスキャナなどで使われる解像度の単位で、幅1インチ(約2.54cm)を何個の点(ドット)で表現できるかを表す値。この値が高いほど、より精細な印刷や読み取りが可能となる。

例えば300dpiのプリンタは、紙面上の1インチ幅あたりに300個、面積1平方インチあたりに9万個の微細な点を印刷することができ、100dpiの機種に比べ、長さあたりで3倍、面積あたりで9倍の密度で表現することができる。

ディスプレイなどの表示装置では、解像度の単位として幅1インチあたりの画素(ピクセル)数を表す「ppi」(pixels per inch:ピクセル毎インチ)が用いられることがあるが、表示装置ではドットとピクセルも同じであるためdpiとppiも同義である。

プリンタは印刷品質を安定させるため、コンピュータ上の一つの画素(ピクセル)を十数個のインクやトナーの微細な点(ドット)の集まりとして印刷することが多く、その際のdpi値はppi値の数倍となる。

例えば、1600dpiのプリンタが一つのピクセルを縦横4つずつ、16のドットの集まりとして表現する場合、そのピクセル密度はdpi値の1/4の400ppiとなる。イメージスキャナにはこのような事情はないため、ディスプレイなどと同じようにdpiはppiは同義である。

ppi 【ピクセル毎インチ】

主にディスプレイで使われる解像度の単位で、幅1インチ(約2.54cm)あたりに何個の画素(ピクセル)を表示できるかを表す値。この値が高いほど表示面積あたりの画素密度が高く、精細な表示が可能となる。

例えば144ppiの液晶ディスプレイは、表示面の1インチ幅あたりに144個、面積1平方インチあたりに20,736個の画素を表示することができ、72ppiの機種に比べ長さあたりで2倍、面積あたりで4倍の密度で表現することができる。

一方、プリンタなどの装置では解像度の単位として、幅1インチあたりの点(ドット)の数を表す「dpi」(dots per inch:ドット毎インチ)が用いられることがある。

ディスプレイなどの場合はコンピュータ上の画像データの画素と表示装置上の表示素子が一対一に対応するためppi値もdpi値も同じだが、プリンタなどは品質を安定させるため装置が印刷する微細な点をたくさん集めて一つの画素を表現することがあり、ppi値がdpi値の数分の一となる。

例えば、1600dpiのプリンタが一つのピクセルを縦横4つずつ、16のドットの集まりとして表現する場合、その画素密度はdpi値の1/4の400ppiとなる。イメージスキャナにはこのような事情はないため、ディスプレイなどと同じようにdpiはppiは同義である。

GIF 【Graphics Interchange Format】

画像データを圧縮して記録するファイル形式の一つ。256色までの画像を無劣化で圧縮することができ、図やイラストなどの画像に向いている。

データを圧縮符号化する方式と、ファイルに記録する形式(ファイルフォーマット)の両方を定めている。ファイル名の標準の拡張子は「.gif」。圧縮時に内容の改変や画質の劣化を伴わない可逆圧縮(ロスレス:lossless)方式を用い、モノクロ(白黒2色)から256色(フルカラー1677万7216色から画像ごとに必要な色を選択)までの色を扱うことができる。

写真などの圧縮に適したJPEG形式とともに、初期のWeb(ウェブ)で標準的に用いられる画像形式として広く普及したが、2000年代半ば以降は仕様や特徴の多くが重複する「PNG」(Portable Network Graphics)も同じ目的で広く用いられている。

画像中の色を一つ選んで透過色(背景が透けて見える)とすることができる「透過GIF」、一部のデータを受信するだけで画像の全体像を確認することができる「インターレースGIF」など様々な拡張仕様がある。

パラパラ漫画の要領で複数の静止画像を連結して簡易な動画とすることができる「アニメーションGIF」というユニークな拡張仕様があり、動画データの再生ソフトなどを組み込まなくてもWebブラウザなどで短時間の簡易な動画を表示できることから人気を博している。現在では「GIF」という用語をこのアニメーションGIFの意味で用いる例も増えている。

歴史と特許問題

最初の仕様は1987年に当時のパソコン通信大手、米コンピュサーブ(CompuServe)社によって開発・公開され、現在よく用いられるのは1990年に発表された改訂版(GIF89a)である。

圧縮アルゴリズムとして米ユニシス(Unisys)社が特許を所有していた「LZW」という方式を用いており、同社は当初、特許使用料の徴収などは行わない方針だったが、広く普及すると方針を一転させ、ソフトウェア開発者にライセンス料の請求などを始めた。

これを嫌って一部のソフトウェアがGIF対応を取りやめるなど混乱が起き、代替形式として考案された特許を使用しないPNG形式の開発・普及が進んだ。2003年から2004年に各国のLZW特許が失効したため、現在では再び自由に使うことができる形式となっている。

JPEG 【Joint Photographic Experts Group】 ⭐⭐

静止画像のデータ圧縮形式の一つ。フルカラーの画像を多少の劣化を伴いながら高い圧縮率で符号化できるのが特徴で、写真など自然画像の記録に向いている。

画像の一部の不可逆的な変化や画質の劣化、情報の欠損を許容する代わりに極めて小さなデータに圧縮することができる「非可逆圧縮」(lossy compression)方式を採用しているのが大きな特徴で、圧縮前の状態に完全に復元することはできない。ファイル名の標準の拡張子は「.jpg」あるいは「.jpeg」である。

非可逆圧縮では画質の劣化の度合いが大きくなるほど圧縮率を高められるため、保存時にどの程度の画質とするかを係数の形で利用者が指定することができる。人間の目にはほとんど見分けがつかない画質でも元のデータの数分の一程度には圧縮することができ、最も低い画質では数十分の一から百分の一以下になることもある。

圧縮方式の特性やノイズの発生などから、図やグラフ、イラストなど同じ色が連続するのっぺりした質感の画像には向いておらず、写真や絵画など画素の色味が細かく変化する画像の保存に適している。このため、インターネットなどでは写真などの画像にはJPEGを使い、図表やアイコン、イラストなどの画像にはGIFやPNGなどで保存するなど、特徴の異なる画像形式を使い分けることが多い。

ベースラインとプログレッシブ

JPEGでは画像を8×8ピクセルの正方形の領域(ブロック)に分け、ブロックごとに色情報を記録していく。通常のデータ形式では左上のブロックから右下に向かって一段ずつ記録され、表示時には上から順番に画像が表示される。この方式を「ベースラインJPEG」という。

一方、各ブロックの情報を細かく分割し、何回かに分けて記録する方式も規定されており「プログレッシブJPEG」という。表示時にはまず全体がぼやけた画像で表示され、読み込みが進むにつれて次第に鮮明になっていく。低速回線で大きな画像を表示する際に素早く全体像が分かるため、Webサイトなどで用いられる。

ロスレスJPEG (Lossless JPEG/JPEG-LS)

JPEGでは元の状態に完全に復元できる「可逆圧縮」(lossless compression/ロスレス圧縮)を行う符号化方式も拡張仕様として追加されている。圧縮率は通常の非可逆圧縮を行う方式よりも悪いが、圧縮前の完全な画像を取り出すことができる。

1993年に追加された「Lossless JPEG」と1999年に追加された「JPEG-LS」の二方式があり、符号化方式やデータ形式が異なっている。後者の方が圧縮率が高く、復号後データのゆがみをパラメータで指定された誤差の範囲内に収めることができる「準可逆圧縮」(near-lossless compression/ニアロスレス圧縮)を行うこともできる。

可逆圧縮を行う画像形式としてはPNGなどが一般的であまり馴染みがないが、医用画像の保管システムなどに採用例がある。JPEGの後継規格のJPEG 2000やJPEG XR(HD Photo/JXR)には当初から可逆圧縮モードが用意されている。

標準規格

JPEG規格はISO/IEC JTC 1(ISOとIECの情報分野の合同委員会)とITU-Tの合同作業部会であるJoint Photographic Experts Groupが1992年に策定したもので、この部会の名称がそのまま画像形式の名称として用いられている。

策定された規格はITU-TではT.81として1992年に、ISO/IECではISO/IEC 10918として1994年に、ぞれぞれ標準化された。日本でも両規格を参照して同内容のものがJIS X 4301として1995年に国内規格化されている。

ファイル形式

JPEG規格では当初は画像データの圧縮符号化方式のみを定め、標準のファイル形式(コンテナフォーマット)を規定しなかったため、「JFIF」(JPEG File Interchange Format)と呼ばれる形式が広く普及し事実上の標準となった。

JPEG画像が保存されているファイル(拡張子が「.jpg」のファイル)は一般的にはJFIF形式か、あるいはその拡張形式のExif形式(カメラの撮影時などに使用)であることが多い。JFIF形式は2011年にITU-Tによって、2013年にISO/IECによってJPEG規格の一部として標準化されている。

PNG 【Portable Network Graphics】

画像データを圧縮して記録するファイル形式の一つ。フルカラーの画像を無劣化で圧縮することができ、図やイラストなどの配布、写真などの高画質での保存に向いている。

色のついた画素を縦横に敷き詰めたビットマップ形式の画像を圧縮符号化するデータ形式の一つで、内容の変質や劣化を一切起こさず正確に元の状態に戻すことができる「可逆圧縮」(ロスレス圧縮)方式を採用している。ファイル名の標準の拡張子は「.png」である。

写真などに適した非可逆圧縮のJPEG形式とともに、インターネットで標準的に用いられる画像形式として広く普及している。派生仕様として、画像を連結して記録することで簡易な動画とすることができる「MNG」や「APNG」などがある。

主な仕様

画像の色数はフルカラー(RGB各色8ビットの24ビットあるいは各色16ビットの48ビット)および最大256色(8ビット)のインデックスカラー(画像ごとに必要な色を選択)、最大65,536段階(16ビット)のグレースケールなどから選択できる。

一部の色の透明化や半透明化(透過PNG)にも対応している。8ビットPNG(256色)では透過GIFと同じように特定の1色を透明色に指定することができる。フルカラーPNGでは各画素の透過度を指定する「アルファチャネル」(8ビット256段階あるいは16ビット65,536段階)を設定し、背景色と合成された半透明表現を行うこともできる。

ファイルに画像の付加情報を埋め込むことができ、ホワイトバランスやデフォルト背景色、ガンマ補正値、任意の文字列などを含めることができる。圧縮方式としてZip形式などにも利用されるDeflate圧縮を採用しており、LZ77とハフマン符号化の2段階の圧縮を行う。

簡易動画

用途が近いGIF画像形式には一つのファイルに複数の画像を連結して格納し、パラパラ漫画の要領で次々に切り替えて表示することで簡易な動画を表示できる「アニメーションGIF」仕様があるが、PNGでもこれに似た派生仕様が用意されている。

初期に策定されたのは「MNG」(Multiple-image Network Graphics)形式だが、機能を詰め込みすぎて仕様が複雑化しすぎ、ソフトウェアの対応が進まなかった。後に簡素な仕様の「APNG」(Animated PNG)形式が策定され、GIFでは不可能なフルカラーの簡易動画を記録できる画像形式として2010年代後半から徐々に普及している。

歴史

PNGは1996年にGIF形式の代替となることを目指して開発され、後にW3CやIETF、ISOなどの標準化団体によって規格化された。当時は図やイラストなどの保存にはGIFがよく用いられていたが、圧縮方式に米ユニシス(Unisys)社の特許を使用していた。同社は当初は自由な特許利用を認めていたが、突如方針転換してライセンス料徴収を宣言したため、特許から自由な画像形式としてPNGが考案された。

2000年代初頭には主要なWebブラウザや画像編集ソフトなどがPNGに対応したためGIFに代わって広く普及し、標準的に利用される画像形式の一つとなった。GIFの特許権が期限切れとなった現在ではGIFの権利問題を回避するという当初の意義は消失している。

BMP 【Windows bitmap image】

Windowsが標準で対応している画像データのファイル形式の一つ。通常は無圧縮でデータを記録する。Windowsで使用されるアイコン画像などでよく利用される。

白黒2値画像から24ビットフルカラー(1677万7216色)までの色数に対応し、透過色やアルファチャンネルを利用することもできる。256色などのモードはインデックスカラー方式で、約1678万色の中から選択した色がカラーパレット領域に記録されている。

標準ではデータ圧縮を行わず元のサイズのまま保存するため、無圧縮の画像形式と説明されることが多いが、仕様上はランレングス圧縮で可逆圧縮を行う方式についても定めている。ただし、圧縮モードによる記録・読み込みに対応しているソフトウェアは多くはない。

個別の機器の仕様から独立した画像形式とするため、数学などで用いられる座標系(原点から上と右に正、下と左に負)を用いて画素データの並び順を規定しており、他の多くの形式とは異なり、画面上では最も下に表示される画素列がファイルの先頭に、最も上の列が末尾に来るように記録される(特殊な指定により上から下に記録することも可能)。

BMPファイルをプログラム上で取り扱うためメインメモリ上にそのまま展開したデータ集合を「DIB」(Device Independent Bitmap)という。データ形式自体は同一であるため、DIBとBMPはあまり区別されずほとんど同義語のように用いられることが多い。

なお、「ビットマップ画像」「ビットマップ形式」とは、ベクター形式などと対比して、各画素の色情報を端から順番に並べた画像データの表現形式全般を表す用語であり、BMP形式(Windowsビットマップ)はその具体的な仕様の一つにすぎない。文脈によってはビットマップという語がBMPを指す場合もあり紛らわしいため注意が必要である

PICT 【Pairwise Independent Combinatorial Tool】

米マイクロソフト(Microsoft)社が開発・公開している、ソフトウェアテストのテストケース作成ツール。ペアワイズ法に必要なケースを自動生成してくれる。

ペアワイズ法(オールペア法)は組み合わせテストの技法の一つで、テスト対象に複数のパラメータがある場合に、2つのパラメータの組み合わせを列挙し、それぞれの組について取り得る値の組み合わせを網羅するという手法である。

PICTはパラメータと取り得る値を列挙したテキストファイルを与えると、自動的にPICTに必要なテストケースを生成してくれる。オプションを指定することで(3つ以上の)任意の数のパラメータの組み合わせを網羅させることもできる。

ファイルに「サブモデル定義」という項目を追加すると、指定した複数のパラメータについてはすべての組み合わせを網羅させることができる。他より重要なパラメータが存在する場合に使用する。また、「制約条件」を指定することで組み合わせることができない条件を除外することができる。

PICTはMicrosoft社が開発し、MITライセンスに基づいてオープンソースソフトウェアとして公開している。テキストデータを入出力するコマンドラインツールとして実装されており、様々な開発ツール、テストツールと組み合わせて使用することができる。ソースコードからビルドすればWindowsだけでなくmacOSやLinuxなどのUNIX系OSでも使用可能である。

TIFF 【Tagged Image File Format】

様々な符号化方式に対応した、ビットマップ形式の画像データを保存するためのファイル形式の一つ。色数や圧縮形式を様々な選択肢から選ぶことができ、「タグ」という仕組みで様々な情報を埋め込むことができる。

保存する画像の色数(白黒2値、グレースケール、フルカラーなど)や解像度、圧縮符号化形式(非圧縮、ランレングス圧縮、ZIP、LZWなど)に様々なものを選択して指定することができ、バージョン6.0からはJPEG圧縮された画像の保存にも対応した。各色32ビットまで対応するなど色数の表現が柔軟な点が大きな特徴となっている。ファイル名の標準の拡張子は「.tif」あるいは「.tiff」。

ファイル内部には「タグ」(tag)という項目名と値が並んでおり、タグによって画像の様々な属性を表現することができる。読み込み時にはタグに記載された情報を元に画像の仕様や形式を特定し、展開して表示する。タグの種類は仕様改訂のたびに増え続け、すべてのタグに対応することは困難となっている(規格上も全タグ対応は必須ではない)。

TIFFには「マルチページ」と呼ばれる仕様が規定されており、一つの画像ファイルに複数枚の画像データを保存することができる。それぞれの画像ごとにタグを設定できるため、異なる仕様・形式の画像を組み合わせて一つのファイルに記録することができる。

ファクシミリ(FAX)の伝送画像を扱うための拡張仕様として「TIFF-F」が定められており、FAX規格で定められたMH符号、MR符号、MMR符号などの符号化方式で生成された画像データをそのままTIFFファイルに保存することができる。いわゆるインターネットFAXサービス/システムで広く採用されており、受信画像の端末への保管や外部への転送などに用いられている。

1986年に米マイクロソフト(Microsoft)社と米アルダス(Aldus)社(現Adobe社)によって開発された形式で、古くから汎用の画像形式として様々なソフトウェアで利用されてきた。BMP形式が標準になる前の初期のWindowsでは標準の画像形式だったことでも知られる。Exif形式やDICOM形式など、TIFFの仕様を拡張して独自に定義されたファイル形式もある。

RAWデータ 【RAW画像】

デジタルカメラなどの画像形式の一種で、撮像素子から得たデータをそのまま羅列したもの。デジタル一眼レフカメラやミラーレス一眼カメラなどで利用できる。いわゆるコンパクトデジタルカメラ(コンデジ)にはRAW形式での出力機能は無いことが多い。

撮像素子から出力される信号をデジタル化してそのまま記録したもので、データ圧縮や画像処理が行われていない「生」(raw)の状態が記録されている。データ形式は撮像素子の構造や仕様に依存しており、同じRAWデータでもメーカーや機種によって形式が異なり互換性がない。

RAWデータ自体を一般的なソフトウェアで表示、編集、印刷することはできないため、JPEGなど汎用的な画像形式に変換する必要がある。この作業・変換処理を、ネガフィルムから印画紙への焼き付けになぞらえて「現像」ということがある。

RAWデータには撮影時に取得したすべての情報が含まれており、これを起点に編集を行うことで品質を損なわずに撮影者が望む通りの補正や加工を施すことができる。現像処理はカメラに添付されたメーカー製の専用ソフトでなければできないことが多い。

ファイル名の標準の拡張子はメーカーによって異なり、キヤノンが「.cr2」や「.cr3」、ニコンが「.nrf」、ソニーが「.arw」や「.sr2」、オリンパスが「.orf」、パナソニックが「.rw2」、富士フイルムが「.raf」などとなっている。

ジャギー

デジタル化された画像や動画に発生する乱れ(ノイズ)の一種で、線や輪郭に現れる階段状のギザギザのこと。

ビットマップ形式の画像(ラスター画像)を拡大した時などによく見られるもので、画像を縦横に格子状に並んだ微細な正方形の集合として表現しているため、拡大によって曲線や斜線なっている部分がガタガタした階段状になってしまう。

周囲に背景と線(あるいは輪郭の内と外)の中間色を配置してジャギーを目立たなくする画像処理を「アンチエイリアシング」(アンチエイリアス)あるいは「スムージング」という。これによりジャギーは目立たなくなるが、輪郭がぼやける代償がある。

かつてはディスプレイやプリンタの解像度が低く表示・印刷された個々の画素が視認できるほど大きかったため通常の使用法でもジャギーを意識したり対策することがあったが、近年では両機器とも極めて高解像度になったため、ジャギーを意識する機会は画像の拡大処理を行う場合くらいとなっている。

ビットマップ画像 【ラスター画像】 ⭐⭐⭐

画像データの表現形式の一つで、画像を色のついた点(画素/ピクセル)が縦横に規則正しく並んだ矩形として表現したもの。画面表示や印刷の際には最終的にこの形式で出力する必要がある。

ディスプレイ画面への表示やプリンタによる印刷はビットマップ形式で行われるため、コンピュータでも基本的には画像をビットマップ画像として表現・保存・処理することが多い。ファイル形式としては無圧縮のBMP(Windows Bitmap)、可逆圧縮のGIFやPNG、不可逆圧縮のJPEGなどが有名である。

任意の画像を表現することができ、特に写真など図形の組み合わせでは表現できない画像の保存に適しているが、内容についての幾何学的な情報などは持たないため、拡大や縮小、変形、合成などの処理を行うと内容が不可逆に変質し、画質の劣化、不鮮明化の原因となる。

ビットマップ画像は縦横それぞれの画素数が決まっており、その積が画像を構成する総画素数となる。例えば横1024ピクセル×縦768ピクセルの画像ならば78万6432画素の色情報が並んだデータとして表現される。画像形式によっては解像度(単位長さあたりに並ぶ画素数)の情報を持つものがあり、表示や印刷の際の画像の実際の大きさに反映される。

色情報と色深度

個々の画素が持つ色情報の大きさを色深度(color depth)と呼び、色情報のビット数(bpp:bits per pixel)で表す。例えば、色深度が1bppの場合は各画素は0と1の二値の色情報を持ち、通常は0を黒、1を白に対応付けた白黒画像のことを意味する。

色情報はRGB(Red-Green-Blue)形式など色自体の属性を直接表記したものと、色に番号をつけ、番号と実際の色情報(RGB値など)の対応関係を別のデータとして与えるインデックスカラー(indexed color)方式がある。16~32bppの場合は前者の方式(RGBの各値を5~8ビットずつ並べる)であることが多く、8bppの場合は後者の場合が多い。8bpp(256色)はインデックスカラー以外にもモノクロ256階調のグレースケール形式(白黒と254段階の灰色)にも用いられる。

また、色情報として透明色を設定したり、各画素ごとに透明度(アルファ値)を設定できる形式もあり、他の画像と重ね合わせたときに背後の色が透ける表現ができる。32bppの場合はRGB各8ビットに透明度8ビット(256段階)とすることが多い。

ベクター画像

一方、画像を図形を表す数値情報の集合として表現した形式はベクター画像(ベクトルグラフィックス)と呼ばれる。画像を点や線分、面などの図形の描画情報の組み合わせとして表したもので、画質を劣化させることなく自由に拡大・縮小や変形ができる利点がある。表示や印刷を行う際には最終的に特定の画素数のビットマップ画像に変換(ラスタライズ)される。

ペイントソフト 【ペインティングソフト】 ⭐⭐

グラフィックスソフトの一種で、紙やキャンバスにペンや絵筆で絵を描くように画像を描画できるソフトウェア。

マウスなどを使ってカーソルをペン先や筆先のように動かし、画面上に絵を描いていくことができる。タッチパネル操作の機種では指や専用のスタイラスペンで画面に直に触れて描くこともできる。できた画像はビットマップ画像として保存される。

筆先の質感やタッチを自由に選択できるほか、画像の一部あるいは全体にぼかしやモザイク、水面の波紋などの特殊効果をかけられるフィルター機能、画像の一部を切り抜いたり変形したりする編集機能、複数の画像を重ね合わせるレイヤー機能などを備えているものが多い。

近年では、アニメーション制作を支援する製品、マンガ原稿の制作を支援する製品、複数人で共同作業できる製品、ペンタブレットでの操作を重視した製品、ネットサービスとしてWebブラウザ上で操作する製品など、様々な特色ある製品が登場している。

描画機能よりも、写真など既存の画像にフィルターや色の調整などの編集を行うことに力点を置いたソフトもあり、「フォトレタッチソフト」(photo editting software)と呼ばれる。また、ペイントソフトとは異なり、点や曲線、領域の塗りつぶしなどを組み合わせて図形やイラストレーションを作成するソフトは「ドローソフト」という。

「ペイントソフト」「ドローソフト」といった呼称は和製英語で、英語ではペイントソフトを “raster graphics editor” (ラスター画像編集ソフト)、ドローソフトを “vector graphics editor” (ベクター画像編集ソフト)といったように編集対象の画像形式によって呼び分けることが多い。

トリミング 【トリム】

刈り込む(こと)、切り取る(こと)、整頓(する)、仕上げ(る)、などの意味を持つ英単語。端から一定の長さや割合を切り取って小さく(短く)する操作などのことを意味する。

写真や画像、図版などでは、全体の中で必要な部分だけを取り出して強調するために、不要な周縁部を切り取って排除する処理や操作をトリミングという。

映像の場合は、主に縦横比(アスペクト比)の調整のために上下あるいは左右を一定の割合で切り落として調整することをトリミングという。映画をアナログテレビ放送する際に左右をカットしてアスペクト比を4:3にする処理などが該当する。一方、写真の場合ように被写体の強調のために一部を切り取って拡大する処理や作業のことは「クロッピング」(cropping)という。

プログラミングやデータベースの分野では、文字列データの先頭や末尾に含まれる空白文字などを削除する操作のことをトリミングという。また、ログなど時系列に蓄積されていくデータなどについて、一定の条件や基準に基づいて自動的に削除する処理のことをトリミングという場合もある。

レタッチ 【フォトレタッチ】

(写真や絵画などに)手を入れる、手直しする、修整するといった意味を持つ英単語。ITの分野では専用の画像処理ソフトを用いて写真などの既存の画像を加工することを指す。

パソコンなどで写真などのビットマップ画像(ラスター画像)データを加工・編集するソフトウェアを「フォトレタッチソフト」(英語では retouch の語を使わず photo editing software などとすることが多い)と呼び、これにより様々な加工や修正を行うことをレタッチという。

一般的なレタッチ作業では、画像の拡大や縮小、一部の切り抜き、様々なペン先による書き込みや塗りつぶし、ぼかしや鮮明化(シャープ)、明るさやコントラスト、色味などの補正、セピア色やモノクローム(グレースケール/白黒)などへの色調変換、他の画像や文字との合成などが行われる。

また、ソフトウェアによっては画像に様々な効果を施す「フィルタ」機能があり、モザイク風、すりガラス風、ステンドグラス風エンボス(浮き彫り)風、線画風、イラスト風、スケッチ風、版画風など異なる画風に変換することができる。

レイヤー

層、階層、層にする、層をなす、などの意味を持つ英単語。何かの構造や設計などが階層状になっているとき、それを構成する一つ一つの階層のことをレイヤーという。

機能階層

何らかの装置やソフトウェア、システム、ネットワークの構造を説明する際、構成要素が階層状に積み上がった構造になっている場合にそれぞれの要素をレイヤーと呼ぶことがある。

例えば、コンピュータのハードウェア上でオペレーティングシステム(OS)が動き、OS上でアプリケーションソフトが動いている、という構造について、それぞれのことをハードウェアレイヤー、OSレイヤー、アプリケーションレイヤー、などと呼ぶことがある。

通信の分野でも、機器やソフトウェアの役割やプロトコル(通信規約)について、階層構造で整理することがあり、それぞれの機能階層をレイヤーという。

例えば、OSI参照モデルでは通信機能を物理層、データリンク層、ネットワーク層、トランスポート層、セッション層、プレゼンテーション層、アプリケーション層の7つレイヤーに分割して定義している。

画像処理

ペイントソフトやフォトレタッチソフトなどで、画像を載せる仮想的なシートのことをレイヤーということがある。

1枚の画像を任意の枚数の透明なレイヤーを重ねあわせたものとみなし、各層に画像を構成する個々の要素を置いたり効果を加えたりすることで、画像の加工・編集を容易にすることができる。

ベクター画像 【ベクターデータ】 ⭐⭐⭐

画像データの表現形式の一つで、画像を図形を表す数値情報の集合として表現したもの。拡大・縮小・変形しても画質が劣化せず、サイズや解像度によらず同じ品質の出力結果を得ることができる。

画像を単純な図形の集合として表現する方式で、輪郭などを構成する点の位置や、それらを結ぶ直線や曲線を表す方程式のパラメータ、変形・回転など操作情報、線や面の色情報などの組み合わせとして記述する。“vector” の表記は「ベクター」「ベクタ」「ベクトル」の揺れがあるが、意味の違いはない。

一方、画像を最小単位の小さな点である画素(ピクセル)の集合として表し、各画素の色情報を端から順に縦横に規則正しく並べた形式の画像データは「ビットマップ画像」(bitmap image)あるいは「ラスター画像」(raster image)と呼ばれる。

コンピュータのディスプレイやプリンタなどの出力装置はビットマップ方式で画像を扱うため、ベクター画像はそのままでは表示・印刷することができない。表示する際には画像の縦横の画素数を決めて、その範囲の中で実際に各図形を描画してビットマップ画像を得る。この描画処理のことを「ラスタライズ」(rasterization)という。

ビットマップ形式はどのような画像でも同じように記録できるが、ベクター画像は原理的に写真のような像の表現には向かず、文字や図、イラスト、デザインなど図形の組み合わせで表現しやすい像の記録に向いている。実際、コンピュータで扱う文字の形状データを収録したフォントデータの多くはベクター画像で表現されたアウトラインフォント(outline font)である。

ベクター画像を作成・編集するソフトウェアもあり、米アドビ社の「Adobe Illustrator」(アドビ・イラストレーター)などが有名である。汎用のベクター画像記録用の画像ファイル形式もいくつかあり、Illustrator標準の「AI形式」(.aiファイル)や、Webページなどでベクター画像を扱えるXMLベースの「SVG」(Scalable Vector Graphics)形式などがよく知られる。

ドローソフト 【ドローイングソフト】 ⭐⭐

画像の描画や編集を行うソフトウェアの一種で、画像を図形を組み合わせとして構成するベクター形式のイラストやデザインを作成するためのもの。

画面上でマウス操作やペン操作、タッチ操作により位置を指定して図形を描画していくソフトで、点や直線、曲線、多角形、円などの図形、アウトラインフォントの文字などを配置していき、これらに描画色を設定したり、囲まれた領域を塗りつぶすなどの編集を行って画像を作成する。

作成された画像は構成要素の点の座標や曲線方程式のパラメータなどの集合として表されたベクター画像として記述・保存されるため、算術的な変換により容易に変形や拡大・縮小を行うことができる。そのような変形処理によって画質が劣化しないという特徴がある。

1988年に初版が発売された米アドビ(Adobe)社の「Adobe Illustrator」(アドビ・イラストレーター)が本格的なプロ向けのソフトウェアとして広く普及している。他に米コーレル(Corel)社の「CorelDRAW」や、日本ではジャストシステムの「花子」などが有名で、「Inkscape」などのフリーソフトウェアもある。

主にベクター形式の画像を扱うソフトウェアとしては「CAD」(Computer Aided Design)ソフトなどもあるが、こちらは工業製品や建築物の設計図面の作成のための機能が充実しており、主にイラストレーションやグラフィックスの作成、デザインのために用いられるドローソフトとは区別される。

「Microsoft Visio」のようにダイアグラムなどの作図に特化したソフトウェアも、機能的な重複は大きいが主目的が異なるため区別されることが多い。ワープロソフトなどDTPソフトの中にも、線分や多角形、円、吹き出しなどドローソフトに似た簡易な作図機能を有するものは多くあり、この機能を「ドローツール」などと呼ぶこともある。

一方、同じ画像編集ソフトでも、画像を微細な色の付いた点(画素/ピクセル)の集合として取り扱うものを「ペイントソフト」と呼ぶ。絵画のようなきめ細かい描写や、写真の編集、合成などを行うことができるが、拡大や縮小、変形を行うと画質が劣化する。ドローソフトとは必要な画像の種類に応じて使い分ける必要がある。

CG 【Computer Graphics】

コンピュータで作成・加工された画像や動画のこと。工業製品の設計(CAD)やビデオゲーム、映像作品の制作など様々な分野で用いられている。

狭義には、ゼロから完全にコンピュータ上での作画や編集、加工などを経て生成された画像や動画を指し、特に、コンピュータプログラムが人の用意したデータ群を一定の手順で計算、処理して像を描画する手法により作成されたものを意味することが多い。

広義には、元になる写真や図画、映像などにコンピュータで作り出した像を合成したり、元とは大きく異なる態様に処理、加工したものを含む。写真や動画の撮影、編集をデジタル機器やコンピュータで行うのが一般的となったこともあり、撮影した写真や映像の全体的なイメージは変えず、細部の修整や変形、色調の変更などの編集(レタッチ)を施したものはCGと呼ばないことが多い。

イラストやマンガなどでは、人が手でペン型の機材などを操作してコンピュータ上で直接作画する手法が用いられることがあり、以前はそのような作画手法が珍しく、(主に技術的な制約から)紙に手で描いたものとは表現が大きく異なっていたため、一種のCGとみなされていたが、現在では紙に描くのと変わらない表現が可能となり、CGではなく手描きの作画手法の一つと考えられることが多い。

CGの作成手法は大別して、図形や像を平面的に組み合わせたり加工する「2次元コンピュータグラフィックス」(2DCG:2-Dimensional Computer Graphics)と、立体的に処理する「3次元コンピュータグラフィックス」(3DCG:3-Dimensional Computer Graphics)があり、単にCGという場合は3DCGを指すことが多い。これは作成時のデータの取り扱いや計算・描画手法の区別であり、できあがった画像の内容、表現が平面的であるか立体的であるかを表すのではない。

3DCG 【3次元コンピュータグラフィックス】

コンピュータグラフィックス(CG)の表現手法の一つで、3次元空間に存在する立体の様子を平面に投影して描画したもの。映画やアニメーションなどの映像作品、ビデオゲーム、工業製品の設計、シミュレーションなど様々な分野で利用される。

コンピュータ内に数値的な3次元空間を用意して様々な色や形の立体図形を配置し、それらがある投影面上に映る様子を数値計算によって求め、画像として描画する。空間内の立体を任意に移動、変形、生成、除去して再計算することで異なる画像を得ることができ、単に「立体的に見えるように描かれた画像」とは異なる。

立体は頂点を結ぶ座標やそれらを結ぶ線分や曲線、線によって囲まれた多角形(ポリゴン)やその他の平面図形によって表現される。立体をどのような存在として構成するかによって、いくつかのモデリング方式が使い分けられている。

主なモデリング方式として、点を結ぶ骨組みのみでできた「ワイヤーフレームモデル」(wire frame model)、多角形の面で覆われたハリボテ(内部は空洞)として表す「サーフェスモデル」(surface model)、中身の詰まった物体として表す「ソリッドモデル」(solid model)がある。三角形を組み合わせたサーフェスモデルがよく用いられる。

3DCGの作成は、立体の形状データの入力や編集(モデリング)、空間内での配置や光源、視点などの設定(シーンレイアウト)、投影面に映る像を数値計算によって求める描画(レンダリング)などの工程からなる。

映画などの場合は製作時にレンダリングを行い固定的な映像データを得る「プリレンダリング」(prerendering)が、コンピュータゲームなどの場合は利用者側の操作に応じてシーンレイアウトとレンダリングを高速に何度も繰り返す「リアルタイムレンダリング」(real-time rendering)が行われる。

コンピュータの性能や記憶容量が低かった頃は「赤い立方体」といったような単純な幾何学図形のようなものしか表示できなかったが、性能向上に従い一つの立体を多数の図形に分割できるようになり、複雑な形状や滑らかな曲面のように見える構造を形作れるようになった。

また、表面も単色の塗りつぶしだけでなく任意の画像を面に貼り付ける「テクスチャマッピング」(texture mapping)や、微細な凹凸を設定できる「バンプマッピング」(bump mapping)などの手法が考案され、現実の物体や空想上の物体をリアルな表現で再現できるようになった。

色の三属性 【色の3属性】

人間が色を認識する上での基本的な性質で、色相、明度、彩度の3つの属性のこと。これら3つを数値で指定することにより様々な色を表現することができる。

「色相」(hue)は赤、青、緑などといった色合い、色味のことである。光は波長の違いにより人の目にそれぞれ異なった色として映る。波長の変化に応じて連続的に色味が変化する様子を帯状に表しものを「色相スケール」、円環状に表したものを「色相環」という。

「明度」(brightness)は色の明るさのことで、実際に放たれる光の強さのことではなく、色から受ける印象が明るいか暗いかを表す心理的な「明るさ」である。人間は色について「明るい色」「暗い色」という感覚を持っており、その度合いを何らかの尺度を用いて数値で表現する。

「彩度」(saturationまたはchroma)は色の鮮やかさのことで、白・黒・灰色の「無彩色」で0となり、真っ赤、真っ青などの「純色」で最大となる数値で表される。彩度が高いほど純粋で鮮やか、くっきりした色合いとなり、彩度を下げていくと白・黒・灰色に近づいていき、ぼんやりとした色合いになっていく。

彩度

色を表す属性の一つで、色の鮮やかさのこと。白・黒・灰色の無彩色で0となり、純色で最大値となる。彩度を用いる表色系では最大値を100とするパーセンテージで表すことが多い。

表色系によって詳細は異なるが、彩度が高いほど純粋で鮮やか、くっきりした色合いとなる。彩度を下げていくと白・黒・灰色に近づいていき、ぼんやりしたくすんだ色合いになる。一般に多くの種類の色を混ぜるほど彩度は下がっていく。

コンピュータ上の表色系でよく用いられるHLS(HSL)、HSV、HSBなどの色空間では「S」(Saturation)が彩度を表しており、0を最小として1あるいは100を最大とする尺度で表される。これらの体系では残りの二つの属性として、色味を表す「色相」(H:Hue)、明るさを表す「輝度」(L:Lightness)あるいは「明度」(B:Brightness)が用いられる。

明度

色を表す属性の一つで、色の明るさのこと。実際に放たれる光の強さのことではなく、色から受ける印象が明るいか暗いかを表す心理的な尺度である。

人間は色について「明るい色」「暗い色」という感覚を持っており、その度合いを何らかの尺度を用いて表したものを明度という。色合い・色味を表す「色相」(hue)、色の鮮やかさを表す「彩度」(saturation)と合わせて「色の三属性」という。

例えば、無彩色で考えると白が最も明度が高く、黒が最も明度が低い。灰色はその濃さに応じて両者の中間に位置する。彩度の高い色の場合には、明度が高いときに最もくっきりした色合いとなり、明度が0で彩度も色相も失われ黒になる。

色を数値で表す表色系では、黒を0、白を1または100とする尺度で表される。HSV色空間では「V」(Value)が明度を示している。似た表色系のHLS色空間(HSL色空間)などでは、ほぼ同じ概念を「輝度」(L:LightnessあるいはLuminance)と呼んでいる。

色相

色を表す要素の一つで、赤、青、緑などといった色合い、色味のこと。可視光線は波長の違いにより人の目にそれぞれ異なった色として映り、この色の違いや種類のことを色相という。

赤、青、緑、黄、橙、紫など、日常的によく用いられる色には名前がついているが、波長は連続量であり中間色は無数にある。色相の全体像は色味が連続的に変化する図で示され、帯状に表したものを「色相スケール」、円環状に表したものを「色相環」という。

色を表す要素には色相のほかに、色の明るさ(明度/輝度)と鮮やかさ(彩度)がある。これらを組み合わせて一つの色を表すことができ、こららを「色の三属性」または「色の三要素」という。例えば、同じ赤の色相でも、明度が低ければ「暗い赤」に、彩度が低ければ「くすんだ赤」になる。

コンピュータの表色系でも色相(H:Hue)を用いるものがあり、彩度(S:Saturation)、輝度(L:LightnessあるいはLuminance)と組み合わせたものを「HSL色空間」あるいは「HLS色空間」、輝度に替えて明度(V:ValueあるいはB:Brightness)を組み合わせたものを「HSV色空間」「あるいは「HSB色空間」という。

補色

色相環でちょうど反対の位置にある色の組み合わせのこと。また、ある色の反対側にある色のこと。

様々な色味を、対応する光の波長の連続的な変化に応じて円環状に並べたものを「色相環」(color circle)という。波長が最長の赤の隣に最短の紫を繋いで環状としている。この中で、ちょうど環の反対側にある色同士を補色という。

色相環の色と位置の対応関係は色の表現方法(表色系)によって微妙に異なるため、系によって色の組み合わせも異なるが、絵の具や印刷物など減法混色の系でよく知られるRYB色相環やマンセル色相環では「赤-緑」「黄-紫」「青-橙」の組み合わせがよく知られる。

補色の組み合わせは互いがくっきりと際立つ効果があるため、目立たせたい場所などに使うと効果的であるとされる。ただし、明度の赤い補色同士を直接隣り合わせると目がチカチカしてかえって見にくい状態になることがある。

類似色

色相環で隣や近くにある色の組み合わせのこと。また、ある色の近くにある別の色のこと。

様々な色味を、対応する光の波長の連続的な変化に応じて円環状に並べたものを「色相環」(color circle)という。波長が最長の赤の隣に最短の紫を繋いで環状としている。この中で、位置が近い色同士を類似色という。

色相環の色と位置の対応関係は色の表現方法(表色系)によって微妙に異なるが、おおむね赤-赤紫-紫-青紫-青-水色-エメラルドグリーン-緑-黄緑-黄-橙-赤の順に並んでいる。この中で、例えば、「黄-橙-赤」や「緑-水色-青」、「青紫-赤紫-赤」といった組み合わせが類似色となる。

配色で類似色の組み合わせを用いると統一感や安定感が増し、暖色の組み合わせであれば明るさや優しさ、寒色の組み合わせであれば落ち着きや涼しさなどを演出することができる。一方、色相環で反対側にある色同士の組み合わせは「補色」と呼ばれ、対照的で目立つ組み合わせとされる。

色相環 ⭐⭐

様々な色味を、対応する光の波長の連続的な変化に応じて円環状に並べたもの。波長が最長の赤の隣に最短の紫を繋いで環状としている。

光は波長の違いにより人の目にそれぞれ異なった色として映り、赤、青、緑といった人間が感じる色の種類(色味)のことを「色相」(hue)という。波長の変化に応じて連続的に色味が変化する様子を円環状に表したものを色相環という。

色と位置の対応関係は色の表現方法(表色系)によって微妙に異なるが、名前のある主な色で言うと赤-赤紫-紫-青紫-青-水色-エメラルドグリーン-緑-黄緑-黄-橙-赤の順に並ぶ。いわゆる「光の三原色」(赤・緑・青)や「色の三原色」(水色・薄紫・黄)は、概ね各色が120度ずつ離れた配置となる。

色相環で隣や近くにある色同士を「類似色」、中心を挟んでちょうど反対側にある色同士を「補色」という。補色については表色系によって色の組み合わせも微妙に異なるが、絵の具や印刷物など減法混色の系でよく知られるRYB色相環やマンセル色相環では「赤-緑」「黄-紫」「青-橙」などが補色となる。

三原色

混合すると様々な色を表現することができる、元となる色のこと。発光体における赤・緑・青の「光の三原色」と、反射体におけるシアン・マゼンタ・イエローの「色の三原色」がある。

光の三原色と加法混色

人間の視覚は主に赤(red)・緑(green)・青(blue)の各色の光に強く反応する色覚受容体で構成され、これらの組み合わせとして様々な色を知覚している。この三色を「光の三原色」と呼び、各色の頭文字を取って「RGB」(Red-Green-Blue)という略号で表される。

テレビやディスプレイ装置の表示画面や照明のような発光体の色はこの三色の組み合わせにより表現される。三色の強度を高めるほど色が明るくなっていき、三色とも最大の強度で足し合わせると白色となる。このような混色系を「加法混色」という。

色の三原色と減法混色

印刷物など光の反射体の色は、シアン(cyan:濃い水色)、マゼンタ(magenta:薄紫)、イエロー(yellow:黄色)の三色の組み合わせによって表現することができる。この三色を「色の三原色」と呼び、各色の頭文字を取って「CMY」(Cyan-Magenta-Yellow)の略号で表される。

この三色は白色光から光の三原色のいずれか一つを遮った(残りの二色を同強度で混合した)色である。シアンとマゼンタを混ぜると青に、マゼンタとイエローを混ぜると赤に、イエローとシアンを混ぜると緑になるという関係にある。

我々は色の三原色の混合を絵の具の色を混ぜることにより身近に体験している。三色の強度を高めるほど色は暗くなっていき、三色を最大の強度で足し合わせると(理屈の上では)黒色となる。このような混色系を「減法混色」という。

光の三原色 ⭐⭐

発光体の色のうち、組み合わせることで様々な色を合成することができる、赤・緑・青の三つの原色のこと。各色の頭文字を取って「RGB」(Red-Green-Blue)という略号で表される。

人間の視覚は主に赤・緑・青の各色の光に強く反応する色覚受容体で構成されているため、この三色の光を様々な強さで組み合わせることで、任意の色を構成することができる。実際には、緑は明るい黄緑に近い色、青はわずかに紫がかった群青に近い色が用いられる。

テレビやディスプレイ装置など発光して像を映し出す装置では、表示面にこの三色に対応する微細な発光素子が敷き詰められており、それぞれの強さを制御して各点の色を表現している。各色の強度を高めるほど色が明るくなっていき、三色とも最大の強度で足し合わせると白色、最低の強度で黒色となる。このような混色系を「加法混色」という。

一方、絵の具や印刷物のインクなど光の反射体の色は、シアン(cyan:濃い水色)、マゼンタ(magenta:薄紫)、イエロー(yellow:黄色)の三色の組み合わせによって表現することができる。この三色を「色の三原色」と呼び、各色の頭文字を取って「CMY」(Cyan-Magenta-Yellow)の略号で表される。

加法混色 ⭐⭐

光(光源、発光体)で様々な種類の色を表現するときの色の混合方法。最も一般的な方式は、赤(Red)、青(Blue)、緑(Green)のいわゆる「光の三原色」を混合してすべての色を表現する手法で、そのような系を三色の頭文字を取って「RGB」と呼ぶ。

RGBによる加法混色の系では、赤と緑を混ぜると黄色、オレンジ色、茶色を、青と緑を混ぜると水色を、赤と青を混ぜると紫色を、三色を同じ強度で混ぜると黒、灰色、白を、それぞれ表現することができる。

これに対し、光を反射する媒体で色を表現する場合の色の混合方法は「減法混色」という。コンピュータのディスプレイ装置などは加法混色の系で、印刷物などは減法混色の系(CMYやCMYKなど)であるため、コンピュータで作成した文書などを印刷するためには系の変換が必要になる。

RGB 【Red-Green-Blue color model】

色の表現方式の一つで、赤・緑・青をそれぞれ様々な強度で混合し、すべての色を表現する方式。コンピュータで図形や画像、動画などを扱う際の標準的な色表現の一つで、ディスプレイ装置など加法混色の系で利用される。

赤(Red)・緑(Green)・青(Blue)の3色は「光の三原色」と呼ばれ、頭文字を繋ぎ合わせて「RGB」と呼ばれる。発光体の色は強度を高めるほど明るくなっていき、3色を最大の強度で足し合わせると白色となる。このような混色系を「加法混色」という。

絵の具など光の反射体は発光体とは逆の「減法混色」となるため、RGBの各色の強度と出来上がる色の対応関係は我々が日常的に慣れ親しんできた色の感覚とはズレている部分もある。

例えば、赤と青を混ぜると明るい紫になるのは日常感覚に近いが、赤と緑を混ぜると黄色、青と緑を混ぜると水色となる。3色の強度が同じだと無彩色(灰色)となり、すべて最大の強度なら白、最低の強度なら黒となる。

色深度とアルファ値

RGBの各色について、その強度を何段階のきめ細かさで区別するかにより、表現できる色の数が決まる。機器やソフトウェア、画像形式などが対応する最大発色数を「色深度」(カラーデプス)と呼び、色情報のビット数を「bpp」(bits per pixel)という単位で表現する。

人間の目から見て自然の光景と遜色ない色表現を実現するには各色8ビット(256段階)、合わせて24bpp(1ピクセルあたり3バイトの色情報)程度の情報量が必要と言われ、これを「フルカラー」(full color)あるいは「トゥルーカラー」(true color)という。

RGBの色情報に透明度(A:Alpha、アルファ値)を追加し、半透明の色を表現する方式もあり、RGBAカラーモデルという。例えば、アルファ値が50%の半透明に指定された画素は、その画素自体のRGB値を50%、背景にある画素のRGB値を50%の割合で合成した色で描画される。

CMYKとの違い

印刷など減法混色の系では「シアン」(Cyan:水色)、「マゼンタ」(Magenta:明るい赤紫色)、「イエロー」(Yellow:黄色)の強度の組み合わせで色を表現するCMY方式が用いられる。光の反射体の色を表す方式であるため日常の色の感覚に近い。

印刷では黒を他の色のインクの混色できれいに表現するのが難しいため、実用上はCMYに黒(K:Key plate)の強度を追加したCMYK方式がよく用いられる。印刷関連のソフトウェアにはRGBとCMYKの相互変換機能が内蔵されていることが多い。

色の三原色 ⭐⭐

印刷物など光の反射体の色のうち、組み合わせることで様々な色を合成することができる、シアン(cyan:濃い水色)、マゼンタ(magenta:薄紫)、イエロー(yellow:黄色)の三色の組み合わせ。各色の頭文字を取って「CMY」(Cyan-Magenta-Yellow)の略号で表される。

人間の視覚は主に赤・緑・青の各色の光に強く反応する色覚受容体で構成されているため、この三色の光を様々な強さで組み合わせることで、任意の色を構成することができる。これを「光の三原色」と呼び、各色の頭文字を合わせて「RGB」(Red-Green-Blue)という。

色の三原色は外光の反射によって色を発する物体における原色で、白色光から光の三原色のいずれか一つを遮った(残りの二色を同強度で混合した)色である。シアンとマゼンタを混ぜると青に、マゼンタとイエローを混ぜると赤に、イエローとシアンを混ぜると緑になるという関係にある。

我々は色の三原色の混合を絵の具の色を混ぜることにより身近に体験している。三色の強度を高めるほど色は暗くなっていき、三色を最大の強度で足し合わせると(理屈の上では)黒色となる。このような混色系を「減法混色」という。

白、黒、灰色といった無彩色は、理論上は三原色を同量ずつ混合することにより作り出すことができる。発光体の制御と異なり着色剤の混合で灰色や黒を作ろうとするとくすんだ汚い色になってしまうため、印刷などの実用上は灰色や黒の着色剤を三色と別に用意することが多い。そのようなカラーモデルを「CMYK」という。「K」は黒色印刷に用いる冶具 “key plate” に由来する。

減法混色 ⭐⭐

光を反射する媒体で様々な種類の色を表現するときの色の混合方法。最も一般的な方式は、水色(Cyan:シアン)、赤紫色(Magenta:マゼンタ)、黄色(Yellow:イエロー)の三色を原色として、これらの混合によりすべての色を表現する手法で、そのような系を三色の頭文字を取って「CMY」と呼ぶ。

CMYによる減法混色の系では、シアンとマゼンタを混ぜると青を、マゼンタとイエローを混ぜると赤を、イエローとシアンを混ぜると緑を、三色を同じ強度で混ぜると黒、灰色、白を、それぞれ表現することができる。印刷などで用いる場合には、カラーインクの混合でモノトーンを表現するとくすんだ汚い色になりがちなため、灰色や黒のインクを別に用意することが多い。三原色に黒を追加した系を「CMYK」という。

これに対し、光(光源、発光体)で色を表現する場合の色の混合方法は「加法混色」という。コンピュータのディスプレイ装置などは加法混色の系(RGBなど)で、印刷物などは減法混色の系であるため、コンピュータで作成した文書などを印刷するためには系の変換が必要になる。

CMYK 【Cyan/Magenta/Yellow/Key plate】

色の表現方式の一つで、シアン(水色)、マゼンタ(赤紫色)、イエロー(黄色)、ブラック(黒色)の配合比率を変化させて、すべての色を表現する方式。インクによる印刷など減法混色の系で利用される方式である。

印刷物のような光の反射体の色は、「色の三原色」とも呼ばれるシアン(Cyan)、マゼンタ(Magenta)、イエロー(Yellow)の三つの色(CMY)を様々な強度で組み合わせることにより表現される。

この三色は白色光から光の三原色(赤緑青)のいずれか一つを遮った色で、各色の強度を強めるほど色が濃く、暗くなっていき、黒に近づいていくため「減法混色」(減法混合)と呼ばれる。

理論上はCMYの三色ですべての色を表現できるが、インクのような現実の着色材料でこの三色の混合により黒を表現しようとすると汚い暗灰色になってしまうことが多いため、美しく印刷するために黒だけが独立している。

印刷機において黒インクで画像の輪郭や文字、罫線などを表現する印刷板のことをキープレート(key plate)と呼んでいたことから、黒色の略号に “K” が用いられるようになった。

コンピュータのディスプレイなど発光体を用いる加法混色の系では赤(Red)、緑(Green)、青(Blue)の3色を組み合わせて色を表現する「RGB」が用いられる。印刷関連に用いられる業務用ソフトウェアなどにはRGBとCMYの相互変換機能が内蔵されていることが多い。

CMYK 【Cyan/Magenta/Yellow/Key plate】

色の表現方式の一つで、シアン(水色)、マゼンタ(赤紫色)、イエロー(黄色)、ブラック(黒色)の配合比率を変化させて、すべての色を表現する方式。インクによる印刷など減法混色の系で利用される方式である。

印刷物のような光の反射体の色は、「色の三原色」とも呼ばれるシアン(Cyan)、マゼンタ(Magenta)、イエロー(Yellow)の三つの色(CMY)を様々な強度で組み合わせることにより表現される。

この三色は白色光から光の三原色(赤緑青)のいずれか一つを遮った色で、各色の強度を強めるほど色が濃く、暗くなっていき、黒に近づいていくため「減法混色」(減法混合)と呼ばれる。

理論上はCMYの三色ですべての色を表現できるが、インクのような現実の着色材料でこの三色の混合により黒を表現しようとすると汚い暗灰色になってしまうことが多いため、美しく印刷するために黒だけが独立している。

印刷機において黒インクで画像の輪郭や文字、罫線などを表現する印刷板のことをキープレート(key plate)と呼んでいたことから、黒色の略号に “K” が用いられるようになった。

コンピュータのディスプレイなど発光体を用いる加法混色の系では赤(Red)、緑(Green)、青(Blue)の3色を組み合わせて色を表現する「RGB」が用いられる。印刷関連に用いられる業務用ソフトウェアなどにはRGBとCMYKの相互変換機能が内蔵されていることが多い。

階調 【階調数】 ⭐⭐⭐

コンピュータが画像を扱う際に、色の濃さや明るさを何段階で表現することができるかを表す数。この数が大きいほど細かな色や明るさの違いを表現できるが、画素あたりのデータ量は増大する。

自然界では色は光の波長によって異なり、連続量の一種だが、コンピュータで画像を扱う際にはこれを離散量(有限桁の数値)に変換する必要がある。その際、ある色の最も明るい(濃い)状態と暗い(薄い)状態の間を何段階で識別・表現することができるかを表す値が階調である。

モノクロの階調

最も単純な階調は白黒画像(モノクロ2階調)であり、すべての画素が真っ白と真っ黒のいずれかで表現される。色は「0」(黒)と「1」(白)の2値で識別され、各画素につき1ビットで表現することができる。

一方、一般に「モノクロ画像」あるいは「グレースケール画像」と呼ばれるものは白と黒の中間に明るさ(濃さ)の異なる複数の灰色を表現することができるものを指すことが多い。よく用いられる256階調(各画素の情報量は8ビット)のモノクロ画像では、白、黒、254段階の灰色の計256色を表現できる。

カラーの階調

カラー画像の場合は色を複数の原色に分解し、各色の階調の組み合わせで表現できる色の数が決まる。コンピュータ上で画像データを扱う際には色を赤(Red:R)・緑(Green:G)、青(Blue:B)の「光の3原色」に分解し、それぞれを同じ階調で表現することが多い。

人間の目にとって自然の光景と区別がつかない表現は、この各色について256段階(8ビット)程度の階調が必要であると言われており、これを「フルカラー」(full color)あるいは「トゥルーカラー」(true color)という。256の3乗で1677万7216色を表現することができる。

通常の用途ではフルカラーで十分なことが多いが、赤外線暗視映像のように特定の色味しか現れない特殊な表現の場合は単色256階調では色の境界が階段状になってしまうなど表現力が不足する場合がある。そのような状況にも対応できるよう、業務用の機器などでは内部的に各色10ビット(1024階調)や12ビット(4096階調)で表現するものもある。

フルカラー

画像などに使われる色の種類・範囲を表す用語の一つで、原色を混合して様々な種類の色を表現できること。特に、RGBの各色を8ビットで表し、24ビットで色情報を表現する方式のこと。

コンピュータで色を表現する場合、光の三原色である赤・緑・青(RGB:Red Green Blue)の各色の強度を数値で表し、これを組み合わせて一つの色を表現する方式が用いられることが多い。各色4ビットなら4096色、各色8ビットなら1677万7216色を表すことができる。

しかし、かつてのコンピュータは8色、16色、256色といった同時発色数の制約があったため、必要な色を選んで番号をつけ、各画素にはRGB形式の色情報ではなく色番号で色を指定していく「インデックスカラー」(パレットカラー)が用いられていた。現代でもGIF画像などはこの方式で色を指定する。

この方式と対比して、RGB形式の色情報を各画素に直に指定できる方式を「フルカラー」と呼ぶようになった。このため、初期のフルカラー表示は各色4ビット(16階調)の12ビットカラー(4096色)、各色5ビット(32階調)の15ビットカラー(32768色)、緑のみ6ビットとした16ビットカラー(65536色)などの種類があった。

コンピュータやディスプレイの性能が向上し、各色8ビット(256階調)の24ビットカラー(約1677万色)を表示できるようになると、人間の目にはほぼ自然な色彩に感じられるようになったため、これを指してフルカラーと呼ぶようになった。初期の様々なフルカラー方式と区別するために、24ビットカラーを「トゥルーカラー」(true color)と呼ぶこともあったが、この呼称はほとんど用いられなくなっている。

24ビットのフルカラー表示は通常使用する範囲では人間の目にはほとんど色の違いがわからないほど自然な表現が可能なため、コンピュータや録画・撮影機器、表示機器、および画像データや動画データは、フルカラーを取り扱える最大の色数とするものが多い。ただし、用途によってはより詳細な色表現を要する場合もあり、業務用の機器やソフトウェアなどでは各色10~16ビットの方式が用いられることもある。

24ビットカラー 【1677万色】

コンピュータが扱う色情報の種類・範囲やその表現方法の一つで、24ビットの値で色を識別する方式。最大で1677万7216色を表現することができる。

光の三原色である赤・緑・青(RGB:Red Green Blue)をそれぞれを8ビット(256段階)で表し、24ビットで色情報を表現する。通常使用する範囲では人間の目にはほとんど色の違いがわからないほど自然な表現が可能なため、コンピュータや録画・撮影機器、表示機器、および画像データや動画データは、24ビットカラーを取り扱える最大の色数とするものが多い。

24ビットの色情報に加えて8ビットの追加の情報を加え、1画素あたり32ビットで表す方式は「32ビットカラー」という。8ビットは256段階の透明度(透過度)を表すのに用いることが多いが、単に32ビット単位でデータを扱うために何も記録しない場合もある。

24ビットカラーと32ビットカラーを合わせて「フルカラー」(full color)あるいは「トゥルーカラー」(true color)と呼ぶこともあるが、24ビットをフルカラー、32ビットをトゥルーカラーと呼び分ける場合もある。あまり一般的ではないが、16ビットや32ビット以上も含め原色の階調情報を組み合わせた色表現方式の総称をフルカラー、そのうち24ビットあるいは32ビットの方式をトゥルーカラーとすることもある。

Webセーフカラー 【ウェブセーフカラー】

Webページを多色表示が困難な環境で閲覧する場合でも最低限確保されるべきとされた216色の集合。8ビット256色のインデックスカラー(パレットカラー)しか利用できない環境でも様々な色味が利用できるように定められたもので、事実上の業界標準として広まっている。

RGB(赤緑青)各色を16進数の「00」から「FF」まで均等に6段階の「00」「33」「66」「99」「CC」「FF」に分割し、「#336699」「#FF66CC」といったようにこれらの値の任意の組み合わせで色を定義する。「#000000」(黒)から「#FFFFFF」(白)までの間に、赤(R)6段階×緑(G)6段階×青(B)6段階の計216色が定義される。

値を等間隔に区切って機械的に組み合わせたものであるため、視覚的に区別する必要が薄い暗色側が豊富な一方、明色側は逆に大雑把すぎてデザインに用いるには難しい配色となっている。フルカラー表示が一般的になった現在はほとんど意識されることはない。

周波数

規則正しく繰り返される現象の、単位時間あたりの繰り返し回数のこと。1秒あたりの繰り返し数を「Hz」(ヘルツ)という単位で表す。

音や光、電波、電気信号などの性質の記述によく用いられ、1秒間に1回繰り返す現象は1Hzとなる。1回の繰り返しにかかる時間の長さを「周期」(cycle)というが、これは周波数の逆数となる。

クロック周波数

コンピュータ内部の回路間や装置間の通信、デジタル伝送方式による機器間の通信などでは、信号を伝送するタイミングを揃えるためにクロック信号と呼ばれる周期的な電気信号を利用する。

このクロック信号の周波数が高ければ高いほど、単位時間あたりに多数の伝送や処理を行うことができ、伝送速度や処理性能を高めることができる。

1970年代の初期のマイクロプロセッサは数百kHz(キロヘルツ:1kHzは1000Hz)で動作していたが、半導体技術の急速な発展により現代では数GHz(ギガヘルツ:1GHzは10億Hz)で動作するチップが一般的になっている。

電磁波の周波数

電磁波は周波数により大きく特性が異なり、周波数の範囲によって呼び名が代わる。真空中では光速を周波数で割ると波長に、波長で割ると周波数になるという関係にある。

概ね3THz(テラヘルツ:1THzは1兆Hz)以下のものは「電波」(radiowave)と呼ばれ、放送や通信、レーダーなど様々な用途で広く活用されている。

概ね400~800THzは人間の目に光として認識される「可視光線」(visible light)で、単に光とも呼ばれる。人間の視覚は光の周波数の違いを色の違いとして知覚し、例えば最も低い領域は赤く、最も高い領域は紫に見える。可視光と電波の中間は「赤外線」(infrared:「赤い光より低い」の意)、可視光より高い周波数は「紫外線」(ultraviolet:「紫の光より高い」の意)である。

紫外線より高く、概ね30PHz(ペタヘルツ:1PHzは1000兆Hz)以上の領域は「X線」(エックス線)、さらに高い3EHz(エクサヘルツ:1EHzは100京Hz)程度より上の領域は「γ線」(ガンマ線)と呼ばれ、両者は放射線の一種に分類される。

音波の周波数

音は周波数によって高さが決まり、小さい周波数の音は低く、大きな周波数の音は高く聞こえる。人間の聴覚で聞き取れる可聴周波数は概ね20~20000Hz(20kHz)程度と言われ、それより低い低周波音や高い超音波は聞くことができない。

この範囲には個人差があるほか、加齢により高音(上限に近い周波数の音)が次第に聞こえなくなっていくことが知られている。動物の中にはこのような人間には聞こえない低いあるいは高い音を利用してコミュニケーションや反響定位(エコーロケーション)を行うものもいる。

Hz 【Hertz】

周期的な現象の頻度を表す単位で、1秒あたりの生起回数(毎秒何回起きるか)を示したもの。1ヘルツは毎秒1回を意味し、周波数や振動数の単位として用いられる。

国際単位系(SI)に定められた単位で、19世紀に電磁波の研究をしていたドイツの物理学者、ハインリヒ・ヘルツ(Heinrich Rudolf Hertz)の名に由来する。基本単位の組み合わせ(組立単位)としては秒(s:second)を用いてその逆数「/s」「s-1」で表される。

ヘルツは周期が一定の現象についてのみ用いられ、同じ1秒あたりの数を表していても、ランダムに起きる事象の頻度などには「/s」(毎秒)が、1秒あたりの原子核の崩壊数については「Bq」(ベクレル)が用いられる。

ITの分野では、無線電波の周波数や電子回路の同期信号(クロック信号)の周波数、音声のサンプリング周波数などの単位としてなじみ深い。値が大きい場合は接頭辞をつけて、1000倍を「kHz」(キロヘルツ)、100万倍を「MHz」(メガヘルツ)、10億倍を「GHz」(ギガヘルツ)、1兆倍を「THz」(テラヘルツ)のように呼ぶ。

サンプリング周波数 【標本化周波数】 ⭐⭐

アナログ信号をデジタルデータに変換する際に、信号の変位を測定するサンプリング(標本化)を行う頻度。1秒間に何回サンプリングを行うかをHz(ヘルツ)で表す。

音声など連続的に変化する物理量をデジタルデータとして記録するには、ある瞬間の信号の変位量を測定するサンプリングを行い、得られた測定値を一定の桁数の離散値で表す量子化を行う。

この変換処理の頻度が標本化周波数で、周波数が高いほど短いサンプリング周期で頻繁に標本を得るため、もとの信号をより忠実に記録することができるが、その分だけ変換後の単位時間あたりのデータ量は増大する。

サンプリング定理により、標本化周波数の半分の周波数の信号まで正しく再現できるとされる。例えば、音声信号の場合、人間の耳に聞こえる最も高い音は20kHz(キロヘルツ)程度とされるため、音楽CDなどの標本化周波数は44.1kHzに設定されている。

サンプリング周波数 【標本化周波数】

アナログ信号をデジタルデータに変換する際に、信号の変位を測定するサンプリング(標本化)を行う頻度。1秒間に何回サンプリングを行うかをHz(ヘルツ)で表す。

音声など連続的に変化する物理量をデジタルデータとして記録するには、ある瞬間の信号の変位量を測定するサンプリングを行い、得られた測定値を一定の桁数の離散値で表す量子化を行う。

この変換処理の頻度がサンプリング周波数で、周波数が高いほど短いサンプリング周期で頻繁に標本を得るため、もとの信号をより忠実に記録することができるが、その分だけ変換後の単位時間あたりのデータ量は増大する。

サンプリング定理により、サンプリング周波数の半分の周波数の信号まで正しく再現できるとされる。例えば、音声信号の場合、人間の耳に聞こえる最も高い音は20kHz(キロヘルツ)程度とされるため、音楽CDなどのサンプリング周波数は44.1kHzに設定されている。

サンプリング周期 【サンプリング間隔】

アナログ信号をデジタルデータに変換する際に、信号の変位を測定するサンプリング(標本化)を行う周期。ある瞬間に信号の標本を得てから次の標本を得るまでの間隔を秒で表す。サンプリング周波数の逆数。

音声など連続的に変化する物理量をデジタルデータとして記録するには、ある瞬間の信号の強度や変位量を測定するサンプリングを行い、得られた測定値を一定の桁数の離散値で表す量子化を行う。

この標本化処理は一定の周期で行われ、その間隔を標本化周期という。周期が短ければ短いほど高頻度で標本を得るため、もとの信号をより忠実に記録することができるが、その分だけ変換後の単位時間あたりのデータ量は増大する。

通常、標本化の頻度は周期の逆数であるサンプリング周波数で表される。例えば、周期が0.01秒であれば、周波数は100Hz(ヘルツ)で表される。音楽CDなどに記録されている音声信号は人間の耳が聞き取れる可聴音(約20kHzまでの音波)を収録するため44.1kHz(44100Hz)でサンプリングされているが、これは標本化周期で表すと1/44100で約0.0000227秒、22.7マイクロ秒となる。

サンプリング周期 【サンプリング間隔】

アナログ信号をデジタルデータに変換する際に、信号の変位を測定するサンプリング(標本化)を行う周期。ある瞬間に信号の標本を得てから次の標本を得るまでの間隔を秒で表す。サンプリング周波数の逆数。

音声など連続的に変化する物理量をデジタルデータとして記録するには、ある瞬間の信号の強度や変位量を測定するサンプリングを行い、得られた測定値を一定の桁数の離散値で表す量子化を行う。

この標本化処理は一定の周期で行われ、その間隔をサンプリング周期という。周期が短ければ短いほど高頻度で標本を得るため、もとの信号をより忠実に記録することができるが、その分だけ変換後の単位時間あたりのデータ量は増大する。

通常、標本化の頻度は周期の逆数であるサンプリング周波数で表される。例えば、周期が0.01秒であれば、周波数は100Hz(ヘルツ)で表される。音楽CDなどに記録されている音声信号は人間の耳が聞き取れる可聴音(約20kHzまでの音波)を収録するため44.1kHz(44100Hz)でサンプリングされているが、これはサンプリング周期で表すと1/44100で約0.0000227秒、22.7マイクロ秒となる。

標本化定理 【サンプリング定理】

アナログ信号をデジタル信号に正確に変換するには、元の信号の最大周波数の2倍のサンプリング周波数で標本化すればよいことを示した定理。

アナログ信号をデジタル化するには、一定の周期で振幅を計測して離散値に変換するサンプリング(標本化)処理を行う。この周期が短い(サンプリング周波数が高い)ほど、より高い精度で元の波形を記録することができるが、その分だけデジタル化後のデータ量は増大する。

どの程度のサンプリング周波数で記録すれば正確に元の波形を再構成できるかを示したのが標本化定理で、元の信号に含まれる最も高い周波数の2倍を超えるサンプリング周波数なら、デジタル化された後のデータから元のアナログ信号の波形を正確に再現できることを示している。

これは、デジタル化された信号からはサンプリング周波数の半分の周波数までの信号しか正確に復元できない、と表現することもできる。この再現可能な最大周波数(サンプリング周波数の半分)のことを「ナイキスト周波数」(Nyquist frequency)という。

ハイレゾオーディオ 【ハイレゾ音源】

CD(コンパクトディスク)の規格を上回る音質の音声データや、その録音・再生機器のこと。音声データは「ハイレゾ音源」と呼ばれることもある。

CDのオーディオ規格(CD-DA)では、音声をサンプリング周波数44.1kHz、量子化ビット数16ビットで記録すると定められており、これは、音圧を毎秒44,100回計測し、65,536段階の数値として表現することに相当する。

ハイレゾ音源はこのいずれかあるいは両方がより高い状態で音声を記録・再生できるようにしたもので、サンプリング周波数が高い場合はCDよりも高い音が記録・再生でき、量子化ビット数が高い場合はより繊細な音の違いを表現することができる。実際の製品では96kHz、24ビットといった仕様のものが多い。

業界団体のJEITAによる定義では、DAT(Digital Audio Tape)相当のサンプリング周波数48kHzについては除外され、これを超える周波数が求められる。また、日本オーディオ協会の定義では、これらの条件に加えて可逆圧縮形式(リニアPCM/FLAC/Apple Lossless等)またはDSD(Direct Stream Digital)形式による記録、マイクやアンプなど信号を扱う機器の特性についての規定が含まれる。

ノイズ

取り扱う対象となる信号やデータ、情報などの総体のうち、目的に照らして必要のない、余計な要素や部分のこと。

一般の外来語としては音響における「雑音」(不要な音)を指すことが多いが、ITの分野では、画像や映像、電気信号、電磁波(光や電波)、その他、様々な種類のデータや情報の集合について、目的に対して不要な要素や部分のことをノイズということがある。

音響ノイズ

録音時などに混入する音声のノイズには、周囲の環境音(騒音)や、台本などをめくる音(ペーパーノイズ)、口の開閉や発声時に舌や唇から生じる湿った音(リップノイズ)、マイクに強い風や息がかかった時に生じる「ボッ」という音(ポップノイズ)など、環境や人間に由来するものがある。

また、スピーカーとマイクを近づけすぎて音が循環してアンプが際限なく増幅してしまう「ハウリング」(キーンという大きな高音)や、磁気記録媒体の磁性体の不均一性から生じる「ヒスノイズ」(シューという小さな音)、電源から生じる電磁ノイズが低周波音として記録される「ハムノイズ」(ブーンという低い音)など、機器に由来するものもある。

電磁ノイズ

電気通信や無線通信では、金属製の通信線を流れる電気信号や空中を伝わる電波に対する外部からの電磁的な干渉・撹乱がノイズとなり、信号の波形を歪めて情報の伝送を妨げる。

原因や発生源によってパターンや強さは様々で、通信線内を流れる自由電子の熱振動に起因する熱雑音や、機器の電源の開閉に伴い生じる接点ノイズ、複数の伝送路の合流時にノイズが増幅される流合雑音などがよく知られる。

近くの通信線を流れる信号が電磁的に漏れ出て混信する漏話(クロストーク)や、無線電波に他の機器の出す同じ周波数の電磁波が干渉する電波障害などはEMI(Electromagnetic Interference:電磁妨害)と呼んでノイズと区別する場合もある。

ノイズの大きさ

電気回路などの品質などを表す指標で、信号に対するノイズの量を対数で表したものを「S/N比」(SNR:Signal-to-Noise Ratio)という。

信号とノイズのパワー比の常用対数を求め、値を10倍して「dB」(デシベル)という単位で表す。この値が高いほどノイズが少なく品質が高いことを示している。

電気信号や無線電波などの場合は、搬送波の信号に対するノイズの比を「C/N比」(Carrier-to-Noise ratio)ということもある。ノイズと混信を区別する場合は、混信の強さを表す指標として「SIR」(Signal-to-Interference Ratio:信号対混信比)などが用いられることもある。

PCM 【Pulse Code Modulation】 ⭐⭐

音声などのアナログ信号をデジタルデータに変換する方式の一つ。信号の強度を一定周期で標本化(サンプリング)したもの。そのまま保存すれば非圧縮音声データとなる。

音波をマイクなどでアナログ電気信号に変換し、その強度をサンプリング周波数に従って一定周期で測定する。各測定値は定められた量子化ビット数の範囲で整数値として記録する。

例えば、CDの音声はサンプリング周波数44.1kHz(キロヘルツ)、量子化16ビットのPCM方式で記録される。これは毎秒44,100回信号を測定し、その強度を65,536(216)段階の値で表していることを意味する。

サンプリング周波数と量子化ビット数を高めるほど高品質のデータを得ることができるが、その分データ量は増大する。標本化定理により、サンプリング周波数の半分の周波数までの信号は再現可能とされており、これを「ナイキスト周波数」という。

音声の場合は人間の可聴音の上限が20kHz程度であることが知られており、40kHzを超えるサンプリング周波数を用いれば録音データからおおむね自然な音が再生できるようになると言われる。

通常のPCM方式は「リニアPCM」(LPCM:Linear PCM)とも呼ばれ、毎回の標本化で得られたデータを単純に順番に並べた形式だが、一つ前のデータとの差分を記録していく方式を「DPCM」(Differential PCM:差分PCM)という。

さらに、DPCMの各標本の量子化ビット数を直前の標本の変動幅に応じて適応的に変化させる方式を「ADPCM」(Adaptive Defferential PCM:適応的差分PCM)という。PCMとほぼ同じ品質を保ちながら符号化後のデータ量を削減できるため、実用上はこちらが用いられることも多い。

MP3 【MPEG Audio Layer-3】

音声データを圧縮する方式およびファイル形式の一つで、動画圧縮方式のMPEG-1で音声を記録するために策定されたもの。最も普及している音声圧縮形式の一つである。

元のデータを一定の規則に従って改変し、人間の聴覚が感じ取りにくい部分のデータを間引くことによって高い圧縮率を得ており、元のデータが完全には保存されない非可逆圧縮(不可逆圧縮)形式である。標準のファイル拡張子は「.mp3」。

ビットレート(1秒あたりの情報の表現に費やすデータ量)は32kbps(キロバイト毎秒)から320kbpsまで選択でき、音質を下げればより少ない容量に圧縮できる。CDに記録されたリニアPCM形式の無圧縮音声データ(サンプリング周波数44.1kHz、量子化16ビット、2chステレオ、ビットレート1411.2kbps)を圧縮する場合、概ね128kbps(約1/11)~192kbps(約1/7)程度までならほとんどの人にとって音質の違いが気にならないと言われる。

MP3は音声データの圧縮符号化方式(コーデック)とファイルへの格納形式(コンテナフォーマット)の両方を規定しているが、コーデックのみを使用してWAV(RIFF)ファイルなど他のコンテナ形式に格納したり、動画ファイルの音声部分に使用することができる。MP3ファイル形式には音声についての情報を記録する「ID3タグ」というデータ形式が規定されており、曲名やアーティスト名などを記録することができる。

歴史

MP3は1993年にドイツの産学連携研究機関、フラウンホーファー研究機構の集積回路研究所(Fraunhofer IIS)が開発したもので、同研究所は圧縮方式に関して特許を取得した。対応ソフトウェアの開発には特許使用料の支払いが必要なため、これを嫌ってMP3に対応しないメーカーなどもあった。2017年に特許権の保護期間が終了したため、現在では誰でも自由に利用することができる。

MPEG-1ではMP3の他に「Audio Layer-1」(MP1)および「Audio Layer-2」(MP2)の音声形式が規定され、それぞれ異なる方式で圧縮を行うため互換性はない。MPEG-2ではこれらに加えて「AAC」(Adavanced Audio Coding)と呼ばれる新しい方式が追加され、いずれかを選択して使用する形になった。MPEG-4では音声形式はAACに一本化されている。

AAC 【Advanced Audio Coding】

MPEG-2およびMPEG-4の一部として規定されている、音声の圧縮符号化方式の一つ。主に動画データに付随する音声データの記録に用いられるが、単体の音声ファイルとしても用いられることがある。

MPEG形式の動画データに含まれる音声データの標準圧縮方式の一つで、MPEG-1に採用され広く普及した「MP3」(MPEG-1 Audio Layer-3)の後継として、1997年にISOとIECが共同で標準規格を策定した。音声ファイル単体の圧縮方式としてもよく利用される。

サンプリング周波数は最大96kHz、使用できるチャンネル数は最大48チャンネルとなっており、MP3の48kHz、2チャンネルから大幅に拡張されている。圧縮方式の改良により、MP3に比べ同じ程度の音質なら1.4倍ほど効率よく圧縮することができるとされる。

MPEG形式の動画に付随する音声の記録に用いられ、AVIやMOV、MP4、Matroska(.mkvファイル)、MPEG-2 TS(.m2tsファイル)などの動画ファイルに含まれることがある。単体で音声ファイルとして記録されることもあり、音声ファイル形式として.m4aファイルや.aacファイル、.3gpファイル、.3g2ファイルなどが用いられる。

仕様のバリエーション

様々な拡張機能が用意されており、用途に応じて「プロファイル」(profile)と呼ばれる機能や設定値の組み合わせが定義されている。標準として設計されたのは「AAC-Main」方式だが、一般的な用途では基本機能のみで最も処理負荷の軽い「AAC-LC」(Low Complexity)が用いられることが多い。

MPEG-2規格(ISO/IEC 13818)に含まれる仕様(MPEG-2 AAC)と、これを拡張したMPEG-4規格(ISO/IEC 14496)に含まれる仕様(MPEG-4 AAC)がある。基本仕様は同一であり、通常はあまり区別されない。MPEG-4規格では低ビットレート時の音質を改善する拡張仕様が追加され、「HE-AAC」あるいは「aacPlus」と呼ばれる。

AIFF 【Audio Interchange File Format】

音声データを非圧縮状態で格納することができるファイル形式の一つ。米アップル(Apple)社が開発したもので、同社のmacOS(Mac OS X/旧Mac OSを含む)、iOSなどで標準的に利用される。

正確にはAIFF自体はファイルへのデータの記録形式を定めたコンテナフォーマットで、標準の音声データ形式として非圧縮のリニアPCM形式に対応している。WindowsにおけるWAV形式に近く、MacやiOSデバイスで非圧縮音声を扱う際の標準形式の一つとなっている。

オプションで圧縮データを記録する「AIFF-Compression」仕様が定められており、その場合はファイル拡張子に「.aifc」が用いられる。μLawやADPCMなどいくつかのコーデックが用意されているが、音声圧縮には他に有力な形式がいくつもあるためあまり使われていない。

1988年にApple社が開発し、MacintoshおよびMac OSで標準的に利用されてきたほか、Amigaシステム上でも標準の音声形式として利用された。Windowsなど他の環境のソフトウェアも、Mac環境との音声データの交換のためにAIFF形式によるデータの読み込みや書き出しに対応しているものが多く存在する。

WAV 【Waveform Audio File Format】

音声データを記録するためのファイル形式の一つ。Windowsが標準で対応している形式として有名で、通常は非圧縮PCM形式の音声データを記録する。

汎用のデータ記録用ファイル形式である「RIFF」(Resource Interchange File Format)形式を元に米マイクロソフト(Microsoft)社と米IBM社が共同開発したファイル形式で、音声信号をデジタルデータ化したものをファイルに記録する形式を定めている。ファイル名の標準の拡張子は「.wav」。

ファイル内でのデータの配置や格納方式のみを定めた「コンテナフォーマット」の一つであり、記録する音声データは様々な圧縮形式から選択することができる。特定の形式で記録されたデータを扱うには、その形式を扱うためのコーデック(CODEC:COmpressor/DECompressor)が必要となる。

標準では無圧縮のPCM方式(リニアPCM)のデータが記録されていることが多いため、「無圧縮の音声フォーマットである」と説明されることもあるが、PCM以外のコーデックを用いて別の形式のデータを記録することもできる。実際、WMA形式やMP3形式のWAVファイルも存在する。

PCM形式のWAVファイルはWindowsのオーディオ機能や音声を扱う多くのソフトウェアが標準で対応しているため、録音やデータ交換、マスターデータの保管などのために用いられることがある。無圧縮でデータが巨大になるため、最終的に配布などを行う際の形式として用いることは少ない。

WMA 【Windows Media Audio】

米マイクロソフト(Microsoft)社が開発した音声データの圧縮符号化方式。単体で保存する際の標準のファイル拡張子は「.wma」で、動画に付随する音声として動画ファイルに保存される場合もある。同社のWindowsなどが標準で対応している。

人間の聴覚では気付きにくいようにデータをわずかに改変したり間引くことにより劇的に圧縮効率を高める非可逆圧縮方式を採用しており、符号化時に利用者が希望する音質と圧縮率の組み合わせを段階的に選択することができる。高い音質なら低い圧縮率(圧縮後のデータが大きい)、低い音質なら高い圧縮率となる。

発表当初に音声圧縮の標準的な形式だったMP3(MPEG Audio Layer-3)とよく比較されたが、同社では同じ程度の音質ならWMAはMP3の半分程度のデータ量で済む(CD並みの音質を64kbpsで記録可能)としている。バージョンが上がるに連れてアルゴリズムが改良され、圧縮効率は向上している。

また、当初は単位時間あたり常に同じビット数で記録する固定ビットレート(CBR:Constant Bit-Rate)方式のみの対応だったが、バージョン9から変化の激しい箇所に多くのビット数を割り当てる可変ビットレート(VBR:Variable Bit-Rate)や、VBRの平均データ量が一定になるよう調整する平均ビットレート(ABR:Averate Bit-Rate)にも対応するようになった。

1999年に最初のバージョンが公開され、Windows Media Playerの更新に合わせて新バージョンが発表されてきた。派生仕様として可逆圧縮の「WMA Lossless」、声の録音に特化した「WMA Voice」、より高音質で多チャンネル(最高7.1ch)対応の「WMA Pro」が追加された。これらと対比して通常のWMAを「WMA Standard」ということもあるが、明記しなくても単にWMAと言えばこれを指すことがほとんどである。

MIDI 【Musical Instrument Digital Interface】

楽曲データの記述、保存、伝送などの方式を定めた標準規格の一つ。シンセサイザーなどの電子楽器やコンピュータを接続し、楽曲データを送信して自動演奏させるのに使われる。

機器間を接続してデータを送受信するための端子(コネクタ)やケーブル、信号、伝送制御などの規格と、音色や音量の指定、演奏する音の並びといった楽曲データの記述形式、楽曲データを保存するファイル形式などを定めた規格があり、単に「MIDI」と言った場合は何を指しているのか文脈に注意する必要がある。

MIDIによる楽曲データは楽譜などと同じように楽器による演奏の仕方を記述するデータ形式であるため、音声そのものを録音して記録する形式に比べデータ量が少なく、変換や編集などで劣化することもないが、利用できる音は楽器や音源装置が発することのできるものに限られる。例えば、人が歌唱する声を記録・再生することはできない。

MIDI規格は当初、コンピュータなどで作成した楽曲データを電子楽器に伝送して自動演奏することを想定して作成されたが、後に、コンピュータに内蔵されたICチップやソフトウェア(MIDI音源と呼ばれる)で音を合成して発する仕組みも利用されるようになった。携帯電話の音楽再生機能などで広く普及したことから、一般にはこちらの方が馴染み深い。

最初のMIDI規格は1981年に日本音楽製造(現ヤマハ)、ローランド、コルグ、河合楽器など業界の有力企業が共同で策定した。後に業界団体として国内に「MIDI規格協議会」(JMSC:Japan MIDI Standards Committee、現・音楽電子事業協会)、国際団体として「MMA」(MIDI Manufacturers Association)が置かれ、規格の標準化と普及にあたった。2020年には最新版の「MIDI 2.0」が発行された。

DTM 【デスクトップミュージック】

コンピュータで音楽の制作や編集、演奏などを行なうこと。「DTP」(デスクトップパブリッシング:印刷物の制作・編集をコンピュータで行うこと)をもじった和製英語で、英語で正確に対応する表現は無いが、いわゆる「打ち込み」に相当する “programming” が近い。

パソコンなどの汎用コンピュータ製品に音源モジュールやシンセサイザーなどの電子楽器を接続し、専門のソフトウェアを用いてデジタルデータとして譜面を作成・編集し、音源や楽器に転送して再生する。ピアノなどが弾ける人は、コンピュータに接続した鍵盤を弾いて実際に曲を演奏し、これを記録してデータに変換して入力するという方法を用いることもある。

楽器を弾いて録音、録画するのに比べ、スタジオや録音機材、楽器がなくても音楽制作ができ、自分で演奏できないものも含め一人で複数の楽器の音を操って音楽を奏でることが可能である。いつでも何度でも繰り返し演奏でき、細かな修正や調整もしやすい。

電子音や録音した音声などと組み合わせて楽器以外の音を取り入れた音楽を制作することや、人体では物理的に演奏不能な譜面を演奏させることもできる。近年では人間の発声データを元に任意の歌詞で歌声の合成を行うことができるソフトウェアも登場し、コンピュータだけでボーカル入りの楽曲を完成させられるようになっている。

DTMにおける楽曲データの記録や機器間の伝送には「MIDI」(Musical Instrument Digital Interface)と呼ばれる標準規格が用いられることが多い。パソコン上でDTMの作業を行うための専門のソフトウェアを「シーケンスソフト」あるいは「MIDIシーケンサー」などという。

シーケンサー機能に加えてレコーディングやミキシングなど音楽制作に必要な一通りの機能を備えた高度なソフトウェアパッケージのことを「DAW」(Digital Audio Workstation:デジタルオーディオワークステーション)と呼ぶことがある。

フレーム ⭐⭐

骨組み(を作る)、枠、縁、額縁、台、骨格、枠組み、背景、構造物、構成、組み立てる、枠にはめる、立案する、でっち上げる、などの意味を持つ英単語。IT分野では動画の各瞬間の画像(コマ)や、通信回線でやり取りするデータの送受信単位などを指すことが多い。

一般の外来語としては、絵画や写真などを入れる額縁や、画像の周囲を囲む飾り枠、機械などの骨組み、物事の理解の枠組みや共通の考え方などを意味することが多い。IT関連では主に以下の意味で用いられる。

動画のフレーム

動画を構成する一枚一枚の静止画(コマ)のことをフレームという。コンピュータで動画を表示する際は、数十分の1秒といった極めて短い一定の時間間隔で次々に静止画像を切り替えて表示することで人間の目に動いているように見せている。

この一枚ずつの静止画像をフレームという。動画の滑らかさの指標として、1秒間に書き換えるフレームの数を表す「fps」(frames per second:フレーム毎秒)という単位がよく用いられる。例えば、60fpsの動画といった場合は毎秒60枚の画像を切り替えて表示している。

データの送受信単位としてのフレーム

イーサネット(Ethernet)などいくつかの通信方式や通信プロトコル(通信規約)では、データの送受信単位をフレームと呼ぶ。送りたいデータを一定の大きさに分割し、先頭に宛先アドレスなどの制御情報を付加したもので、最大長や制御情報の形式は各規格ごとに定められている。

一般に、物理層における信号の送受信を一定のまとまりのデータ単位ごとの送受信に編成する「リンク層」あるいは「データリンク層」における送受信単位をフレームと呼ぶことが多い。有線LANの標準であるイーサネットの送受信単位は「MACフレーム」あるいは「イーサネットフレーム」と呼ばれる。

Webページ/HTMLのフレーム表示

Webページの表示手法の一つで、Webブラウザの表示領域を縦または横に複数の領域に分割して、それぞれに別のページを表示できるようにしたものをフレームという。HTMLではframeset要素(タグ)およびframe要素で定義する。

また、ページ内に矩形(箱型)の領域を設けて元のページから分離し、別のページの内容を埋め込んで表示する方式もあり、「インラインフレーム」(inline frame)という。広告の表示などに応用されており、HTMLではiframe要素で定義する。

フレームレート ⭐⭐⭐

動画像の表示の滑らかさを表す指標の一つで、動画が1秒あたり何枚の(静止)画像によって構成されるかを表す数。1秒あたりのコマ数。単位は「フレーム毎秒」(fps:frames per second)で、1fpsは動画が1秒あたり1枚の画像で構成されている(1秒あたり1回書き換えられる)ことを表す。

動画やゲームなど表示内容が時系列に変化する像をコンピュータで表示する場合、静止画像を高速に切り替えて表示することで動いているように見せている。動画像を構成する静止画像を「フレーム」(frame)と呼び、単位時間あたりのフレーム数が多ければ多いほど自然に近い滑らかな動画像となる。

動画データなどの属性としてフレームレートという場合は、その動画が毎秒何枚の画像を繋ぎあわせてできたものなのかを表している。人間の目に自然な動画として映るのは概ね30fps程度かそれ以上と言われており、これを下回るとカクカクとぎこちなく動く印象を与えるとされる。

コンピュータや映像機器などの処理能力についてフレームレートという場合は、動画を撮影、記録、圧縮、再生などする際に、1秒あたりに処理可能な画像の枚数や画面の書き換え回数の上限を表す。動画の処理能力が高いほどフレームレートも高くなり、より滑らかな動画を作成したり再生したりできる。

一方、ディスプレイ装置の画面書き換え頻度を「リフレッシュレート」(refresh rate)と呼び、1秒あたりの書き換え回数を「Hz」(ヘルツ)で表す。60Hzなら毎秒60回再描画される。動画データやゲームのフレームレートが高くても、表示側のリフレッシュレートが低ければその上限がフレームレートの上限となる。

fps 【フレーム毎秒】 ⭐⭐

動画のなめらかさを表す単位の一つで、画像や画面を1秒間に何回書き換えているかを表したもの。30fpsの動画は1秒あたり30枚の静止画で構成され、約0.033秒(33ミリ秒)ごとに画像を切り替えて再生される。

コンピュータや映像機器が動画像の録画や再生を行う際、毎秒数十枚の静止画像を撮影あるいは描画することで連続的な動画を構成している。この静止画を「フレーム」(frame)と呼び、単位時間あたりの密度を「フレームレート」(frame rate)という。1秒あたりの画像数を表す単位としてfpsが用いられる。

fpsの値が小さいと一枚の画像が表示される時間が長くなるため、動きのカクカクとした不自然で低品質な動画となる。大きいと高頻度で書き換えが行われるため、滑らかで高品質な動画となる。アナログテレビ放送が25~30fps程度だったことから、概ねこれ以上の大きさであれば自然で高品質な動画であるとみなされるが、近年では60fpsの高品質な動画に対応した機器が増えている。

フィールド毎秒

インターレース方式の動画や表示装置では、一度の書き換えで上から奇数番目と偶数番目のラインを交互に書き換えるため、2回の書き換えで全体が入れ替わるようになっている。この半分の画像を「フィールド」と呼び、フィールドを書き換える頻度として「フィールド毎秒」(fields per second)という単位が用いられることがある。この値は一般にfpsの2倍となる。

リフレッシュレートとの関係

ディスプレイ装置は高速で画面を書き換えることで表示内容の変化を表現する。1秒あたりの書き換え頻度を「リフレッシュレート」(refresh rate)と呼び、「Hz」(ヘルツ)という単位で表す。30Hzであれば毎秒30回画面を書き換えることを意味する。

動画やゲームが60fpsで書き換えを行っていても、ディスプレイが30Hzで動作していれば、表示内容は毎秒30回しか書き換わらない。逆に、ディスプレイが60Hzで動作していても、コンピュータ側の動画像の表示が30fpsであれば、やはり書き換え頻度は毎秒30回となる。

動画もディスプレイも同じ頻度で再描画していても、描画のタイミングがずれると表示が乱れることがある。例えば、60fpsの動画を60Hzのディスプレイで映す際、フレーム描画が始まるタイミングと画面リフレッシュが始まるタイミングが1/120秒ずれていると、毎回のリフレッシュで上半分が最新のフレームの内容、下半分が1コマ前のフレームの内容となってしまい、上下が繋がらず微妙にズレた表示となってしまう。この現象を「ティアリング」(screen tearing)あるいは「テアリング」という。

AVI 【Audio Video Interleave】

米マイクロソフト(Microsoft)社が開発した、動画を保存するためのファイル形式の一つ。動画と付随する音声を記録・再生するためのもので、同社のWindowsをはじめ様々なソフトウェアが対応している。

データをファイルにどのように記録するかを定めた記録形式(コンテナフォーマット)であり、動画データや音声データの圧縮符号化方式を定めたものではない。標準のファイル拡張子は「.avi」である。

主な動画の圧縮方式としてはMPEG-1/MPEG-2/MPEG-4やWMV、H.264、H.264、Motion JPEGなどに、音声の圧縮方式としてはリニアPCM、MP3、AAC、WMA、AC-3、FLACなどに対応し、これ以外にも数十の形式に対応している。

AVI形式のファイルを再生するには、圧縮時に使われた符号化プログラム(コーデック)と同じものを再生ソフトに組み込んでおく必要があるが、ファイル名の拡張子は内部形式によらず常に「.avi」であるため、標準的でない形式だとどのコーデックが必要なのか分からない場合もある。

1990年代前半に策定された形式で、Windows上でメディアデータを格納する際に用いられる「RIFF」(Resource Interchange File Format)というファイル形式を元に開発された。音声(audio)と動画(video)を交互に折り混ぜた(interleave)構造になっていることが名称の由来とされる。

古い時代のコンピュータの仕様に合わせた形式であるため、現代では不都合となる制約が含まれる。例えば、ファイル末尾まで読み込まなければ正しく再生できないためストリーミング再生に向いていない、2GBを超えるファイルを作成できない、可変フレームレートの動画に対応していないといった点である。1996年に「AVI 2.0」と呼ばれる拡張仕様が追加されており、ファイルサイズの問題は緩和されている。

H.264 【MPEG-4 AVC】

2003年5月にITU-T(国際電気通信連合)によって勧告された、動画データの圧縮符号化方式の標準規格。2010年代に動画配信やデジタルテレビ放送、デジタルビデオカメラなどで広く普及した。

H.264は携帯電話のテレビ電話といった低画素数、低画質の用途から、HD画質のデジタルテレビ放送などの高画素数、高画質の動画まで幅広い用途に用いることができる。前世代のMPEG-2やH.263に比べ圧縮効率が改善されており、同じ画質なら概ね半分程度のデータ量で済むようになっている。

2007年にISOとIECによってMPEG-4規格の追加仕様(MPEG-4 Part 10)の一つとして「Advanced Video Coding」(AVC)の名称で同じ内容が勧告されているため、「H.264/MPEG-4 AVC」「H.264/AVC」のように両者の呼称を併記することが多い。

H.264の符号化の基本的な方式はH.263などの従来方式を踏襲しており、動き補償、フレーム間予測、DCT(離散コサイン変換)、エントロピー符号化などを組み合わせたアルゴリズムを利用する。それぞれの技術について、浮動小数点演算を整数演算で代替するなど処理方式を改良したり、新しい技術を取り込むことにより従来方式よりも優れた圧縮率を達成している。

フレーム予測技術や圧縮符号化方式(圧縮アルゴリズム)に関していくつかの方式から選べるため、それらの組み合わせが「プロファイル」として複数定義されている。目的に応じて使い分けることで、要求される処理性能やビットレートの違いに柔軟に対応できる。

MPEG-4では当初別の動画圧縮方式が定義されていたが、より効率の良いAVC方式が策定されたことにより、2000年代後半以降はこのAVC形式が一般的となっている。MP4ファイルに格納される動画データの大半は実際にはこの形式である。

一部のデジタル放送方式やAVCHDおよびAVCREC、Blu-ray Discのコーデックの一つにも採用されている。Adobe FlashのFlash Video(FLV)のコーデックに採用されたことからインターネット上の動画共有サービスなどにも広く採用された。現在はFlashが廃止されたこともありネット上の動画形式は後継世代のVP9やAV1、H.265などへ移行中である。

MPEG 【Moving Picture Experts Group】

動画・音声データの圧縮方式の標準規格を検討するため、ISO(国際標準化機構)とIEC(国際電気標準会議)が1988年に合同で設置した専門家委員会。また、同委員会の勧告した規格群の総称。動画・音声データの圧縮方式の標準として広く普及している。

正式な組織名は「ISO/IEC JTC 1/SC 29/WG 11」。ISOとIECが情報技術分野の標準化を合同で行うために設けた第一合同技術委員会(JTC 1)の副委員会(SC:subcommittee)29番、作業部会(WG:Working Group)11番という意味である。

同じSC 29には静止画像の圧縮符号化方式を扱う「WG 1」があり、「JPEG」(Joint Photographic Experts Group)の通称でよく知られている。ちなみに、SC 29の国際事務局は日本の工業標準調査会(JISC)が務めている。

これまでに、動画データ圧縮方式の「MPEG-1」や「MPEG-2」「MPEG-4」、付随する音声圧縮規格の「MP3」(MPEG Audio Layer-3)などの標準を策定してきた。メディアデータの圧縮符号化方式だけでなく、動画を扱うためのファイル形式や送信データ形式、メタデータの記述方式などの標準も策定している。

国際電気通信連合(ITU-T)とも連携し、「MPEG-2」と「H.262」、「MPEG-4/AVC」と「H.264」、「HEVC」と「H.265」のように合同で同じ仕様を策定し、それぞれが規格番号を付して標準として発表している規格もある。

MPEG諸規格は国際標準として仕様が公開され、誰でも入手して製品などに実装することができるが、一部の規格には企業などの特許技術を含み、権利者に別途ライセンス料を収める必要がある。MPEG-2およびMPEG-4では権利者が合同で特許管理団体MPEG LAを運営しており、窓口が一元化されている。

MPEG-4 【Moving Picture Experts Group phase 4】

動画・音声データの圧縮方式の国際的な標準規格の一つ。ISO(国際標準化機構)とIEC(国際電気標準会議)の合同作業部会であるMPEG委員会がMPEG-2に次いで策定した規格で、1999年にISO/IEC 14496として最初の仕様が発行された。

MPEG-1/2の主な用途として想定された蓄積型メディア、放送・通信などに加え、携帯端末や携帯データ通信の普及を見据え、低速な通信回線でも実用に耐える仕様として規格化が進められた。動画・音声データの圧縮・符号化(正確には復号)方式の標準に加え、データを格納するためのファイルフォーマットや様々な映像関連技術の標準仕様を規定している。

圧縮符号化方式

MPEG-4における動画圧縮方式は二つあり、一つは当初規定された「ISO/IEC 14496-2」である。これは以前に標準化されたMPEG-1/2およびITU-TのH.263標準を参考に、離散コサイン変換(DCT)やエントロピー符号化、動き補償、フレーム間予測などの技術を基盤に構成され、さらに人間の体や顔(表情)などを3Dグラフィックスで合成する技術など野心的な仕様も盛り込まれた。

もう一方は2007年に追加された「ISO/IEC 14496-10」、通称「MPEG-4 AVC」(Advanced Video Coding)である。ISO/IECがITU-T(国際電気通信連合・電気通信標準化セクタ)と共同で策定したため、ITU側では同じ規格を「H.264」として標準化している。現代では一般にMPEG-4形式という場合はこちらを指すことが多い。

ISO/IEC 14496-2が撮影された映像の圧縮に留まらず様々な映像生成・制御技術を取り込んで肥大化してしまい、そのほとんどが利用されなかった反省を踏まえ、AVCは一般的な動画の圧縮・伸張に特化した仕様となっている。浮動小数点演算を整数演算で代替するなど処理方式を改良することにより、同じ画質でより高い圧縮率を得ることができる。

音声の圧縮方式「MPEG-4 Audio」では数十の形式を規定しており、情報の損失のないロスレス圧縮方式や楽器の演奏データを表現するMIDI形式などが利用できるようになった。最もよく使われる形式はMPEG-2 AACとほぼ同じMPEG-4 AAC形式だが、用途に応じてLC-AAC(Low Complexity AAC)やHE-AAC(High Efficient AAC)などの派生形式が追加された。

格納形式と用途

MPEG-4では米アップル(Apple)社のQuickTime技術を元に動画・音声を格納するための「MP4ファイル形式」を定めており、一般的には「.mp4」という拡張子が用いられる。ファイル形式は符号化方式とは分離されており、様々な形式のデータを格納できるため、MP4ファイルであっても動画や音声の圧縮方式がMPEG-4のものであるとは限らない。

MPEG-4は携帯電話の動画形式の標準である3GPP形式/3GPP2形式や、Blu-ray Discの動画記録形式の標準の一部、地上デジタル放送の移動体受像機向けの1セグメント放送(ワンセグ放送)などに採用され、デジタルカメラやデジタルビデオカメラ、スマートフォンの動画撮影・録画機能の動画形式としてもよく利用されている。また、インターネット上のサービスやコンテンツにおける標準的な動画形式として広く普及している。

MOVファイル 【.movファイル】

米アップル(Apple)社が策定した、動画や音声などのデータを格納するためのファイル形式の一つ。標準のファイル拡張子は「.mov」あるいは「.qt」。マルチメディア技術「QuickTime」の一部として規定された。標準のファイル拡張子は「.mov」だが、「.qt」も用いられる。

動画や音声、画像、文字(メタデータや字幕など)など様々な種類のメディアデータを統合してファイルに格納するための記録形式(コンテナフォーマット)を定めた仕様で、動画や音声の圧縮形式には様々なものを選択することができる。

動画の圧縮方式としてはMPEG-1、MPEG-2、MPEG-4/H.264、H.263、DVなどを、音声の圧縮形式としてはMP3、AAC、Apple Lossless(ALAC)、WAV、MIDI(音楽)などを選択することができる。特定の圧縮形式のデータを作成あるいは再生するには、その形式に対応した「コーデック」(codec)というソフトウェアが必要となる。

様々な種類のデータを「トラック」(track)という単位で格納し、再生時に重ね合わせて出力する仕組みになっており、動画中の特定のタイミングで字幕を表示するといった複合的なメディア表現が可能となっている。

macOS(Mac OS/Mac OS X)やiOSなどApple社のソフトウェア製品で標準メディアファイル形式として利用されているほか、仕様が公開されているため、主要な動画ファイル形式の一つとして他のソフトウェアやメディア機器などでも広く普及している。

また、MOVを元に一部の仕様を拡張して、MPEG-4の標準のコンテナフォーマットである「MP4」ファイル形式(.mp4ファイル)が策定され、ISO/IEC 14496-12(MPEG-4 Part 14)として国際標準となっている。「Motion JPEG 2000」の標準ファイル形式(.mj2ファイル)もMOVをベースとした仕様である。

FLV 【Flash Video】

Adobe Flashが標準で利用するファイル形式の一つで、動画データの格納形式を定めたもの。標準のファイル拡張子は「.flv」。

動画や音声をファイルに格納する方式を定めたコンテナフォーマットと呼ばれる仕様で、データの圧縮符号化の方式自体は定めていない。動画圧縮形式としてはSorenson SparkやOn2 VP6などに、音声圧縮形式としてはMP3やADPCMなどに対応している。

Flashアニメーションには画像や音声などとともにFLV形式の動画を含めることができ、メディアプレーヤーやコーデックなどを別途用意しなくてもFlash Playerを組み込んだWebブラウザだけで再生することができる。これを利用して、Flashで作成した動画プレーヤーにビデオを埋め込んでWeb上でそのまま再生できる動画配信サービスなども提供された。

F4V (.f4vファイル)

Flash 9で導入された動画のコンテナフォーマットの一つで、動画形式としてH.264/AVC、音声形式としてAACに対応する。派生形式として、Adobe Primetime DRM(旧Adobe Access)によるデータを暗号化・保護に対応した.f4pファイル、音声のみを収録した.f4aファイル、オーディオブック形式の.f4bファイルなどがある。

DivX

米ディビックス(DivX)社が開発した動画データの圧縮形式、および、同形式への圧縮や展開を行うコーデック(CODEC)。基本的な圧縮・再生などが可能な無償版(DivX)と、設定項目などが豊富な有償版(DivX Pro)がある。

同社が配布しているパッケージには、コーデックとメディアプレーヤーの「DivX Player」、動画をDivX形式に変換できる「DivX Converter」、遠隔地の端末に配信することができる「Media Server」が同梱されている。有償のPro版ではDVDからの変換などの追加機能が利用できる。

DivX形式はMPEG-4標準を元に同社が独自に開発した圧縮方式で、他の形式に比べ高画質と高圧縮率を両立しているとして2000年代前半に人気を博した。動画圧縮にしか対応していないため、音声の圧縮符号化には別の方式で対応する必要がある。

動画データを格納するファイル形式(コンテナフォーマット)は当初Windowsなどで標準的に用いられるAVI形式が使用されたが、その後MKV(Matroska Video)形式が標準となり、他にMP4やMOVなどにも対応するようになった。AVI 2.0を拡張した独自のコンテナ形式である「DivX Media Format」(.divファイル/.divxファイル)も開発されたが、あまり利用されなかった。

ストリーミング

通信ネットワークを介して動画や音声などを受信して再生する際に、データを受信しながら同時に再生を行う方式。データが完結していなくても配信・視聴を始めることができ、ライブ配信などで用いられる。

従来はデータ全体の受信(ダウンロード)を完了してから再生する方式が一般的だったが、ストリーミングではデータをある程度受信した時点で再生を開始し、受信処理と再生処理を並行して進めることにより、利用者は短い待ち時間で視聴を開始することができる。

ストリーミングにより、ダウンロード型では実現が難しい、始まりや終わりの決まっていない放送局型の配信サービスを実現することができる。テレビ放送やラジオ放送の生放送・生中継のように、撮影や録音を行いながら同時に配信・視聴できる配信方式のことは「ライブストリーミング」(live streaming)という。

技術的には、専用のデータ形式や通信方式(プロトコル)を用い、受信したデータが視聴者側でファイルとして残らない方式をストリーミングと呼ぶことが多く、動画ファイルなどをダウンロードしながら同時に再生する方式(利用者の使用感はほとんどストリーミングと変わらない)は「プログレッシブダウンロード」(progressive download)という。

ライブストリーミング (live streaming)

通信ネットワークを通じて映像・音声を配信する手法の一つで、撮影・録音しながら同時にデータを圧縮・変換して視聴者へ配信する方式。いわばネットワークを通じた「生放送」。

視聴者側が末尾まで受信の完了を待たずに受信しながら同時に再生することをストリーミング(再生)というが、ライブストリーミングではこれに加え、配信側も撮影・録音とデータ送信を並行して行い、収録したものをわずかなタイムラグでリアルタイムに配信する。テレビやラジオの生放送・生中継に相当する配信方式である。

インターネット上で大規模にライブストリーミングできる動画サービスも普及しており、開催中のイベントやスポーツの試合の様子をリアルタイムに伝えたり、視聴者とリアルタイムにやり取りしながら進行する生放送番組などが人気を博している。

ストリーミングサーバ (streaming server)

映像や音声のストリーミング配信を行うコンピュータをストリーミングサーバという。そのような機能を提供するソフトウェアのことを指すこともある。多数のクライアントからの接続を受け付け、同時にストリーミング方式のマルチメディアデータを配信する。

ストリーミング方式のデータは通常のWebサーバから配信することも可能だが、サーバや回線への負担が大きいため、ストリーミングサーバを利用するのが一般的である。また、録画した映像をリアルタイムに配信(ライブストリーミング)するような作業は、専用のストリーミングサーバでなければ行えない。

以前は専用のソフトウェアと高性能なハードウェアが必要とされていたが、パソコンの高性能化や光ファイバーなどの高速回線の普及によって、小規模なストリーミングサーバは個人でも構築できるようになった。

プログレッシブダウンロード (progressive download)

動画や音声などのファイルをダウンロードしながら、全体の受信完了を待たずに同時に再生(を開始)すること。

データを受信しながら同時に再生するストリーミング視聴に似ているが、技術的にはストリーミングとは異なり、あくまでファイルのダウンロードであるため、事前に再生時間を決めずに連続的に視聴することはできず、サーバ側に任意の位置からの再生(送信)開始を指示することもできない。

また、通信エラーなどでデータの一部が損なわれた際、ストリーミングではそのデータを飛ばして次のデータを送信し、再生時間が遅延しないよう制御するが、プログレッシブダウンロードではデータを再送して完全なデータが揃えようとするため、再生が一時停止することがある。

ストリーミングで視聴したデータは再生後すぐに破棄されるのが一般的だが、プログレッシブダウンロードの場合はキャッシュファイルの形で記憶装置に永続的に保管され、次に同じものを再生する際にそこから再生することができる。

動画コーデック 【ビデオコーデック】

動画データを圧縮符号化(エンコード)したり、圧縮符号を展開して元の動画に復元(デコード)する装置やソフトウェアのこと。動画形式ごとに対応したコーデックを用意する必要がある。圧縮のみ(エンコーダ)あるいは復元のみ(デコーダ)を行うものもコーデックと呼ばれることがある。

動画データは静止画像を1秒あたり数十枚連ねたもので、画素数や長さによってはそのままでは膨大なデータ量になることがある。これをデータ圧縮技術を利用して短いデータに符号化し、あるいは展開して再生するのがビデオコーデックの役割となる。

動画は細部がわずかに異なっていても人間の目には違いが分かりにくいため、圧縮しやすいよう一部を改変したり情報を間引くなどして高い効率で圧縮する「非可逆圧縮」(不可逆圧縮)を行うのが一般的である。元のデータの数十分の一といった小さなデータに変換できるが、圧縮率を高めるほど画質が低下する。

動画に固有の事情として、各時点の静止画(コマ、フレーム)は前後のコマと似ているという性質がある。これを利用して、あるコマを静止画として記録した後、後続のコマは一つ前のコマとの差異のみを検出して符号化したり、画面内を移動する被写体についての情報を記録する(動き補償)などのテクニックが用いられる。

動画の圧縮符号化形式には様々な種類があり、コーデックによって対応形式が異なる。主な形式としてMPEG-1、MPEG-2、H.264/MPEG-4 AVC、H.265/HEVC、AV1などがある。動画再生ソフト(メディアプレーヤー)などには著名なビデオコーデックが複数内蔵され、様々な形式の動画を再生できるようになっていることが多い。ビデオコーデックが単体で提供され、ソフトウェアにプラグインやモジュールなどの形で追加できる場合もある。

なお、ほとんどの動画には音声が付随するが、ビデオコーデックは動画像(「絵」の部分)の処理のみに対応するため、音声データの圧縮や展開のためには「音声コーデック」(オーディオコーデック)が必要となる。再生ソフトなどには主要なビデオコーデックと音声コーデックがセットで組み込まれていることが多い。

トランジション

移行、推移、変遷、転移、変転などの意味を持つ英単語。ある状態から別の状態に移り変わること。分野によって、何らかの専門的な意味が与えられていることがある。

動画では、あるカットから別のカットへの切り替えや、その際に用いられる特殊効果などのことをトランジションという。例えば、前のカットを徐々にフェードアウトさせながら、次のカットをフェードインさせる「ディゾルブ」、前のカットに端から徐々に覆い被さるように次のカットが現れる「ワイプ」などの効果が該当する。

Webデザインでは、スタイルシート(CSS)のプロパティ変更時に徐々に変化するようアニメーションさせる特殊効果をCSSトランジションという。通常はプロパティを変更すると即座に見た目も変更されるが、transitionプロパティで移行にかかる時間を指定すると、中間の状態が表示され徐々に変化していく。

情報システムの管理では、ITサービスを本番環境へ移行させるプロセスを「サービストランジション」(service transition)という。ITILなどで規定されたサービスライフサイクルの段階の一つで、サービスデザインで設計されたサービスを実際に現場に導入する過程を指す。

ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる