音声コーデック 【audio codec】 オーディオコーデック / audio coder/decoder
概要
音声コーデック(audio codec)とは、音声データを圧縮符号化(エンコード)したり、圧縮符号を展開して元の音声に復元(デコード)する装置やソフトウェアのこと。音声形式ごとに対応したコーデックを用意する必要がある。圧縮のみ(エンコーダ)あるいは復元のみ(デコーダ)を行うものもコーデックと呼ばれることがある。音声データは音波の信号強度を毎秒数万回(CD音質なら4万4100回)記録したもので、チャンネル数や時間の長さによってはそのままでは膨大なデータ量になることがある。これをデータ圧縮技術を利用して短いデータに符号化し、あるいは展開して再生するのが音声コーデックの役割となる。
音声は細部がわずかに異なっていても人間の耳には違いが分かりにくいため、圧縮しやすいよう一部を改変したり情報を間引くなどして高い効率で圧縮する「非可逆圧縮」(不可逆圧縮)を行うことが多い。元データの数十分の一といった小さなデータに変換できるが、圧縮率を高めるほど音質が低下する。
音声は動画ほど元のデータサイズが大きくないため、近年のストレージ容量の大容量化、容量単価の低下に伴い、完全に元の信号に復元できる(音質が全く劣化しない)「可逆圧縮」を行う音声形式および音声コーデック(ロスレスオーディオ)も広まっている。その場合は最高で1/3程度に圧縮できる。
音声の圧縮符号化形式には様々な種類があり、コーデックにより対応形式が異なる。汎用的な形式としてMP3、AAC、WMA、Vorbisなどがよく知られる。Bluetoothの音声伝送に用いられるSBCやaptX、LDACのように特定用途に特化したものもある。ALACやFLAC、WMA Losslessなどは可逆圧縮形式である。信号を記録した生データ、すなわち無圧縮(非圧縮)のリニアPCM形式も便宜上音声コーデックの一種として扱うことが多い。
音声コーデックは音楽や音声配信の再生などでは単体で用いるが、動画データに付随する音声データを展開して再生するのにも用いられる。メディアプレーヤーなどには主要な形式の音声コーデックが内蔵されていることが多く、後からプラグインなどの形で特定の形式に対応した音声コーデックを追加できるようになっていることもある。