可逆圧縮 【lossless compression】 ロスレス圧縮 / 可逆符号化
概要
可逆圧縮(lossless compression)とは、データ圧縮方式のうち、圧縮符号化の過程で元のデータを一切毀損せず、完全に元通りに復元できるように圧縮する手法のこと。主にファイル圧縮や通信プロトコルなど、データの種類を特定しない汎用の保存形式や伝送方式で用いられる。コンピュータプログラムや文字(テキスト)などのデータは、1ビットでも欠けたり変質するとその意味する内容自体が変わってしまうため、圧縮したデータを展開(解凍)したときに元のデータと完全に一致する可逆圧縮が行われる。
一方、画像や動画、音声などの場合には、人間の視聴覚が違いを感じ取りにくいように一部を省略・改変することで実質的な内容を維持しつつ劇的に圧縮率を高める「非可逆圧縮」(不可逆圧縮)が行われることがある。可逆圧縮は元のデータを完全に保存できるが、非可逆圧縮に比べ圧縮率は低い。
主な可逆圧縮アルゴリズムとしてはランレングス符号やハフマン符号、LZ77、LZSS、LZW、Deflateなどが知られる。ZIPやCAB、LZH、RAR、gzip、bzip2など汎用のファイル圧縮形式はすべて可逆圧縮を用いる。画像圧縮ではJPEGなどが非可逆圧縮、GIFやPNG、WebP、AVIF、Loassless JPEGなどが可逆圧縮である。
また、通常は非可逆圧縮が用いられることが多い音声圧縮でも、「ALAC」(Apple Lossless)や「FLAC」「WMA Lossless」など高音質のために可逆圧縮を用いるファイル形式があり、「ロスレス音源」と総称される。
なお、非可逆圧縮は実際には元のデータを圧縮しやすい状態に変換し、圧縮符号化自体は可逆圧縮アルゴリズムを用いて行うため、正確には圧縮方式そのものが可逆と非可逆に分かれているわけではないが、実用的にはこの変換処理も含めて圧縮方式や圧縮形式の仕様の一部とみなされるため、便宜上このような区分が常用されている。
(2019.7.4更新)