ファイル圧縮【file compression】

デジタルデータは「0」と「1」の数値の並びで構成されているが、実際のファイルには同じパターンの繰り返しや規則性が含まれることが多い。この性質を利用し、繰り返しを短い記号に置き換えるなどの方法でデータ全体のサイズを小さくする処理を「圧縮」(compress)という。圧縮後のファイルを元の状態に戻す処理は「伸張」(decompression)または「展開」「解凍」と呼ばれる。
圧縮の方式は「可逆圧縮」と「非可逆圧縮」の二種類に大別される。可逆圧縮は展開すると元のデータを完全に再現できる方式で、一文字の誤りも許されない文書ファイルやプログラムに用いられる。Zipや7z、gzipといった形式がよく知られており、複数のファイルを一つにまとめるアーカイブ機能と組み合わせて使われることも多い。
非可逆圧縮は、人間の目や耳では気づきにくい細かな情報をあえて削除することで高い圧縮率を実現する方式である。主に画像や音声、動画に使われており、画像のJPEGやPNG、音声のMP3、動画のH.264などの形式がある。元のデータには完全には戻せないため、圧縮率を高めすぎると画質や音質の低下につながる。
圧縮率はファイルの種類によって異なる。テキストファイルは繰り返しが多いため圧縮の効果が出やすく、元の半分以下になることもある。一方、すでに非可逆圧縮が施された画像ファイルや動画ファイルをさらにファイル圧縮にかけても、容量はほとんど減らない。一般に圧縮率が高い方式ほど処理に時間がかかる傾向がある。
現在ではオペレーティングシステム(OS)やアプリケーションにファイルの圧縮・展開の機能が組み込まれており、利用者が特別な操作を意識せずに扱える場面も多い。インターネット通信やクラウドストレージの普及した現在においても、データ転送のコスト削減や保存容量の効率的な活用のために、ファイル圧縮は広く使われ続けている。