重複排除 【deduplication】 デデュープ / デデュプリケーション

概要

重複排除(deduplication)とは、記憶装置(ストレージ)の管理などに用いられる技法の一つで、記憶領域全体の中から同じデータを探し出し、一つを残して他を削除することで記憶容量を節約する手法。バックアップシステムなどでよく用いられる。

削除した箇所には代わりに元のデータが記録された箇所への参照情報(アドレスなど)を書き込み、その箇所に記録されたデータが必要になったときは参照先から読み込むようにする。

一般的にコンピュータに保管されるデータは同じ内容がいくつも複製されていたり、異なる内容でも部分的に重複している場合がかなり存在するため、重複排除をなうことで必要な記憶容量を大幅に削減することができる。企業の業務用データなどでは数分の一から数十分の一まで削減できた事例もある。

重複箇所の検出や削除はファイル単位でう方式と、数KBキロバイト)程度の固定長ブロック単位でう方式、可変長ブロック固定長と区別するためにチャンクセグメントなどと呼ぶこともある)単位でう方式がある。後者ほど節約効果が高いが、処理が複雑で時間がかかるようになる。

(2020.4.11更新)

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる