読み方 : ウェイバックマシン

Wayback Machine【ウェイバックマシン】

Wayback Machineとは?

米国の非営利団体インタネットアーカイブ(Internet Archive)が運営するWebアーカイブサービス。過去のWebページを保存、公開しており、削除や更新がされた後も当時の状態で閲覧できる。
Wayback Machineのイメージ画像

クローラ(clawler)と呼ばれる自動巡回プログラムが世界中のWebサイトを定期的に巡回し、HTMLや画像、スタイルシートスクリプトといった構成要素をまとめて収集・保管する。1996年に収集が開始され、2001年に一般公開された。保存件数は一貫して増加し続け、2025年10月には延べ1兆ページを突破した。

利用方法はシンプルで、公式サイト(web.archive.org)に閲覧したいURLを入力するだけである。結果はカレンダー形式で保存日時の一覧として表示され、任意の時点のスナップショットを選んで閲覧できる。基本的に無料で誰でも利用可能であり、取得当時の状態のままページが再現される。

ただし、保存に関してはいくつかの制約がある。robots.txtで収集を拒否しているサイトやパスワード保護されたページはアーカイブされない。JavaScriptに依存した動的なコンテンツや外部サーバの要素は正確に再現されないケースもある。また、著作権者やプライバシーに関わる削除申請が認められれば、閲覧不能となる場合もある。ページ取得の間隔はサイトやページによるが、数か月に一度の場合もあり、その間の状態は確認できない。

広く一般に公開されているサービスであり、様々な用途で利用されている。廃止されたWebサービスの過去情報の確認、企業や公的機関のサイト変遷の検証、論文・報道においてリンク切れとなった資料の参照などである。法的な証拠収集や学術研究における引用文献の保全など、第三者機関による客観的な記録としての信頼性の高さから、研究者やジャーナリスト、法曹関係者などの実務でも活用されている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。