ディープウェブ【deep web】インビジブルWeb

別名  :invisible web/深層ウェブ/深層Web

概要

ディープウェブとは、Web上の情報のうち、一般的なWeb検索エンジンからは到達できないもののこと。到達可能な「サーフェスウェブ」(surface web/表層ウェブ)と対比される。インターネット全体のコンテンツの大部分を占めるとされている。
ディープウェブのイメージ画像

インターネット上でアクセス可能な場所にあるWebページなどのうち、人間には閲覧することができるが、検索エンジンの巡回プログラムクローラー/ボット)が到達することができない形態の情報がある。このような、外部から検索を通じてたどり着くことが困難な情報資源をまとめてディープウェブと呼ぶ。

例えば、人間が検索キーワードを打ち込んで内容を引き出すようなデータベースサービスは、人間にとっては必要なキーワードを入力して閲覧することが可能だが、クローラーなどがリンクをたどって内容を網羅的に収集・登録(インデックス化)することはできない。

このような自動収集の難しい情報としては、スクリプトなどの動的な実行が必要なページ、会員登録や利用者認証、料金の支払いなどを行わないと閲覧できないページ、クローラーによるアクセスを拒否・遮断しているページ、企業などの組織内のイントラネット上のページなどがある。

このうちの多くは、会員向けサイトのようにアクセス制限によって誰でも自由にアクセスできないように運用されているサイトに存在する。現在はスクリプト実行が必要なページの多くはクローラーWebブラウザと同じようにアクセスできるようになっており、以前は技術的にアクセス困難だった一部のページは表層に現れるようになっている。

なお、似た用語に「ダークウェブ」(dark web)があり、こちらは「Tor」などのP2Pネットワークや匿名化技術を利用しなければアクセスできないWebサイト群である。非合法な情報やサービスの流通が行われているとの指摘がある。これらもディープウェブの一部を構成するが、ディープウェブ全体の中ではごく一部であり、ディープウェブ全体が違法な活動に関連するわけではない。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。