スクレイピング 【scraping】

概要

スクレイピング(scraping)とは、削り、こすり、ひっかき、削屑などの意味を持つ英単語。ITの分野ではデータの整形や抽出をうデータスクレイピングを単にスクレイピングということが多い。

入手したひとまとまりのデータを解析し、不要な部分を削ったり、必要な部分だけを取り出したり、一部を置き換えたり、並べ替えたりして、目的に適う形式に整形することをスクレイピングという。

特に、人間が閲覧するために作成された文書ファイルなどから必要なデータなどを抜き出し、ソフトウェアでの自動処理に適したデータ形式で保存し直すことを指すことが多い。

Webスクレイピング (ウェブスクレイピング)

WebページWeb上で公開されているデータについて、ソフトウェアで処理しやすい形に整形したり必要な部分を抽出することをWebスクレイピングという。

必要なWebサイトやページを選んで巡回し、収集したWebページを解析して必要なデータを抽出、CSVファイルなど汎用的なデータ形式に整形・変換して保存する。

この過程の多くはソフトウェアによって自動化されるが、Webページの記述形式はサイトごとの個別性が高いため、対象や目的に合わせて個別にプログラム開発しなければならないことも多い。

(2020.5.3更新)

他の辞典による解説 (外部サイト)

この記事を参照している文書など (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる