セマンティックWeb 【Semantic Web】

概要

セマンティックWeb(Semantic Web)とは、Webページに記述された内容について、それが何を意味するかを表す「情報についての情報」(メタデータ)を一定の規則に従って付加し、コンピュータシステムによる自律的な情報の収集や加工を可能にする構想。

1998年にWeb(WWW:World Wide Web)の創始者であるティム・バーナーズ・リー(Timothy J. Berners-Lee)氏が提唱し、同氏の主導するWeb関連技術規格の標準化団体W3C(World Wide Web Consortium)内のプロジェクトとして推進された。

背景と意義

Webページは主にHTMLHyperText Markup Language)を用いて記述されるが、これは主にWebブラウザが人間にデータを整形して見せるためのものであるため、データの種類や所在、配置、見栄えなどの記述が中心で、ソフトウェアが読み込んで意味のあるデータとして活用するには情報が不足している。

セマンティックWeb構想では、Webページ内のデータがそれぞれ何を表しているのかを一定の統一されたデータ形式に基づいて記述することで、ソフトウェアがサイトやページを横断して同種のデータを取得や比較、統合できるようにする。これにより、Webをある種の巨大な知識や情報のデータベースとし、様々なシステムが自らの必要とするデータを自律的に収集して組み合わせ、高度に知的な処理を効率的に行えるようにする。

技術仕様

具体的な技術仕様として、テキスト(文字)データの構造を統一的な形式で記述するXML(およびXML版HTMLであるXHTML)、XMLベースの記述言語を定義するXML Schema、様々な資源についての情報を記述する汎用的なデータ形式であるRDFResource Description Framework)などの規格(これらはセマンティックWebとは無関係に標準化済み)が用いられる。

また、自動化の肝となるメタデータの記述に用いられる共通の語彙やその分類体系、語間の関係性などを定義するオントロジーの記述言語としてOWL(Web Ontology Language)が定義された。

普及状況

規格の策定は2000年代前半に行われたが、技術体系が複雑で膨大だったことや、対応にコストがかかる割には個々のWeb開発者にとって短期的な分かりやすい利点が見えにくかったことなどから、上記の技術仕様自体がWeb上に広く普及する状況は今日まで実現していない。

ただし、Webページ内の要素に自動処理に役立つメタデータを付与するというコンセプト自体はその後様々な形で見られるようになり、Microdataやmicroformats、RDFa、JSON-LD、Schema.orgなどの技術やプロジェクトが一定の成功を収めている。

検索エンジンの検索結果ページに表示されるリッチスニペットや強調スニペットなどの応用例も知られている。これらはW3Cが構想した当初のセマンティックWebの仕様とは異なるが、広い意味でセマンティックなWebの実装例とみなすことができる。

(2019.1.29更新)

他の辞典による解説 (外部サイト)

この記事を参照している文書など (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。