ナレッジグラフ【knowledge graph】

概要

ナレッジグラフとは、対象となる事物や概念をノード(節点)として表し、それらの関係をエッジ(辺)として結び付けることで知識を構造化して表現するデータモデルのこと。人物、場所、出来事などの実体とその関係をグラフ構造として整理し、コンピュータが意味を自動処理しやすい形式で情報を構造化する。
ナレッジグラフのイメージ画像

世界に存在するさまざまな対象を「エンティティ」(entity)と呼ばれるノードとして表現し、それらの間の関係を「関係」や「述語」としてエッジで結ぶ。例えば、「人物―所属―組織」「都市―所在―国」「作品―著述―作者」といった関係を三つ組(主語・述語・目的語)として表現する手法がよく知られる。

このような知識の形式的な表現手法を「オントロジー」(ontology)と呼び、三つ組形式以外にも様々な形式が提唱されている。何らかのオントロジーに従って記述されたデータ群がナレッジグラフであると考えることもできる。技術標準としては「RDF」(Resource Description Framework)がよく知られており、Web上の情報をRDFに従って体系化する構想を「セマンティックWeb」という。

ナレッジグラフの概念自体は古くから存在するが、一般に広く知られるきっかけとなったのは、2012年に米グーグル(Google)社の検索エンジンの検索結果ページに表示されるようになった同名の機能「ナレッジグラフ」であるとされる。これは、検索結果の脇に、Wikipediaなどのオープンな情報源から収集した関連情報をまとめて表示するパネルである。

近年では、大規模言語モデルLLM)などを応用した生成AIとの組み合わせにも注目が集まっている。LLM文章生成に優れる一方で事実の正確性に課題があるとされ、ナレッジグラフと連携することで信頼性の高い事実情報を補完する手法が研究されている。RAGRetrieval-Augmented Generation検索拡張生成)と組み合わせた「GraphRAG」などの応用例が知られる。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。