ナレッジグラフ【knowledge graph】
概要

世界に存在するさまざまな対象を「エンティティ」(entity)と呼ばれるノードとして表現し、それらの間の関係を「関係」や「述語」としてエッジで結ぶ。例えば、「人物―所属―組織」「都市―所在―国」「作品―著述―作者」といった関係を三つ組(主語・述語・目的語)として表現する手法がよく知られる。
このような知識の形式的な表現手法を「オントロジー」(ontology)と呼び、三つ組形式以外にも様々な形式が提唱されている。何らかのオントロジーに従って記述されたデータ群がナレッジグラフであると考えることもできる。技術標準としては「RDF」(Resource Description Framework)がよく知られており、Web上の情報をRDFに従って体系化する構想を「セマンティックWeb」という。
ナレッジグラフの概念自体は古くから存在するが、一般に広く知られるきっかけとなったのは、2012年に米グーグル(Google)社の検索エンジンの検索結果ページに表示されるようになった同名の機能「ナレッジグラフ」であるとされる。これは、検索結果の脇に、Wikipediaなどのオープンな情報源から収集した関連情報をまとめて表示するパネルである。
近年では、大規模言語モデル(LLM)などを応用した生成AIとの組み合わせにも注目が集まっている。LLMは文章生成に優れる一方で事実の正確性に課題があるとされ、ナレッジグラフと連携することで信頼性の高い事実情報を補完する手法が研究されている。RAG(Retrieval-Augmented Generation:検索拡張生成)と組み合わせた「GraphRAG」などの応用例が知られる。