読み方 : ニューラルげんごモデル

ニューラル言語モデル【neural language model】

ニューラル言語モデルとは?

人間の脳神経回路を模倣したニューラルネットワークを用いて、自然言語の構造や意味をデータから学習した機械学習モデルのこと。大量の文字情報から単語や文節の関係を統計的に学び、ある文脈の後にどのような語が続くかを予測する。機械翻訳文章生成、要約、質問応答など、様々な自然言語処理の基盤として利用されている。
ニューラル言語モデルのイメージ画像

ニューラルネットワーク以前の言語モデルは、設計者が言語の語彙や文法を定義したデータを与えたり、直前の数個の単語の出現頻度を統計的に集計して確率を計算するといった手法が主流だった。これらは長い文脈の把握や多義的な語彙や表現への対応には限界があった。ニューラルネットワークの導入により、文例データを大量に与えるだけで言語の語彙や規則性を自動的に獲得できるようになった。

ニューラル言語モデルでは、単語や文字を「ベクトル」と呼ばれる多次元の数値列に変換して処理する。意味や用法が似た語は近いベクトルとして表現されるため、単純な一致では捉えられない語の関係も学習できる。例えば、「犬」と「猫」は異なる語だが、「動物」「ペット」などの文脈では一定の類似性、共通性を持っている。こうした関連性をモデル内部で表現できる。

モデルの構造は時代とともに変化してきた。初期は単純なフィードフォワードネットワークが用いられ、その後、系列データの処理に適した「リカレントニューラルネットワーク」(RNN)や「LSTM」(長・短期記憶)が考案された。2017年に提案された「Transformer」が普及すると状況は大きく変わった。このモデルは文中の語同士の関係を並列に計算する仕組みを持ち、長い文脈でも重要な箇所を適切に参照できる。これにより、翻訳や要約、質問応答など様々なタスクでの精度が大幅に向上し、自然言語処理の主流となった。

近年普及している「大規模言語モデル」(LLM)もニューラル言語モデルの一種であり、パラメータ数が数千億規模に達するものも登場している。膨大な文字データで学習されたモデルは、文章生成の能力を応用して対話や要約、プログラムコード生成などを行う。一方、学習データの量や品質、モデルの構造、学習方法によって性能が大きく左右され、文法的に自然な文章を生成できても内容の正確性が常に保証されるわけではない。流暢に作り話をする「ハルシネーション」(hallucination幻覚)などの課題もある。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。