自然言語処理 【NLP】 Natural Language Processing

概要

自然言語処理(NLP)とは、人間が普段使っている日本語や英語といった自然言語を対象として、コンピュータによる自動処理により解析や生成、変換などをう技術の総称。

日本語の書き言葉を対象とした自然言語処理では、文を単語などの最小単位(形態素)に分解する「形態素解析」、文の構造を調べる「構文解析」、単語の意味や語間の修飾関係を調べる「意味解析」、前後の文で得られる知識も用いて文意を確定する「文脈解析」などの段階で進めていく。

言語や表現形態によって必要な処理の内容が異なる場合がある。例えば、英語など単語間に空白を開けて文を記述する「分かち書き」をう言語では形態素解析は不要となるが、話し言葉を対象に音声認識う場合は形態素解析が必要となる。

自然言語処理では処理手順を定めたアルゴリズムだけでなく、その言語の語彙や文法、連語、慣用句などを知るための大量のデータが必要となる。単語の意味や読み、品詞、活用形などを機械可読な形式に整理した「辞書データや、構文解析済みの大量の文例を集めた「コーパス」などのデータ集合が利用される。近年では機械学習システムで自然言語処理をうための学習済みデータモデル(言語モデル)の開発も盛んにわれている。

自然言語処理の応用としては、Web検索エンジンや音声アシスタント、かな漢字変換システム、光学文字認識(OCR)、文書編集ソフトのスペルチェッカーや校正ツール音声認識(音声入力)や音声合成、機械翻訳、自動要約、テキストマイニングなどが挙げられる。

(2021.9.22更新)

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる