自然言語 【natural language】
概要
自然言語(natural language)とは、日本語や英語のように、人間が日常的な意思疎通や情報の伝達、記録、思考などのために用いる言語のこと。IT分野ではコンピュータ言語と対比する文脈でこのように呼ぶことが多い。人間が他の人間との間で会話などを通じて情報のやり取りをしたり、記録物の読み書きを行ったり、頭の中で思考や記憶を行なう際に用いる言語のことである。日常的に単に「言語」と言えば通常は自然言語のことを指すことが多い。
一方、ITの分野では、人間がデータやコンピュータへの命令などをコンピュータプログラムが自動処理可能な形で記述するために、語彙や文法が人工的に規定された言語を用いる。これを総称して「コンピュータ言語」(computer language)という。
用途や対象分野によってプログラミング言語、ハードウェア記述言語、マークアップ言語、スタイルシート言語、問い合わせ言語(クエリ言語)、モデリング言語など様々な種類に分かれる。これらの一部は人間同士の意思疎通や情報交換のために用いられることもあり、語彙や構文などを自然言語から拝借することも多い。
対義語として「人工言語」(artificial language)という用語が用いられることもあるが、これは自然言語と同じ人間同士の意思疎通のために人工的に作り出された言語(エスペラント語など)を指す場合と、コンピュータ言語のように自然言語とは異なる用途のために作られた言語を指す場合がある。情報理論などでは文法が形式的に定義された言語のことを「形式言語」(formal language)と呼び、これを自然言語と対置することもある。
なお、自然言語による情報を対象として、コンピュータによる自動処理により解析や生成、変換などを行う技術のことを「自然言語処理」(NLP:Natural Language Processing)という。人間がコンピュータで情報処理を行うための有力な支援機能であり、Web検索エンジンや音声アシスタント、かな漢字変換システム、光学文字認識(OCR)、文書編集ソフトのスペルチェッカーや校正ツール、音声認識(音声入力)や音声合成、機械翻訳、自動要約、テキストマイニングなどの形で実用化されている。