読み方 : きかいほんやく
機械翻訳【machine translation】
概要

古くから研究・開発されている分野で、1970年代の初期の研究では、文法や辞書に基づいて入力文を解析し、同じ語彙と構造を持つ翻訳文を出力する「ルールベース機械翻訳」(RBMT:Rule-Based Machine Translation) が主流だった。専門家が作成した膨大な文法規則と対訳辞書を用いる方式で、特定の分野や限定的な表現には高い精度を示す一方、汎用性や自然な表現の生成には限界があった。
1990年代になると、コンピュータの性能や記憶容量の増大を背景に、膨大な対訳データベースを解析して統計モデルを作成し、これに基づいて翻訳文を生成する「統計的機械翻訳」(SMT:Statistical Machine Translation)が登場した。ルールベース手法より流暢で自然な訳文を生成することができたが、十分な量の対訳コーパスが用意できない言語ペアでは利用できず、特定の誤りを修正して精度を向上させることができないなどの難点もあった。
2010年代には、ニューラルネットワークを応用した機械学習、特に、深い階層のネットワークを用いて学習を行うディープラーニングの技術が飛躍的に発展し、「ニューラル機械翻訳」(NMT:Neural Machine Translation)が主流となった。回帰型ニューラルネットワーク(RNN)やTransformerなど言語を扱うのに適したモデルが考案され、人間の翻訳に匹敵する精度の高い品質が得られるようになりつつある。
(2025.12.4更新)