読み方:ルールベースきかいほんやく
ルールベース機械翻訳 【RBMT】 Rule-Based Machine Translation
概要
ルールベース機械翻訳(RBMT)とは、コンピュータによる翻訳の手法の一つで、辞書や文法に基づいて入力文を解析し、同じ語彙と構造を持つ翻訳文を出力するもの。最も初期に構想された自動翻訳の手法である。単語の対訳を集めた辞書に相当するデータ集と、翻訳元と翻訳先の言語の文法を記述したデータを用意する。元の文の単語の品詞や活用形、文の構造を解析し、翻訳先の言語で対応する単語、対応する構文に置き換えて翻訳文を出力する。
人間が与えたルールに従って翻訳するため、原文と翻訳文の要素の対応関係がわかりやすく、特定の誤りについて辞書やルールを部分的に修正することも容易である。統計的機械翻訳と異なり、膨大な対訳集のない言語ペア間でも辞書と文法を用意できれば翻訳することができる。
一方、原文の構造に忠実に訳すため、訳文はいわゆる「直訳調」となり、翻訳先の言語の表現としては不自然だったり堅苦しかったりすることがある。多義的な単語のどの意味を選ぶかについて、人間は文脈や常識から判断するが、辞書と文法だけで特定することは難しい。口語のくだけた表現や慣用句なども苦手である。
初期のルールベース機械翻訳システムは1970年代に開発され、語彙や文法の似ている欧州の言語間などでは良好な結果を得られることもあった。1990年代になると大量の対訳集から統計的なパターンを見出して翻訳する「統計的機械翻訳」(SMT:Statistical Mathine Translation)が主流となり、ルールベースの手法はあまり用いられなくなった。
(2025.9.4更新)