読み方 : オープンエーアイオーワン
OpenAI o1
OpenAI o1とは?

従来の言語モデルは、入力に対して即座に応答文を生成する方式が主流であった。OpenAI o1では、問題を分解して段階的に検討するプロセスを内部で実行してから回答を返す。各段階の推論結果は「思考トークン」として内部的に消費され、利用者には最終的な回答のみが表示される。内部推論にかける時間が長くなるほど、回答の正確性が向上する傾向がある。
この仕組みは「思考連鎖」(CoT:Chain-of-Thought)の自動化とも言われる。複数の観点を内部で検討し、誤りや矛盾を減らす方向で応答が生成される仕組みで、「リーズニングモデル」(reasoning model)とも呼ばれる。ソフトウェア開発支援、数理分野の問題解決、研究補助などの用途で注目された。
性能評価では、国際数学オリンピックの予選問題や米国の司法試験、医師資格試験といった人間にとっても高い難易度のベンチマークで、同世代のGPT-4oを大きく上回るスコアを記録した。一方、内部推論に時間とトークンを費やすため、応答速度はGPT-4oより遅く、単純な質問や雑談には向かない。また、推論プロセスは利用者に開示されないため、どのように答えに至ったかを追跡することはできない。
提供形態はWebサービスおよびOpenAI APIを通じた利用が一般的で、当初は「o1-preview」と軽量版の「o1-mini」の2種類が公開された。同年12月には正式版「o1」がリリースされ、画像入力にも対応した。なお、生成AIに共通する課題として、事実と異なる内容を自然な文章で出力する「ハルシネーション」(hallucination:幻覚)現象があり、OpenAI o1も例外ではない。業務・研究用途では人間による確認作業が必要とされる。