読み方 : ジーピーティーフォー
GPT-4
GPT-4とは?

前世代のモデルがテキストのみを受け付けていたのに対し、GPT-4は画像も入力として扱える。写真の内容説明、図表の読み取り、手書きメモの解析(OCR)などに対応しており、画像に基づいた質問への回答も可能である。公開当初の出力はテキストのみであったが、マルチモーダルな入力処理は大きな特徴の一つとなった。
推論精度の向上は各種試験のスコアにも表れており、GPT-3.5では下位圏に留まっていた米国の司法試験模擬問題では上位10%程度の成績を獲得した。複数条件を含む複雑な指示や専門的な質問への対応精度も向上し、長い会話でも前後関係を保ちながら応答できるようになった。
ChatGPTの有料プラン「ChatGPT Plus」に採用されたほか、提携先である米マイクロソフト(Microsoft)社のBing検索やOffice製品群にも組み込まれた。APIとして外部にも提供されており、顧客サポート、文書作成支援、開発支援ツールなど多くの分野で導入が進んだ。一度に扱うことができるデータ量(コンテキストウィンドウ)の大きい派生モデル(バリアント)も用意され、長大な文書の一括処理にも対応した。
人間による評価結果を反映した調整も行われ、不適切な出力を抑える仕組みが強化された。一方、誤った情報を自然な文章として生成する「ハルシネーション」(hallucination:幻覚)は完全には解消されておらず、出力内容の確認は引き続き必要とされる。GPT-4を改良した「GPT-4 Turbo」や「GPT-4o」も順次公開されている。なお、OpenAIは前世代までは公表していたGPT-4のパラメータ数を発表していない。