読み方 : ジーピーティーフォー

GPT-4

GPT-4とは?

オープンAIOpenAI)社が2023年に発表した大規模言語モデルLLM)。GPT-3.5から推論能力や文脈理解が大幅に向上し、文字情報(テキスト)と画像の両方を入力できるマルチモーダル構成となっている。質問応答、長文読解、コード生成、多言語処理など幅広いタスクで高い精度を発揮する。
GPT-4のイメージ画像

前世代のモデルがテキストのみを受け付けていたのに対し、GPT-4は画像も入力として扱える。写真の内容説明、図表の読み取り、手書きメモの解析(OCR)などに対応しており、画像に基づいた質問への回答も可能である。公開当初の出力はテキストのみであったが、マルチモーダルな入力処理は大きな特徴の一つとなった。

推論精度の向上は各種試験のスコアにも表れており、GPT-3.5では下位圏に留まっていた米国の司法試験模擬問題では上位10%程度の成績を獲得した。複数条件を含む複雑な指示や専門的な質問への対応精度も向上し、長い会話でも前後関係を保ちながら応答できるようになった。

ChatGPTの有料プラン「ChatGPT Plus」に採用されたほか、提携先である米マイクロソフト(Microsoft)社のBing検索やOffice製品群にも組み込まれた。APIとして外部にも提供されており、顧客サポート、文書作成支援、開発支援ツールなど多くの分野で導入が進んだ。一度に扱うことができるデータ量コンテキストウィンドウ)の大きい派生モデル(バリアント)も用意され、長大な文書の一括処理にも対応した。

人間による評価結果を反映した調整も行われ、不適切な出力を抑える仕組みが強化された。一方、誤った情報を自然な文章として生成する「ハルシネーション」(hallucination幻覚)は完全には解消されておらず、出力内容の確認は引き続き必要とされる。GPT-4を改良した「GPT-4 Turbo」や「GPT-4o」も順次公開されている。なお、OpenAIは前世代までは公表していたGPT-4のパラメータ数を発表していない。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。