読み方 : きばんモデル
基盤モデル【foundation model】
概要

従来、翻訳には翻訳用、要約には要約用のモデルを個別に開発する必要があったが、基盤モデルは自己教師あり学習などの手法を通じて大量の未整理データから統計的規則性を学習し、幅広いタスクに適用可能な内部表現を獲得する。用途に応じてわずかな追加学習や指示を与えるだけで、多種多様なタスクを遂行できるようになる。
基盤モデルを特定の用途で利用するには、その用途に適した学習データで追加学習を行う「ファインチューニング」(fine tuning)や、利用者が与えるプロンプトで例示や指示を行って振る舞いを制御する「コンテキスト内学習」(ICE:In-Context Learning)を行う。これにより、音声認識、機械翻訳、画像分類、対話生成など様々な応用が比較的少量の追加データで実現可能となる。
開発者はゼロからモデルを構築する労力を省き、既存の強力なモデルを微調整することで、高度な機能を短期間で実装できるようになった。同一モデルを複数のサービスや製品に横断的に利用できるため、開発コストや運用コストの削減にも寄与する。オープンソースとして公開されている基盤モデルもあり、無償で入手して活用することもできる。
一方、著名な基盤モデルは社会の様々なサービスやシステムに組み込まれるため、そのモデルが持つ偏見や誤りが広範囲に波及するリスクも指摘されている。また、応用モデルの開発者が基盤モデルの詳細な内部構造や学習に用いた訓練データの全貌を知ることができず、解釈性や制御性の低下、安全対策や品質管理の困難化を招きやすいともされる。
関連用語
資格試験などの「基盤モデル」の出題履歴
▼ ITパスポート試験
【令7 問80】 AIにおいて,広範囲かつ大量のデータで訓練されたものであり,ファインチューニングなどによって文章生成AIのような様々な用途に適応できる特徴をもつものを何というか。