読み方 : きばんモデル

基盤モデル【foundation model】

概要

基盤モデルとは、大規模データによる事前学習によって汎用的な表現能力を獲得し、様々な下流タスクへ再利用することが可能な機械学習モデルのこと。タスクごとにゼロからモデル設計と学習を行う手間を省き、微調整によって様々な用途に転用することができる。
基盤モデルのイメージ画像

従来、翻訳には翻訳用、要約には要約用のモデルを個別に開発する必要があったが、基盤モデルは自己教師あり学習などの手法を通じて大量の未整理データから統計的規則性を学習し、幅広いタスクに適用可能な内部表現を獲得する。用途に応じてわずかな追加学習や指示を与えるだけで、多種多様なタスクを遂行できるようになる。

基盤モデルを特定の用途で利用するには、その用途に適した学習データで追加学習を行う「ファインチューニング」(fine tuning)や、利用者が与えるプロンプトで例示や指示を行って振る舞いを制御する「コンテキスト内学習」(ICE:In-Context Learning)を行う。これにより、音声認識機械翻訳、画像分類、対話生成など様々な応用が比較的少量の追加データで実現可能となる。

開発者はゼロからモデルを構築する労力を省き、既存の強力なモデルを微調整することで、高度な機能を短期間で実装できるようになった。同一モデルを複数のサービスや製品に横断的に利用できるため、開発コストや運用コストの削減にも寄与する。オープンソースとして公開されている基盤モデルもあり、無償で入手して活用することもできる。

一方、著名な基盤モデルは社会の様々なサービスやシステムに組み込まれるため、そのモデルが持つ偏見や誤りが広範囲に波及するリスクも指摘されている。また、応用モデルの開発者が基盤モデルの詳細な内部構造や学習に用いた訓練データの全貌を知ることができず、解釈性や制御性の低下、安全対策や品質管理の困難化を招きやすいともされる。

資格試験などの「基盤モデル」の出題履歴

▼ ITパスポート試験
令7 問80】 AIにおいて,広範囲かつ大量のデータで訓練されたものであり,ファインチューニングなどによって文章生成AIのような様々な用途に適応できる特徴をもつものを何というか。
この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。