オープンウェイトモデル【open-weights model】

オープンウェイトモデルとは?

機械学習モデルが学習によって獲得したパラメータ(重み)のデータを外部に公開し、誰でも自由に取得・実行・改変できるようにしたもの。誰でも使用できるオープンなAIモデルである。
オープンウェイトモデルのイメージ画像

ニューラルネットワークは、大量のデータを学習する過程で無数の数値パラメータを調整し、文章生成画像認識といった能力を身につける。各パラメータネットワーク内部のノード間で値を送り合うときに、どのノードからの入力をどのくらい重視するかを表す係数であるため、「重み」(weight)と呼ばれている。

通常、商用AIサービスでは、このモデル内部の重みはサーバ側で実行される推論プログラムなどで用いられ、利用する側から直接アクセスすることはできない。利用者は操作画面やAPIなどを通じて結果だけを受け取る形となる。一方、オープンウェイトモデルはこの重みそのものをファイルとして配布するため、利用者は自分の環境でモデルを再現し、直接動かすことができる。

重みが手元にあることで、クラウドサービスを経由せず自社サーバや個人のパソコンなどの上で推論処理を実行できる。外部にデータを送信しないため、機密情報を扱う業務での導入もしやすい。公開された重みを土台に専門データを追加学習させる「ファインチューニング」も比較的少ない計算量で行えるため、特定の業界や用途に特化したモデルを構築しやすい。

オープンウェイトは「オープンソース」と同一ではない。AIモデルにおけるオープンソースは、プログラムソースコードと学習データ、構築手順の完全な公開と自由な改変、再配布を認める概念を指すが、オープンウェイトモデルは重みを公開しても元になった学習データを非公開としたり、商用利用に制限を設けたりするケースが多い。利用の際は各モデルのライセンス条項を確認する必要がある。

オープンウェイトモデルは内部構造の検証がしやすく、少数の企業や特定の国による技術独占を避けられるという観点から、研究者や開発者の間で広く受け入れられている。ただし、重みが公開されている以上、有害コンテンツの生成を制限する安全機構を第三者が無効化することも技術的には可能であり、悪用リスクへの対処が難しいとの指摘もある。具体的な製品として、米メタ(Meta Platforms)社の「Llama」シリーズや米グーグル(Google)社の「Gemma」シリーズなどがよく知られている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。