オープンウェイトモデル【open-weights model】
オープンウェイトモデルとは?

ニューラルネットワークは、大量のデータを学習する過程で無数の数値パラメータを調整し、文章生成や画像認識といった能力を身につける。各パラメータはネットワーク内部のノード間で値を送り合うときに、どのノードからの入力をどのくらい重視するかを表す係数であるため、「重み」(weight)と呼ばれている。
通常、商用AIサービスでは、このモデル内部の重みはサーバ側で実行される推論プログラムなどで用いられ、利用する側から直接アクセスすることはできない。利用者は操作画面やAPIなどを通じて結果だけを受け取る形となる。一方、オープンウェイトモデルはこの重みそのものをファイルとして配布するため、利用者は自分の環境でモデルを再現し、直接動かすことができる。
重みが手元にあることで、クラウドサービスを経由せず自社サーバや個人のパソコンなどの上で推論処理を実行できる。外部にデータを送信しないため、機密情報を扱う業務での導入もしやすい。公開された重みを土台に専門データを追加学習させる「ファインチューニング」も比較的少ない計算量で行えるため、特定の業界や用途に特化したモデルを構築しやすい。
オープンウェイトは「オープンソース」と同一ではない。AIモデルにおけるオープンソースは、プログラムのソースコードと学習データ、構築手順の完全な公開と自由な改変、再配布を認める概念を指すが、オープンウェイトモデルは重みを公開しても元になった学習データを非公開としたり、商用利用に制限を設けたりするケースが多い。利用の際は各モデルのライセンス条項を確認する必要がある。
オープンウェイトモデルは内部構造の検証がしやすく、少数の企業や特定の国による技術独占を避けられるという観点から、研究者や開発者の間で広く受け入れられている。ただし、重みが公開されている以上、有害コンテンツの生成を制限する安全機構を第三者が無効化することも技術的には可能であり、悪用リスクへの対処が難しいとの指摘もある。具体的な製品として、米メタ(Meta Platforms)社の「Llama」シリーズや米グーグル(Google)社の「Gemma」シリーズなどがよく知られている。