読み方 : ゼロショットがくしゅう
Zero-shot学習【ゼロショット学習】Zero-shot learning/Zero-shotプロンプティング

一般的な機械学習モデルの学習では、大量の学習データを与えて正解(教師あり学習の場合)や、対象の特徴・構造など(教師なし学習の場合)を学ばせる。これにはデータを用意するための膨大なコストと、大量の計算資源、学習時間が必要となる。
Zero-shot学習は特定の対象分野についての学習が済んでいる「事前学習済みモデル」を使用し、新たなタスクや分類クラスに適合させる手法の一つである。タスクやクラスの内容を自然言語の単語や文章で与えることで、モデルがすでに知っている知識を組み合わせて指示に対応する。
例えば、被写体の種類や特徴を自然言語のラベルで学習した画像識別モデルに、「白黒の縞模様の馬」を分類するよう指示すると、モデルがシマウマそのものを学習していなくても、手がかりとなる情報を元にシマウマの分類に対応することができる。このとき、通常の学習プロセスのようにモデル内部のパラメータは改変されず、その挙動のみが一時的に変更される。
似た手法で、モデルに与える手がかりとして一つの具体例を用いる手法を「One-shot学習」(ワンショット学習)、複数の具体例を与える手法を「Few-shot学習」(フューショット学習)という。大規模言語モデル(LLM)のプロンプトによって実行する手法は「Zero-shotプロンプティング」とも呼ばれるが、この手法自体は画像認識など様々な種類のモデルに適用できる。