読み方 : サイクルガン / サイクルギャン

CycleGAN

概要

CycleGANとは、敵対的生成ネットワークGAN)を発展させた画像生成モデルの一つで、一対一の対応関係がない二つの異なるデータ群の間で、画像の特徴を相互に変換するもの。
CycleGANのイメージ画像

このモデルは二つの生成器と二つの識別器から構成される。一方の生成器は領域Aの画像を領域Bの画像へ変換し、もう一方は領域Bから領域Aへの変換を行う。各生成器に対応する識別器は、生成された画像がそれぞれの領域に属する実画像かどうかを判別する。この敵対的学習により、見た目の分布が変換先の画像集合に近づくように生成器が更新される。

「サイクル一貫性」という概念が導入され、領域Aの画像をBに変換し、さらにAへ戻したときに元の画像が復元されるべきだとする制約が設けられている。この制約を損失関数(サイクル一貫性損失)として追加することで、対応関係のないデータ同士であっても、物体の形や背景の構造といった意味的な情報を維持したまま、色や質感などのスタイルのみを変換することができる。

CycleGANは、馬とシマウマ、写真と絵画風画像、季節変換など多様なスタイル変換タスクで利用されている。Pix2Pixのように厳密な対データを必要としないため、インターネット上の膨大な既存画像を活用できる利点がある。一方、形状が大きく異なる変換には不向きとされる。例えば、犬を猫に変換しようとすると、耳の形や体格の根本的な違いを埋められず、不自然な結果が生じることがある。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。