読み方 : サイクルガン / サイクルギャン
CycleGAN
概要

このモデルは二つの生成器と二つの識別器から構成される。一方の生成器は領域Aの画像を領域Bの画像へ変換し、もう一方は領域Bから領域Aへの変換を行う。各生成器に対応する識別器は、生成された画像がそれぞれの領域に属する実画像かどうかを判別する。この敵対的学習により、見た目の分布が変換先の画像集合に近づくように生成器が更新される。
「サイクル一貫性」という概念が導入され、領域Aの画像をBに変換し、さらにAへ戻したときに元の画像が復元されるべきだとする制約が設けられている。この制約を損失関数(サイクル一貫性損失)として追加することで、対応関係のないデータ同士であっても、物体の形や背景の構造といった意味的な情報を維持したまま、色や質感などのスタイルのみを変換することができる。
CycleGANは、馬とシマウマ、写真と絵画風画像、季節変換など多様なスタイル変換タスクで利用されている。Pix2Pixのように厳密な対データを必要としないため、インターネット上の膨大な既存画像を活用できる利点がある。一方、形状が大きく異なる変換には不向きとされる。例えば、犬を猫に変換しようとすると、耳の形や体格の根本的な違いを埋められず、不自然な結果が生じることがある。