読み方 : がぞうせいせい

画像生成【image generation】

概要

画像生成とは、コンピュータが学習したデータに基づいて、新しい画像を自動的に作成する技術。既存の画像データの特徴や分布を学習し、人間による入力や文脈に沿った視覚表現を出力する。
画像生成のイメージ画像

与えられたデータを解釈してコンピュータグラフィックスCG)として描画する技術は以前から存在するが、画像生成という場合は機械学習システムなどを用いてコンピュータが画像の内容自体を新たに作成する技術を指す。現在主流の方式では、画像データを学習させたニューラルネットワークを使い、入力されたテキストやランダム値(シード値)、あるいは元になる画像などの条件に沿って、色や形状のパターンを組み合わせて新しい画像を生成する。

主要な手法の一つに、「敵対的生成ネットワーク」(GANGenerative Adversarial Network)がある。これは、画像を作る「生成者」と、その真偽を見破る「識別者」という二つのニューラルネットワークを競わせることで、より精巧な画像を模索する。また、「拡散モデル」(diffusion model)と呼ばれる手法では、画像に段階的にノイズを加えていき、元の情報を完全に破壊する過程を学習し、その逆プロセスとしてノイズから徐々に鮮明な画像を復元していく。

画像生成のプロセスにおいては、膨大な数の画像と、その内容を説明する文字情報(テキスト)のペアが学習データとして用いられる。モデルは単に画像を暗記するのではなく、対象物の特徴やスタイル、構図といった概念的な特徴を多次元空間(潜在空間)の中に学習する。生成時には、この空間内の特定の座標から情報を引き出し、具体的な画素へと変換することで、学習データには直接存在しない新しい組み合わせの画像が生み出される。

すでに高品質で実用的な画像生成技術が実用化されており、対話型の画像作成サービスや、デザイン、資料作成、ゲーム開発など様々な分野で利用されている。。一方、生成された画像の著作権の帰属や、学習データの透明性や著作者の権利、「ディープフェイク」(deep fake)と呼ばれる写実的な偽画像の作成や拡散など、これまでにない種類の倫理的あるいは法的な問題も引き起こしている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。