読み方：せいせいエーアイ

生成AI 【Generative Artificial Intelligence】

別名：生成的人工知能，ジェネレーティブAI， GAI

概要

生成AIとは、機械学習技術を応用したAIシステムの一種で、文章や画像、音声、動画、プログラムコードなど、まとまった量の新しい情報を生み出すことができるもの。

目
次

解説
種類
法的な問題

機械学習（ML：Machine Learning）システムに大量の学習データを与え、データ中によく出現するパターンや規則性を学習させる。完成したモデルに対して人間が指示を与えると、学習したデータに似た特徴を持つ新たな情報を生成して出力する。

文字、画像、プログラムなど、学習および出力できるデータの種類はシステムごとに決まっている。一種類の情報の入力にのみ対応することを「ユニモーダル」（unimodal）、文字と画像など複数種類の情報の入力に対応することを「マルチモーダル」（multimodal）という。

種類

現在実用的な水準で広く受け入れられているのはテキスト（文字）生成AIと画像生成AIである。テキスト生成AIは米オープンAI（OpenAI）社が開発した大規模言語モデル（LLM：Large Language Model）の「GPT」（Generative Pre-trained Transformer）シリーズ、および、これを対話形式（チャット）で利用できるようにしたクラウドサービス「ChatGPTチャットジーピーティー」により一気に注目を集めるようになった。

画像生成AIは写真風やイラスト風、絵画風などの静止画像を人間の指示する文字列や元になる画像に基づいて生成するもので「AIアート」「生成的アート」などとも呼ばれる。OpenAIによる「DALL-Eダリ」、米ミッドジャーニー（Midjourney）研究所の「Midjourneyミッドジャーニー」、英スタビリティAI（Stability AI）社らの「Stable Diffusionステーブルディフュージョン」などがよく知られる。

他にも、動画、音楽、音声、コンピュータプログラム（のソースコード）、化学物質（分子構造）などを生成するAIシステムの研究・開発が進められており、一部は実用的なソフトウェアやサービスとして実装されている。ロボットの動作を生成AIに基づいて制御するなどの応用も研究されている。