生成AI 【Generative Artificial Intelligence】 生成的人工知能 / ジェネレーティブAI / GAI

概要

生成AI(Generative Artificial Intelligence)とは、機械学習技術を応用したAIシステムの一種で、文章や画像、音声、動画、プログラムコードなど、まとまった量の新しい情報を生み出すことができるもの。

機械学習MLMachine Learningシステムに大量の学習データを与え、データ中によく出現するパターンや規則性を学習させる。完成したモデルに対して人間が指示を与えると、学習したデータに似た特徴を持つ新たな情報を生成して出力する。

文字、画像、プログラムなど、学習および出力できるデータの種類はシステムごとに決まっている。一種類の情報入力にのみ対応することを「ユニモーダル」(unimodal)、文字と画像など複数種類の情報入力に対応することを「マルチモーダル」(multimodal)という。

種類

現在実用的な水準で広く受け入れられているのはテキスト(文字)生成AIと画像生成AIである。テキスト生成AIは米オープンAIOpenAI)社が開発した大規模言語モデルLLMLarge Language Model)の「GPT」(Generative Pre-trained Transformer)シリーズ、および、これを対話形式(チャット)で利用できるようにしたクラウドサービスChatGPTチャットジーピーティー」により一気に注目を集めるようになった。

画像生成AIは写真風やイラスト風、絵画風などの静止画像を人間の指示する文字列や元になる画像に基づいて生成するもので「AIアート」「生成的アート」などとも呼ばれる。OpenAIによる「DALL-Eダリ」、米ミッドジャーニー(Midjourney)研究所の「Midjourneyミッドジャーニー」、英スタビリティAI(Stability AI)社らの「Stable Diffusionステーブルディフュージョン」などがよく知られる。

他にも、動画、音楽、音声、コンピュータプログラム(のソースコード)、化学物質(分子構造)などを生成するAIシステムの研究・開発が進められており、一部は実用的なソフトウェアサービスとして実装されている。ロボットの動作を生成AIに基づいて制御するなどの応用も研究されている。

法的な問題

学習データ出力データについて、著作権肖像権など既存の法的権利との関係の整理が進む前に一気に実用レベルの技術が登場したため、どのような枠組みに基づいて法規制をうかをまさに現在各国で議論している最中である。

現在の著作権関連法規には機械学習システムに学習データとして入力することについての規定は無いが、出力される文章や画像には学習した著作物の特徴などが反映されており、著作者の許諾や補償無しに利用することは「タダ乗り」であるとして何らかの規制を求める声が上がっている。

また、生成AIの出力結果の文章や画像などを著作物として著作権を認めるか、認める場合は誰が著作者となるのかについても議論となっている。画像や映像の出力結果に著名人にそっくりな人物が含まれる場合の肖像権との関係、生成結果を公開する際にAI生成物であることを明示させるべきか否か、などの論点もある。

(2023.9.27更新)

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる