生成AI 【Generative Artificial Intelligence】 生成的人工知能 / ジェネレーティブAI / GAI
概要
生成AI(Generative Artificial Intelligence)とは、機械学習技術を応用したAIシステムの一種で、文章や画像、音声、動画、プログラムコードなど、まとまった量の新しい情報を生み出すことができるもの。機械学習(ML:Machine Learning)システムに大量の学習データを与え、データ中によく出現するパターンや規則性を学習させる。完成したモデルに対して人間が指示を与えると、学習したデータに似た特徴を持つ新たな情報を生成して出力する。
文字、画像、プログラムなど、学習および出力できるデータの種類はシステムごとに決まっている。一種類の情報の入力にのみ対応することを「ユニモーダル」(unimodal)、文字と画像など複数種類の情報の入力に対応することを「マルチモーダル」(multimodal)という。
種類
現在実用的な水準で広く受け入れられているのはテキスト(文字)生成AIと画像生成AIである。テキスト生成AIは米オープンAI(OpenAI)社が開発した大規模言語モデル(LLM:Large Language Model)の「GPT」(Generative Pre-trained Transformer)シリーズ、および、これを対話形式(チャット)で利用できるようにしたクラウドサービス「ChatGPT」により一気に注目を集めるようになった。
画像生成AIは写真風やイラスト風、絵画風などの静止画像を人間の指示する文字列や元になる画像に基づいて生成するもので「AIアート」「生成的アート」などとも呼ばれる。OpenAIによる「DALL-Eダリ」、米ミッドジャーニー(Midjourney)研究所の「Midjourney」、英スタビリティAI(Stability AI)社らの「Stable Diffusion」などがよく知られる。
他にも、動画、音楽、音声、コンピュータプログラム(のソースコード)、化学物質(分子構造)などを生成するAIシステムの研究・開発が進められており、一部は実用的なソフトウェアやサービスとして実装されている。ロボットの動作を生成AIに基づいて制御するなどの応用も研究されている。
法的な問題
学習データや出力データについて、著作権や肖像権など既存の法的権利との関係の整理が進む前に一気に実用レベルの技術が登場したため、どのような枠組みに基づいて法規制を行うかをまさに現在各国で議論している最中である。
現在の著作権関連法規には機械学習システムに学習データとして入力することについての規定は無いが、出力される文章や画像には学習した著作物の特徴などが反映されており、著作者の許諾や補償無しに利用することは「タダ乗り」であるとして何らかの規制を求める声が上がっている。
また、生成AIの出力結果の文章や画像などを著作物として著作権を認めるか、認める場合は誰が著作者となるのかについても議論となっている。画像や映像の出力結果に著名人にそっくりな人物が含まれる場合の肖像権との関係、生成結果を公開する際にAI生成物であることを明示させるべきか否か、などの論点もある。