読み方 : ヴィオスリー / ベオスリー

Veo 3

Veo 3とは?

米グーグル(Google)社が2025年に発表した動画生成AIモデル。文章や画像による指示を基に短い映像を自動生成し、効果音や環境音、人物の台詞まで同時に作成できる。従来の動画生成AIでは映像のみを出力する例が多かったが、Veo 3は音声も含めて一体化した映像を生成できる。
Veo 3のイメージ画像

自然言語による指示文から場面や構図を解析し、人物の動作、背景、光源、カメラ移動などを含む映像を生成する。利用者は「街を歩く人物」「宇宙空間を飛行する船」といった内容を入力するだけで映像を作成できる。生成される動画には会話音声や周囲の雑音、音楽なども付加でき、映像と音声の同期も行われる。映像品質は前世代の「Veo 2」から向上し、1080p出力や縦長動画への対応も進められている。

Veo 3は対話型AIサービス「Gemini」や動画・画像生成サービス「Flow」、開発者向けAPI、企業向けAI基盤「Vertex AI」などを通じて提供されている。文章だけでなく画像を入力として動画化する機能も備え、既存の写真やイラストを動かす用途にも利用される。企業では広告映像や製品紹介、教育用動画などの作成への活用が想定されており、短時間で多数の試作映像を生成できる点が注目されている。高速生成版の「Veo 3 Fast」も公開され、生成速度を重視した運用にも対応する。

動画生成AIは大量の映像データを学習して構築されており、Veo 3も映画的な画面構成や人物表現、物体の動きなどを再現できる。一方、実在しない映像を容易に生成できるため、偽映像や誤情報への悪用を防ぐ対策も求められている。Veo 3では、AI生成映像であることを識別する電子透かし技術SynthID」が導入されている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。