読み方 : ヴィオスリー / ベオスリー
Veo 3
Veo 3とは?

自然言語による指示文から場面や構図を解析し、人物の動作、背景、光源、カメラ移動などを含む映像を生成する。利用者は「街を歩く人物」「宇宙空間を飛行する船」といった内容を入力するだけで映像を作成できる。生成される動画には会話音声や周囲の雑音、音楽なども付加でき、映像と音声の同期も行われる。映像品質は前世代の「Veo 2」から向上し、1080p出力や縦長動画への対応も進められている。
Veo 3は対話型AIサービス「Gemini」や動画・画像生成サービス「Flow」、開発者向けAPI、企業向けAI基盤「Vertex AI」などを通じて提供されている。文章だけでなく画像を入力として動画化する機能も備え、既存の写真やイラストを動かす用途にも利用される。企業では広告映像や製品紹介、教育用動画などの作成への活用が想定されており、短時間で多数の試作映像を生成できる点が注目されている。高速生成版の「Veo 3 Fast」も公開され、生成速度を重視した運用にも対応する。
動画生成AIは大量の映像データを学習して構築されており、Veo 3も映画的な画面構成や人物表現、物体の動きなどを再現できる。一方、実在しない映像を容易に生成できるため、偽映像や誤情報への悪用を防ぐ対策も求められている。Veo 3では、AI生成映像であることを識別する電子透かし技術「SynthID」が導入されている。