ビジネスジャーナル > ITニュース > Veo 3で制作したテレビCM放映

グーグルの生成AI・Veo 3で制作したテレビCM、早くも放映…制作期間・コストを劇的に削減

2025.08.02 2025.08.01 16:58 IT
グーグルの生成AI・Veo 3で制作したテレビCM、早くも放映…制作期間・コストを劇的に削減の画像1
Geminiでは、このように日本語のプロンプトでも出力可能なため、最初の試用には向いていると感じました

●この記事のポイント
・グーグルの動画生成AIモデル「Veo 3」、テキストを入力するだけで、数分程度で約8秒の動画が自動で生成
・米国ではNBAファイナルの中継で、Veo 3を使って制作されたCMが放映
・日本で普及すれば広告業界に大きな影響を与える可能性も

 米Google(グーグル)が5月にリリースした音声付き動画生成AIモデル「Veo 3」。テキストや画像をプロンプト入力するだけで、数分程度で約8秒の動画が自動で生成される。米国では早くも6月のプロバスケットボール「NBAファイナル」のテレビ中継で、Veo 3を使って制作されたCMが放映されるなど、急速に普及する兆候がみられる。日本語にも対応しており、Google AI Pro(月額2,900円)を契約していれば利用可能(回数に制限あり)だが、どれくらいのクオリティのコンテンツをつくれるのか。また、6月23日付「GIZMODO」記事によれば、このNBAファイナルのCMの制作期間はわずか2日で、従来の広告制作費用より95%も削減できたとのことだが、もし日本で普及すれば広告業界にも大きなインパクトを与えるのか。専門家の見解を交えて追ってみたい。

●目次

表現としてはかなりリアル

 どれくらいのクオリティの動画がつくれるのか。実際の使用感について、システムエンジニアでライターの伊藤朝輝氏はいう。

「『Gemini』と『Flow』を使って、Veo 3を試してみました。Gemini経由であれば、日本語のプロンプトでも動画を生成できるため、Veo 3の基本的なクオリティを確認する手段としては非常に手軽です。たとえば『公園でサックスの練習をするロングヘアの女性』と入力してみたところ、音声と映像が連動して生成されるVeo 3の特徴がよく伝わる動画が出力されました。女性の指の動きに合わせてサックスの音が鳴り、口元もメロディに合わせて息を吹き込んでいるように見えます。奏でられる音が実際の運指に合っているかどうかは、私には判別できませんが、表現としてはかなりリアルです」

「続いて、キャラクターの外見や衣装、表情、位置関係が動画全体で一貫して保たれるVeo 3の特性を確かめるため、Flowからも試してみました。Flowは日本語プロンプトに非対応のため、英語で入力する必要があります」(伊藤氏)

グーグルの生成AI・Veo 3で制作したテレビCM、早くも放映…制作期間・コストを劇的に削減の画像2
Flowは動画の生成機能に加え、複数の生成動画を並べて編集できる「シーン編集機能」を備えたアプリです
グーグルの生成AI・Veo 3で制作したテレビCM、早くも放映…制作期間・コストを劇的に削減の画像3
前バージョンの「Veo 2」も使えますが、今回は音声付きで生成する目的があったため「Veo 3」を選択しました

「『日本人の女子高生が台所でチャーハンを作っている』といった内容を英語で記述するだけで、中華鍋を振る音や油のはねる音まで自動生成され、非常に簡単です。ローマ字でセリフを書けば、日本語もほぼ違和感なく話してくれました。リップシンク(口の動き)も自然で、しっかり合っています。ただし、キャラクターに日本人であることを明記しないと、セリフが片言になるケースも見られました。

 Veo 3で生成される動画は1本8秒ですが、それをFlowのシーン編集機能に読み込んで、延長用プロンプトを入力すれば最大1分の動画に仕上げられます。キャラクターの外見を固定したまま複数のシーンを連結できるため、ストレスなく編集できました」(伊藤氏)

グーグルの生成AI・Veo 3で制作したテレビCM、早くも放映…制作期間・コストを劇的に削減の画像4
生成した動画を並べて編集しているところ。最大1分の動画を、複数まとめることでそれなりの作品に仕上げられると感じました
グーグルの生成AI・Veo 3で制作したテレビCM、早くも放映…制作期間・コストを劇的に削減の画像5
プロンプトにローマ字で記述した日本語のセリフを、ほぼ違和感なくしゃべりました。リップシンクも合っています

 Veo 3の強み・魅力は何か。逆に弱い部分や難点はあるのか。

「Veo 3の最大の魅力は、テキストだけで音声付きの映像を自動生成できることです。カメラワークの指定に応じて、動きや奥行きのある映像が簡単に作れる点も非常に優れています。また、写真やイラストをもとに動画を生成する機能も試してみました。ただ、これについてはあまり大きな動きをつけられないように感じました。操作が不十分だった可能性もありますが、生成の自由度は完全ではない印象です。

 利用には『Google AI Pro』(月額2,900円/初月無料)または『Google AI Ultra』(月額3万6,400円/初回3カ月は1万8,000円)の契約が必要です。Flowで動画を生成する際には『AIクレジット』を消費し、Proプランでは月に1,000クレジットが付与されます。Veo 3で動画を1本作ると100クレジットを消費するため、試行錯誤するとすぐ使い切ってしまいました。本格的に使うなら、毎月1万2,500クレジットが付くUltraプランのほうが現実的だと思います」(伊藤氏)

YouTubeで公開・収益化されているチャンネルも

 では、どのような用途・目的の動画の制作に向いていると考えられるか。

「すでにVeo 3で作られたキャラクター動画や、会話形式の短編がYouTubeで公開・収益化されているチャンネルも存在します。特に自然な発話やカメラワーク、映像と音声の一体感を活かした表現は強みといえるでしょう。ただし、カメラの完全なコントロールは難しく、絵コンテ通りの映像を制作するような現場での導入は難しいと思います。偶然性や曖昧さを許容できるケースに限られそうです。一方で、直感的に高品質な映像を生成できるため、教育、広報、企画プレゼン、試作映像やストーリーボードの代替としては非常に有用だと感じました」

 テレビCMを制作しようとした場合、どれくらいの時間・労力が必要になると考えられるか。

「実際、NBA中継で放送されたCMがVeo 3で制作された事例があり、制作期間はわずか2日間だったそうです。簡単なプロンプトでも完成度の高い映像が得られる半面、狙い通りの演出を実現するにはかなりの試行錯誤と調整が必要です。また、Veo 3には『誰が作っても似た雰囲気になりやすい』という側面があります。個性やブランド性を重視する場面では、Veo 3だけで完結する制作手法は、現場での採用に至らない可能性もあるでしょう」(伊藤氏)

生成AIでつくったCMは増えてくる可能も

 もし日本で普及した場合、広告業界に大きな変化をもたらす可能性はあるのか。大手広告会社社員はいう。

「ナショナルクライアントのテレビCMの場合、有名タレントなどを起用するとなると企画から納品まで含めた制作期間は数カ月におよび、1本あたりの制作費は数千万円に上ります。生成AIを使えば制作期間もコストも大幅に削減されるのは間違いないですが、明らかに見た目的に『生成AIでつくりました』ということが分かるクオリティを、クライアントである企業が良しとするかどうか次第でしょう。また、生成AIによってつくられた動画が、すでに存在する他のコンテンツの著作権を侵害していないかどうかを、どう担保するのかという課題もあります。

 ただ、今の10~30代くらいの層は、普段からテレビほどクオリティが高くはないYouTubeやTikTokの“素人っぽい”動画などに慣れ親しんでいることもあり、生成AIによってつくられたテレビCMにそれほど違和感を感じないかもしれず、将来的には少しずつ生成AIでつくったCMは増えてくる可能性はあります。そうなると、従来の広告制作手法と多額の制作コストを前提に成り立っていた広告業界が少なくない影響を受けるかもしれません」

(文=BUSINESS JOURNAL編集部、協力=伊藤朝輝/ライター、システムエンジニア)

伊藤朝輝/ライター/SE

伊藤朝輝/ライター/SE

SEとして働く傍ら、1995年ごろから雑誌や書籍で執筆活動を始めた。デビューの記事は「Windows 98リアルモード徹底活用テクニック」。最近はアップル製品に関する記事を書くことが多い。「アップル製品に使うお金はアップル製品で稼ぐ」がモットー。

X:@_akibyon