グーグル「Project Genie」とは何か…動画を超える空間生成プラットフォームの全貌

●この記事のポイント
グーグルが発表したProject Genieは、従来の動画生成AIとは異なり、プロンプトからリアルタイムに「操作可能な空間」を生成する技術だ。基盤モデルGenie 3と画像生成モデルNano Banana Proを組み合わせ、ユーザーは生成された世界を最大60秒間探索できる。視点移動や操作が可能で、生成空間はリミックスや動画書き出しにも対応する。従来のメタバースが事前構築型だったのに対し、Genieは生成型の空間体験を実現する点が特徴で、インタラクティブ広告や仮想試乗、パーソナライズ接客など、マーケティング領域への応用も見込まれる。
ChatGPTの登場から数年、生成AIの舞台はテキストから画像、そして動画へと広がった。OpenAIのSoraやグーグルのVeoが生み出す映像は、わずかな指示から映画のような世界を立ち上げ、多くの人を驚かせてきた。
だが2026年に発表されたグーグルのProject Genieは、その延長線上には収まらない。これは動画をつくる道具というより、操作できる世界そのものを生成する仕組みだ。映像を眺めるのではなく、自分で足を踏み入れ、歩き回り、視点を変えられる。ゲームエンジンやメタバース、広告のあり方まで巻き込む変化が始まっている。
「見る動画」から「入る世界」へ
従来の動画生成AIは、ユーザーの指示に沿って数秒から数分の映像を出力する。完成した一本の作品を受け取る形だ。Project Genieはそこが違う。入力されたプロンプトや画像をもとに、フレームごとに次の瞬間を予測しながら環境をリアルタイムで生成し続ける。自己回帰型のモデルを使い、空間を絶えず更新する。
たとえばサイバーパンクな雨の街並みと入力すれば、その場で都市が立ち上がり、ユーザーはキャラクターを操作するように路地を歩き、ネオンを見上げ、建物の裏側へ回り込める。映像とゲームの境界がほとんど消える体験だ。
ITジャーナリスト・小平貴裕氏は、「従来の生成AIがコンテンツをつくる装置だったのに対し、Genieは環境を生み出す装置」だと指摘する。ユーザーの行動に応じて世界が変わる以上、それは動画という枠を超えているという。
この仕組みを支えるのが、グーグルの基盤モデルGenie 3と、画像生成に特化したNano Banana Proだ。Genie 3は空間と時間の連続性を保ちながらシーンを生成し、Nano Banana Proが高精細なビジュアルを担う。現在は上位プランのGoogle AI Ultra契約者向けに実験的に提供されている。
連続して探索できる時間は60秒。キーボードやポインタで視点や動きを操作でき、生成した空間は他のユーザーがリミックスできる。自分が歩いた軌跡は動画として書き出せる。発表時に期待された、探索中に天候やオブジェクトを言葉で変える機能はまだ実装されていないが、将来的には自然言語で空間を書き換える構想が示されている。あるベンチャーキャピタリストは、これが実現すれば生成AI版のUnreal Engineに近づくと見る。コンテンツの民主化というより、空間そのものの民主化だという。
想定されるビジネス活用
数年前に注目を浴びたメタバースは、構築コストの高さやコンテンツ不足で失速した。人間がコードを書き、あらかじめ設計した空間を用意する方式だったからだ。Genieが示すのは、AIが瞬時に無数の空間を立ち上げる発想である。事前に3Dモデリングを重ねる必要もない。デジタルマーケティング企業の幹部は、「従来のメタバースが建設型だったのに対し、Genieは生成型だ」と語る。コスト構造が変われば、ブランド体験の投資対効果も変わる可能性がある。
ビジネス活用の場面も具体的だ。ブランドの世界観を歩き回るインタラクティブ広告では、ユーザーが空間の中で商品に触れる。「スイスの雪道を走るSUV」と入力すれば、その環境で走行体験ができる。顧客の嗜好に合わせて店舗の雰囲気を変えるといった接客も想定される。もっとも、没入型広告には無意識の誘導につながる懸念もある。体験ログの管理や倫理設計は欠かせないという指摘も出ている。
生成された世界を他者が改変し、さらに広げていく仕組みも特徴だ。誰かがつくった空間を別の誰かが手を加え、それがまた公開される。UGCの拡張形ともいえる循環である。
「テキストや動画の共有が主流だったSNSが、次は空間を共有する段階へ進む可能性もある」(小平氏)
課題も小さくない。膨大な計算資源の消費、リアルと区別のつかない体験の拡散、著作権や肖像権の扱い。体験そのものが改ざんできる社会では、説明責任やログ保存のあり方が問われる。法学者の間からは、空間生成AIはディープフェイクの次の段階にあたるとの警告も上がる。
Project Genieは、動画生成の延長ではなく、企業と顧客の接点を固定された情報から流動的な体験へと移す試みだ。企業が生み出した世界をユーザーが改変し、その改変がさらに広がる。見るAIから入るAIへという転換が、現実と呼んでいるものの輪郭を静かに揺らし始めている。
(文=BUSINESS JOURNAL編集部、協力=小平貴裕/ITジャーナリスト)











