Gemini Omni がリーク:Googleの「Video Nano Banana」が登場へ — AnyCap は統合を計画中

SNS で拡散している Gemini Omni の未確認デモ。Google の新しい AI 動画モデルが事実なら何を意味するのか、AnyCap の統合方針とあわせて解説します。

by AnyCap

Gemini Omni AI 動画生成

注意: 本記事における Gemini Omni に関するすべての情報は、未確認のリーク情報とコミュニティによる憶測に基づいています。Google はこのモデルを公式に発表しておらず、機能の確認や提供スケジュールの表明も行っていません。公式情報が確認できた場合は、随時本記事を更新します。

Google I/O 2026 まであと1週間。SNS では「Gemini Omni」と思われる新しい動画生成機能の未確認デモが拡散しています。リークが示す内容、それが事実であった場合の意味、そして AnyCap がどのような統合アプローチを取るかについて解説します。


AnyCap で今すぐ使える動画モデル

Omni はまだ憶測の域を出ていませんが、AI 動画生成をすぐに活用したい場合は、以下のモデルが AnyCap 上で1つの API キーから利用可能です:

モデル プロバイダー 得意分野
Veo 3.1 Google シネマティックなカメラワーク、音声・映像の同期
Seedance 2.0 ByteDance 最高水準のベンチマーク性能、Fast/Turbo バリアント
Wan 2.7 Alibaba 1080p 出力、音声同期モーション
Kling V3.0 Kuaishou 高忠実度、Std/Pro/O3 バリアント
Sora 2 OpenAI API 経由でアクセス可能な動画生成
Nano Banana 2 Google 高速な画像生成・編集
Nano Banana Pro Google 高忠実度の画像生成

すべてのモデルが同一の API エンドポイント、課金、認証を共有しています。モデルごとの個別 SDK や契約は不要です。

AnyCap モデルカタログを見る


リークの内容(未確認)

5月2日、Reddit ユーザーが Gemini モバイルアプリのスクリーンショットを共有しました。そこには 「Start with an idea or try a template. Powered by Omni.」 というテキストが表示されていました。このラベルは「Toucan」という表記とともに現れており、これは現在の Veo 3.1 を使った動画経路における Google の社内コードネームとされています。スクリーンショットは独立した形での検証がなされていません。

UI の説明文は以下の通りと報告されています:

新しい動画生成モデルをご紹介します。動画をリミックスし、チャット内で直接編集し、テンプレートを試してみてください。

このテキストはリーク済みのスクリーンショットに由来するものであり、Google による確認はされていません。

3つの可能性(いずれも憶測)

リークが実際に開発中の製品を反映しているとすれば、AI コミュニティではいくつかの解釈が議論されています — Google が公式情報を提供するまではすべて憶測です:

# 可能性 確度 備考
1 Veo のリブランディング — Omni は既存 Veo パイプラインの新しい製品名 不明 事実であれば外観上の変更のみ
2 新しい動画モデル — Gemini の下で訓練された異なるアーキテクチャ 不明 基盤技術は Google のみが把握
3 統合オムニモデル — テキスト+画像+動画+音声を扱う単一システム 高度に憶測的 名称からこの解釈が連想されるが、裏付けとなる証拠はない

これらの可能性はいずれも確認されていません。


リークされた映像の内容

オンラインで出回っているデモは未確認であり、それらが Gemini Omni によって生成されたものか、あるいはモデルの典型的な出力品質を反映しているかを独立して確認することはできません。

黒板の前の教授(未確認)

広く拡散した映像には、教授と思われる人物が黒板に数式を書きながら導出を説明する様子が映っています。映像内の数式は正確に見え、チョークの字も整合していると観察者は指摘しています。この映像の出所は独立して検証されていません。

AI 生成動画におけるテキストレンダリングは、歴史的に信頼性が低いとされてきました。この映像が本物でかつ代表的なものであれば、その領域での進歩を示唆することになりますが、公式確認や独立したテストなしに確定的な結論を導くことはできません。

レストランのシーン(未確認)

別のリーク映像では、2人の男性がレストランでスパゲッティを食べている様子が映っています。これは AI 動画の品質を非公式に評価する際に使われる「Will Smith eating spaghetti」ベンチマークへの言及です。この映像のソースと真正性は確認されていません。

編集機能(未確認)

リーク済みのスクリーンショットは、チャットインターフェース経由での透かし除去やオブジェクト置換などの編集機能を示唆しています。これらの機能は Google によって確認されておらず、完成品を反映しているのかそれとも内部テストなのかも不明です。


Google の現在のアプローチとの比較

Google が実際にリリースした内容(リーク情報ではなく)を見ると:

  • Nano Banana 2 と Pro:Google が公開している AI 画像生成モデルで、Gemini に統合済み。チャットインターフェースを通じて画像を生成・編集できます。
  • Veo 3.1:Google が公開している動画生成モデルで、Gemini 経由でアクセス可能ですが、「Powered by Veo 3.1」と表示される独立したパイプラインとして動作します。

リーク情報を受け、36Kr を含む一部のメディアは Omni を「Nano Banana の動画版」と表現しました。これはあくまで比喩であり、Google の公式なポジショニングではなく、実際の製品を反映している保証もありません。


AI 動画の現状(確認済み情報)

参考として、2026年5月時点で公開されている主要な AI 動画モデルは以下の通りです:

モデル 企業 ステータス
Seedance 2.0 ByteDance 一般公開済み
HappyHorse-1.0 Alibaba 一般公開済み
Wan 2.7 Alibaba 一般公開済み
Kling V3.0 Kuaishou 一般公開済み
Sora 2 OpenAI API のみ(消費者向けアプリは2026年4月29日に終了)
Veo 3.1 Google Gemini 経由で提供(地域制限あり)

OpenAI は Sora の消費者向けアプリを2026年4月29日に終了したことを確認しました。Google は動画生成が引き続きロードマップに含まれていることを公式に表明しています。

Gemini Omni は正式な発表がないため、このリストには含まれていません。


AnyCap のスタンス

AnyCap は、画像・動画・音声・検索など生成 AI モデルを単一の API に統合した AI 能力プラットフォームです。本記事冒頭に掲載した動画モデル(Veo 3.1、Seedance 2.0、Wan 2.7、Kling V3.0、Sora 2、Nano Banana 2、Nano Banana Pro)はいずれも AnyCap モデルカタログ で現在利用可能です。

Gemini Omni に関する AnyCap の立場:

  • Google はこのモデルを発表しておらず、API アクセスの提供も確認していません。
  • Google が API アクセス付きで Omni をリリースした場合、AnyCap はモデルを評価し、統合を目指します。
  • Google 側にも確定したスケジュールがないため、現時点で確認済みのタイムラインはありません。
  • AnyCap は未発表の Google 製品への早期または特権的なアクセスを持っていません。

注目すべきポイント

Google I/O 2026 は2026年5月19〜20日に開催されます。Google は例年このイベントで製品アップデートを発表していますが、具体的なアジェンダはまだ確認されていません。Omni が取り上げられるかどうかにかかわらず、AnyCap は公式発表を注視し、統合の機会が生まれ次第、評価を行います。


まとめ

未確認のリーク情報は、Google が「Omni」という名称で Gemini のネイティブ動画生成体験を開発中である可能性を示唆しています。拡散している映像は興味深いものの、確認はされていません。Google はこの製品を発表しておらず、機能の説明もリリースのスケジュールも示していません。

Omni が API アクセス付きでリリースされた場合、AnyCap は主要な新モデルに対して行うように、評価と統合を進める方針です。それまでの間、7つの動画・画像生成モデルが AnyCap ですでに利用可能 であり、すべて単一の API キーでアクセスできます。


Google が Gemini Omni に関する公式情報を発表した際には、本記事を更新します。