Gemini Omni 泄露：谷歌 AI 视频生成模型即将来袭？AnyCap 计划集成

未经证实的泄露信息显示谷歌可能正在开发名为 Gemini Omni 的 AI 视频生成功能。了解泄露内容、仍待确认的事项以及 AnyCap 的集成计划。

Gemini Omni AI 视频生成

注意： 本文中有关 Gemini Omni 的所有内容均基于未经证实的泄露信息和社区推测。Google 尚未正式宣布该模型、确认其功能或承诺发布时间表。一旦官方信息公布，我们将及时更新本文。

Google I/O 2026 还有一周就要开幕，社交媒体上已出现疑似名为"Gemini Omni"的新视频生成功能的未经核实演示。以下是泄露内容的呈现、其可能意味着什么，以及 AnyCap 将如何集成该模型。

AnyCap 目前可用的视频模型

Omni 仍属推测，但如果您现在就想使用 AI 视频生成，以下模型已在 AnyCap 上线，一个 API 密钥即可全部访问：

模型	提供商	最适合
Veo 3.1	Google	电影级摄影、音视频同步
Seedance 2.0	ByteDance	顶级基准性能，Fast/Turbo 变体
Wan 2.7	Alibaba	1080p 输出，音频同步动态
Kling V3.0	Kuaishou	高保真，Std/Pro/O3 变体
Sora 2	OpenAI	可通过 API 访问的视频生成
Nano Banana 2	Google	快速图像生成与编辑
Nano Banana Pro	Google	高保真图像生成

所有模型共享同一 API 端点、计费方式和认证机制，无需单独的 SDK 或按模型签署合同。

→ 浏览 AnyCap 完整模型目录

泄露内容（未经核实）

5 月 2 日，一位 Reddit 用户分享了一张来自 Gemini 移动端应用的截图，其中显示文字："Start with an idea or try a template. Powered by Omni."（从一个想法开始，或尝试模板。由 Omni 提供支持。）该标签与"Toucan"一同出现，据报道"Toucan"是 Google 当前 Veo 3.1 视频路径的内部代号。该截图尚未得到独立核实。

界面说明据报道显示：

认识我们全新的视频生成模型。重混您的视频，在聊天中直接编辑，尝试模板，以及更多功能。

此文字来自泄露截图，尚未得到 Google 官方确认。

三种可能性（均属推测）

如果泄露内容反映了一款真实在研产品，AI 社区讨论了几种解读——均属推测，需等待 Google 官方说明：

#	可能性	可信度	备注
1	Veo 品牌重塑 — Omni 是现有 Veo 管线的新产品名称	未知	若属实，仅为表面更名
2	全新视频模型 — 在 Gemini 体系下训练的不同架构	未知	底层技术只有 Google 知晓
3	统一多模态模型 — 文字＋图像＋视频＋音频的单一系统	高度推测	名称引发此联想，但无证据支撑

以上可能性均未得到证实。

泄露片段内容

网络上流传的演示均未经核实——无法独立确认这些片段是否由 Gemini Omni 生成，或是否代表该模型的典型输出质量。

黑板前的教授（未经核实）

一个广泛流传的片段显示，一位疑似教授的人物一边在黑板上书写数学公式，一边讲解推导过程。观察者注意到片段中的公式看似正确，粉笔书写也较为连贯。该片段的来源尚未得到独立核实。

AI 生成视频中的文字渲染历来不够可靠。若此片段真实且具代表性，将表明该领域取得了进展——但在没有官方确认或独立测试的情况下，无法得出确定性结论。

餐厅场景（未经核实）

另一段泄露片段显示两名男子在餐厅吃意大利面。这引用了非正式评估 AI 视频质量时常用的"Will Smith eating spaghetti"基准。该片段的来源和真实性均未经核实。

编辑功能（未经核实）

泄露截图显示，编辑功能包括通过聊天界面去除水印和替换对象。Google 尚未确认这些功能，也不清楚这反映的是成品还是内部测试。

与 Google 当前方案的对比

回顾 Google 实际已发布的内容（非泄露）：

Nano Banana 2 和 Pro：Google 公开发布的 AI 图像生成模型，已集成至 Gemini，可通过聊天界面生成和编辑图像。
Veo 3.1：Google 公开发布的视频生成模型，可通过 Gemini 访问，但作为独立管线运行，标注为"Powered by Veo 3.1"（由 Veo 3.1 提供支持）。

泄露内容促使包括 36Kr 在内的部分媒体将 Omni 描述为"Nano Banana 的视频版"。这只是一种类比，并非 Google 的官方定位，可能并不反映实际产品。

AI 视频领域现状（已确认）

以下是截至 2026 年 5 月已公开可用的主要 AI 视频模型：

模型	公司	状态
Seedance 2.0	ByteDance	公开可用
HappyHorse-1.0	Alibaba	公开可用
Wan 2.7	Alibaba	公开可用
Kling V3.0	Kuaishou	公开可用
Sora 2	OpenAI	仅 API（消费者应用于 2026 年 4 月 29 日关闭）
Veo 3.1	Google	通过 Gemini 提供（受地区限制）

OpenAI 已确认 Sora 消费者应用于 2026 年 4 月 29 日关闭。Google 已公开表示视频生成仍是其产品路线图的一部分。

Gemini Omni 未出现在此列表中，因为它尚未被官方宣布。

AnyCap 的立场

AnyCap 是一个 AI 能力平台，将图像、视频、音频、搜索等生成式 AI 模型汇聚于单一 API 之下。本文开头列出的视频模型（Veo 3.1、Seedance 2.0、Wan 2.7、Kling V3.0、Sora 2、Nano Banana 2 和 Nano Banana Pro）目前均已在 AnyCap 模型目录中上线。

关于 Gemini Omni：

Google 尚未宣布该模型，也未确认 API 访问方式。
若 Google 发布带有 API 访问的 Omni，AnyCap 将对其进行评估并着手集成。
目前没有已确认的时间表，因为 Google 也尚未披露。
AnyCap 不拥有对 Google 未发布产品的提前或特殊访问权限。

值得关注的事项

Google I/O 2026 将于 2026 年 5 月 19 至 20 日举行。Google 通常借助此活动宣布产品更新，但具体议程尚未确认。无论 Omni 是否被提及，AnyCap 都将持续关注官方公告，并在机会出现时评估集成可能性。

总结

未经证实的泄露信息表明，Google 可能正在以"Omni"为名开发 Gemini 的原生视频生成体验。流传中的片段令人关注，但尚未得到确认。Google 既未宣布该产品，也未描述其功能或提供发布时间表。

若 Omni 随 API 访问一同发布，AnyCap 将按照对待其他重要新模型的惯例，对其进行评估和集成。与此同时，七款视频和图像生成模型已在 AnyCap 上线，均可通过单一 API 密钥访问。

如 Google 就 Gemini Omni 发布官方信息，本文将随时更新。

Gemini Omni 泄露：谷歌的「Video Nano Banana」即将到来——AnyCap 计划集成