Gemini Omni Vazado: O "Video Nano Banana" da Google Está a Chegar — e o AnyCap Planeia Integrar

Fugas não confirmadas sugerem que a Google pode estar a desenvolver o Gemini Omni. Saiba o que mostram os demos, o que permanece por confirmar e como o AnyCap abordaria a integração.

by AnyCap

Geração de Vídeo com IA Gemini Omni

Nota: Tudo o que é referido sobre o Gemini Omni neste artigo baseia-se em fugas de informação não confirmadas e em especulações da comunidade. A Google não anunciou oficialmente este modelo, não confirmou as suas capacidades nem assumiu qualquer compromisso relativamente a um prazo de lançamento. Actualizaremos este artigo quando e se surgirem informações oficiais.

O Google I/O 2026 acontece daqui a uma semana e surgiram nas redes sociais demonstrações não verificadas do que parece ser uma nova funcionalidade de geração de vídeo chamada "Gemini Omni". Eis o que as fugas revelam, o que podem significar se forem verdadeiras, e como o AnyCap abordaria a integração desse modelo.


Modelos de Vídeo Disponíveis no AnyCap Hoje

O Omni é ainda especulação — mas se quiser trabalhar com geração de vídeo por IA agora mesmo, estes modelos estão activos no AnyCap com uma única chave de API:

Modelo Fornecedor Ideal Para
Veo 3.1 Google Trabalho de câmara cinemático, sincronização áudio-visual
Seedance 2.0 ByteDance Melhor desempenho em benchmarks, variantes Fast/Turbo
Wan 2.7 Alibaba Saída em 1080p, movimento sincronizado com áudio
Kling V3.0 Kuaishou Alta fidelidade, variantes Std/Pro/O3
Sora 2 OpenAI Geração de vídeo acessível via API
Nano Banana 2 Google Geração e edição rápida de imagens
Nano Banana Pro Google Geração de imagens de alta fidelidade

Todos os modelos partilham o mesmo endpoint de API, facturação e autenticação. Sem SDKs separados ou contratos por modelo.

Ver o catálogo completo de modelos AnyCap


O Que as Fugas Mostram (Não Verificado)

A 2 de Maio, um utilizador do Reddit partilhou uma captura de ecrã da aplicação móvel do Gemini com o texto: "Start with an idea or try a template. Powered by Omni." A etiqueta aparecia junto a "Toucan", que é alegadamente o nome de código interno da Google para o caminho de vídeo actual baseado no Veo 3.1. A captura de ecrã não foi verificada de forma independente.

A descrição da interface é reportada como:

Conheça o nosso novo modelo de geração de vídeo. Faça remix dos seus vídeos, edite directamente no chat, experimente um modelo e muito mais.

Este texto provém de uma captura de ecrã vazada e não foi confirmado pela Google.

Três Possibilidades (Todas Especulativas)

Se as fugas reflectirem um produto real em desenvolvimento, a comunidade de IA discutiu várias interpretações — todas especulativas até a Google fornecer informação oficial:

# Possibilidade Confiança Notas
1 Rebranding do Veo — Omni é um novo nome para o pipeline Veo existente Desconhecida Seria apenas uma mudança cosmética
2 Novo modelo de vídeo — Uma arquitectura diferente treinada sob o Gemini Desconhecida Só a Google conhece a tecnologia subjacente
3 Modelo omni unificado — Sistema único para texto + imagem + vídeo + áudio Altamente especulativo O nome sugere esta interpretação, mas nenhuma evidência a confirma

Nenhuma destas possibilidades foi confirmada.


O Que os Clips Vazados Mostram

As demonstrações que circulam online não estão verificadas — não é possível confirmar de forma independente se foram geradas pelo Gemini Omni ou se reflectem a qualidade típica de saída do modelo.

Um Professor no Quadro (Não Verificado)

Um clip amplamente partilhado mostra o que parece ser um professor a escrever fórmulas matemáticas no quadro enquanto explica a derivação. Os observadores notaram que as fórmulas no clip parecem estar correctas e a escrita a giz é coerente. A proveniência deste clip não foi verificada de forma independente.

A renderização de texto em vídeo gerado por IA tem sido historicamente pouco fiável. Se este clip for genuíno e representativo, sugeriria progresso nessa área — mas sem confirmação oficial ou testes independentes, não é possível tirar conclusões definitivas.

Uma Cena de Restaurante (Não Verificado)

Outro clip vazado mostra dois homens a comer esparguete num restaurante. Esta é uma referência ao conhecido benchmark "Will Smith eating spaghetti", usado informalmente para avaliar a qualidade do vídeo por IA. A fonte e a autenticidade deste clip não estão verificadas.

Funcionalidades de Edição (Não Verificado)

Capturas de ecrã vazadas sugerem capacidades de edição incluindo remoção de marcas de água e substituição de objectos através da interface de chat. Estas funcionalidades não foram confirmadas pela Google, e não é claro se reflectem um produto acabado ou um teste interno.


Comparação com a Abordagem Actual da Google

Olhando para o que a Google efectivamente lançou (não vazado):

  • Nano Banana 2 e Pro: Os modelos de geração de imagens por IA da Google disponíveis publicamente, integrados no Gemini. Geram e editam imagens através da interface de chat.
  • Veo 3.1: O modelo de geração de vídeo da Google disponível publicamente, acessível através do Gemini mas a operar como um pipeline separado com a etiqueta "Powered by Veo 3.1."

As fugas levaram alguns meios — incluindo o 36Kr — a descrever o Omni como uma potencial "versão de vídeo do Nano Banana." Trata-se de uma analogia, não do posicionamento oficial da Google, e pode ou não reflectir o produto real.


O Panorama do Vídeo por IA (Actual, Confirmado)

Para contextualização, eis os principais modelos de vídeo por IA disponíveis publicamente em Maio de 2026:

Modelo Empresa Estado
Seedance 2.0 ByteDance Disponível publicamente
HappyHorse-1.0 Alibaba Disponível publicamente
Wan 2.7 Alibaba Disponível publicamente
Kling V3.0 Kuaishou Disponível publicamente
Sora 2 OpenAI Apenas API (aplicação para consumidores encerrada a 29 de Abril de 2026)
Veo 3.1 Google Disponível através do Gemini (limitado por região)

A OpenAI confirmou o encerramento da aplicação Sora para consumidores a 29 de Abril de 2026. A Google declarou publicamente que a geração de vídeo permanece parte do seu roadmap.

O Gemini Omni não aparece nesta lista porque não foi oficialmente anunciado.


A Posição do AnyCap

O AnyCap é uma plataforma de capacidades de IA que agrega modelos de IA generativa — imagem, vídeo, áudio, pesquisa — numa única API. Os modelos de vídeo listados no início deste artigo (Veo 3.1, Seedance 2.0, Wan 2.7, Kling V3.0, Sora 2, Nano Banana 2 e Nano Banana Pro) estão todos disponíveis hoje no catálogo de modelos AnyCap.

Relativamente ao Gemini Omni:

  • A Google não anunciou este modelo nem confirmou acesso via API.
  • Se a Google lançar o Omni com disponibilidade de API, o AnyCap avaliaria o modelo e tentaria integrá-lo.
  • Não existe um prazo confirmado, uma vez que a Google também não tem nenhum.
  • O AnyCap não tem acesso antecipado ou privilegiado a produtos Google não anunciados.

O Que Acompanhar

O Google I/O 2026 decorre de 19 a 20 de Maio de 2026. A Google utiliza tipicamente este evento para anunciar actualizações de produtos, mas a agenda específica não foi confirmada. Independentemente de o Omni ser ou não discutido, o AnyCap irá acompanhar os anúncios oficiais e avaliar as oportunidades de integração à medida que surgirem.


Resumo

Fugas não verificadas sugerem que a Google poderá estar a desenvolver uma experiência de geração de vídeo nativa para o Gemini com o nome "Omni." Os clips que circulam são interessantes, mas não confirmados. A Google não anunciou este produto, não descreveu as suas capacidades nem forneceu um prazo de lançamento.

Se o Omni for lançado com acesso à API, o AnyCap tenciona avaliá-lo e integrá-lo, como faz com os principais novos modelos. Entretanto, sete modelos de geração de vídeo e imagem estão já disponíveis no AnyCap, todos acessíveis com uma única chave de API.


Este artigo será actualizado quando e se a Google fornecer informação oficial sobre o Gemini Omni.