
Nota: Tudo que é mencionado sobre o Gemini Omni neste artigo é baseado em vazamentos não confirmados e especulações da comunidade. O Google não anunciou oficialmente este modelo, não confirmou suas capacidades nem assumiu nenhum compromisso com um prazo de lançamento. Atualizaremos este post quando e se informações oficiais estiverem disponíveis.
O Google I/O 2026 acontece em uma semana, e demos não verificadas do que parece ser um novo recurso de geração de vídeo chamado "Gemini Omni" surgiram nas redes sociais. Veja o que os vazamentos mostram, o que podem significar se forem verdadeiros, e como o AnyCap abordaria a integração desse modelo.
Modelos de Vídeo Disponíveis no AnyCap Hoje
O Omni ainda é especulação — mas se você quiser trabalhar com geração de vídeo por IA agora, estes modelos já estão ativos no AnyCap com uma única chave de API:
| Modelo | Provedor | Melhor Para |
|---|---|---|
| Veo 3.1 | Cinematografia, sincronização de áudio e vídeo | |
| Seedance 2.0 | ByteDance | Melhor desempenho em benchmarks, variantes Fast/Turbo |
| Wan 2.7 | Alibaba | Saída em 1080p, movimento sincronizado com áudio |
| Kling V3.0 | Kuaishou | Alta fidelidade, variantes Std/Pro/O3 |
| Sora 2 | OpenAI | Geração de vídeo acessível via API |
| Nano Banana 2 | Geração e edição rápida de imagens | |
| Nano Banana Pro | Geração de imagens de alta fidelidade |
Todos os modelos compartilham o mesmo endpoint de API, faturamento e autenticação. Sem SDKs separados ou contratos por modelo.
→ Explorar o catálogo completo de modelos AnyCap
O Que os Vazamentos Mostram (Não Verificado)
Em 2 de maio, um usuário do Reddit compartilhou uma captura de tela do aplicativo móvel do Gemini com o texto: "Start with an idea or try a template. Powered by Omni." O rótulo apareceu ao lado de "Toucan," que é supostamente o codinome interno do Google para o caminho de vídeo atual baseado no Veo 3.1. A captura de tela não foi verificada de forma independente.
A descrição da interface é relatada como:
Conheça nosso novo modelo de geração de vídeo. Faça remix dos seus vídeos, edite diretamente no chat, experimente um template e muito mais.
Este texto vem de uma captura de tela vazada e não foi confirmado pelo Google.
Três Possibilidades (Todas Especulativas)
Se os vazamentos refletirem um produto real em desenvolvimento, a comunidade de IA discutiu várias interpretações — todas especulativas até o Google fornecer informações oficiais:
| # | Possibilidade | Confiança | Notas |
|---|---|---|---|
| 1 | Rebranding do Veo — Omni é um novo nome para o pipeline Veo existente | Desconhecida | Seria apenas uma mudança cosmética |
| 2 | Novo modelo de vídeo — Uma arquitetura diferente treinada sob o Gemini | Desconhecida | Só o Google conhece a tecnologia subjacente |
| 3 | Modelo omni unificado — Sistema único para texto + imagem + vídeo + áudio | Altamente especulativo | O nome convida essa interpretação, mas nenhuma evidência confirma |
Nenhuma dessas possibilidades foi confirmada.
O Que os Clipes Vazados Mostram
As demos que circulam online não estão verificadas — não é possível confirmar de forma independente se foram geradas pelo Gemini Omni ou se refletem a qualidade típica de saída do modelo.
Um Professor na Lousa (Não Verificado)
Um clipe amplamente compartilhado mostra o que parece ser um professor escrevendo fórmulas matemáticas na lousa enquanto explica a derivação. Observadores notaram que as fórmulas no clipe parecem estar corretas e a escrita no quadro é coerente. A procedência deste clipe não foi verificada de forma independente.
A renderização de texto em vídeo gerado por IA tem sido historicamente não confiável. Se este clipe for genuíno e representativo, sugeriria progresso nessa área — mas sem confirmação oficial ou testes independentes, nenhuma conclusão definitiva pode ser tirada.
Uma Cena de Restaurante (Não Verificado)
Outro clipe vazado mostra dois homens comendo espaguete em um restaurante. Isso faz referência ao famoso benchmark "Will Smith eating spaghetti" usado informalmente para avaliar a qualidade do vídeo por IA. A fonte e a autenticidade deste clipe não estão verificadas.
Recursos de Edição (Não Verificado)
Capturas de tela vazadas sugerem capacidades de edição incluindo remoção de marca d'água e substituição de objetos pela interface de chat. Esses recursos não foram confirmados pelo Google, e não está claro se refletem um produto finalizado ou um teste interno.
Como Isso se Compara à Abordagem Atual do Google
Olhando para o que o Google realmente lançou (não vazado):
- Nano Banana 2 e Pro: Os modelos de geração de imagens por IA do Google disponíveis publicamente, integrados ao Gemini. Eles geram e editam imagens pela interface de chat.
- Veo 3.1: O modelo de geração de vídeo do Google disponível publicamente, acessível pelo Gemini, mas operando como um pipeline separado rotulado como "Powered by Veo 3.1."
Os vazamentos levaram alguns veículos — incluindo o 36Kr — a descrever o Omni como uma potencial "versão de vídeo do Nano Banana." Isso é uma analogia, não o posicionamento oficial do Google, e pode ou não refletir o produto real.
O Panorama do Vídeo por IA (Atual, Confirmado)
Para contextualização, estes são os principais modelos de vídeo por IA disponíveis publicamente em maio de 2026:
| Modelo | Empresa | Status |
|---|---|---|
| Seedance 2.0 | ByteDance | Disponível publicamente |
| HappyHorse-1.0 | Alibaba | Disponível publicamente |
| Wan 2.7 | Alibaba | Disponível publicamente |
| Kling V3.0 | Kuaishou | Disponível publicamente |
| Sora 2 | OpenAI | Apenas API (aplicativo para consumidores encerrado em 29 de abril de 2026) |
| Veo 3.1 | Disponível pelo Gemini (limitado por região) |
A OpenAI confirmou o encerramento do aplicativo Sora para consumidores em 29 de abril de 2026. O Google declarou publicamente que a geração de vídeo permanece parte de seu roadmap.
O Gemini Omni não aparece nesta lista porque não foi anunciado oficialmente.
A Posição do AnyCap
O AnyCap é uma plataforma de capacidades de IA que agrega modelos de IA generativa — imagem, vídeo, áudio, pesquisa — em uma única API. Os modelos de vídeo listados no início deste post (Veo 3.1, Seedance 2.0, Wan 2.7, Kling V3.0, Sora 2, Nano Banana 2 e Nano Banana Pro) estão todos disponíveis hoje no catálogo de modelos AnyCap.
Sobre o Gemini Omni:
- O Google não anunciou este modelo nem confirmou acesso via API.
- Se o Google lançar o Omni com disponibilidade de API, o AnyCap avaliará o modelo e buscará integrá-lo.
- Não há prazo confirmado para isso, já que o Google também não definiu um.
- O AnyCap não tem acesso antecipado ou privilegiado a produtos Google não anunciados.
O Que Acompanhar
O Google I/O 2026 acontece de 19 a 20 de maio de 2026. O Google costuma usar esse evento para anunciar atualizações de produtos, mas a agenda específica não foi confirmada. Independentemente de o Omni ser discutido ou não, o AnyCap monitorará os anúncios oficiais e avaliará as oportunidades de integração conforme surgirem.
Resumo
Vazamentos não verificados sugerem que o Google pode estar desenvolvendo uma experiência de geração de vídeo nativa para o Gemini com o nome "Omni." Os clipes em circulação são interessantes, mas não confirmados. O Google não anunciou este produto, não descreveu suas capacidades nem forneceu um prazo de lançamento.
Se o Omni for lançado com acesso à API, o AnyCap pretende avaliá-lo e integrá-lo, como a plataforma faz com os principais novos modelos. Enquanto isso, sete modelos de geração de vídeo e imagem já estão disponíveis no AnyCap, todos acessíveis com uma única chave de API.
Este post será atualizado quando e se o Google fornecer informações oficiais sobre o Gemini Omni.