
Nota: Tudo o que é referido sobre o Gemini Omni neste artigo baseia-se em fugas de informação não confirmadas e em especulações da comunidade. A Google não anunciou oficialmente este modelo, não confirmou as suas capacidades nem assumiu qualquer compromisso relativamente a um prazo de lançamento. Actualizaremos este artigo quando e se surgirem informações oficiais.
O Google I/O 2026 acontece daqui a uma semana e surgiram nas redes sociais demonstrações não verificadas do que parece ser uma nova funcionalidade de geração de vídeo chamada "Gemini Omni". Eis o que as fugas revelam, o que podem significar se forem verdadeiras, e como o AnyCap abordaria a integração desse modelo.
Modelos de Vídeo Disponíveis no AnyCap Hoje
O Omni é ainda especulação — mas se quiser trabalhar com geração de vídeo por IA agora mesmo, estes modelos estão activos no AnyCap com uma única chave de API:
| Modelo | Fornecedor | Ideal Para |
|---|---|---|
| Veo 3.1 | Trabalho de câmara cinemático, sincronização áudio-visual | |
| Seedance 2.0 | ByteDance | Melhor desempenho em benchmarks, variantes Fast/Turbo |
| Wan 2.7 | Alibaba | Saída em 1080p, movimento sincronizado com áudio |
| Kling V3.0 | Kuaishou | Alta fidelidade, variantes Std/Pro/O3 |
| Sora 2 | OpenAI | Geração de vídeo acessível via API |
| Nano Banana 2 | Geração e edição rápida de imagens | |
| Nano Banana Pro | Geração de imagens de alta fidelidade |
Todos os modelos partilham o mesmo endpoint de API, facturação e autenticação. Sem SDKs separados ou contratos por modelo.
→ Ver o catálogo completo de modelos AnyCap
O Que as Fugas Mostram (Não Verificado)
A 2 de Maio, um utilizador do Reddit partilhou uma captura de ecrã da aplicação móvel do Gemini com o texto: "Start with an idea or try a template. Powered by Omni." A etiqueta aparecia junto a "Toucan", que é alegadamente o nome de código interno da Google para o caminho de vídeo actual baseado no Veo 3.1. A captura de ecrã não foi verificada de forma independente.
A descrição da interface é reportada como:
Conheça o nosso novo modelo de geração de vídeo. Faça remix dos seus vídeos, edite directamente no chat, experimente um modelo e muito mais.
Este texto provém de uma captura de ecrã vazada e não foi confirmado pela Google.
Três Possibilidades (Todas Especulativas)
Se as fugas reflectirem um produto real em desenvolvimento, a comunidade de IA discutiu várias interpretações — todas especulativas até a Google fornecer informação oficial:
| # | Possibilidade | Confiança | Notas |
|---|---|---|---|
| 1 | Rebranding do Veo — Omni é um novo nome para o pipeline Veo existente | Desconhecida | Seria apenas uma mudança cosmética |
| 2 | Novo modelo de vídeo — Uma arquitectura diferente treinada sob o Gemini | Desconhecida | Só a Google conhece a tecnologia subjacente |
| 3 | Modelo omni unificado — Sistema único para texto + imagem + vídeo + áudio | Altamente especulativo | O nome sugere esta interpretação, mas nenhuma evidência a confirma |
Nenhuma destas possibilidades foi confirmada.
O Que os Clips Vazados Mostram
As demonstrações que circulam online não estão verificadas — não é possível confirmar de forma independente se foram geradas pelo Gemini Omni ou se reflectem a qualidade típica de saída do modelo.
Um Professor no Quadro (Não Verificado)
Um clip amplamente partilhado mostra o que parece ser um professor a escrever fórmulas matemáticas no quadro enquanto explica a derivação. Os observadores notaram que as fórmulas no clip parecem estar correctas e a escrita a giz é coerente. A proveniência deste clip não foi verificada de forma independente.
A renderização de texto em vídeo gerado por IA tem sido historicamente pouco fiável. Se este clip for genuíno e representativo, sugeriria progresso nessa área — mas sem confirmação oficial ou testes independentes, não é possível tirar conclusões definitivas.
Uma Cena de Restaurante (Não Verificado)
Outro clip vazado mostra dois homens a comer esparguete num restaurante. Esta é uma referência ao conhecido benchmark "Will Smith eating spaghetti", usado informalmente para avaliar a qualidade do vídeo por IA. A fonte e a autenticidade deste clip não estão verificadas.
Funcionalidades de Edição (Não Verificado)
Capturas de ecrã vazadas sugerem capacidades de edição incluindo remoção de marcas de água e substituição de objectos através da interface de chat. Estas funcionalidades não foram confirmadas pela Google, e não é claro se reflectem um produto acabado ou um teste interno.
Comparação com a Abordagem Actual da Google
Olhando para o que a Google efectivamente lançou (não vazado):
- Nano Banana 2 e Pro: Os modelos de geração de imagens por IA da Google disponíveis publicamente, integrados no Gemini. Geram e editam imagens através da interface de chat.
- Veo 3.1: O modelo de geração de vídeo da Google disponível publicamente, acessível através do Gemini mas a operar como um pipeline separado com a etiqueta "Powered by Veo 3.1."
As fugas levaram alguns meios — incluindo o 36Kr — a descrever o Omni como uma potencial "versão de vídeo do Nano Banana." Trata-se de uma analogia, não do posicionamento oficial da Google, e pode ou não reflectir o produto real.
O Panorama do Vídeo por IA (Actual, Confirmado)
Para contextualização, eis os principais modelos de vídeo por IA disponíveis publicamente em Maio de 2026:
| Modelo | Empresa | Estado |
|---|---|---|
| Seedance 2.0 | ByteDance | Disponível publicamente |
| HappyHorse-1.0 | Alibaba | Disponível publicamente |
| Wan 2.7 | Alibaba | Disponível publicamente |
| Kling V3.0 | Kuaishou | Disponível publicamente |
| Sora 2 | OpenAI | Apenas API (aplicação para consumidores encerrada a 29 de Abril de 2026) |
| Veo 3.1 | Disponível através do Gemini (limitado por região) |
A OpenAI confirmou o encerramento da aplicação Sora para consumidores a 29 de Abril de 2026. A Google declarou publicamente que a geração de vídeo permanece parte do seu roadmap.
O Gemini Omni não aparece nesta lista porque não foi oficialmente anunciado.
A Posição do AnyCap
O AnyCap é uma plataforma de capacidades de IA que agrega modelos de IA generativa — imagem, vídeo, áudio, pesquisa — numa única API. Os modelos de vídeo listados no início deste artigo (Veo 3.1, Seedance 2.0, Wan 2.7, Kling V3.0, Sora 2, Nano Banana 2 e Nano Banana Pro) estão todos disponíveis hoje no catálogo de modelos AnyCap.
Relativamente ao Gemini Omni:
- A Google não anunciou este modelo nem confirmou acesso via API.
- Se a Google lançar o Omni com disponibilidade de API, o AnyCap avaliaria o modelo e tentaria integrá-lo.
- Não existe um prazo confirmado, uma vez que a Google também não tem nenhum.
- O AnyCap não tem acesso antecipado ou privilegiado a produtos Google não anunciados.
O Que Acompanhar
O Google I/O 2026 decorre de 19 a 20 de Maio de 2026. A Google utiliza tipicamente este evento para anunciar actualizações de produtos, mas a agenda específica não foi confirmada. Independentemente de o Omni ser ou não discutido, o AnyCap irá acompanhar os anúncios oficiais e avaliar as oportunidades de integração à medida que surgirem.
Resumo
Fugas não verificadas sugerem que a Google poderá estar a desenvolver uma experiência de geração de vídeo nativa para o Gemini com o nome "Omni." Os clips que circulam são interessantes, mas não confirmados. A Google não anunciou este produto, não descreveu as suas capacidades nem forneceu um prazo de lançamento.
Se o Omni for lançado com acesso à API, o AnyCap tenciona avaliá-lo e integrá-lo, como faz com os principais novos modelos. Entretanto, sete modelos de geração de vídeo e imagem estão já disponíveis no AnyCap, todos acessíveis com uma única chave de API.
Este artigo será actualizado quando e se a Google fornecer informação oficial sobre o Gemini Omni.