Gemini Omni geleakt: Googles „Video Nano Banana" kommt – und AnyCap plant die Integration

Nicht verifizierte Leaks deuten auf ein neues Google-Videomodell namens „Gemini Omni" hin. Was die Demos zeigen, was offen bleibt – und wie AnyCap eine Integration angehen würde.

by AnyCap

Gemini Omni KI-Videogenerierung

Hinweis: Alle Informationen zu Gemini Omni in diesem Artikel basieren auf unbestätigten Leaks und Spekulationen der Community. Google hat dieses Modell nicht offiziell angekündigt, seine Funktionen nicht bestätigt und sich auf keinen Veröffentlichungszeitraum festgelegt. Wir aktualisieren diesen Beitrag, sobald offizielle Informationen vorliegen.

Google I/O 2026 findet in einer Woche statt, und in sozialen Medien sind unverifizierte Demos aufgetaucht, die offenbar ein neues Videogenerierungsfeature namens „Gemini Omni" zeigen. Hier erfahren Sie, was die Leaks zeigen, was sie bedeuten könnten – und wie AnyCap bei einer möglichen Integration vorgehen würde.


Aktuell verfügbare Videomodelle auf AnyCap

Omni ist noch Spekulation – wenn Sie jedoch jetzt mit KI-Videogenerierung arbeiten möchten, sind diese Modelle auf AnyCap unter einem einzigen API-Schlüssel verfügbar:

Modell Anbieter Am besten geeignet für
Veo 3.1 Google Cinematografische Kameraarbeit, Audio-Video-Synchronisation
Seedance 2.0 ByteDance Top-Benchmark-Leistung, Fast/Turbo-Varianten
Wan 2.7 Alibaba 1080p-Ausgabe, audiosynchronisierte Bewegung
Kling V3.0 Kuaishou Hohe Wiedergabetreue, Std/Pro/O3-Varianten
Sora 2 OpenAI API-zugängliche Videogenerierung
Nano Banana 2 Google Schnelle Bildgenerierung und -bearbeitung
Nano Banana Pro Google Hochauflösende Bildgenerierung

Alle Modelle teilen denselben API-Endpunkt, die gleiche Abrechnung und Authentifizierung. Keine separaten SDKs oder modellspezifischen Verträge.

Den vollständigen AnyCap-Modellkatalog durchsuchen


Was die Leaks zeigen (nicht verifiziert)

Am 2. Mai teilte ein Reddit-Nutzer einen Screenshot aus der Gemini-Mobile-App mit dem Text: „Start with an idea or try a template. Powered by Omni." Die Bezeichnung erschien neben „Toucan" – dem angeblich internen Codenamen von Google für den aktuellen Veo 3.1-betriebenen Videopfad. Der Screenshot wurde nicht unabhängig verifiziert.

Die UI-Beschreibung lautet angeblich:

Lernen Sie unser neues Videogenerierungsmodell kennen. Remixen Sie Ihre Videos, bearbeiten Sie direkt im Chat, probieren Sie eine Vorlage und mehr.

Dieser Text stammt aus einem geleakten Screenshot und wurde von Google nicht bestätigt.

Drei Möglichkeiten (alle spekulativ)

Wenn die Leaks ein tatsächlich in Entwicklung befindliches Produkt widerspiegeln, hat die KI-Community verschiedene Interpretationen diskutiert – alle spekulativ, bis Google offizielle Informationen liefert:

# Möglichkeit Verlässlichkeit Anmerkungen
1 Veo-Rebrand – Omni ist ein neuer Produktname für die bestehende Veo-Pipeline Unbekannt Wäre lediglich eine kosmetische Änderung
2 Neues Videomodell – Eine andere Architektur, die unter Gemini trainiert wurde Unbekannt Nur Google kennt die zugrundeliegende Technologie
3 Einheitliches Omni-Modell – Ein einzelnes System für Text + Bild + Video + Audio Sehr spekulativ Der Name legt diese Interpretation nahe, aber keine Belege bestätigen sie

Keine dieser Möglichkeiten wurde bestätigt.


Was die geleakten Clips zeigen

Die online kursierenden Demos sind nicht verifiziert – es ist nicht möglich, unabhängig zu bestätigen, ob sie von Gemini Omni generiert wurden oder die typische Ausgabequalität des Modells widerspiegeln.

Ein Professor an einer Tafel (nicht verifiziert)

Ein weit verbreiteter Clip zeigt, was offenbar ein Professor ist, der mathematische Formeln an eine Tafel schreibt und dabei die Herleitung erklärt. Beobachter haben festgestellt, dass die Formeln im Clip korrekt zu sein scheinen und die Kreidenotizen kohärent sind. Die Herkunft dieses Clips wurde nicht unabhängig verifiziert.

Die Textdarstellung in KI-generiertem Video war historisch gesehen unzuverlässig. Wenn dieser Clip echt und repräsentativ ist, würde er Fortschritte in diesem Bereich andeuten – aber ohne offizielle Bestätigung oder unabhängige Tests können keine gesicherten Schlussfolgerungen gezogen werden.

Eine Restaurantszene (nicht verifiziert)

Ein weiterer geleakter Clip zeigt zwei Männer, die in einem Restaurant Spaghetti essen. Dies spielt auf den bekannten „Will Smith eating spaghetti"-Benchmark an, der informell zur Bewertung der KI-Videoqualität verwendet wird. Quelle und Echtheit dieses Clips sind nicht verifiziert.

Bearbeitungsfunktionen (nicht verifiziert)

Geleakte Screenshots deuten auf Bearbeitungsfunktionen hin, darunter Wasserzeichenentfernung und Objektersatz über die Chat-Oberfläche. Diese Funktionen wurden von Google nicht bestätigt, und es ist unklar, ob sie ein fertiges Produkt oder einen internen Test widerspiegeln.


Vergleich mit Googles aktuellem Ansatz

Ein Blick auf das, was Google tatsächlich veröffentlicht hat (nicht geleakt):

  • Nano Banana 2 und Pro: Googles öffentlich verfügbare KI-Bildgenerierungsmodelle, in Gemini integriert. Diese generieren und bearbeiten Bilder über die Chat-Oberfläche.
  • Veo 3.1: Googles öffentlich verfügbares Videogenerierungsmodell, über Gemini zugänglich, aber als separate Pipeline mit der Bezeichnung „Powered by Veo 3.1" betrieben.

Die Leaks haben einige Medien – darunter 36Kr – dazu veranlasst, Omni als potenzielle „Videoversion von Nano Banana" zu beschreiben. Dies ist eine Analogie, nicht Googles offizielle Positionierung, und entspricht möglicherweise nicht dem tatsächlichen Produkt.


Die KI-Videolandschaft (aktuell, bestätigt)

Zum Kontext: Hier sind die wichtigsten KI-Videomodelle, die ab Mai 2026 öffentlich verfügbar sind:

Modell Unternehmen Status
Seedance 2.0 ByteDance Öffentlich verfügbar
HappyHorse-1.0 Alibaba Öffentlich verfügbar
Wan 2.7 Alibaba Öffentlich verfügbar
Kling V3.0 Kuaishou Öffentlich verfügbar
Sora 2 OpenAI Nur API (Consumer-App am 29. April 2026 eingestellt)
Veo 3.1 Google Über Gemini verfügbar (regional begrenzt)

OpenAI bestätigte die Einstellung der Sora-Consumer-App am 29. April 2026. Google hat öffentlich erklärt, dass Videogenerierung Teil seiner Roadmap bleibt.

Gemini Omni erscheint nicht auf dieser Liste, da es offiziell nicht angekündigt wurde.


AnyCaps Position

AnyCap ist eine KI-Fähigkeitsplattform, die generative KI-Modelle – Bild, Video, Audio, Suche – unter einer einzigen API bündelt. Die zu Beginn dieses Beitrags aufgeführten Videomodelle (Veo 3.1, Seedance 2.0, Wan 2.7, Kling V3.0, Sora 2, Nano Banana 2 und Nano Banana Pro) sind alle heute im AnyCap-Modellkatalog verfügbar.

Zu Gemini Omni:

  • Google hat dieses Modell nicht angekündigt und keinen API-Zugang bestätigt.
  • Sollte Google Omni mit API-Verfügbarkeit veröffentlichen, würde AnyCap das Modell evaluieren und eine Integration anstreben.
  • Es gibt keinen bestätigten Zeitplan, da Google keinen angegeben hat.
  • AnyCap hat keinen frühzeitigen oder privilegierten Zugang zu nicht angekündigten Google-Produkten.

Was zu beobachten ist

Google I/O 2026 findet vom 19. bis 20. Mai 2026 statt. Google nutzt diese Veranstaltung typischerweise für Produktankündigungen, aber die genaue Agenda wurde noch nicht bestätigt. Unabhängig davon, ob Omni diskutiert wird, wird AnyCap offizielle Ankündigungen verfolgen und Integrationsmöglichkeiten prüfen, sobald sie sich ergeben.


Zusammenfassung

Unbestätigte Leaks deuten darauf hin, dass Google möglicherweise eine native Videogenerierungserfahrung für Gemini unter dem Namen „Omni" entwickelt. Die kursierenden Clips sind interessant, aber unbestätigt. Google hat dieses Produkt nicht angekündigt, seine Funktionen nicht beschrieben und keinen Veröffentlichungszeitraum angegeben.

Sollte Omni mit API-Zugang starten, beabsichtigt AnyCap, es zu evaluieren und zu integrieren, wie die Plattform es bei bedeutenden neuen Modellen tut. In der Zwischenzeit sind sieben Video- und Bildgenerierungsmodelle bereits auf AnyCap verfügbar, alle über einen einzigen API-Schlüssel zugänglich.


Dieser Beitrag wird aktualisiert, sobald Google offizielle Informationen zu Gemini Omni bereitstellt.