Neues KI Modell Gemini Omni verändert die Videobearbeitung

Google hat mit Gemini Omni ein neues KI Modell vorgestellt, das Medienformate wie Text, Bild, Ton und Video direkt miteinander verbindet. Im Zentrum steht die Videobearbeitung: Nutzer können vorhandene Videos mit einfachen Texteingaben verändern und etwa Umgebungen anpassen oder Details wie spiegelnde Oberflächen hinzufügen. Das Modell soll dabei Charaktere und Szenenverläufe beibehalten und physikalische Zusammenhänge wie Schwerkraft und Strömungsmechanik berücksichtigen.

Gemini Omni verarbeitet auch unterschiedliche Referenzmedien zu einem gemeinsamen Clip. So kann etwa aus einer Zeichnung und einer Audiodatei ein Video mit passendem Rhythmus entstehen. Außerdem unterstützt das Modell die Erstellung persönlicher Avatare, die das eigene Aussehen und die Stimme nachbilden. Zum Schutz vor Fälschungen versieht Google alle generierten Inhalte automatisch mit dem unsichtbaren Wasserzeichen SynthID.

Die erste Version namens Gemini Omni Flash ist ab sofort für Abonnenten der Stufen AI Plus, Pro und Ultra über die Gemini App und Google Flow verfügbar. Gleichzeitig integriert Google die Technik ohne Zusatzkosten in YouTube Shorts und die YouTube Create App. Für Unternehmenskunden und Entwickler sollen in den kommenden Wochen API Schnittstellen folgen.

Zur Originalmeldung