Google Lumiere: Durchbruch bei KI-Videos

von Jörg Schieb | 25.01.2024 | Tipps

Google Lumiere erzeugt bemerkenswerte Kurzvideos - Text to Video

Google ist es gelungen, eine bemerkenswert leistungsfähige KI zur Erzeugung von Videos an den Start zu bringen. Lumiere erzeugt aus dem Nichts bis zu fünf Sekunden lange Videos. Ein Anfang.

KI kann heute Texte erzeugen, Fotos und Bilder, auch Audios – und das in zunehmend guter Qualität. Nur an Bewegtbildern (Videos) hat sich die KI bislang die Zähne ausgebissen.

Denn Videos sind selbst für KI sehr anspruchsvoll. Doch das könnte sich bald ändern, denn Google hat ein KI-System entwickelt, das selbst diese Hürde meistert und mehrsekündige Videosequenzen herstellen kann.

Ein erster Anfang, wie vor einigen Monaten, als KI die ersten echt aussehenden Bilder erzeugt hat.

Google Lumiere kann auch bestehende Bilder animieren

Google Lumiere: Eine Verbeugung vor der gleichnamigen Brüdern

In Fachkreisen spricht man gerade über diese neue KI-Technologie, die Google da entwickelt hat.

Fangen wir doch mit dem Namen an: Google hat das KI-Modell „Lumière“ getauft. Eine Verneigung vor den Brüdern Lumière.

Die beiden Franzosen entwickelten 1895 die erste funktionstüchtige Filmkamera – und das erste Abspielgerät. Der Grundstein des Kinos. Google Lumiere will der Grundstein für Videos generierende KI sein.

Mit der KI, die noch nicht öffentlich zugänglich ist, wohl aber technischen Dokumente und Beispiele, die mit der KI erzeugt wurden, kann fünf Sekunden lange Videosequenzen erzeugen. Aus dem Nichts.

Es reicht, der KI zu sagen, was man sehen möchte. Zum Beispiel: Ein Hund mit roter Brille, der seine Nase beim Autofahren aus dem Fenster hält. Fertig. Oder eine Schildkröte, die an den Strand krabbelt. Fertig. Ein tanzender Bär. Ein Sonnenuntergang in Paris. Das können Bilder generierende KIs ja schon lange. Aber nun gibt es die erste KI, die durchaus real wirkende Videos generiert.

Das Konzept hinter Google Lumiere erklärt

Google Lumiere verwendet anderen Ansatz

Die aller erste KI, die Videosequenzen erzeugt, ist Google Lumiere ja nicht.

Die bisherigen KI-Modelle sind daran gescheitert, Bewegungen wirklich gut zu simulieren. Man könnte sagen, die KI scheitert an der Zeit. Denn wenn sich etwas bewegt, dann verändert sich oft auch die Perspektive, das Licht.

Die Google-Ingenieure verfolgen eine ganz andere Philosophie als bisherige KI-Modelle. Bislang haben Video-KIs das erste Bild erzeugt, dann das zweite, dann das dritte – und immer Kleinigkeiten verändert.

Google Lumiere erzeugt alle Bilder gleichzeitig. Das sorgt für mehr „Kohärenz“, wie Ingenieure sagen. Alles bewegt sich natürlich, es gibt nichts, was unnatürlich wirkt. Die KI wurde mit 30 Millionen Videos trainiert, um natürliche Bewegungen zu erlernen.

Die KI kann nicht alles erzeugen, aber Natur und Tiere funktionieren schon sehr überzeugend. Ein erster Schritt ist gemacht: Alle KI-Entwickler werden jetzt auf diese neue Methode setzen, weil sie am erfolgversprechendsten ist.

Durchbruch gelungen: Missbrauch vorherzusehen

Das klingt jetzt erst mal sehr beeindruckend, man könnte auch sagen viel versprechend. Aber natürlich auch beängstigend: Drohen uns nach Fake-Bildern nun auch Fake-Videos?

Das ist wohl unausweichlich – früher oder später. Es gibt durchaus schon Fake-Videos. Etwa Videos, die Personen zeigen, die reden – und ihnen werden andere Wörter in den Mund gelegt. Oder KI tauscht das eine Gesicht im Film gegen ein anderes Gesicht aus.

Aber dass eine KI tatsächlich eine komplette Bildsequenz aus dem Nichts erstellt und es sieht echt aus: Das ist neu! Sobald diese Technologie frei zugänglich ist oder von anderen kopiert wurde, wird ohne jeden Zweifel Missbrauch stattfinden.

So wie auch mit Bildern und Audios schon geschehen. Allerdings wird es noch eine Weile dauern, bis wirklich längere Sequenzen erstellt werden können. So sind zum Beispiel im Augenblick noch keine Umschnitte möglich.

Nur eine Einstellung und Sequenz. Aber das ist alles eine Frage der Zeit. Denn mit dieser Technologie lassen sich auch Objekte in einem vorhandenen Video austauschen. Eine Person gegen eine andere. Eine Uhr der Marke A gegen eine der Marke B. Das perfekte Werkzeug für Werbung, Spaß, Unterhaltung und Kino – aber eben auch für die Giftküche von Betrügern und Staaten.

Wie geht es mit Google Lumiere weiter

Stellt sich die Frage: Lässt sich der Geist denn wieder in die Flasche bekommen oder so „zähmen“, dass Missbrauch ausgeschlossen ist.

Das kommt darauf an, wie schnell sich die KI-Technologie entwickelt – und wer sie kopieren kann. Durch die Möglichkeiten bisheriger KI-Technologien ist die Politik und Gesellschaft aufgewacht und gewarnt.

Es ist wahrscheinlich, dass Grenzen gezogen werden, was mit so einer KI möglich sein darf – und was damit gemacht werden darf. Oder wer sie benutzen darf. Das wird Missbrauch allerdings niemals vollständig verhindern können, bestenfalls erschweren.

Einige KI-Modelle, die Bilder generieren können, erlauben es zum Beispiel nicht mehr, Fake-Bilder von einem verhafteten Donald Trump zu erzeugen.

Gut möglich aber trotzdem, dass schon bald KI-erzeugte Videos zu sehen sind, die genau so etwas zeigen – und für Manipulationen bei Wahlen verwendet werden. Wir müssen also wachsam bleiben – zunehmend.