Google Gemini gestartet: Eine KI mit vielen Talenten

von Jörg Schieb | 08.12.2023 | KI

Google Gemini: Eine bis dato unerreichte KI

Google war mal einer der führenden Unternehmen in Sachen KI. Dieser Status ist durch ChatGPT ein wenig angekratzt. Doch jetzt wagt Google mit Gemini den großen Schlag. KI kommt in alle Produkte und Dienste.

Das Thema Künstliche Intelligenz (KI) hat durch ChatGPT so richtig Fahrt aufgenommen. Seit ziemlich genau einem Jahr ist ChatGPT für alle zugänglich. Und seitdem gibt es einen Wettbewerb, wer mit seinen KI-Modellen besser, schneller und intelligenter ist.

Jetzt hat auch Google ein KI-Modell an den Start gebracht, das sich „Gemini“ nennt (gesprochen: Jehmenai) – und es locker mit ChatGPT aufnehmen kann. Gemini kann Text, Code, Audio, Bild und Video verstehen und generieren. Der Markt gerät in Bewegung – und die Politik will und muss KI Grenzen setzen.

Google und die KI

Bislang ist Google nicht so richtig in Erscheinung getreten im Bereich KI – dabei forscht das Unternehmen länger als alle anderen an KI.

Eins muss man sagen: Google forscht schon lange an KI und hat die angesehensten Forscher und Experten im Team oder im Team gehabt, zum Beispiel Geoffrey Hinton. Er gilt als Pionier und hat die Grundsteine gelegt für ganz neue Methoden und Technologien, die ChatGPT und andere KI-Modelle wie selbstverständlich verwenden.

Google hat in der Vergangenheit KI-Maschinen gebaut, die jeden Menschen schlagen – AlphaZero genannt. Später hat Google AlphaGo entwickelt. Diese KI spielt besser „Go“ als jeder Mensch. Go ist das schwierigste und komplexeste Spiel, das es gibt. Google hat also in der Vergangenheit Meilensteine gesetzt, wurde aber trotzdem von OpenAI und ChatGPT überrasche und überrollt.

Denn ChatGPT ist die erste KI, die man die Öffentlichkeit hat nutzen lassen. Das gab es vorher nicht. Da wurde Google überrascht. Zwar hat Google mit dem Chatbot „Bard“ schon vor Monaten ein durchaus vergleichbares KI-Modell vorgestellt, das aber bei weitem nicht so viel von sich Reden macht wie ChatGPT.

Google Gemini gibt es in mehreren Modellen für jeden Zweck und Bedarf

Google Gemini: KI mit vielen Talenten

Doch jetzt der große Game Changer: Google hat „Gemini“ vorgestellt. Ein KI-System, das in der Branche große Beachtung findet. Was steckt dahinter?

Google hat jetzt ein KI-System vorgestellt, das es in drei Größen geben soll: „Nano“, läuft auch auf Smartphones. „Pro“, für den Einsatz auf Servern. Die Pro-Version soll ab sofort im Chatbot Google Bard zum Einsatz kommen, aber auch in vielen anderen Google-Diensten.

Und Gemini „Ultra“ ist der große Bruder: Dieses KI-Modell ist besonders leistungsfähig und kommt nur bei speziellen Anwendungen zum Einsatz. Doch nicht nur Google selbst kann und wird Gemini nutzen, aber nächster Woche steht es auch allen Entwicklern zur Verfügung: Sie können dann damit eigene Anwendungen bauen oder Apps.

Ich habe mir erste Beispiele angesehen, was Gemini kann – und muss sagen: Es ist beeindruckend. Man kann mit der KI sprechen, ihr Dinge zeigen, Fragen dazu stellen und diskutieren. Gemini verfügt über ein beeindruckendes Wissen und reagiert sehr schnell.

Wer mit Google im Netz sucht oder Google-Dienste wie Google Docs benutzt, kommt damit schon sehr bald in Berührung. Noch kann Gemini nur Englisch, aber das soll sich schnell ändern. Da Gemini von Anfang an auf Text, Audio, Foto und Video gleichzeitig trainiert wurde, ist diese KI in der Lage, Dinge in Fotos oder sogar Videos blitzschnell zu erkennen und zu reagieren.

Alle setzen auf KI

Alle setzen auf KI! Microsoft ist schon eine ganze Weile dabei, überall KI-Fähigkeiten einzubauen – basierend auf ChatGPT. Die Suchmaschine Bing hat KI-Funktionen, aber auch die Büroprogramme Word, Excel und Powerpoint werden mit KI ausgerüstet. „Copilot“, nennt sich die KI.

Selbst das Betriebssystem Windows, das die meisten Menschen auf ihren Computern verwenden, bekommt KI-Funktionen. KI wird also zum Alltag.

Das gilt nun auch für Google-Dienste. Google hat angekündigt, in der Suchmaschine mehr KI einzubauen, aber auch in Google Mail: „Intelligent“ in den Archiven der Mail-Postfächer suchen zum Beispiel. „Zeige mir alle Mails, in denen ich ein Restaurant vorgeschlagen habe!“

Kein Problem. Aber auch in Youtube wird mit man KI suchen können. Selbst der Browser soll KI-Funktionen bekommen. Es gibt einen radikalen Wandel in der Art und Weise, wie wir Online-Dienste und Software benutzen. Als Nächstes wird Meta kommen. Auch Meta entwickelt an leistungsfähigen KI-Modellen, die demnächst für die Öffentlichkeit verfügbar gemacht werden.

Einschränkungen für KI

Überall KI: Das ist auf der einen Seite faszinierend, weil sich neue Möglichkeiten auftun. Es ist für viele aber auch beängstigend, weil sie nicht einschätzen können, was da auf sie zukommt und was KI alles kann. Die EU plant doch Regulierungen für KI. Wie weit sind wir da?

Die EU ist umtriebig, sie hat im April 2021 einen Vorschlag für ein KI-Gesetz vorgelegt. Das Gesetz – auch als „AI Act“ bezeichnet – soll sicherstellen, dass KI-Systeme in der EU sicher, ethisch und menschenrechtskonform eingesetzt werden.

Die Regeln unterscheiden nach der Risikoklasse: KI mit niedrigem Risiko, etwa in Spielen oder um die Suche zu unterstützen, unterliegen keinen Regeln. Wenn jedoch KI eingesetzt wird, die auch Entscheidungen beeinflusst, sind bereits strengere Regeln vorgesehen.

Wichtig ist: KI soll nie selbständig entscheiden, keine Menschen gefährden und bei leistungsfähiger KI sieht die EU mitunter sogar Genehmigungsverfahren vor. Noch sind die Regeln nicht verabschiedet und es wird auch darüber diskutiert. Denn zu strenge Regeln könnten auch schädlich sein für den Standort Deutschland. Zu lasche Regeln stellen eine Gefahr da.

Aber das kann alles nur der Anfang sein. Denn es verändert sich alles – und es muss über vieles gesprochen werden. Ob über Urheberrecht, Haftung und Verantwortung, Transparenz und vieles andere mehr.