12 05 2023

Neue Bard-Updates sollen Googles Rückstand bei KI aufholen

Ein wenig von der Krisenstimmung, die bei Google angesichts des spektakulären Erfolgs von ChatGPT seit Monaten herrscht, blitzte bei der Keynote-Rede von Bard-Chefin Sissie Hsiao auf der Google I/O am Mittwoch durch. Die Präsentation legt die Vermutung nahe, dass Google – ganz entgegen üblicher Gewohnheiten – sein neues KI-Modell Bard zum frühestmöglichen Zeitpunkt an die Öffentlichkeit bringt. Dessen ungeachtet verspricht Bard, zu einem ernsthaften Konkurrenten des OpenAI-Chatbots zu werden – und noch einiges mehr.

Ein Schwerpunkt der jetzt vorgestellten Updates ist die Erweiterung auf weitere Sprachen und Regionen über den englischen Sprachraum hinaus. Doch alleine die Tatsache, dass Google mit seinem KI-System noch im Experimentalstadium einen vollwertigen Produktlaunch hinlegt, weist auf die Panikstimmung hin, die offenbar bei der Konzernmutter Alphabet vorherrscht.

Bard gibt es bald in vielen Sprachen

Zur Google I/O konnte Sissie Hsiao den Start von Bard auf koreanisch und japanisch verkünden. Doch dabei soll es natürlich nicht bleiben: Bald soll die KI 40 Sprachen unterstützen und in 180 Ländern verfügbar sein. Was “bald” allerdings in konkreten Zeiträumen bedeutet, wollte die General Managerin noch nicht verraten.

Dass es sich bei einer generischen KI wie Bard um eine sehr junge Technologie mit ihren bekannten Grenzen handelt, ist eine der Bemerkungen von Sissie Hsiao, die auf die Krisenstimmung bei Google hindeutet. Man werde natürlich expandieren, das allerdings nur unter Beachtung der eigenen Qualitätskriterien – so bemäntelt man die Aussage, dass man sich unter massivem Zugzwang befindet.

Leistungsfähigeres Sprachmodell

Mit dem neuen Update nutzt Bard ab sofort das Sprachmodell PaLM 2, das insbesondere bei der Lerntiefe erheblich höhere Leistungsdaten aufweist. Erst dadurch konnten die Entwickler das System mit einer Reihe neuer Funktionalitäten ausstatten, insbesondere in den Bereichen Mathematik, Logik und Programmierung.

In den Ländern, in denen Bard verfügbar ist, fällt ab sofort der Eintrag in die Warteliste weg. Das trifft allerdings vorerst nur auf die USA, Großbritannien, Südkorea und Japan zu. Wann der Zugang zu den versprochenen weiteren 180 Ländern erfolgt, ist noch nicht bekannt.

Google betont den visuellen Ansatz

Was Bard in Zukunft von ChatGPT abheben soll, ist der visuelle Ansatz bei der Benutzerinteraktion. So sollen Antworten auf Anfragen mit entsprechendem Bildmaterial ausgestattet sein, beispielsweise Fotos von Sehenswürdigkeiten der angefragten Region.

In umgekehrter Richtung lassen sich Anfragen eigene Bilder beiordnen, um daraus Antworten zu beziehen, beispielsweise passende Bildunterschriften. Dazu soll Google Lens direkt in Bard integriert werden. Das allerdings deutet darauf hin, dass auch Bard die Schwächen von Lens teilen wird. Die richtige Antwort auf die Frage “Wer ist das?” zum Bild einer Person des öffentlichen Lebens wird also vermutlich weiterhin ein unerfüllter Wunsch bleiben.

Quellennachweise und Integration in die Google-Welt

Ein echter Vorteil von Bard gegenüber ChatGPT werden die Quellennachweise sein. Ein Klick auf die entsprechenden Textabschnitte oder Codeblöcke soll direkt auf die Quellen verlinken. Das könnte insbesondere für wissenschaftliche Texte einen Quantensprung bedeuten.

Als erste Schnittstellen zu anderen Google-Anwendungen kommen in Kürze Exportfunktionen von Antworten direkt nach Gmail und Google Docs hinzu. Das ist allerdings erst der erste Schritt: In Zukunft soll Bard fester Bestandteil aller wichtigen Google-Dienste werden – von Drive bis zu Maps. Die Art, wie Bard mit den Anwendungen interagiert, soll sich durch entsprechende Privatsphäre- und Datenschutzeinstellungen regulieren lassen.

Integration externer Dienste

Bald schon sollen die Schranken zu Webdiensten externer Partner fallen. Als erstes soll es eine Integration von Adobes KI-Modell Firefly geben. Das soll es möglich machen, eigene Ideen textlich auszudrücken und mittels Adobe in qualitätsvolle Bilder umzuwandeln. Die weitere Bearbeitung kann dann beispielsweise in Adobe Express erfolgen.

Interessant sind in diesem Zusammenhang die Vorteile der Kooperation mit Adobe in Hinsicht auf das Urheberrecht. Noch ist die Rechtslage für die Verwendung von im Netz befindlichen Bildmaterial für die Lernprozesse von KI-Systemen weitgehend ungeklärt. Adobe kann dabei auf sein eigenes umfangreiches Stock-Archiv zurückgreifen, was die Frage nach dem Copyright obsolet macht. Adobe arbeitet bereits an einem Vergütungsmodell für seine Zulieferer von Bildmaterial.

Ob Google es über vollmundige Ankündigungen schaffen wird, den Rückstand zu anderen KI-Anbietern aufzuholen, bleibt abzuwarten. Es kann auch anders kommen – die Konkurrenz schläft nicht.