Fenster schliessen
 | RSSImpressum | Login logo
logo



WWDC 2024: Nicht Siri, sondern APIs


27.03.2024  


Das obige Spiel wurde vollständig von einer künstlichen Intelligenz programmiert. Man kann den linken Puck mit der Maus nach oben/unten bewegen. Der rechte Puck wird von der KI gesteuert. Es hat mich nur wenige Minuten gekostet, das kleine Spiel zu erzeugen.

Ich habe die KI gebeten, Buttons zu erzeugen, mit denen die Anwender die Hintergrundfarbe der Webseite ändern können. Die KI hat das Problem in 10 Sekunden wie folgt gelöst:








Wann ist eine Computerfirma wichtig und mächtig? Liegt das an den Umsätzen? Nicht auf Dauer. Denn die Wichtigkeit und die Macht einer Computerplattform ergibt sich aus den APIs und deren Verwendung. Unter APIs versteht man Bausteine eines Betriebssystems, mit denen Software-Entwickler ihre Apps aufbauen können. APIs ermöglichen es Entwicklern, auf bereits vorhandene Funktionen zuzugreifen, ohne diese von Grund auf selbst entwickeln zu müssen.

Das hat drei wichtige Folgen: Erstens, eine leistungsfähige API kann eine ganze Plattform auf ein höheres Niveau heben, weil die Entwickler bereits von einem höheren Niveau starten können. Das hält die Plattform attraktiv und wettbewerbsfähig für die Anwender. Zweitens, eine leistungsfähige API bindet die Entwickler an die Plattform. Drittens, eben dies ist die Voraussetzung dafür, dass es überhaupt jemanden interessiert, wenn Apple zu einer WWDC einlädt, um die neuen Funktionen zu demonstrieren. Es ist also ein Kreislauf: Gute APIs sind die Voraussetzung für gute Apps, dies bindet die Kunden, dies bindet die Entwickler, und dies macht den Anbieter relevant, sodass er die APIs weiter ausbauen kann.

Wenn dieser Kreislauf ins Stocken gerät, verliert der Plattformbetreiber seinen Einfluss. Selbst wenn er gute Innovationen bieten würde, käme es nicht mehr im Markt an. Es ist daher unverzichtbar, dass ein Plattformbetreiber es erreicht, dass seine APIs benutzt werden.

Neue Spielregeln

Mit dem überfallartigen Erfolg von Künstlicher Intelligenz ändert sich das Spiel. Aktuell dominiert OpenAI das Feld der KI-Entwicklungswerkzeuge, unterstützt durch die Partnerschaft mit Microsoft. Ihr Erfolg liegt nicht nur in der Leistungsfähigkeit ihrer KI-Modelle, sondern auch in der Vielfältigkeit und Zugänglichkeit ihrer APIs. Diese Werkzeuge ermöglichen es Entwicklern, Anwendungen zu erschaffen, die weit über einfache Chatbots hinausgehen. Tatsächlich steht die KI-Technologie an der Schwelle, die nächste große Plattform zu werden, vergleichbar mit der Revolution durch das Smartphone und dessen App-Ökosystem.

In der allgemeinen Öffentlichkeit wird KI derzeit verbunden mit Quassel-Engines wie ChatGPT: Sie sind unterhaltsam, können Texte kürzen und eventuell als Ersatz für Google oder Wikipedia dienen. Aber sonst?

Tatsächlich ist das nur die Spitze des Eisbergs. ChatGPT ist lediglich eine Anwendung der neuen Technik. Das wahre Potenzial der KI liegt in ihrer Fähigkeit, die Grundlage für zukünftige Apps und Workflows zu bilden. Man kann damit programmieren, nur viel schneller; und man kann damit Lösungen erzeugen, die mit klassischer Programmierung völlig außer Reichweite sind.

Die neuen KI-Systeme sind also nur scheinbar eine »Anwendung«. Unter der Haube verbergen sich Plattformen. ChatGPT ist also weniger eine Konkurrenz zu einer herkömmlichen App (oder zu Siri), als vielmehr eine Konkurrenz zu einem Betriebssystem — in dem Sinne, dass darauf Apps und Lösungen aufgebaut werden.

Ist das gefährlich? Ja. Denn wenn ein Entwickler erhebliche Zeit aufwendet, um damit eine neue Lösung zu bauen, dann wird er nicht bei nächster Gelegenheit zurückkehren zu Apple, falls diese irgendwann ein ähnliches System anbieten. Sondern weg ist weg. Das trifft auf KI-Systeme noch stärker zu als auf klassische APIs, weil KI-Systeme zusätzlich trainiert werden müssen, um sie fit zu machen für bestimmte Anwendungen. Man kann es nicht ohne weiteres auf ein anderes System übertragen. Manchmal dauert es eine Weile, bis ein KI-System zuverlässig die richtigen Antworten gibt oder die richtigen Entscheidungen fällt.

Vermutlich hat Microsoft deswegen so hastig eine Partnerschaft mit OpenAI eingefädelt. Es ging wohl weniger um einen Chatbot innerhalb von Word. Sondern es ging um die APIs, mit denen sich Apps und Anwendungen bauen lassen. Microsoft hat verstanden, dass es sich um eine Plattform handelt. Es geht darum, Entwickler zu binden.



Ein Beispiel

Hier ist ein konkretes Beispiel, welche Art von App man per KI realisieren könnte — und wohlgemerkt, es geht darum, ob der Aufwand dafür so gering ist, dass es sich überhaupt lohnt:

Nehmen wir an, ich würde gerne eine App entwickeln, mit der man sich fit halten, ein paar Kilo abnehmen und etwas gesunder leben könnte. Die App würde Tipps geben, ein tägliches Training vorschlagen und Kochrezepte empfehlen. Es soll aber alles abhängig sein von den Daten des Anwenders. Die Daten wären also nicht fest vorgegeben.

Die Infos dazu (Trainingspläne, Kochrezepte, ein paar kluge Sprüche) hätte ich bereits in Form einiger Bücher. Vielleicht wäre ich selber ein Autor und würde nun das Wissen der Bücher in diese App übertragen wollen.

Das ist mit Apples herkömmlichen APIs eine sehr große Aufgabe. Aber eine KI würde sich die Infos aus den Büchern holen. Ich würde dann eine Reihe von Beispielen geben, wie die zu erwartenden Fragen der Anwender beantwortet werden sollten. Das muss keineswegs vollständig sein, sondern die KI soll nur Beispiele bekommen.

Wenn das Training der KI erledigt ist, sage ich der App genau, was sie tun soll: Jeden Tag eine motivierende Meldung ausgeben, den aktuellen Trainingsplan erläutern, nach dem heutigen Befinden fragen, drei Kochrezepte vorschlagen. Die KI findet selbstständig heraus, wie es diese Aufgaben löst. Es muss nicht programmiert werden. Das ist der Clou.

OpenAI und Microsoft bieten schon heute Werkzeuge an, mit denen sich eine solche App realisieren liesse. Die API ist noch nicht sehr umfangreich, aber man kann immerhin schon eine KI anhand eigener Daten (die man als Datei hochlädt) trainieren. Man kann einen Fragenkatalog hochladen, anhand derer die KI den Anwender befragt, um daraus Schlüsse zu ziehen.

Es ist nicht Siri

In der Gerüchteküche über Apple hört man davon nichts. Man hört von einzelnen Apps wie »Apple Music«, die automatisch irgendwelche Playlisten erzeugen sollen. Oder von einer besseren Version von Siri. Aber das ist überhaupt nicht das, warum es in Zukunft gehen wird. Es geht um Werkzeuge für Entwickler, damit diese dann tausende von neuen Anwendungen schaffen.

Die neuesten Gerüchte von Mark Gurman behaupten, Apple würde Funktionen zeigen, die den Anwendern in ihrem täglichen Leben helfen (»assist users in their daily lives«). Das klingt nach Siri und nach ein paar Komfort-Funktionen. Aber der eigentlich wichtige Punkt ist: Wird Apple überzeugende APIs für Entwickler bereitstellen, sodass die nächste Revolution losbrechen kann? Oder werden sie nur ein paar eigene Apps etwas verbessern? Darauf sollte wir bei der nächsten WWDC achten.



Diskussion im Forum