WERTSCHÖPFUNG MIT »MODERATER KI«

#Machbarkeit #Pragmatismus #Umorientierung

Prof. Dr. John Zimmerman
Carnegie Mellon University

Ich bin User Experience- und Service-Designer, außerdem unterrichte ich als Professor an der School of Computer Science an der Carnegie Mellon University.

Dies ist ein Screenshot des ersten KI-Systems, das ich entwickelt habe. Es ist ein Recommender-System für TV-Sendungen für Philips, damals lief ›Xena – Die Kriegerprinzessin‹ erstmals im Fernsehen. Wir haben es 1999 entwickelt, also in einer Zeit, in der sich das Fernsehen stark veränderte. Anstatt einen Sender aus Hunderten von Kanälen auszuwählen, hatten Nutzer nun die Wahl zwischen Millionen von Sendungen. Ein Recommender-System für die Auswahl von TV-Sendungen schien sich daher viel eher zu eignen als eine alphabetische Auflistung.

Seither habe ich an vielen KI-Projekten gearbeitet.

Dieses System erkennt den Beginn einer schweren Depression, indem es Veränderungen im Aktivitätsniveau, dem Schlafverhalten und der sozialen Aktivität von Nutzern registriert, d.h. wenn diese weniger Sozialkontakte haben, oder sich zunehmend isolieren.

Diese App für Mobiltelefone ist eines meiner Lieblingsprojekte aus den frühen Tagen des User Experience Designs. Wir wollten eine Anwendung entwickeln, die Eltern darin unterstützen würde, zu den Eltern zu werden, die sie sein wollten. Kann Technologie dazu beitragen, dass sich Eltern als bessere Eltern fühlen? Wir wussten, dass vielbeschäftigte Eltern. die beide berufstätig sind, häufig ein schlechtes Gewissen haben. Wir mussten also nur dafür sorgen, dass sie sich besser fühlten. Das schien uns möglich. Unser System erfasste die Aktivitäten der Kinder und auch welcher Elternteil die Kinder regelmäßig zu verschiedenen Aktivitäten fuhr. Durch die Beobachtung der Familie konnte es erkennen, wann ein Kind abgeholt werden musste und wenn sich noch kein Elternteil auf den Weg gemacht hatte. Es funktionierte im Prinzip wie eine Art Rauchmelder, der darauf aufmerksam macht, wenn man vergessen hatte, dass ein Kind noch abgeholt werden muss.

Für ein aktuelles Projekt konzipieren wir smarte Klassenräume, die Lehrer beim Unterrichten und die Reaktion der Schüler darauf beobachten. Unser System gibt Feedback, um den Lehrenden die Möglichkeit zu geben, ihren Unterricht zu verbessern.

Ich habe mehrere Projekte im Gesundheitswesen umgesetzt. In diesem Sektor werden hochriskante Entscheidungen getroffen, weshalb der Einsatz von KI problematisch ist. Dieses System hat Ärzte bei der Entscheidung unterstützt, wann ein künstliches Herz implantiert werden sollte.

Ich habe während meiner gesamten akademischen Laufbahn KI-Systeme entwickelt. Vor etwa sieben Jahre habe ich begonnen, mich eingehender mit dem KI-Entwicklungsprozess zu beschäftigen. Ich ging der Frage nach, wie man Designer dazu bringen könnte, KI als Designmaterial zu nutzen. Die ganze Sache verlief wenig zufriedenstellend. Heutzutage werden KI-Systeme von Wissenschaftlern konzipiert, die im Bereich maschinelles Lernen promoviert haben. Diese Leute sind zwar ausgesprochen intelligent, aber sich die Bedürfnisse von Menschen vorzustellen, ist nicht unbedingt ihre Stärke. Ich wollte an dieser Stelle eine Tür öffnen und den Aspekt des Design Thinking in die KI-Innovation einfließen lassen. Es ging mir darum den Diskurs über die potenzielle Rolle von KI im Alltagsleben der Menschen auszuweiten.

Um es etwas präziser zu formulieren: Wenn ich von KI spreche, meine ich alles von einfachen Spam-Filtern für E-Mails bis hin zu Systemen, die auf der Basis von medizinischen Aufnahmen Krebs diagnostizieren. Aber auch Mapping Apps, die eine Fahrstrecke empfehlen bis zu Systemen, die neuartige Medikamente entdecken, indem sie Zusammenhänge zwischen chemischen Verbindungen und deren physiologischen Auswirkungen auf den menschlichen Körper herstellen.

Was alle diese Innovationen aus der Perspektive der Designentwicklung verbindet, ist Unsicherheit. Wenn man an einem KI-Projekt arbeitet, weiß man nie, ob das System am Ende funktionieren wird und welche Fehler es macht. Das heißt, die Designentwicklung in diesem Bereich ist häufig von einem gewissen Unbehagen begleitet.

Ich möchte zunächst über das enorme Potenzial von KI sprechen, bevor ich Aspekte erörtere, die sie weniger vielversprechend erscheinen lassen.

Das sind Kiva-Roboter, die in einer Lagerhalle eingesetzt werden. Sie fahren unter Regale. Wenn sie sich drehen, werden sie höher und heben die Regale an. Sie fahren daraufhin die Regale zu einem Mitarbeiter, der eine Kiste packt. Dank dieses Systems ist jeder benötigte Artikel im richtigen Moment in unmittelbarer Reichweite des Mitarbeiters. Das ist außerordentlich effizient. Amazon war von den Kiva-Robotern so begeistert, dass das Unternehmen aufgekauft und anderen die Nutzung untersagt wurde. Mittlerweile firmiert es unter dem Namen Amazon Robotics.

Ein anderes gutes Beispiel ist Smart Pricing von Airbnb. Hier wird anhand von maschinellem Lernen der Höchstpreis vorausgesagt, den ein Gastgeber für die Vermietung seiner Unterkunft verlangen kann. Damit ist die Fortune 500 CEO Analytics Methode für jeden verfügbar. Es ist großartig, wie KI faire Rahmenbedingungen für alle schaffen kann.

Vor einigen Monaten, im November hat Open AI Chat GPT öffentlich zugänglich gemacht. Das ist einerseits frustrierend, aber es eröffnet auch ein transformatives Potenzial.

In ihrer Gesamtheit betrachtet lassen diese Erfolgsgeschichten auf einen komplexen und effektiven Innovationsprozess schließen. Dies ist aber nicht zutreffend. Gegenwärtig erreichen etwa 85 Prozent der KI-Initiativen nicht den Schritt der Umsetzung. Überdies funktionieren viele nach der Einführung nicht. Das heißt, die Misserfolgsquote von KI-Anwendungen liegt eher bei 90 Prozent. Als Forschender im Bereich Designentwicklung finde ich solche Situationen ausgesprochen spannend. Wenn die Dinge so schlecht laufen, kann Design helfen. Design Thinking kann transformativ wirken.

Es gibt vier Hauptgründe für das Scheitern von KI-Projekten.

Technologische Gründe: Das System kann die minimal erforderliche Modellperformance nicht erreichen. Meta ist diesbezüglich ein Beispiel. Auf der Basis einer gewaltigen Datenmenge aus wissenschaftlichen Arbeiten wurde ein LLM bzw. Large Language Model aufgebaut. Es sollte Wissenschaftler dabei unterstützen, Forschungsfragen besser zu formulieren. Innerhalb von drei Tagen wurde das Projekt eingestellt. Die fehlerhaften Antworten hätten negative Auswirkungen auf die Wissenschaft gehabt.

Projekte scheitern aus finanziellen Gründen: Ihre Entwicklung und der Betrieb kosten mehr als der Wert, der durch sie generiert wird. Ein interessantes Beispiel hierfür ist Alexa von Amazon. Branchenexperten schätzen, dass Alexa jedes Jahr einen Verlust von einer Milliarde Dollar verursacht. Die Hoffnung war, dass Alexa die Nutzer zum Einkaufen animieren würde. Allerdings kauft fast niemand mit Alexa ein. Die Nutzer sagen hingegen eher »Hey Alexa, spiel Spotify«. Das Gerät digitalisiert die Audiospur und lädt sie zur Verarbeitung auf einen Amazon-Server hoch. Das kostet Amazon Geld. Eine Antwort geht daraufhin an Alexa, die sich mit Spotify verbindet. Spotify macht Profit.

Projekte scheitern, wenn sie nicht auf den tatsächlichen Bedarf der Nutzer ausgerichtet sind. Nutzer nehmen dann diese Systeme nicht an und verwenden sie nicht. Diese Problematik zeigt sich bei fast allen KI-Innovationen im Gesundheitswesen. KI funktioniert sehr gut bei Fällen aus dem Lehrbuch, da diese den Großteil der Daten ausmachen. Ärzte benötigen jedoch Unterstützung bei Sonderfällen. Hier liefert die KI jedoch keine zufriedenstellenden Ergebnisse.

Und nicht zuletzt scheitern KI-Projekte aus ethischen Gründen. Dies betrifft Aspekte von Fairness, Datenverzerrung und Datenschutzverletzungen oder die Möglichkeit, dass die KI böswilligen Akteuren eine Plattform bietet. Ethische Risiken bleiben eine große Herausforderung für KI.

In meinem Team halten wir auch nach ‚leichter Beute‘ Ausschau, wie wir es nennen. Dabei handelt es sich um Möglichkeiten, bei denen der Einsatz einer sehr einfachen KI einen Mehrwert für Nutzer und Anbieter schafft. Hierfür ist Starbucks mit seiner App ein gutes Beispiel. Über die App können Geschenkgutscheine zur Bezahlung genutzt werden. Starbucks profitiert davon, da es das Geld schon lange hat bevor der Kunde seinen Kaffee bekommt. Außerdem wird die App bei 25 Euro immer wieder automatisch aufgeladen. Dadurch vermeidet Starbucks Kreditkartengebühren.

Interessanterweise speichert die App nicht, welche Kunden ihren Kaffee mit der App bezahlen. Diese Kunden werden nicht aufgefordert ihre Rechnung zu bezahlen, sobald sie die App in einem Starbucks aktivieren. Der Vorteil hiervon ist eigentlich offenkundig, schließlich würden sowohl der Kunde als auch Starbucks daran Interesse haben. Seltsamerweise scheint das erstklassige UX-Team von Starbucks diese nützliche Option jedoch zu übersehen.

Für Instagram lässt sich ein ähnliches Beispiel aufführen. Es gehört zum Meta-Konzern, der die weltweit besten Datenwissenschaftler und UX-Designer beschäftigt. Instagram möchte, dass Influencer Beiträge posten. Diese Beiträge ziehen Nutzer an, die Werbung anschauen, wodurch Instagram Geld einnimmt. Die App speichert jedoch nie welche Tags bzw. Schlüsselwörter von den Influencern regelmäßig genutzt werden. Die Influencer müssen vielmehr bei jedem Post immer und immer wieder dieselben Tags eingeben. Die Verantwortlichen für dieses erstklassige KI-System sehen einfach nicht wie leicht sich diese Unannehmlichkeit beheben lassen würde.

Ein weiteres Beispiel, das ich irritierend finde, sind selbstparkende Autos. BMW, Mercedes und viele andere Autohersteller arbeiten an Autos, die selbstständig einparken können. Das ist nur für eine kleine Zielgruppe relevant, nämlich Menschen, die in Vororten leben und Angst haben, in der Stadt Auto zu fahren. Wir haben es hier mit einer äußerst komplexen Aufgabe zu tun. Das Auto muss erkennen, wie groß der Platz ist. Technisch gesehen benötigt es Zugriff auf Beschleunigung, Lenkung, Getriebe und Bremsen. Die KI muss eine optimale Strategie für den Einparkprozess wählen und dann das Erreichen des Ziels abschätzen. Im ersten Schritt muss das Auto jedoch erkennen, ob die Einparklücke groß genug ist. Diese Funktion könnte in jedem heute verkauften Auto vorhanden sein. Die entsprechenden Sensoren sind bereits im Auto verbaut. Es entstünden keine Zusatzkosten. Interessanterweise entwickeln die Autohersteller jedoch lieber eine komplexe anstatt eine unmittelbar nützliche Funktion. Das möchten wir ändern.

Ich möchte an dieser Stelle meine Verwendung der Begriffe Erfindung und Innovation etwas präzisieren. Philips hat in den 1960er Jahren den Kassettenrecorder entwickelt. Damit hat das Unternehmen eine neue technische Möglichkeit für die Aufnahme und Wiedergabe von Audioinhalten erfunden. Designer erzielen Wertschöpfung durch Innovation. Wir identifizieren Situationen, in denen Menschen eine bestimmte Funktion benötigen. Designer entwerfen Objekte, die diese Funktion beinhalten, wodurch diese nützlich, und nutzbar sind und eine Wertschöpfung generieren. Eine Designinnovation, die auf dem Kassettenrecorder aufbaute, waren Boomboxen, sodass Kinder die Musik mit auf den Spielplatz nehmen konnten. Oder der Walkman, der ein ganz persönliches Musikerlebnis eröffnete. Außerdem wurden Anrufbeantworter entwickelt, sodass die Leute nicht mehr zu Hause sitzen mussten, wenn sie einen wichtigen Anruf erwarteten. Im Bereich der KI sehen wir jedoch keine Designinnovationen. Vielmehr stellen wir fest, dass Designer sich schwer tun mit dieser Technologie zu arbeiten.

Ich spreche mit vielen Unternehmen über deren KI-Innovationen. Dabei kommt immer wieder eine bestimmte Problematik zum Ausdruck:

»Die Teams mit Datenwissenschaftlern entwickeln KI-Konzepte, die die Kunden nicht wollen. Designteams denken sich KI-Konzepte aus, die nicht umgesetzt werden können.«

Wir bezeichnen das als KI-Innovationslücke. Diese Lücke wollen wir schließen. Wie schaffen wir ein Designumfeld, in dem Innovationsteams KI-Produkte und -Services entwickeln, die Kunden wollen und die leicht umsetzbar sind? In der Auseinandersetzung mit dieser Problematik haben wir festgestellt, dass Projekte dann scheitern, wenn die Teams angesichts der Frage, was entwickelt werden soll, keine adäquaten Entscheidungen treffen. Hier liegt kein Versagen der KI vor, vielmehr ein Versagen der Vorstellungskraft zu Beginn des Innovationsprozesses.

Dieses Bild zeigt einen typischen datenwissenschaftlichen Prozess. Zu Beginn erfolgt die Formulierung der Aufgabe. In einem Lehrbuch über Datenwissenschaft würde das wahrscheinlich ein oder zwei Absätze am Anfang einnehmen. Es gilt zunächst eine interessante Aufgabe zu finden. Im Detail geht es dann vor allem um den Aufbau des Systems. Datenwissenschaftler lernen nicht, Ideen zu entwickeln. Sie stellen sich nicht hundert Dinge vor, die sie entwickeln könnten und die sie dann systematisch bewerten, um hochwertige, risikoarme Optionen herauszufiltern.

Ein weiteres Problem ist, dass Designer zu spät in die Projekte einbezogen werden. Gegenwärtig ist es meistens so, dass Designer erst an einem KI-Innovationsprojekt teilhaben, wenn bereits entschieden wurde, was genau entwickelt werden soll. Ich gestalte bereits seit den frühen neunziger Jahren Software-Schnittstellen. Die Designer wurden damals erst hinzugezogen, wenn die Ingenieure die Entscheidung über das endgültige Produkt bereits getroffen hatten. So gesehen, ist die KI-Entwicklung uns schon vertraut, aber auch dysfunktional. Am Anfang fragten die Ingenieure gewöhnlich: »Hey, wir haben diese Software entwickelt. Könnt ihr sie hübsch gestalten?« Bei uns hieß das, ein Schwein schminken. Es ist interessant, dass man in der KI-Innovation wieder in diesen ineffektiven Prozess zurückgefallen ist. Ein benutzerorientiertes Design löst dieses Problem, aber die KI funktioniert meist nicht so.

Leider hilft es nicht, wenn Designer von Anfang an einbezogen werden. Designer und andere Stakeholder, die keinen datenwissenschaftlichen Hintergrund haben, betrachten KI als übermenschliche Intelligenz. Eine solche Auffassung ist für den Prozess der Ideenfindung mehr als schädlich. Dafür ist auch die Presse verantwortlich, die gerne auf Clickbait-Storys setzt. »Target weiß vor den Eltern, dass ihr Teenager schwanger ist«, »Künstliche Intelligenz entwickelt ihre eigene Sprache«, »Google-Ingenieur sagt, Chatbot ist empfindungsfähig«. Keine dieser Geschichten hat irgendeinen Wahrheitsgehalt. Sie sind ausgesprochen irreführend, vermitteln jedoch den Eindruck, dass wir KI als Superintelligenz betrachten sollten.

Wenn Designer oder andere sich also die Frage stellen »Was können wir mit KI alles anstellen?«, dann ziehen sie nur solche Dinge in Betracht, die für Menschen schwer zu bewerkstelligen sind und die eine nahezu perfekte Modellperformance erfordern, um erfolgreich zu sein. Der Großteil des Handlungsspielraums bleibt folglich ungenutzt. IBM hat diesbezüglich hervorragende Arbeit geleistet, da es Data Science als eigene neue Disziplin im Unternehmen betrachtet und untersucht, warum es in die gewöhnlichen Abläufe nicht richtig hineinpasst. Die meisten Leute betrachten Data Science als Ingenieurswissenschaft. Wenn man Ingenieuren Spezifikationen vorgibt, dann produzieren sie etwas, was diesen Spezifikationen entspricht. Datenwissenschaftler sehen sich selbst nicht als Ingenieure, vielmehr als Forschende. Sie suchen in den Daten nach interessanten Aspekten. Die Erwartungen gehen hier weit auseinander.

Die meisten Missverständnisse betreffen die Modellperformance, d.h. die Frage, wie gut die KI funktionieren wird. Die Datenwissenschaftler sagen dann Dinge wie »Wir können eine Modellperformance von 90 Prozent erreichen.« Und dann erwarten sie Applaus. Ist doch gut, oder? Wie eine 1 minus. Also relativ gut. Bei der automatischen Spracherkennung haben die meisten Sätze ungefähr 14 Wörter. Das heißt, im Durchschnitt ist in jedem Satz ein Wort falsch. Das scheint nicht wirklich gut zu sein. Man würde auf keinen Fall mit so etwas Gerichtsverhandlungen transkribieren wollen. Für die Transkription einer Voicemail ist sie jedoch ausgesprochen nützlich. Die Nutzer erhalten mehr als genug Informationen, um den Inhalt der Nachricht zu verstehen. Wie finden wir also Anwendungen, bei denen eine nicht ganz perfekte Modellperformance ausreichend ist?

Ein weiteres großes Problem besteht darin, dass Designer Schwierigkeiten haben, die Leistungsfähigkeit von KI zu verstehen. Ich unterscheide hier zwischen Mechanismen und Leistungsfähigkeit. Mechanismen bezeichnen die Funktionsweise von etwas. Die Leistungsfähigkeit beschreibt, was etwas kann. Ich bin Designprofessor, also muss ich hier über Designtheorie sprechen. In seiner Beschreibung des Gedankens einer Reflexion im Handeln benutzt Donald Schön die Metapher eines Jazzmusikers, der sein Instrument so gut kennt, dass er während des Spielens Musik erschaffen kann. Im kreativen Schaffensprozess muss man ein verinnerlichtes Verständnis der Möglichkeiten haben. Im Prozess des Brainstormings entsteht eine Idee, die den Bedürfnissen des Nutzers und dem technischen Leistungsvermögen entspricht. Gegenwärtig ist fast alles, was über KI geschrieben wird, dem mechanistischen Aspekt gewidmet. Es geht um beaufsichtigtes, unbeaufsichtigtes und verstärktes Lernen, um vortrainierte Modelle, Support-Vektor-Maschinen und Deep Learning. Im Vordergrund steht die Frage wie Inferenzen zustande kommen. Es gibt fast nichts darüber, ›was KI leisten kann‹.

Ein weiteres großes Problem, auf das ich immer wieder gestoßen bin, besteht darin, dass nutzerorientiertes Design nicht funktioniert. Ich habe lange gebraucht, um diese Tatsache anzuerkennen. Es funktioniert nicht, weil jegliche KI-Innovation in der Mitte des Double Diamond ihren Anfang nimmt. Jedes Projekt beginnt mit der Auswahl der KI-Anwendung.

Wenn man einem nutzerorientierten Prozess folgt, untersucht man welche Schwachstellen sich bei der Nutzung offenbaren. Dann werden die wesentlichen Probleme der Nutzer priorisiert. Das sind die wirklichen Probleme. Wenn wir die lösen könnten, wäre das großartig. Leider wird im nutzerorientierten Prozess das praktisch nutzbare Leistungsvermögen von KI nicht berücksichtigt. Vielmehr wird zu Beginn festgelegt, dass eine KI-Lösung gesucht werden soll. Dafür wird ein Data-Science-Team beauftragt. Es geht gar nicht in erster Linie darum, dem Nutzerbedarf zu entsprechen. Vielmehr wird nach einer harmonischen Schnittmenge aus Bedürfnissen und Möglichkeiten geschaut, Bei einem nutzerorientierten Designansatz wird das Team auf der Suche nach Nägeln zum Hammer und KI wird auf die falschen Probleme angewendet.

Ein letzter problematischer Aspekt, auf den ich hinweisen möchte, betrifft die mangelnde Kalkulierbarkeit der Kosten für KI. Niemand kann einschätzen, was die Entwicklung oder gar der Betrieb kosten wird. Und praktisch niemand stellt die Frage, welche Wertschöpfung sie genau generieren kann. Das ist ein großes Problem. Einem Architekten kann man sagen »Ich habe eine Million, was können Sie mir dafür bauen?«. Der Architekt hat darauf eine Antwort. Er kann mit einem bestimmten Budget arbeiten und die Möglichkeiten darlegen. Wenn man zum Data-Science-Team sagt »Ich habe eine Million …«, dann können sie nur mit Sicherheit sagen »Das können wir ausgeben«, Das ist wirklich sehr unzufriedenstellend.

Mein Team arbeitet an der Verbesserung von KI-Innovation. Als Erstes haben wir uns mit Leuten getroffen, die das gut können. Wir haben bei Google, Meta, Philips, und Accenture Zeit verbracht und dabei festgestellt, dass dort, wo es gut funktioniert hat, die Datenwissenschaftler und die Designer sehr eng zusammengearbeitet haben. Im Dublin-Büro von Accenture gelingt das besonders gut. Die Designer und Datenwissenschaftler sitzen hier nebeneinander und arbeiten jeden Tag zusammen. Wirklich gute Designer hatten auf diese Weise viele Abstraktionen der KI-Fähigkeiten verinnerlicht und konnten diese Fähigkeiten anhand zahlreicher Beispiele schnell kommunizieren.

Wir haben erkannt, dass ein mangelndes Verständnis für KI-Fähigkeiten eine echte Herausforderung für Designer ist. Über drei Jahre haben wir an der Erstellung einer Systematik der KI-Fähigkeiten gearbeitet. Dafür haben wir uns verschiedene industrielle Sektoren angeschaut, in denen durch KI eine Wertschöpfung möglich wurde. Es wurden nur KI-Anwendungen berücksichtigt, die kommerziell erfolgreich waren. Im Rahmen der Entwicklung dieser Taxonomie haben wir acht übergeordnete Fähigkeiten definiert. KI kann schätzen, prognostizieren, vergleichen, erkennen, identifizieren, entdecken, generieren und agieren.

Für eine vereinfachte Auswertung der Taxonomie hatten wir einige unterstützende Materialien vorbereitet, die es den Designern erleichtern sollten, die KI-Fähigkeiten schnell zu verstehen. Wir baten die Designer, diese Materialien für ein Brainstorming zu verwenden, aber das war ein totaler Reinfall. Dabei dachten wir, wir hätten das Problem gelöst. Bei der Verwendung unserer Ressourcen waren die Designer bei der Ideenfindung schließlich doch von einem breiteren Spektrum an Fähigkeiten ausgegangen. Fast alle ihre Ideen waren jedoch nicht umsetzbar. Dieser Rückschlag ließ uns in eine andere Richtung blicken, während wir zu verstehen versuchten, was wir übersehen hatten.

Bei unserer Suche sind wir auf eine sehr coole Analogie bei Google gestoßen. Die Idee stammt von Cassie Kozyrkov. Sie war früher Chief Decision Scientist bei Google. Sie hat unter dem Motto ›Making Friends with Machine Learning‹ einen internen Kurs veranstaltet. Sie hat den Teams für KI-Innovation bei Google geholfen, Anwendungsbeispiele für KI zu finden, die eine Wertschöpfung versprechen. In ihrem Unterricht hat sie KI mit einer Insel voller betrunkener Menschen verglichen. KI ist sehr schnell, sie kann eine unfassbare Menge von Informationen verarbeiten, da es sehr viele betrunkene Menschen gibt. Allerdings sollten wir nicht vergessen, dass betrunkene Menschen gewöhnlich nicht intelligent agieren. Wozu braucht man hier also dann die Geschwindigkeit oder eine größere Dimension? Aber wann ist schon weder Intelligenz noch Qualität nötig? An dieser Stelle eröffnet sich der ideale Spielraum. Allerdings ist es vielleicht etwas seltsam, in einem solchen Gedankenspiel zu versuchen, neue Produkte oder Dienstleistungen zu entwickeln.

Wir haben eine Matrix für die Betrachtung von KI-Konzepten erarbeitet. Wir bezeichnen sie als Kompetenz-Performance-Matrix. Die vertikale Achse bezeichnet die Kompetenz. Wie viel Fachwissen benötigt ein Mensch, um eine Aufgabe zu erfüllen? Der mittlere Wert entspricht einem »typischen Erwachsenen«. Im unteren Bereich ist weniger als ein durchschnittlicher Erwachsener nötig. Die horizontale Achse bezeichnete die Modellperformance: ausgezeichnet, gut und moderat. Dann haben wir die KI-Merkmale unserer Taxonomie abgebildet. Dabei hat uns überrascht, dass für mehr als die Hälfte der KI-Merkmale nur eine moderate Modellperformance erforderlich war, um den Nutzerbedürfnissen zu genügen.

Das war ausgesprochen aufschlussreich. Nun mussten wir in einem Designprozess Möglichkeiten für einen moderaten Einsatz von KI finden. KI-Entwickler sind sehr gut darin, Modelle mit einer moderaten Performance zu entwickeln. Designer sind hingegen nicht besonders gut darin, diesbezüglich sinnvolle Möglichkeiten zu eruieren.

Wir haben kontinuierlich mit einem Team aus Intensivmedizinern und Datenwissenschaftlern zusammengearbeitet. Sie verfügten über einen beeindruckenden Datensatz mit Daten aus drei Jahren Intensivmedizin. Wir sahen hier eine Möglichkeit, unsere Erkenntnisse über einen moderaten KI-Einsatz umzusetzen.

Wir begannen mit gewöhnlichen Brainstorming-Sessions. Keiner der Beteiligten hatte diese Form der Ideenfindung bisher als Teil seines Arbeitsalltags betrieben. Wir wollten herausfinden, ob Designer ein effektives Brainstorming mit Fachleuten ermöglichen könnten, die dies nicht als nützlich betrachten. Aber sie vertrauten uns. Wir haben sie dazu gebracht, auf der Grundlage ihrer Bedürfnisse und der intensivmedizinischen Daten eine Reihe von Ideen zu entwickeln. Wir haben die Konzepte in einer Impact-Effort-Matrix abgebildet. Interessanterweise stellte sich heraus, dass fast alle Konzepte sehr schwer umsetzbar waren, nur etwa die Hälfte war nutzbringend.

Daraufhin haben wir eine zweite Brainstorming-Runde durchgeführt. Dieses Mal gaben wir den Beteiligten Beispiele für sehr einfache KI-Aufgaben an die Hand sowie KI-Anwendungen, bei denen eine moderate Modellperformance eine Wertschöpfung erlaubte. Als wir diese neuen Konzepte in einer Impact-Effort-Matrix abbildeten, ergab sich ein ganz anderes Bild. Fast alle dieser Konzepte waren wirkungsvoll und zudem war die Hälfte davon leicht zu entwickeln. Als Nächstes haben wir die Konzepte aus beiden Workshops auf der Kompetenz-Performance-Matrix abgebildet und festgestellt, dass die Konzepte aus unserer zweiten Brainstorming-Runde das gesamte Innovationsfeld wesentlich besser abdeckten.

Um die Brainstorming-Runden etwas zu veranschaulichen, möchte ich zwei Beispiele nennen. In der ersten Runde hatten die Ärzte zu uns gesagt ›Könntet ihr uns vielleicht bei der Sedierung helfen?‹. Wenn ein Patient an ein Beatmungsgerät angeschlossen wird, muss ihm ein Schlauch in den Hals eingeführt werden, damit er atmen kann. Das ist extrem unangenehm. Patienten werden sediert, damit sie die Behandlung aushalten können. Wenn die Patienten zu stark sediert werden, delirieren sie, bekommen PTBS und erleiden bleibende psychische Schäden. Werden sie jedoch nicht ausreichend sediert, sind die Patienten ängstlich und haben Schmerzen, was die Genesung beeinträchtigt. Jeder reagiert anders auf Sedativa. Die Ärzte wollten, dass wir mittels Deep Learning dieses Problem lösen halfen. Wir haben abgelehnt. Wir wollen KI keinesfalls dort einsetzen, wo sie Menschen schaden könnte.

Interessanterweise haben wir mit ihnen auch über Nachfrageprognosen gesprochen. Unternehmen wie Amazon nutzen KI, um vorherzusagen, was die Leute in Kürze kaufen wollen. Um Weihnachten herum werden beispielsweise weihnachtliche Lichterketten gekauft, sodass Amazon diese vorab in die Lager liefern lässt. Wenn die Weihnachtsbeleuchtung dann bestellt wird, gibt es entsprechend nur kurze Transportwege. Die Ärzte erkannten, dass diese KI-Fähigkeit für ihr Umfeld nützlich sein könnte. Sie erzählten uns »Wir bestellen jeden Tag in der Apotheke Medikamente. Es wäre großartig, wenn die Patienten die Medikamente sofort erhalten könnten. Gegenwärtig warten wir stundenlang auf die Medikamente. Außerdem ist es für das ohnehin stark ausgelastete Krankenpflegepersonal viel effizienter, wenn den Patienten alle Medikamente gleichzeitig gegeben werden, anstatt einzeln, sobald sie aus der Apotheke eintreffen. Wir könnten den jeweils aktuellen Zustand der intensivmedizinisch betreuten Patienten auf der Station erfassen und dann einen möglichen Bedarf ermitteln und die Medikamente vorbestellen. Und wenn sich die Prognose als falsch herausstellt, können wir einfach wie immer bei der Apotheke bestellen. Es kann also keinesfalls eine schlechtere Situation als der aktuelle Zustand eintreten, im besten Falle würden wir damit jedoch operative Effizienz sicherstellen können. Diese operative Effizienz ohne Risiko entsprach genau unserer Zielvorstellung.«

Diesen neuen Brainstorming-Ansatz haben wir mit verschiedenen Unternehmen erprobt. Wir betrachten dies als einen Schritt, der vor einer agilen Softwareentwicklung stattfindet. Das hat sich als recht erfolgreich erwiesen.

Im Folgenden finden sich fünf wichtige Erkenntnisse aus unserer Arbeit im Bereich KI-Innovation. Erstens: Nicht die Arbeit von Fachleuten, sondern von Praktikanten sollte ersetzt werden. Noch besser ist es, nach Bereichen zu schauen, für die Unternehmen noch nicht einmal einen Praktikanten einsetzen würden. Hier muss die KI nur besser sein, als gar nichts und das kann sie erstaunlich gut. Eine moderate Modellperformance kann an dieser Stelle leicht eine Wertschöpfung ermöglichen.

Wenn ein KI-Prozess gestartet wird, sollte die Innovationsskala klar definiert werden. Vielleicht kennen Sie das Horizons Model für Innovation von McKinsey. Wie weit in die Zukunft sollen Innovatoren schauen? Ich bevorzuge die Sichtweise von Google. Dort spricht man von Versionierung. Entwickeln Innovatoren lediglich neue Funktionen für ein bereits existierendes Produkt, das vielleicht in ein paar Monaten auf den Markt kommt? Oder haben sie eine Vision? Hier denken Innovatoren über Dinge nach, die noch ein bis zwei Jahre in der Zukunft liegen. Das ist eine wichtige neue Funktion. Wagen sie etwas Neues? Schauen sie 5 Jahre voraus?

Bei der Versionierung kann das User Experience Design ein großes Wirkpotenzial eröffnen, wenn tatsächlich aus der Perspektive des Nutzers über Optimierungen nachgedacht wird. Bei der Entwicklung von Visionen und einem Zeithorizont von zwei Jahren, verspricht das Service Design den größten Vorteil. Hier steht das strategische Denken im Mittelpunkt. Es geht darum, gemeinsam mit den Nutzern eine Wertschöpfung zu generieren. Bei der Frage »Was kann ich in fünf Jahren tun?« bleibt nicht viel Raum für Design. Designer haben keine Vorstellung davon, was KI in fünf Jahren leisten kann. Damit sollte sich ein Technologieteam beschäftigen, Design würde den Prozess nur verlangsamen.

Design muss eine andere Aufgabe erfüllen. Es geht nicht darum, dass Designer Ideen entwickeln, vielmehr sollten sie als Vermittler agieren, Datenwissenschaftler und Fachleute zusammenbringen damit diese gemeinsam herausfinden, was sie Nützliches und Sinnvolles entwickeln können. Ich möchte mich von der Vorstellung lösen, dass dieser Prozess maßgeblich durch das Design definiert wird. Design ist vielmehr ein gleichberechtigter Partner, der für das Funktionieren der Dinge zuständig ist.

Die Bedeutung von Design liegt in der Strukturierung und Umsetzung effektiver Ideenfindung. Designer können sicherstellen, dass Teams der Frage auf den Grund gehen, an welcher Stelle eine moderate Modellperformance sinnvoll ist. Sie können Teams in die Verantwortung nehmen und eine effektive Ideenfindung gewährleisten. In unseren jüngsten Arbeiten haben wir eine starke Korrelation zwischen Konzepten mit einer moderaten Modellperformance und ethischen Risiken festgestellt. Durch den Fokus auf eine moderate Performance können Teams die meisten ethischen Risiken durch KI vermeiden.

Am Ende haben wir ein KI-Brainstorming-Kit entwickelt, das wir online zur Verfügung stellen. Wir ermutigen Designer es zu nutzen und uns mitzuteilen, ob sie es als hilfreich empfinden.

Ich möchte mich bei all jenen bedanken, die diese Forschung finanziell unterstützt haben. Dazu gehören die US National Science Foundation, die National Institutes of Health, das Center for Machine Learning and Health an der Carnegie Mellon University, Accenture sowie Bloomberg. Sie haben uns bei der Arbeit stark unterstützt und uns ermutigt, unsere Erkenntnisse mit anderen zu teilen.

(Aktualisiert am 20. November 2025)