IBM-Supercomputer Watson Auch Dr. Algorithmus kann irren

Von Christian Meier 

Die Künstliche Intelligenz „Watson for Oncology“ gibt Ärzten teilweise Ratschläge, denen sie besser nicht folgen sollten. Der Hersteller IBM sieht dennoch kein Risiko für Patienten.

IBMs Supercomputer Watson soll bei der Krebsdiagnose helfen.Foto: Mauritius

Stuttgart - Die Künstliche Intelligenz „Watson for Oncology“ des amerikanischen IT-Unternehmens IBM berät Krebsärzte in 230 Krankenhäusern weltweit bei der Suche nach der besten Therapie. Seit einiger Zeit ist sie jedoch in Verruf geraten. Schon im Herbst 2017 hatte der Leiter der Krebsabteilung des Kopenhagener Reichskrankenhauses, Leif Jensen, das System scharf kritisiert. Sein Urteil: Folge man Watsons Tipps, könnten Patienten sterben, statt zu genesen. Seine Abteilung stoppte das Experiment.

Mittlerweile zeigen auch interne IBM-Dokumente: Die Führungskräfte wussten bereits im Sommer 2017, dass Watson häufig „unsichere und inkorrekte Behandlungsempfehlungen“ gab – was sie nicht davon abhielt, das System gegenüber den Medien zu loben. Das berichtet Statnews, eine mit der Zeitung „Boston Globe“ kooperierende Website für medizinische Themen, der die Dokumente vorliegen.

Dennoch glauben Entwickler ähnlicher Algorithmen an den Einzug Künstlicher Intelligenz in die Medizin. Zeitersparnis bei gleichzeitig hoher Treffsicherheit in Diagnose und Therapie lautet das Ziel. „Wir wollen Ärzte bei Routineaufgaben, wie der Auswertung von Bilddaten, entlasten“, sagt Jaroslav Bláha. Seine Hamburger Firma CellmatiQ trainiert Systeme, die mit Künstlicher Intelligenz (KI) arbeiten, zusammen mit Ärzten – etwa um Glaukome auf Augenhintergrundbildern zu erkennen.

Personalisierte Medizin als wichtiges Einsatzgebiet

Jüngst zeigten Heidelberger Forscher, dass Algorithmen schwer einschätzbare Melanome öfter richtig als Hautkrebs erkannten als eine Gruppe von Dermatologen. Ein weiteres Einsatzgebiet der KI zeichnet sich bei der sogenannten personalisierten Medizin ab. Diese soll die Eigenheiten jedes einzelnen Patienten berücksichtigen, denn kaum ein Krebsfall gleicht dem anderen. Eine Chemotherapie, die dem einen Patienten hilft, versagt beim nächsten.

KI schärft den Blick für die feinen Unterschiede. „Sie erkennt beispielsweise für das Auge unsichtbare Kontrastunterschiede auf Röntgenbildern“, erklärt Bláha. Am Uniklinikum Essen begutachtet ein Algorithmus Bilddaten von Lungenkrebspatienten, wie der dort praktizierende Radiologe Michael Forsting berichtet. „So können wir sehr genau vorhersagen, auf welche Therapie der Patient ansprechen wird und auf welche nicht“, so Forsting.

Der Anspruch der Entwickler von „Watson for Oncology“ ist indes höher. Der Algorithmus soll Optionen für personalisierte Therapien bei 13 häufigen Krebsarten vorschlagen. Die Stärke des Systems ist das automatisierte Verstehen von Texten in natürlicher Sprache. Dies bewies Watson, als er 2011 in der US-Rateshow „Jeopardy!“ antrat und Ratekönige wie Anfänger alt aussehen ließ.

Algorithmen sollen lernen wie Medizinstudenten

„Watson for Oncology“ gleicht das Wissen aus Hunderten medizinischen Fachjournalen und Lehrbüchern mit dem jeweiligen Fall ab. Zusätzlich trainierten Onkologen der New Yorker Krebsklinik Memorial Sloan-Kettering das System. Ähnlich wie Medizinstudenten sollen die Algorithmen anhand vieler Beispiele lernen, die ihnen erfahrene Mediziner erklären. Die New Yorker Spezialisten zeigten Watson konkrete Fälle und wie sie diese behandeln. Auf Basis des Trainings und einer Literaturrecherche macht das System Vorschläge auf dem Stand des aktuellen medizinischen Wissens. Laut IBM sollen darunter auch Optionen sein, auf die der Arzt nicht kommt.

Manche Anwender loben das System, weil es Entscheidungen auf einer breiteren Informationsbasis ermögliche. Der von Watson gelieferte Hintergrund habe ihm Gewissheit gegeben, dass die ins Auge gefasste Therapie für einen Lungenkrebspatienten die richtige sei, sagte etwa ein Arzt des Jupiter Medical Center in Florida zu Statnews. Als „extrem schwer beherrschbar“ kritisiert Bláha indes den Anspruch von IBM. „Wir trainieren unsere KI für sehr spezifische Teilaufgaben“, sagt der Informatiker. IBM hingegen versuche, den ganzen Arzt zu simulieren. Doch für eine gute Anamnese sei das Gespür des Arztes unerlässlich. Watsons teils gravierende Fehler scheinen den Kritikern recht zu geben. Beim Testfall eines 65-jährigen Patienten mit Blutungen, den Statnews zitiert, habe die KI eine Arznei empfohlen, die bei Blutungen tödlich sein könnte. IBM entgegnet, es habe sich hier nicht um einen realen Patienten gehandelt.

Experten führen Watsons Irrtümer auf mehrere Ursachen zurück. Erstens: zu wenig Trainingsdaten. Algorithmen werden typischerweise mit Tausenden Fällen pro Diagnose trainiert. Die New Yorker Ärzte fütterten die KI mit wenigen Hundert Fällen pro Krebsart. Zweitens: Ärzte aus verschiedenen Ländern folgen unterschiedlichen Leitlinien. Auch weil Watson an einer US-Klinik trainiert wurde, entschied er in zwei von drei Fällen anders als das Kopenhagener Ärzteteam um Leif Jensen.

Verlässliche Daten sind Mangelware

Drittens: Keine KI ist besser als die Daten, mit denen sie geschult wird. Für das Training müssen Daten mit einer Expertise kombiniert werden, etwa ein Röntgenbild mit einer korrekten Diagnose. An solche „validen“ Daten zu kommen sei ein Riesenproblem, sagte Michael Forsting jüngst bei einer Diskussion. Häufig seien Bilder mit der falschen Diagnose etikettiert.

Auch die Qualität von Watsons Trainingsdaten scheint Experten fragwürdig. Teils seien die Fälle nicht real gewesen, sondern von den Ärzten konstruiert, schreibt Statnews. Fiktive Trainingsbeispiele seien aber nur üblich, wenn es sich um seltene Ereignisse handele, wie etwa Naturkatastrophen, erklärt Steffen Konrath vom deutschen KI Bundesverband. „Man sollte für das Training möglichst echte Daten verwenden“, sagt er.

Die Chefin der IBM-Abteilung Watson Health, Deborah DiSanzo, verteidigt das Vorgehen der Ärzte: Die hypothetischen Fälle seien repräsentativ, schreibt sie in einem Blogbeitrag. Die Daten berücksichtigten aktuelle Änderungen in der ärztlichen Praxis, wie es reale, aber historische Daten nicht könnten. „Dieses Werkzeug stellt keine Diagnosen“, betont DiSanzo. Es solle vielmehr Evidenz für Behandlungsoptionen liefern. „Wir arbeiten eng mit Medizinern zusammen, um sicherzustellen, dass Watson sich mit ihren Bedürfnissen und Prozessen weiterentwickelt“, schreibt DiSanzo. Watsons Einsatz in der Praxis, samt der Kritik von Ärzten, gehört demnach zu seinem Lernprozess.

Viele Einsatzgebiete

Prinzip Der IBM-Supercomputer Watson wertet gewaltige Datenmengen aus und sucht darin nach Zusammenhängen. Dank Künstlicher Intelligenz (KI) soll das System ständig dazulernen und so immer bessere Entscheidungen treffen. Die Medizin ist nur einer von vielen Bereichen, in denen Watson eingesetzt werden kann.

Anwendung Beispiele für weitere Einsatzgebiete sind die Verbesserung der Cybersicherheit in Unternehmen, die schnellere Bearbeitung von Schadensfällen bei Versicherungen oder eine bessere Blindenhund-Ausbildung, in die von Anfang an die individuellen Bedürfnisse der späteren Nutzer einfließen. Eingesetzt wird Watson auch zur Steuerung von Bewässerungsanlagen im Weinbau oder um die Wartung von Flugzeugen zu optimieren.

Wissen News