Big Data in der Medizin Jeder Mensch ist eine Bibliothek

Von  

Bei Ärzten und in der Forschung lagern gewaltige Datenschätze. Symptome und eventuell genetische Ursachen lassen sich mit Hilfe moderner Computertechnik vergleichen. Ziel ist eine personalisierte, auf den einzelnen Patienten zugeschnittene Medizin.

Die Gene des Menschen helfen bei Diagnose und Therapie von Krankheiten. Foto: imago
Die Gene des Menschen helfen bei Diagnose und Therapie von Krankheiten. Foto: imago

Stuttgart - Der gläserne Patient wird Realität. Auf der medizinischen Datenbank, die vom Hasso-Plattner-Institut in Potsdam in Zusammenarbeit mit der Ber­liner Charité-Klinik entwickelt wurde, hat eine 48-jährige, fiktive Lungenkrebspatientin nicht nur einen Namen und eine Krankengeschichte. Auf der Startseite des Informationsportals namens „Medical Knowledge Cockpit“ – also „Cockpit des medizinischen Wissens“ – sind vier Gene ihres Erbgutes aufgeführt, bei denen Veränderungen gefunden wurden, die unter Umständen mit ihrer Krankheit in Verbindung stehen könnten.

Gibt es irgendwo auf der Welt Studien, die diese Frage gerade untersuchen? Wenn ein Arzt die Informationen zu einem der veränderten Gene der Patientin aufruft, dann ist aus einem riesigen Datenpool die auf die Patientin zugeschnittene Information herausgefiltert: In Sekundenbruchteilen erhält er etwa die Information, dass in den USA eine medizinische Studie exakt zu solchen Lungenkrebspatienten mit analogen genetischen Veränderungen stattfindet – für die auch noch weitere Teilnehmer gesucht werden. Neben den Veränderungen auf den Genen kann das System auch nach Diagnosebegriffen wie „Lungenkrebs in größeren Zellen“ suchen. Alle weltweit verfügbaren Tabellen und Messwerte, aber auch unstrukturierte Quellen wie Texte, Diagnosen und Tumorberichte werden mit wenigen Klicks durchsucht und gezielt ausgewertet. Ein anderes medizinisches Datensystem lässt den Arzt sofort komplexe Informationen aus einer Blutuntersuchung bewerten.

Der Clou ist, dass man die Informationen einer Vielzahl von Patienten in Sekundenschnelle miteinander abgleichen kann. „Man kann hier auch einzelne ,Kurvenausschläge‘ mit anderen Patientenprofilen vergleichen, auch wenn man noch nicht die Ursache für diesen Ausschlag kennt“, sagt Matthieu Schapranow, der das Projekt mit betreut. Um dem Arzt die Orientierung zu erleichtern, werden die Informationen auf einer Ampelskala bewertet: Rot oder Gelb bedeutet, dass der Arzt sich über die Werte beugen muss.

Renommierbeispiel für eine Big-Data-Anwendung

Noch ist das System nur ein Prototyp. Aber in wenigen Jahren könnten Ärzte schon im Sprechzimmer ihre Untersuchungsergebnisse mit einem Tastendruck mit den Daten Tausender anderer Patienten vergleichen, welche dieselben Symptome zeigen oder die eine vergleichbare Krankheit haben. Für den Softwareanbieter SAP, dessen Datenbanksystem Hana das Rückgrat für die Auswertungen liefert, ist das Projekt ein Renommierbeispiel für eine nutzbringende Big-Data-Anwendung.

Die Medizin hat in Forschung, Kliniken und Arztpraxen in den vergangenen Jahrzehnten gigantische Datenmengen angehäuft und gespeichert. Schon ein einziger dreidimensionaler CT-Scan produziert Daten im Volumen von einem Gigabyte. Doch statistische Auswertungen helfen vielleicht der Forschung. Im medizinischen Alltag stellt sich das Problem, im Falle eines konkreten Patienten die exakt auf ihn zugeschnittenen Antworten zu finden – und zwar möglichst schnell, ohne wochen- oder monatelang recherchieren zu müssen.

Ziel ist die sogenannte personalisierte Medizin. Im medizinischen Bereich sind heute die Datenbanken kaum standardisiert. Es braucht deshalb analytische Systeme, die innerhalb dieser Vielfalt operieren können. Diese sollen nicht nur aufgrund ihrer Rechenleistung, sondern durch bessere Analyse auch in vorhandenen Daten neue Zusammenhänge erschließen.

Zehn Jahre hat es bei den ersten Anläufen zur Entschlüsselung des menschlichen Genoms gebraucht, bis das Erbgut von nur zwei Menschen analysiert war. Inzwischen sind solche Untersuchungen etwa bei der Krebstherapie Alltag. Doch schon die Analyse einer kompletten menschlichen Genomsequenz produziert Daten im Volumen von 300 bis 400 Gigabyte. Das Pro­blem multipliziert sich, wenn man verschiedene Patienten vergleicht.

Genomanalyse binnen weniger Stunden

„Das ist, als ob Sie einen ganzen Parkplatz mit Kleinlastwagen mit denselben Büchern haben – und feststellen wollen, ob sich darin drei oder vier Buchstaben unterscheiden“, sagt Tim Conrad, Professor für medizinische Bioinformatik an der Freien Universität Berlin. „Sie können bei einem Krebspatienten nicht Wochen oder Monate auf die Auswertung eine Genomanalyse warten, um anschließend über eine Therapie zu entscheiden“, sagt Bernhard Küster, Professor für Proteinforschung in Bioanalyse an der Technischen Universität München: „Nun haben Sie die Informationen innerhalb eines Tages, manchmal binnen Stunden.“ Jetzt können Verknüpfungen und Muster gesucht werden, wie das bisher wegen der enormen Zahl der zu untersuchenden Varianten nicht möglich war.

Wie wirken sich Veränderungen im Erbgut auf die Produktion von Proteinen aus? Und welchen Einfluss hat das auf den Stoffwechsel? Die Kombinationen sind endlos: „Wenn Sie Tausende Personen vergleichen müssen, da sind Sie schnell im Bereich der Tera- oder Petabyte.“ Das sind Zahlen mit zwölf und fünfzehn Nullen. Was sich aus den Datenbanken herausfischen lässt, kann Leben retten, aber es kann auch das Leben der Patienten leichter machen: Es wird etwa einfacher, Erkenntnisse von Patienten mit derselben Krankheit zu vergleichen. Das kann schmerzhafte oder aufwendige Untersuchungen ersparen.

Skepsis gegenüber zu viel Transparenz

Der Arzt der Zukunft wird stärker als heute auf Analytiker vertrauen müssen, die ihm eine Flut von Informationen vorsortieren. Nicht jeder Mediziner könne sich mit dieser Rolle anfreunden, sagt Matthieu Schapranow. Schließlich sei so auch genau zu verfolgen, welche Informationen einer ärztlichen Entscheidung zugrunde lagen: „Ältere Ärzte sind bei so viel Transparenz skeptisch, die jüngere Generation, die mit dem Tablet-Computer groß geworden ist, die wünscht sich noch mehr Daten.“ Mit der Überschrift „Gläserner Patient“ ist er nicht glücklich. Auch künftig kenne nur der behandelnde Arzt die persönlichen Daten. Für systematische Auswertungen seien Patientennamen irrelevant: „Da reicht es, wenn Sie die Altersgruppe wissen. Das Geburtsdatum interessiert niemanden“, sagt Schapranow: „Ihre Krankenkasse weiß da schon heute viel mehr über Sie.“