Computerlinguistik: Digital Humanities sind demokratische Gleichmacher

Computerlinguistik Digital Humanities sind demokratische Gleichmacher

14.08.2013 - 14:42 Uhr

Martin Halter

14.08.2013 - 14:42 Uhr

Das dichte Lesen nahe am Text, die profane Version der theologischen Bibelexegese, ist die Existenzgrundlage jeder Philologie. Meisterdenker wie Jacques Derrida schreiben ganze Bücher über das Wort „Yes“ im „Ulysses“ oder die Funktion der Nähmaschine im Surrealismus. Aber selbst der fleißigste Literaturwissenschaftler kann nicht alles in allen Sprachen lesen oder gar verstehen. An diesem Punkt setzt die Computerphilologie an. Sie setzt auf distant reading: Je größer die untersuchte Datenmenge und der Abstand zum Stoff, je feiner die Filter beim Surfen und Schürfen, desto mehr Wissensnuggets bleiben im Sieb hängen. Erkenntnis, so die Milchmädchenrechnung, wächst proportional mit der Quantität der Daten. Leider hält die Qualität selten Schritt.

Digital Humanities sind demokratische Gleichmacher: Sie unterscheiden nicht zwischen einer Gebrauchsanleitung und Goethes „Faust“. Ihre Werkzeuge stehen prinzipiell jedem zur Verfügung. Sie scannen riesige Textmassen auf lexikalische, syntaktische und semantische Muster und spucken auf Knopfdruck Daten aus. Bisher richtete sich ihr Fokus meist auf tote Autoren und vergangene Epochen; bald schon werden sie Trends extrapolieren und Bestseller planen wollen.

Die Digital Humanities stecken noch in den Kinderschuhen

Literaturwissenschaft 2.0 liefert nützliche Erkenntnisse, aber man darf sie nicht überschätzen. Beim Digital-Humanities-Kongress 2012 in Hamburg wurde zweifelsfrei nachgewiesen, dass in Dickens’ Romanen auffällig viele Menschen mit Händen in den Hosentaschen vorkommen. Signature und JGAAP erkannten markante Unterschiede zwischen Val McDermid und Joanne K.Rowling, aber die gewählten Parameter waren eher trivial und exotisch: Kommasetzung, durchschnittliche Wortlänge, sinnlose Vier-Buchstaben-Kombinationen. Schon bei der Frage, was Plagiat, unbewusste Nachahmung oder souverän gestaltete Inspiration ist, gerät das Programm ins Schlingern. Ohne Menschen geht es noch nicht: Sie müssen die Computer anlernen, Algorithmen entwickeln und am Ende eine schlüssige Interpretation oder wenigstens eine windige Hypothese bieten.

Aber auch der Schachcomputer hat einmal klein angefangen und schlägt heute Weltmeister. Die Digital Humanities stecken noch in den Kinderschuhen, die Geisteswissenschaften schon seit Jahrzehnten in der Krise. Franco Moretti prophezeite der Literaturwissenschaft schon im Jahr 2000, sie werde immer mehr „eine Geschichte aus zweiter Hand werden, ein Patchwork aus der Forschung anderer ohne direkte, einzelne Textlektüre“. Der „Wired“-Chefredakteur Chris Anderson ging 2008 noch einen Schritt weiter: Algorithmen, Korrelationen und Symmetrien machten Thesen und Theorien bald gänzlich obsolet. Er hat vielleicht nicht einmal ganz Unrecht. Eine Literatur(wissenschaft), die nur noch kurzatmig googelt, bloggt und quasi automatisch Textbausteine verarbeitet, kann auch problemlos maschinell gelesen werden.

Der Anspruch, Literatur durch schiere Rechenkraft wissenschaftlich zu erschließen, ist eine schwere Kränkung für Dichter und Denker. Wenn geistlose Rechenknechte und bildungsferne Nerds dem Schönen, Guten und Wahren mehr Erkenntnisse abringen können als der aufmerksame, solitäre Interpret in seiner Klause, kann die Literaturwissenschaft mit ihrem „close reading“ einpacken.

Digital Humanities sind demokratische Gleichmacher

Das dichte Lesen nahe am Text, die profane Version der theologischen Bibelexegese, ist die Existenzgrundlage jeder Philologie. Meisterdenker wie Jacques Derrida schreiben ganze Bücher über das Wort „Yes“ im „Ulysses“ oder die Funktion der Nähmaschine im Surrealismus. Aber selbst der fleißigste Literaturwissenschaftler kann nicht alles in allen Sprachen lesen oder gar verstehen. An diesem Punkt setzt die Computerphilologie an. Sie setzt auf distant reading: Je größer die untersuchte Datenmenge und der Abstand zum Stoff, je feiner die Filter beim Surfen und Schürfen, desto mehr Wissensnuggets bleiben im Sieb hängen. Erkenntnis, so die Milchmädchenrechnung, wächst proportional mit der Quantität der Daten. Leider hält die Qualität selten Schritt.

Digital Humanities sind demokratische Gleichmacher: Sie unterscheiden nicht zwischen einer Gebrauchsanleitung und Goethes „Faust“. Ihre Werkzeuge stehen prinzipiell jedem zur Verfügung. Sie scannen riesige Textmassen auf lexikalische, syntaktische und semantische Muster und spucken auf Knopfdruck Daten aus. Bisher richtete sich ihr Fokus meist auf tote Autoren und vergangene Epochen; bald schon werden sie Trends extrapolieren und Bestseller planen wollen.

Die Digital Humanities stecken noch in den Kinderschuhen

Literaturwissenschaft 2.0 liefert nützliche Erkenntnisse, aber man darf sie nicht überschätzen. Beim Digital-Humanities-Kongress 2012 in Hamburg wurde zweifelsfrei nachgewiesen, dass in Dickens’ Romanen auffällig viele Menschen mit Händen in den Hosentaschen vorkommen. Signature und JGAAP erkannten markante Unterschiede zwischen Val McDermid und Joanne K.Rowling, aber die gewählten Parameter waren eher trivial und exotisch: Kommasetzung, durchschnittliche Wortlänge, sinnlose Vier-Buchstaben-Kombinationen. Schon bei der Frage, was Plagiat, unbewusste Nachahmung oder souverän gestaltete Inspiration ist, gerät das Programm ins Schlingern. Ohne Menschen geht es noch nicht: Sie müssen die Computer anlernen, Algorithmen entwickeln und am Ende eine schlüssige Interpretation oder wenigstens eine windige Hypothese bieten.

Aber auch der Schachcomputer hat einmal klein angefangen und schlägt heute Weltmeister. Die Digital Humanities stecken noch in den Kinderschuhen, die Geisteswissenschaften schon seit Jahrzehnten in der Krise. Franco Moretti prophezeite der Literaturwissenschaft schon im Jahr 2000, sie werde immer mehr „eine Geschichte aus zweiter Hand werden, ein Patchwork aus der Forschung anderer ohne direkte, einzelne Textlektüre“. Der „Wired“-Chefredakteur Chris Anderson ging 2008 noch einen Schritt weiter: Algorithmen, Korrelationen und Symmetrien machten Thesen und Theorien bald gänzlich obsolet. Er hat vielleicht nicht einmal ganz Unrecht. Eine Literatur(wissenschaft), die nur noch kurzatmig googelt, bloggt und quasi automatisch Textbausteine verarbeitet, kann auch problemlos maschinell gelesen werden.

Barack Obama als Lügner überführen

Digital Humanities sind so faszinierend wie unheimlich. Sie stellen nicht nur unser Verständnis von Kultur in Frage, sondern liefern Literatur und Geist auch der totalen Überwachung und erkennungsdienstlichen Behandlung aus. Programme, die Texte maschinell auf verdächtige Triggerwörter abtasten und Autorenprofile daraus erstellen, gibt es ja nicht nur in Oxford, sondern auch bei Google, Facebook und den Geheimdiensten.

Der Große Bruder im Nacken aber bereitet Schriftstellern, Lesern und selbst Peter Millican eher Beklemmung: 2008 lehnte er das Ansinnen eines republikanischen US-Politikers ab, Barack Obama durch die Durchleuchtung seiner Autobiografie als Lügner zu überführen.

Was man im Kuckuckskindergarten lernt

Computerlinguistik Digital Humanities sind demokratische Gleichmacher

Lesen Sie auch