Forensische Phonetiker identifizieren Kriminelle anhand ihrer Stimme. Bei diesen Gutachten ist manches fragwürdig, denn zu Sprechervergleichen gibt es kaum Regelungen oder wissenschaftliche Mindeststandards.

Stuttgart - Jeder Mensch hat eine eigene Art zu sprechen. Menschen reden verschieden schnell, haben eine höhere oder tiefere Stimme. Auch beim Dialekt und der Wortwahl hört man Unterschiede. Außerdem hat jeder kleinere oder größere Sprachfehler. Die Kombination dieser Eigenschaften macht einen Sprecher fast unverwechselbar. Deshalb dient die Stimme in Kriminalfällen auch als Beweismittel für die Identität eines Täters. Französische Ermittler konnten zum Beispiel die Stimme in einer Bekennernachricht schon kurz nach den Anschlägen von Paris dem Dschihadisten Fabien Clain und so den Angriff vom November dem IS zuordnen. Experten haben kürzlich auch den „Poster-Boy“ der Terroristen in Deutschland, Denis Cuspert, in einem mitgehörten Telefongespräch an seiner Stimme identifiziert und so festgestellt, dass er – entgegen anderslautenden Meldungen aus dem Pentagon – noch lebt.

 

Diese Art der Ermittlungen gehört zum  Fachgebiet der forensischen Phonetik. Aus Sprachaufzeichnungen, die etwa aus Telefonüberwachungen, Drohanrufen auf einem Anrufbeantworter und zunehmend aus Videos im Internet stammen, erstellen Experten ein Sprecherprofil, um dieses mit einer zweiten Sprechprobe, etwa der eines Verdächtigen, zu vergleichen. Typisch sind Fälle von Bedrohung, Erpressung oder konspirativen Gesprächen organisierter Krimineller oder von Terroristen. Auch Kinderpornos müssen sich die Ermittler manchmal genauestens anhören.

Sprechervergleiche finden in den größten europäischen Ländern in einigen Hundert Gutachten pro Jahr statt, wie die Recherche zu diesem Artikel ergab. Genaue Zahlen liegen nicht vor. Keines der untersuchten Länder besitzt ein amtliches Register dafür. Wie zuverlässig ist die Stimme als Beweismittel? Diese Recherche hat etwa zwei Dutzend Fälle aus aller Welt zu Tage gefördert, in denen Sprechervergleiche unter fragwürdigen Bedingungen oder mit zweifelhaften Methoden stattfanden – auch in Deutschland und Österreich. Sie werden auf einem Internetportal in mehreren Sprachen vorgestellt.

Wissenschaftlich unzureichende Methoden

Sprechervergleiche sind wissenschaftlich nicht so gut etabliert wie etwa Vergleiche von DNA-Spuren oder Fingerabdrücken. Denn kaum einmal finden zwei Sprachaufzeichnungen unter denselben Bedingungen statt. „Es gibt technische Unterschiede bei den Mitschnitten und solche, die mit der Verfassung des Sprechers zu tun haben“, erklärte Stefan Gfrörer, Leiter des Fachbereichs Forensische Sprechererkennung beim Bundeskriminalamt im September bei der Fachkonferenz Interspeech in Dresden. In einem Telefonat hat der Täter womöglich laut und emotional aufgewühlt ins Handy gerufen. Der Mitschnitt dieses Telefonats lässt sich nicht ohne Weiteres mit der Aufnahme eines vorgelesenen Textes vergleichen, den der Verdächtige im Gefängnis ins Mikrofon gesprochen hat.

Die Stimme verändert sich auch mit dem Alter, durch starkes Rauchen, bei Müdigkeit, unter Alkohol- oder Drogeneinfluss oder durch Erkrankungen. Verschiedene Telefonverbindungen beeinflussen die Signaleigenschaften der aufgezeichneten Gespräche, Internetvideos sind meistens komprimiert, worunter die Tonqualität leidet. Aufzeichnungen in Fremdsprachen erschweren den Vergleich zusätzlich. Sprechproben, bei denen man solche Unterschiede vorfindet, bezeichnet man als „Mismatch“, als Fehlpaarung.

Zwar gibt es mit der auditiv-akustischen Methode ein wissenschaftlich weithin anerkanntes Verfahren, das – richtig angewendet – zu verlässlichen Aussagen führt. Dabei nutzen Gutachter ihr geschultes Gehör einerseits und manuelle Messungen der Tonlage oder bestimmter Resonanzfrequenzen des Vokaltrakts aus Rachen-, Mund- und Nasenhöhle andererseits, um zwei Sprechproben abzugleichen. Doch eine aktuelle, noch nicht veröffentlichte Studie von Interpol hat ergeben, dass 15 von 22 befragten Experten in europäischen Strafverfolgungsbehörden immer noch Methoden verwenden, die wissenschaftlich als unzureichend gelten. Dazu gehört die sogenannte Stimmabdruck-Methode („Voiceprint“), ein Verfahren, bei dem zwei Sprechproben rein anhand der visuellen Ähnlichkeit ihres Frequenzspektrums, das die Tonhöhe abbildet, verglichen werden.

Jeder kann zum Gutachter bestellt werden

Zudem arbeiten einige Privatgutachter nach selbst entwickelten Verfahren. So etwa der Physiker und Mineraloge Sameh Rahman aus Hannover, der seine Fähigkeiten in der Signalanalyse mittels einer eigenen Software auf Sprechproben anwendet. Die Technik baut weder auf anerkannten Prinzipien der Phonetik auf, noch wurde sie von unabhängiger Seite geprüft. Dennoch tritt Rahman nach eigener Aussage bei diversen Gerichten in ganz Deutschland als Gutachter auf.

Sylvia Moosmüller, Phonetikerin an der Österreichischen Akademie der Wissenschaften, hält es für wichtig, Richter und Staatsanwälte über diese Probleme aufzuklären. „Genau wie ein Richter nicht einen Phonetiker mit einem gerichtsmedizinischen Gutachten betrauen würde, sollte er nicht fachfremde Personen wie Chemiker, Mineralogen, Audiotechniker oder Psychologen mit einem Sprecher-Gutachten beauftragen“, sagt Moosmüller.

Die fragwürdigen Praktiken können sich auch deshalb behaupten, weil ganze Zweige der Forensik keinen Regelungen unterworfen sind. Stefan Caspari, Strafrechtsexperte beim Deutschen Richterbund, sagt, es gebe für viele nicht naturwissenschaftliche Gerichtsgutachten keine Mindeststandards. Im Prinzip könne jeder als Gutachter bestellt werden. „Es kommt nur darauf an, ob er den Richter von seiner Arbeit überzeugen kann“, sagt Caspari. Dieser müsse also nicht nur über die juristischen Zusammenhänge, sondern auch über die Wissenschaft hinter dem Gutachten ein Urteil fällen. „Dabei stoßen Richter mitunter an ihre Grenzen.“

Neuer Trend zur automatisierten Analyse

Da wundert es nicht, dass im europäischen Vergleich sehr unterschiedliche Praktiken gängig sind, wie eine Studie ergab, die 2011 im Fachblatt „International Journal of Speech Language and the Law“ erschienen ist. Eine solche Vielzahl an Methoden, die stark vom jeweiligen Gutachter bei Gericht abhängt, ist in anderen Bereichen der Forensik unüblich. Bei der DNA-Analyse, der Messung des Blutalkohols oder dem Abgleich von Fingerabdrücken sind sich die Wissenschaftler über die Methoden einig. Egal, ob das Verfahren in Buenos Aires, Boston oder Böblingen stattfindet, die Methoden sind dieselben.

Seit einigen Jahren deutet sich zusätzlich ein Umbruch in der wissenschaftlich weithin anerkannten Praxis der auditiv-akustischen Methode an. Einige Experten wollen das Standardverfahren um automatisierte Auswertungen ergänzen oder gar durch sie ersetzen. Dabei extrahiert ein Computer Merkmale aus einer Sprechprobe und berechnet daraus Parameter, die mit den Eigenschaften des Vokaltrakts des Sprechers zusammenhängen. Diese vergleicht die Software dann mit den Parametern anderer Sprechproben. Ihre Befürworter erhoffen sich von automatischen Sprechervergleichen eine höhere Objektivität und einen besseren Zugang zu Proben in Fremdsprachen, der für Experten mit der auditiv-akustischen Methode nur eingeschränkt möglich ist.

Auch das Bundeskriminalamt (BKA) verwendet die automatische Sprechererkennung. Neben einem selbst entwickelten System namens SPES (kurz für: Sprechererkennungssystem) setzten die Ermittler eine Software aus Großbritannien ein, die VOCALISE heißt. „Wir verwenden zwar automatische Systeme, können sie aber im Moment nur in einem kleinen Anteil der Fälle benutzen“, sagte Stefan Gfrörer vom BKA auf der Interspeech-Konferenz in Dresden. Die Systeme seien nicht für alle Formen der „Mismatches“ zweier Proben auf ihre Verlässlichkeit geprüft. Seine Behörde arbeite aber daran, seine Systeme für eine größere Menge von Bedingungen zu testen.

Die Experten der vier Landeskriminalämter mit eigener Sprecherabteilung verwenden jedoch keine automatischen Systeme – obwohl ihnen SPES zur Verfügung gestellt wurde. Die Experten der Landeskriminalämter Berlin und Brandenburg begründen den Verzicht mit der angeblich mangelnden Praxistauglichkeit der Programme. Sie seien nur unter Laborbedingungen zu gebrauchen. Und die kämen in der Praxis so gut wie nie vor.

-- Förderung: Diese Recherche entstand mit der Unterstützung von journalismfund.eu.