Adobe entwickelt mit "VoCo" ein Sprachbearbeitungsprogramm, das völlig neue Möglichkeiten bieten soll. Die Beweiskraft von Tondokumenten wird massiv in Frage gestellt werden.

Stuttgart - Man hört dieser Tage oft, dass wir in „postfaktischen Zeiten“ leben, in einer Ära, in der Tatsachen kaum noch eine Rolle spielen. Die Gründe dafür sind vielfältig. Ganz sicher gehört dazu, dass es immer schwerer fällt zu bestimmen, was eine Tatsache ist und was nicht. So haben Fotos längst ihre Beweiskraft eingebüßt. Statische wie auch bewegte Bilder können selbst von Laien so geschickt manipuliert werden, dass nur noch Experten die Täuschung erkennen. Allein Tondokumente genießen noch den Ruf, ein weitgehend unbestechliches Abbild der Realität zu liefern. So hätte eine alte Audioaufnahme mit frauenfeindlichen Sprüchen Donald Trump beinahe die Präsidentschaft gekostet. Doch auch mit der Authentizität des gesprochenen Wortes wird es wohl bald vorbeisein.

 

Wundersame Stimmwandlung

Die US-Firma Adobe, vor allem bekannt für ihr Bildbearbeitungsprogramm Photoshop und den Acrobat Reader, hat im Rahmen einer Konferenz in San Diego ein Programm vorgestellt, mit der Sprachaufnahmen nachträglich bearbeitet werden können. „VoCo“, ein Kürzel für „Voice Conversion“, deutsch „Stimmwandlung“, kann Menschen nicht nur die Worte im Mund herumdrehen, sondern sie ihnen sogar hineinlegen. In einer Demonstration, die auch auf Youtube zu sehen ist, lässt ein Adobe-Mitarbeiter den anwesenden Comedian Jordan Peele sagen: „Ich habe Jordan dreimal geküsst“. Tatsächlich hatte dieser ursprünglich bekannt: „Ich habe meine Hunde und meine Frau geküsst.“

Für die „Neuinterpretation“ waren nur wenige Klicks notwendig. Basis der verblüffenden Trickserei ist jeweils eine 20 Minuten lange Aufnahme der betreffenden Person. Die Sätze, Wörter und Silben werden von dem Programm in Phoneme zerlegt, die kleinsten bedeutungsunterscheidenden Laute, aus denen sich die menschliche Sprache zusammensetzt. Das Ergebnis ist ein linguistischer Baukasten, mit dem sich praktische beliebig Sätze umstellen, Wörter hinzufügen oder völlig neue Bedeutungen generieren lassen.

Mittels des jeweiligen Sprachprofils kann VoCo Stimmlage, Tonfall und Melodie des Originalsprechers täuschend echt imitieren. Nach eigener Aussage will Adobe es damit ermöglichen, die Medienproduktion zu perfektionieren. So könnte man künftig Versprecher einfach nachträglich korrigieren, ganz so, wie man mit Photoshop Pickel oder glänzende Hautpartien aus Bewerbungsfotos entfernt. Denkt man etwas weiter, sind auch andere Einsatzmöglichkeiten denkbar. So könnte man die Stimmen der Originalschauspieler zur Synchronisation von Filmen einsetzen – mit entsprechenden Auswirkungen auf den Berufsstand der professionellen Synchronsprecher. Oder Sänger lassen ihre Stimme konservieren, um auch nach ihrem Ableben für Musikproduktionen zur Verfügung zu stehen.

Markierung für manipulierte Dateien

Angesichts solcher Anwendungsmöglichkeiten, die bis vor kurzem noch an Science-Fiction erinnerten, ist die Gefahr der Manipulation nicht von der Hand zu weisen. Die VoCo-Entwickler von Adobe sind sich dessen durchaus bewusst und wollen bearbeitete Aufnahmen deshalb mit „Wasserzeichen“ versehen, mit denen sich die Änderungen zweifelsfrei erkennen lassen. Fälscher, Propagandisten und Kriminelle haben sich von solchen Hindernissen allerdings noch nie lange abschrecken lassen.

Die Folgen sind kaum absehbar. Ob gesprochene Testamente, Aussagen von Zeitzeugen, abgehörte Telefonate oder der Originalton von Videoaufnahmen – all das wird wohl bald kein stichhaltiger Beweis mehr für ein tatsächliches Ereignis sein. Die Worte „Das habe ich so nie gesagt!“ werden so leicht von den Lippen gehen wie niemals zuvor.