Die Black Forest Labs residieren denkbar weit vom Schwarzwald entfernt. Rechtlicher Sitz des Start-up-Unternehmens ist eine Adresse in Wilmington im US-Bundesstaat Delaware. Dort befindet sich ein unauffälliger Flachbau, in dem mehr als 100 000 Firmen einen Briefkasten haben. Grund: er Staat gilt als Steueroase.
Tatsächlich arbeiten die Gründer um den CEO Robin Rombach (31), allesamt Koryphäen im Bereich Künstliche Intelligenz (KI), in der „Hauptstadt“ des Schwarzwalds. Von Freiburg aus mischen sie die Szene derzeit nicht nur in den USA, sondern weltweit auf. Mit ihrem vor wenigen Wochen präsentierten Bildgenerator namens „Flux“, der nach Textbefehlen fotorealistische Darstellungen erzeugt, haben sie einen sagenhaften Siegeszug angetreten. Besonders gut und besonders schnell zugleich, übertrifft er nach Ansicht vieler Nutzer selbst die bisherigen Platzhirsche wie Midjourney, OpenAI oder Dall-E. Inzwischen kooperieren die Black Forest Labs sogar mit Elon Musks Plattform „X“ – und sind dadurch in erste Turbulenzen geraten.
Schwarzwälder Kirschtorte als beliebtes Motiv
Mit einem doppelten Paukenschlag ging das südbadische Start-up Anfang August an den Start. Ohne große PR-Begleitung verkündete es seine Gründung, schaltete die Webseite – Hintergrund: nebelverhangene Baumspitzen – und den Bildgenerator frei. „Wir sind entschlossen, den Industriestandard für generative Medien zu schaffen“, hieß es selbstbewusst. Neben bester Technologie strebe man breite Akzeptanz an, dazu solle „Flux“ möglichst vielen zugänglich sein. Seitenbesucher konnten gleich loslegen und das Modell ausprobieren. Millionenfach wurden inzwischen Bilder erzeugt, harmlose mit Menschen, Tieren, Städten und Landschaften, teils auch problematische, etwa mit Politikern. Ein beliebtes Motiv: Schwarzwälder Kirschtorte.
Zeitgleich gab das 14-köpfige Team – die Hälfte am Rand der Freiburger Innenstadt, die andere in den USA, Kanada und Indien verstreut – seine erste Finanzierungsrunde bekannt: Ein Konsortium unter Führung des US-Wagniskapitalfonds Andreessen Horowitz habe 31 Millionen Dollar bereitgestellt. Renommierter hätte der Geldgeber kaum sein können, zumal die Amerikaner in einer sehr frühen Phase investieren. Offenbar haben sie großes Vertrauen in das Potenzial der Black Forest Labs. Einer der Folgeinvestoren ist der Fonds Mätch VC aus Stuttgart, in dem sich die landeseigene L-Bank, große Familienunternehmen, Manager und Gründer zusammengetan haben. Für den Mätch-VC-Mann Daniel Dilger bestätigt sich mit dem Erfolg der Freiburger „die grundlegende These: Europa hat die Talente, um global führende Tech-Unternehmen aufzubauen“. Und Baden-Württemberg spiele dabei ganz vorne mit.
Gemeinsam in Heidelberg studiert und geforscht
Auch ihr Wissen erhielten die Gründer um Rombach im deutschen Süden: Sie studierten einst gemeinsam in Heidelberg und wechselten später nach München an die Ludwig-Maximilians-Universität. Dort, bei dem renommierten Informatik-Professor Björn Ommer, entwickelten sie den Bildgenerator „Stable Diffusion“. Dessen Vorteil: Er braucht keine Hochleistungsrechner mehr, um – trainiert mit Milliarden von Motiven – nach Textvorgaben fotorealistische Bilder zu erzeugen. Selbst Laien erhielten damit „ein effektives Tool“, lobte Ommer einst. Nach Pinsel und Photoshop eröffneten sich damit ganz neue Möglichkeiten bei der Bilderzeugung – so wie die Textverarbeitung am Computer das Schreiben mit Stift und Maschine revolutioniert habe.
Unterstützt wurden die Forscher vom Londoner Start-up Stability AI, dem Anbieter von Stable Diffusion. Dort arbeiteten Rombach & Co später auch vom Standort Freiburg aus; das Firmenschild hängt heute noch. Im März 2024 geriet das Unternehmen in eine schwere Krise: Erst gingen eine Reihe von leitenden Mitarbeitern, darunter auch Rombach, dann trat sogar der Chef ab, offenbar im Streit mit Investoren. Die sollen darauf gedrungen haben, die Technologie weniger offen und zugänglich zu gestalten. Zu den Umständen ihres Wechsels halten sich die BFL-Leute in Mediengesprächen bedeckt, sie hätten einfach ihr eigenes Ding machen wollen.
CEO Rombach: wir übernehmen Verantwortung
Seit April arbeitete das Team der Black Forest Labs hinter den Kulissen, vier Monate später trat es auf die Bühne. Der nächste Paukenschlag folgte rasch: die Zusammenarbeit mit Elon Musk. Der Milliardär nutzt das Modell „Flux1“ inzwischen, um den bisherigen Bildgenerator auf seinem Kurznachrichtendienst X, „Grok“ genannt, aufzurüsten. Für die Freiburger brachte das einen gewaltigen Schub – sie wurden schlagartig bekannt, Hunderttausende nutzen ihre KI – aber auch neue, ungeahnte Probleme. Weil ihr Programm offenbar weniger Hürden enthielt als andere, ließen sich damit auch problematische, gewaltverherrlichende oder denunzierende Bilder erzeugen: Fake-Motive mit realen Personen in erfundenen Szenarien, etwa Donald Trump und Kamala Harris. Im US-Wahlkampf gab es darum große Aufregung, inzwischen wurden die Filter verschärft – vieles ist nicht mehr möglich. Motive mit deutschen Politikern wie Kanzler Scholz konnte „Flux“ von Anfang an nicht generieren, offenbar mangels Trainingsmaterial. Die dargestellten Personen hatten keinerlei Ähnlichkeit mit den Promis.
Was sagen Rombach und seine Co-Gründer – darunter Andreas Blattmann, Patrick Esser und Axel Sauer – zu den Irritationen? Vom Medieninteresse werden sie gerade überrollt, eine Anfrage unserer Zeitung blieb zunächst unbeantwortet. Gegenüber „Zeit online“ meinten sie, man habe sich die Zusammenarbeit mit Musks KI-Firma gut überlegt, die sei nur einer von mehreren Kunden. „Wir nehmen die Verantwortung an, die mit so einer Technologie kommt“, wurde Rombach zitiert. Der Open-Source-Ansatz, also der offene Zugang für andere Entwickler, trage dazu bei, sie überprüfbarer und damit sicherer zu machen. Das sei „besser, als wenn sie nur von zwei globalen Konzernen kontrolliert wird“.
Ein Video-Generator ist bereits in Arbeit
Geld verdienen lässt sich mit KI-Bildgeneratoren natürlich auch, etwa per kostenpflichtiger Profiversion. Die Einsatzmöglichkeiten dafür scheinen fast unbegrenzt: vom Friseur, der seinen Kundinnen vorab potenzielle Schnitte vorführt, über das Entwerfen von Autodesigns oder Gebäudefassaden bis zum Einsatz in der Werbung. Schon tauchen auf Plakaten und Anzeigen Bilder von vermeintlich echten Menschen auf, die künstlich erzeugt wurden; teure Fotosessions mit Models könnten so nach und nach überflüssig werden.
In Zukunft erscheint noch viel mehr möglich. Als nächstes planen die Black Forest Labs einen Videogenerator, wie sie auf ihrer Webseite ankündigen. Dort ist ein altertümlicher Monitor zu sehen, der auf einer einsamen Holzbank im Schwarzwald steht. Auf dem Bildschirm laufen skurrile Kurzfilme – etwa von einer Katze, die sich Spaghetti kocht und dann genüsslich verzehrt.