KI-Training und Urheberrecht: Warum Anthropic 1,5 Milliarden Dollar zahlt

von Jörg Schieb | 06.09.2025 | KI

Robot diskutiert über KI-Training und Urheberrecht

Eine KI namens Claude und die teuerste Urheberrechts-Einigung aller Zeiten: Warum Anthropic jetzt 1,5 Milliarden Dollar blechen muss – und was das für ChatGPT & Co. bedeutet.Der Präzedenzfall mit Milliarden-Dimension.

KI-Training und Urheberrecht: Warum Anthropic 1,5 Milliarden Dollar zahlt

1,5 Milliarden Dollar – diese schwindelerregende Summe will das KI-Unternehmen Anthropic (der wir das KI-Modell Claud zu verdanden haben) an Buchautoren zahlen, um einer folgenreichen Urheberrechtsklage zu entgehen. Es ist der bisher größte bekannte Vergleich im Bereich des Urheberrechts überhaupt.

Doch was steckt dahinter? Und warum ist dieser Fall so bedeutsam für die gesamte KI-Industrie?

Ursache war die Klage dreier US-Autoren – Andrea Bartz, Charles Graeber und Kirk Wallace Johnson – , die den Stein ins Rollen gebracht haben. Das Fall wirft ein grelles Schlaglicht auf eine der drängendsten Fragen unserer Zeit: Wie dürfen KI-Systeme trainiert werden, und welche Rechte haben die Urheber der verwendeten Inhalte?

Anthropics KI-Modell Claude4 ist einer der stärkste Chatbots überhaupt

Wie funktioniert KI-Training eigentlich?

Um zu verstehen, warum dieser Fall so brisant ist, müssen wir zunächst einen Blick unter die Motorhaube moderner KI-Systeme werfen. Große Sprachmodelle wie Claude oder ChatGPT funktionieren nicht wie traditionelle Software, die nach fest programmierten Regeln arbeitet. Stattdessen lernen sie aus gigantischen Textmengen.

Stellen Sie sich das Training wie einen gewaltigen Lernprozess vor: Das KI-System analysiert Milliarden von Texten – Bücher, Artikel, Webseiten – und erkennt dabei Muster in der Sprache. Es lernt, welche Wörter typischerweise aufeinander folgen, wie Sätze strukturiert sind und welche Konzepte miteinander verknüpft werden. Dieser Prozess erfordert unvorstellbare Mengen an Trainingsdaten. Je vielfältiger und hochwertiger diese Daten sind, desto besser wird das resultierende KI-Modell.

Die Crux dabei: Hochwertige Texte – etwa professionell lektorierte Bücher – sind besonders wertvoll für das Training. Sie enthalten korrektes Deutsch oder Englisch, sind logisch strukturiert und decken ein breites Themenspektrum ab. Genau diese Qualität macht sie für KI-Entwickler so begehrenswert.

Was, wenn ein Roboter wie der Chatbot ChatGPT ein Buch liest?

Der konkrete Vorwurf: Schattenbibliotheken als Trainingsquelle

Im Fall Anthropic geht es um etwa 500.000 Bücher, die das Unternehmen für das Training seines Chatbots Claude verwendet haben soll. Das Brisante: Diese Bücher stammten nicht aus legalen Quellen. Stattdessen soll Anthropic auf zwei berüchtigte Piraterie-Plattformen zurückgegriffen haben: Library Genesis und Pirate Library Mirror.

Diese sogenannten Schattenbibliotheken sind im Internet als Sammelstellen für urheberrechtlich geschützte Werke bekannt. Millionen von Büchern werden dort ohne Erlaubnis der Autoren oder Verlage zum Download angeboten. Für Nutzer mag das verlockend sein – für Urheber bedeutet es entgangene Einnahmen und Kontrollverlust über ihre Werke.

Der zuständige Richter William Alsup in San Francisco kam zu einem differenzierten Urteil: Die Nutzung urheberrechtlich geschützter Texte für das KI-Training könnte durchaus unter den „Fair Use“-Grundsatz fallen – eine Ausnahme im US-Urheberrecht, die bestimmte Nutzungen ohne Erlaubnis erlaubt, wenn dabei etwas substantiell Neues entsteht. Das Herunterladen aus illegalen Quellen allerdings nicht.

Die rechtliche Zwickmühle der KI-Industrie

Der Fall zeigt ein grundlegendes Dilemma der KI-Entwicklung auf. Einerseits argumentieren Unternehmen, dass das Training von KI-Modellen eine transformative Nutzung darstellt – das Modell reproduziert ja nicht einfach die Bücher, sondern lernt aus ihnen, um neue Texte zu generieren. Dies könnte tatsächlich als Fair Use durchgehen.

Andererseits ist die Art der Beschaffung entscheidend. Hätte Anthropic die 500.000 Bücher legal erworben, sähe die Rechtslage möglicherweise anders aus. Doch das Herunterladen aus Piraterie-Quellen, noch dazu in dem Wissen, dass diese illegal sind, macht das Unternehmen angreifbar. Im schlimmsten Fall hätten Strafzahlungen von bis zu 150.000 Dollar pro Buch gedroht – bei 500.000 Büchern eine existenzbedrohende Summe von 75 Milliarden Dollar.

Warum die 1,5 Milliarden ein kluger Schachzug sind

Vor diesem Hintergrund erscheinen die 1,5 Milliarden Dollar – etwa 3.000 Dollar pro Werk – fast wie ein Schnäppchen. Anthropic erkauft sich damit nicht nur Rechtssicherheit, sondern auch die Möglichkeit, weiter zu wachsen. Erst diese Woche verkündete das Unternehmen eine Finanzierungsrunde über 13 Milliarden Dollar, wodurch es mit 183 Milliarden Dollar bewertet wird.

Der Vergleich sendet aber auch ein Signal an die gesamte Branche: Die Zeiten des unregulierten Datensammelns für KI-Training könnten vorbei sein. „Diese Einigung sendet eine starke Botschaft an die KI-Industrie“, betont Mary Rasenberger vom Schriftstellerverband Authors Guild. Es gebe „schwerwiegende Konsequenzen“, wenn Werke unrechtmäßig für KI-Training verwendet werden.

Ein Wendepunkt für die KI-Entwicklung?

Der Fall Anthropic könnte einen Wendepunkt markieren. Während die technische Entwicklung von KI-Systemen rasant voranschreitet, hinkt die rechtliche Klärung hinterher. Dieser Vergleich könnte ein Modell für zukünftige Vereinbarungen werden. Schon jetzt laufen ähnliche Klagen gegen andere KI-Unternehmen, darunter auch gegen OpenAI, den Entwickler von ChatGPT.

Für die KI-Industrie bedeutet das: Die Kosten für Training werden steigen. Unternehmen müssen entweder Lizenzen erwerben, eigene Vereinbarungen mit Rechteinhabern treffen oder sich auf frei verfügbare Inhalte beschränken. Dies könnte kleinere Entwickler benachteiligen und die Dominanz großer Tech-Konzerne verstärken, die sich teure Lizenzvereinbarungen leisten können.

Was bedeutet das für die Zukunft?

Der Anthropic-Fall zeigt: Die KI-Revolution hat ihren Preis. Die Zeiten, in denen Entwickler ungehindert auf alle verfügbaren Daten zugreifen konnten, neigen sich dem Ende zu. Das ist einerseits gut für Kreative und Urheber, deren Arbeit nun angemessen vergütet wird. Andererseits könnte es Innovation bremsen und die Entwicklung neuer KI-Systeme verteuern.

Langfristig wird die Gesellschaft einen Ausgleich finden müssen zwischen dem Schutz geistigen Eigentums und der Förderung technologischer Innovation. Der 1,5-Milliarden-Dollar-Vergleich von Anthropic ist dabei nur der Anfang einer Entwicklung, die unseren Umgang mit KI, Kreativität und Urheberrecht grundlegend prägen wird.