Generative KI als Herausforderung für das Urheberrecht

Der Einsatz generativer KI-Tools wie ChatGPT, Gemini, Stable Diffusion, Midjourney oder DALL-E fordert unsere Rechtsordnung, insbesondere das Urheberrecht, auf ganz grundsätzlicher Ebene heraus. Der Artikel fasst zentrale urheberrechtliche Fragen zusammen, die die Etablierung entsprechender KI-Systeme aufwirft.

Was ist generative künstliche Intelligenz?

Künstliche Intelligenz meint allgemein die Fähigkeit einer Maschine, menschliche Fähigkeiten wie logisches Denken, Lernen, Planen und Kreativität zu imitieren – es geht dabei also um die Automatisierung intelligenten Verhaltens. Unter generativer künstlicher Intelligenz versteht man diejenigen KI-Systeme, die Inhalte erzeugen können. Dabei kann es sich beispielsweise um Text-, Bild-, Audio- und Videodateien oder Programmcode handeln. Die den KI-Systemen zugrundeliegenden Modelle werden mit einer großen Zahl an Daten trainiert. Dabei kommen sog. Machine-Learning-Techniken zum Einsatz, bei denen die Systeme aus gesammelten Daten lernen und genuin neue Daten erzeugen.  

Bekannte Anwendungsbeispiele für generative KI-Tools sind zum einen sog. Chatbots wie ChatGPT von OpenAI, Google Gemini, Microsoft Copilot oder Claude von Anthropic, die mit ihren Nutzern über textbasierte Nachrichten kommunizieren. Die Herstellung von Bildern kann über sog. Text-zu-Bild-Generatoren wie Stable Diffusion von Stability AI, Midjourney, DALL-E von OpenAI oder Adobe Firefly erfolgen. Inzwischen gibt es Text-zu-Videogeneratoren, wie zum Beispiel Sora von OpenAI, mit denen aus einer Texteingabe sofort ein KI-Video erstellt werden kann.

Der Einsatz generativer KI setzt die Sammlung großer Mengen von Trainingsdaten voraus. In einer Datenbank (Korpus) werden große Mengen Text, beispielsweise Bücher, Inhalte von Wikipedia und aus dem Internet zusammengeführt. Mit diesen Daten werden die den Tools zugrundeliegenden KI-Modelle dann trainiert, um Muster und Strukturen in den Daten zu erkennen. Durch spezifisches Training wird dieses grundlegende Modell für eine bestimmte Aufgabe angepasst. Dem trainierten Modell können Nutzerinnen und Nutzer dann Aufträge, sog. Prompts, geben. Das KI-System generiert daraufhin eine Antwort (Output). Zur Erzeugung dieses Outputs nutzt das KI-System die erlernten Muster zur Vorhersage einer nützlichen Antwort. Der KI-generierte Output ist also keine Wiedergabe einer vorhandenen Antwort aus den Trainingsdaten, sondern eine neu erzeugte Information.

Der Umstand, dass KI-Systeme inzwischen also in der Lage sind, menschliche Kreativität auf immer höherem Niveau zu imitieren, stellt das Urheberrecht, das dem Schutz eben dieser kreativen Leistungen dient, vor grundlegende Herausforderungen.

Welche rechtlichen Fragen wirft der Einsatz generativer KI auf?

Die urheberrechtlichen Fragen beim Einsatz generativer KI beziehen sich einerseits auf die Verwertung von Trainingsdaten und die rechtliche Bedeutung von Prompts (sog. Input-Seite), andererseits auf die Schutzfähigkeit der mit dem KI-System erzeugten Inhalte und die Übernahme geschützter Werke sowie Fragen der Haftung für Urheberrechtsverletzungen (sog. Output-Seite).

Urheberrechtliche Probleme auf der Inputseite (Training, Prompts)

Eine der zentralen urheberrechtlichen Fragen bei der Anwendung generativer KI betrifft die großen Datenmengen, mit denen die KI-Modelle trainiert werden. KI-Unternehmen trainieren die ihren Angeboten zugrundeliegenden Modelle häufig mit Daten, an denen Urheberrechte bestehen, beispielsweise mit Texten aus Büchern und von Webseiten. Fraglich ist, ob es für das Training mit urheberrechtlich geschützten Werken eine Rechtsgrundlage gibt. Geht man davon aus, dass es sich beim Sammeln entsprechender Daten um eine Vervielfältigung im Sinne des § 16 des Urheberrechtsgesetzes (UrhG) handelt, hängt die Rechtmäßigkeit des Trainings vom Vorliegen einer Schranke ab. In Betracht käme die Text- und Data-Mining-Schranke des § 44b UrhG, deren Greifen im beschriebenen Zusammenhang jedoch noch umstritten ist. Ob das Training mit urheberrechtlich geschützten Werken künftig legal möglich sein soll, ist für die Etablierung von auf generativer KI basierenden Geschäftsmodellen essenziell. Etwaige Vergütungsverpflichtungen für die Urheberinnen und Urheber der Werke würden angesichts der großen Datenmengen, die für das Training erforderlich sind, wohl dazu führen, dass nur finanzkräftige Unternehmen auf dem KI-Markt existieren könnten. Auch würde im Falle von Lizenzierungspflichten die Gefahr sinkender Datenqualität steigen, da die KI-Modelle dann alternativ lediglich mit gemeinfreien und synthetischen Daten trainiert würden. Der Anreiz für Unternehmen mit innovativen Geschäftsideen im Bereich der generativen KI, ihre Modelle in Europa zu trainieren, würde bei entsprechend restriktiven Regeln wohl verloren gehen. Gleichzeitig erscheint es fragwürdig, Urheberinnen und Urheber ohne Ausgleichsmöglichkeiten zu stellen. Die KI-Systeme erzeugten zudem häufig einen Output, der in unmittelbarer Konkurrenz zu von ihnen geschaffenen Werken steht.

Nutzerinnen und Nutzer entsprechender KI-Tools könnten sich außerdem die Frage stellen, ob die Prompts, also die Aufträge, die sie dem System erteilen, urheberrechtlich geschützt sein können. Denkbar scheint dies allerdings wohl nur in Fällen, in denen Nutzer selbst einen kreativen Input bzw. eine gestalterische Entscheidung treffen. Kurze, einfache Prompts dürften tendenziell kaum schutzfähig sein.

Schon im Rahmen der Eingabe eines Prompts kann es vorkommen, dass Nutzer urheberrechtlich geschützte Inhalte an den KI-Anbieter schicken, indem sie sich beispielsweise einen Text zusammenfassen oder umformulieren lassen. Auch diesbezüglich bestehen erhebliche rechtliche Unsicherheiten, da das Kopieren von Inhalten in den Prompt grundsätzlich eine Vervielfältigung darstellen könnte und das Greifen einer urheberrechtlichen Schranke von den technischen Eigenschaften des verwendeten KI-Systems abhängt.

Urheberrechtliche Probleme auf der Outputseite (KI-generierte Inhalte)

Bezüglich des sog. Outputs, also den Inhalten (Text-, Audio- und Videodateien, Programmcode), die durch das generative KI-System erzeugt werden, stellt sich zum einen die Frage nach der urheberrechtlichen Schutzfähigkeit. Nach § 2 Abs. 2 UrhG sind nur „persönliche geistige Schöpfungen“ vom Urheberrecht geschützt, weshalb KI-generierter Content nach geltendem Recht keinen entsprechenden Schutz genießt. Denn obwohl vor der Erzeugung des Outputs der Auftrag eines Menschen und die Programmierung des Systems stehen, generiert die künstliche Intelligenz die Inhalte letztlich autonom und entwickelt sich eigenständig fort. Diskutiert wird in diesem Zusammenhang insbesondere die Einführung eines Leistungsschutzrechts zugunsten der KI-Programmierer – denn auch diesen könnte man potenziell eine Verwertungsmöglichkeit als Ausgleich für die zeit- und kostenintensive Entwicklung von KI-Software zugestehen wollen.

Wie sieht es außerdem aus, wenn Teile von geschützten Werken im Output enthalten sind? Zulässig ist die bloße Übernahme eines künstlerischen Stils. Wenn das Werk eines Dritten im KI-generierten Output enthalten ist, kommt es letztlich darauf an, ob das Werk dort noch wiederkennbar ist. Ein praktisches Problem aus Nutzersicht dürfte dabei sein, das häufig gar nicht erkennbar sein könnte, wenn der Output urheberrechtlich geschützte Elemente enthält. Fraglich ist außerdem, wie häufig eine Übernahme geschützter Inhalte in der Praxis sein wird, da KI-Bilder ja gerade keine Collagen sind, sondern durch generative KI gerade etwas Neues erzeugt wird.

Fraglich ist auch, wer im Kontext KI-generierter Inhalte für Urheberrechtsverletzungen haftet. Nutzerinnen und Nutzer der KI-Tools kommen als Täter in Betracht. Eine etwaige Haftung der KI-Unternehmen ist bisher ungeklärt. Derzeit schließen viele KI-Anbieter ihre Haftung mit Verweis auf die Eigenverantwortlichkeit ihrer Nutzer aus. Denkbar wäre künftig beispielsweise ein Haftungsmodell, dass demjenigen für Host-Provider ähnelt und bei dem KI-Anbieter zur Einrichtung bestimmter Filter verpflichtet werden.

Das Urheberrecht steht angesichts des Einsatzes generativer künstlicher Intelligenz vor der Aufgabe, neue Zielkonflikte zu lösen. Wie schafft man es, die Interessen von Kreativen und der Allgemeinheit an verschiedensten kreativen Ausdrucksformen zu schützen und gleichzeitig Innovation und Wettbewerb durch den Einsatz neuer Technologien zu ermöglichen? Für die Zukunft stellen sich aus rechtspolitischer Sicht zahlreiche Fragen: Brauchen wir das Urheberrecht in Zukunft noch als Anreizsystem für menschliches kreatives Schaffen? Unter welchen Bedingungen soll das Training von KI-Modellen mit urheberrechtlich geschütztem Material erlaubt sein? Sollte die Einführung eines KI-Leistungsschutzrechts erwogen werden?

Ausgewählte Literatur zum Themenfeld „Generative KI und Urheberrecht“

Baumann, Generative KI und Urheberrecht – Urheber und Anwender im Spannungsfeld, NJW 2023, 3673

De la Durantaye, „Garbage in, garbage out” – Die Regulierung generativer KI durch Urheberrecht, ZUM 2023, 645

Gerecke, Social Media und Recht: Einige urheberrechtliche Gedanken zu generativen KI-Modellen, GRUR-Prax 2023, 381

Heine, Generative KI: Nutzungsrechte und Nutzungsvorbehalt, GRUR-Prax 2024, 87

Hofmann, Retten Schranken Geschäftsmodelle generativer KI-Systeme, ZUM 2024, 166

Kraetzig, KI-Kunst als schöpferische Zerstörung, NJW 2024, 697

Maamar, Urheberrechtliche Fragen beim Einsatz von generativen KI-Systemen, ZUM 2023, 481

Pesch/Böhme, Artpocalypse now? – Generative KI und die Vervielfältigung von Trainingsbildern, GRUR 2023, 997

Raue, Kreativität im Zeitalter ihrer technischen Reproduzierbarkeit: Generative KI als Totengräberin des Urheberrechts? Eine Gedankenskizze, ZUM 2024, 157

Schack, Auslesen von Webseiten zu KI-Trainingszwecken als Urheberrechtsverletzung de lege lata et ferenda, NJW 2024, 113

Von Welser, Generative KI und Urheberrechtsschranken, GRUR-Prax 2023, 516

Wagner, KI-generierter Content: Ein Boost für den Public Domain oder Quell neuer Urheberrechtswerke?, MMR 2023, 811

Wagner, Generative KI: Eine „Blackbox“ urheberrechtlicher Haftungsrisiken?, MMR 2024, 298