Veröffentlicht am 2. Juli 2025
Lesedauer ca. 4 Minuten

Urheberrecht und KI: Spielregeln für datengetriebene Innovation

Dr. Susanne Grimm
Associate Partner
Fachanwältin für Gewerblichen Rechtschutz, Praxisgruppenleiterin IP & Media, Lead International Group IP & Media, Rechtsanwältin
Frank Fischer
Associate Partner
Fachanwalt Urheber- und Medienrecht, Leiter Praxisgruppe IP & Media Deutschland, Rechtsanwalt
Kontaktieren Sie uns:
Jetzt Kontakt aufnehmen
Generative KI-Systeme, die selbstständig Texte, Bilder oder Musik erzeugen, sind bereits vielfältig im Einsatz. Sie basieren auf großen Datenmengen, die in aufwändigen Trainingsprozessen verarbeitet werden.

Häufig greifen KI-Anwendungen auf öffentlich zugängliche Webinhalte zurück, indem sie diese automatisiert „durchforsten“ oder „durchscannen“ (sog. „Crawling“ oder „Scraping“). Was aber, wenn diese Daten urheberrechtlich geschützt sind?

In Deutschland regelt § 44b Urheberrechtsgesetz (UrhG), die sogenannte Text- und Data-Mining-Schranke, die Nutzung von Daten für das KI-Training. Sie stellt einen Kompromiss zwischen Innovationsförderung und Urheberrechtsschutz dar.

Die gesetzliche Grundlage: § 44b UrhG

Grundgedanke des Urheberrechts ist, dass der Urheber das ausschließliche Recht hat, über die Nutzung seiner Werke zu entscheiden. Die Ausnahmeregelung in § 44b UrhG erlaubt jedoch die Nutzung urheberrechtlich geschützter Werke für das maschinelle Lernen ohne Zustimmung des Urhebers. Konkret gestattet diese Schranke das automatisierte Auslesen und Analysieren von Daten, auch durch kommerzielle Anwendungen, sofern der Urheber dem nicht widersprochen hat, wie auch das Landgericht Hamburg in einem ersten wichtigen Urteil zum Text- und Data-Mining von Webinhalten bestätigt hat (Urt. v. 27.09.2024, Az. 310 O 227/23). Der Nutzungsvorbehalt ist wichtig für alle Unternehmen, die ihre Inhalte im Internet vor unberechtigten Zugriffen schützen wollen.

Chancen für KI-Entwicklung

Einerseits bietet § 44b UrhG Technologieunternehmen, Forschungseinrichtungen und Start-ups eine solide rechtliche Grundlage, große Datenmengen zustimmungsfrei zu verarbeiten und damit die Leistungsfähigkeit ihrer KI-Systeme zu verbessern. Der erleichterte Zugang zu Daten fördert die Innovationskraft, während gleichzeitig durch das „Opt-out“ der Urheber ein angemessener Interessenausgleich gewährleistet wird.

Herausforderungen und Grenzen

Andererseits birgt diese Regelung aber auch rechtliche und ethische Risiken. Denn beim Text- und Data Mining werden große Datenmengen analysiert, um Muster und Informationen zu extrahieren. Für Unternehmen bedeutet dies, dass ihre Webinhalte – etwa Produktbeschreibungen, Texte oder Bilder – von KI-Anwendungen genutzt werden können, wenn sie keine ausreichenden rechtlichen oder technischen Schutzmaßnahmen ergreifen. Die Herausforderung besteht also darin, sicherzustellen, dass sie ihren ausdrücklichen Nutzungsvorbehalt so formulieren, dass er von diesen den KI-Anwendungen zuverlässig erkannt wird.

Eine Möglichkeit der Umsetzung ist die Verwendung maschinenlesbarer Formate wie robots.txt-Dateien oder spezieller Meta-Tags, die den Zugriff auf bestimmte Inhalte steuern. Das Landgericht Hamburg hat in seiner oben genannten Entscheidung aber auch natürlichsprachliche Disclaimer, z.B. im Impressum oder in den Allgemeinen Geschäftsbedingungen, anerkannt. Eine endgültige rechtliche Klärung der genauen Ausgestaltung des „maschinenlesbaren Vorbehalts“ steht in Deutschland allerdings noch aus. In den Niederlanden wurde zwischenzeitlich entschieden, dass der Vorbehalt nur in der Programmiersprache robots.txt nicht ausreicht, da nicht alle KI-Anwendungen diese Sprache lesen können (Bezirksgericht Amsterdam, Urt. v. 30.10.2024 – C/13/737170 / HA ZA 23-690, Rechtsbank Amsterdam). Es ist zu erwarten, dass letztlich der Europäische Gerichtshof darüber entscheiden wird, wie der Nutzungsvorbehalt ausgestaltet sein muss, um Datenscraping zu verhindern.

Urheberrecht vs. Wissenschaftsfreiheit

Zugunsten der Wissenschaft gilt zudem eine Besonderheit: Ein rechtlich wirksamer Widerspruch nützt dem Urheber nichts, wenn für Zwecke der wissenschaftlichen Forschung die Regelung des § 60d UrhG Anwendung findet. Diese erlaubt die Nutzung urheberrechtlich geschützter Werke (ausschließlich) zu wissenschaftlichen Zwecken – auch gegen den Willen des Urhebers, da ein Nutzungsvorbehalt hier nicht greift.

Transparenz und Fairness

Unbeantwortet bleiben Fragen der Transparenz und Fairness: Wie sollen Urheber erfahren, ob ihre Werke für ein KI-Training genutzt werden? Und ist es überhaupt ihre Pflicht, sich darüber Klarheit zu verschaffen, oder sind nicht vielmehr die Betreiber der KI-Systeme in der Bringschuld, über das Scraping von Daten zu informieren?

Um festzustellen, ob ihre Werke unrechtmäßig genutzt wurden, müssen Unternehmen derzeit einen nicht unerheblichen Aufwand betreiben und auf verschiedene Maßnahmen zurückgreifen, darunter Plagiatssoftware, Metadatenanalysen oder spezialisierte Dienstleister. Erst das Zusammenspiel dieser Werkzeuge ermöglicht es, mögliche Urheberrechtsverletzungen aufzudecken und rechtlich verfolgen zu können.

Weitgehend ungeklärt ist auch die Frage der Monetarisierung: Wer profitiert von den mit geschützten Inhalten trainierten KI-Systemen und haben Urheber einen Anspruch auf eine angemessene finanzielle Beteiligung an ihrem Erfolg? Wie kann dieser in der Praxis durchgesetzt werden?

Fazit

Die Text- und Data-Mining-Schranke in § 44b UrhG ist eine pragmatische Lösung, um durch das Spannungsfeld zwischen technologischem Fortschritt und Urheberrechtzu navigieren. Während sie Innovationen fördert, bleibt die Debatte um eine angemessene Vergütung und Kontrolle indes bestehen. Ob die Gründung einer neuen Verwertungsgesellschaft nach dem Vorbild der GEMA, wie sie von einigen Experten diskutiert wird, der richtige Weg ist, bleibt vor allem mit Blick auf den damit verbundenen administrativen Aufwand und die Frage der Effizienz abzuwarten.

Es wird sich zeigen, wie sich die Text- und Data-Mining-Schranke in der Praxis bewährt, welche Maßstäbe die Rechtsprechung hier setzen wird und welche Maßnahmen künftig erforderlich sein werden, um eine echte Balance zwischen Innovation und Urheberrechtsschutz herzustellen.

Für Unternehmen bedeutet das, wachsam zu bleiben und ihre Schutzstrategien kontinuierlich anzupassen, um ihre Webinhalte vor unberechtigter Nutzung durch KI-Systeme zu schützen.​