Im Rahmen wissenschaftlicher Nutzung von Werken sind schließlich die Nutzungserlaubnisse für Text und Data Mining zu nennen. Text und Data Mining (TDM) erfreut sich als Praxis auch in den Kulturwissenschaften in den letzten Jahren verstärkter Beliebtheit. Unter dem Begriff lassen sich unterschiedliche Nutzungsszenarien fassen.
Das Gesetz definiert TDM so: „Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen“ (§ 44b Abs. 1 UrhG).
Die Gewinnung von Mustern, Trends und Korrelationen kann zu Beginn eines längeren Zyklus der Beforschung von audiovisuellen Medien stehen. Nutzungsszenarien sind zum Beispiel, die Entwicklung von Sprache oder Bildkomposition im zeitgenössischen Film computergestützt auszuwerten und die Erkenntnisse später zu präsentieren. Zu diesen Zwecken dürfen automatisiert Transkriptionen erstellt oder Stills entnommen werden. Ein weiteres Szenario ist, Audio und Film als Input fürs Trainieren einer KI zu nutzen, mit der sich später neues Material erstellen lässt.1
TDM lässt sich verallgemeinernd in mehreren Stufen darstellen: Der Sammlung audiovisueller Inhalte, deren Aufbereitung (Strukturieren, Normalisieren usw.) und dem Erzeugen von „Korpora“ schließt sich die eigentliche Analyse an, in deren Rahmen ein Algorithmus die Muster, Korrelationen und Trends erkennt, oder, so das verwandte Szenario, KI-Modelle trainiert werden können. Es folgt die öffentliche Darstellung der Erkenntnisse in einer Publikation bzw. die Nutzung eines generierten Outputs. Später besteht häufig ein Interesse daran, die aufbereiteten Materialien/Korpora dauerhaft zu speichern und etwa für Reviewzwecke zugänglich zu machen, zumal in der Wissenschaft derlei Daten im Idealfall adäquat aufbewahrt sowie überprüfbar und nachnutzbar gemacht werden sollten.
In den vergangenen Jahren wurden mit den §§ 44b, 60d UrhG gesetzliche Bestimmungen eingeführt, die sich explizit mit Text und Data Mining befassen und den Umgang von urheberrechtlich geschütztem Material unter dieser Methode erlauben. §§ 44b, 60d UrhG zielen isoliert betrachtet allerdings nur auf den Anfang und das Ende der gerade beschriebenen Stufenfolge ab:
Werden mit dem TDM kommerzielle Zwecke verfolgt, ist eine weitere Einschränkung zu beachten. Dann müssen gem. § 44b Abs. 3 UrhG sogenannte Rechtevorbehalte eingehalten werden:
1 Siehe zum Themenkomplex TDM statt vieler die umfassende Analyse bei Kleinkopf, Felicitas Lea: Text- und Data-Mining – die Anforderungen digitaler Forschungsmethoden an ein innovations- und wissenschaftsfreundliches Urheberrecht, Baden-Baden 2022.
2 Zu den Implikationen in den Kulturwissenschaften auch Rack, Fabian / Boehm, Franziska / Pasdzierny, Matthias / Schmidt, Dörte, NFDI4Culture: Forschungsdaten in den Kulturwissenschaften, in: Schrör, Simon / Fischer, Georg / Beaucamp, Sophie / Hondros, Konstantin (Hg.): Tipping Points, Baden-Baden 2020, S. 271 f.
3 Dies gilt allerdings nicht für Individualforscher, sondern nur für die in § 60d Abs. 2 und 3 UrhG genannten Wissenschafts- und Kulturinstitutionen.
4 Dreier, in: Dreier, Thomas / Schulze, Gernot (Hg.): Urheberrechtsgesetz, 7. Aufl., 2022, UrhG § 60d Rn. 12 f. mwN.