LLMs im Forschungsdatenschutz – Rechtmäßigkeit der Nutzung und des Finetunings von LLMs zu wissenschaftlichen Forschungszwecken

Pesch P, Magnussen K (2025)


Publication Type: Journal article

Publication year: 2025

Journal

Book Volume: Steinrötter (Gasthrsg.), Themenschwerpunkt „KI und Datenschutz”

Journal Issue: 6

URI: https://link.springer.com/article/10.1007/s11623-025-2105-4

DOI: 10.1007/s11623-025-2105-4

Abstract

Bei der automatisierten Generierung von Texten erzielen vortrainierte Large Language Models (LLMs) wie GPT-4o, Claude, DeepSeek oder Llama oft zufriedenstellende Ergebnisse. In vielen Bereichen, z. B. bei der Bearbeitung komplexer juristischer Aufgaben, ist die Leistung solcher LLMs aber noch unzureichend. Bessere Ergebnisse versprechen domänenspezifische LLMs. Diese sind speziell für bestimmte Einsatzzwecke und -bereiche trainiert, in aller Regel, indem vortrainierte LLMs beim sog. Finetuning mit domänenspezifischen Daten nachjustiert werden. So kann man etwa LLMs zur Generierung von Entwürfen für gerichtliche oder behördliche Entscheidungen, Gutachten oder Schriftsätze[1] durch ein Finetuning mit entsprechenden Texten entwickeln.

Das Training und die Nutzung von LLMs werfen aber praktische und rechtliche Probleme auf. Inwiefern sich LLMs als nützlich erweisen und datenschutzkonform betreiben lassen werden, ist noch weitgehend ungeklärt. Die Ergebnisse von Experimenten mit vortrainierten LLMs lassen sich nicht einfach auf andere, erst recht nicht auf domänenspezifische LLMs übertragen. Daher besteht insofern erheblicher Forschungsbedarf. Forschungseinrichtungen, Wissenschaftlerinnen oder Unternehmen, die zu Forschungszwecken mit LLMs experimentieren oder diese finetunen, müssen die damit verbundenen, auf personenbezogene Daten bezogenen Verarbeitungsvorgänge datenschutzkonform gestalten. Für entsprechende Forschungsprojekte empfehlen sich stets datenschutzrechtliche Ausführungen im Projektantrag, die Einbindung von Datenschutzexpertise im Projektteam sowie die Benennung einer Datenschutzbeauftragten.

Der Beitrag bietet einen Überblick über grundlegende Datenschutzfragen der LLM-Forschung und damit eine Orientierungs- und Argumentationshilfe für die Begründung und Sicherstellung der Rechtmäßigkeit von Forschungsarbeiten. Er beschränkt sich auf Datenverarbeitungen zu Forschungszwecken. Keinesfalls dürfen durch Forschungsprojekte höhere Datenschutzanforderungen an die Entwicklung und den Betrieb von LLMs in der Praxis umgangen werden. Sollen in der Forschung entwickelte LLMs in Produkte oder Dienstleistungen integriert werden, ist dies von vornherein datenschutzrechtlich zu bedenken und verbietet sich insoweit der Rückgriff auf Normen, die wissenschaftliche Forschung privilegieren.

Authors with CRIS profile

Involved external institutions

How to cite

APA:

Pesch, P., & Magnussen, K. (2025). LLMs im Forschungsdatenschutz – Rechtmäßigkeit der Nutzung und des Finetunings von LLMs zu wissenschaftlichen Forschungszwecken. Datenschutz und Datensicherheit, Steinrötter (Gasthrsg.), Themenschwerpunkt „KI und Datenschutz”(6). https://doi.org/10.1007/s11623-025-2105-4

MLA:

Pesch, Paulina, and Kristina Magnussen. "LLMs im Forschungsdatenschutz – Rechtmäßigkeit der Nutzung und des Finetunings von LLMs zu wissenschaftlichen Forschungszwecken." Datenschutz und Datensicherheit Steinrötter (Gasthrsg.), Themenschwerpunkt „KI und Datenschutz”.6 (2025).

BibTeX: Download