Dr.in-Ing. Fadwa Alshawaf
Computer- und Medienservice, Organisation und Projekte
Forschungsdatenmanagement (FDM) ist längst mehr als eine administrative Begleitaufgabe. Es gehört heute zum Kern wissenschaftlicher Arbeit – nicht nur, um die Anforderungen von Förderinstitutionen zu erfüllen, sondern auch, um Transparenz, Reproduzierbarkeit und langfristigen Zugang zu Forschungsdaten zu sichern.
Ein strukturierter Datenmanagementplan (DMP) ist dabei Voraussetzung für viele Drittmittelanträge, insbesondere bei der DFG. Doch für viele Forschende bleibt die Erstellung solcher DMPs eine zeitaufwendige Aufgabe – häufig wahrgenommen als bürokratische Pflicht statt als sinnvolle Praxis. Genau hier setzt die Initiative des FDM-Teams an der HU an: Ziel ist es, Prozesse im FDM mit Hilfe von Künstlicher Intelligenz (KI) zu modernisieren, zu vereinfachen und praxisnah zu gestalten. Das Team entwickelt Werkzeuge, die Forschende Schritt für Schritt unterstützen – von der Eingabe grundlegender Informationen bis zur automatisierten Erstellung eines DMPs.
Das erste Ergebnis dieser Arbeit ist ein KI-gestütztes Tool, das strukturierte, textbasierte DMPs generiert. Grundlage bilden echte kuratierte Beispiele aus verschiedenen Disziplinen, kombiniert mit präzisem Prompt-Design. Forschende geben ihre Informationen in ein Formular ein und das System bietet nach kurzer Zeit einen Entwurf zur Nachnutzung – klar strukturiert, inhaltlich nachvollziehbar und direkt bearbeitbar. Die technische Umsetzung stützt sich auf Open-Source-Technologien wie Gradio, lokal gehostete Sprachmodelle (z. B. HU-eigene LLMs) und GitLab für Versionskontrolle und Integration. Diese Architektur erlaubt agile Entwicklung, regelmäßige Updates und einen datensouveränen Betrieb ohne kommerzielle Cloudlösungen.
Im Entwicklungsprozess wurde deutlich: Der Erfolg hängt wesentlich von der Qualität der Trainingsdaten ab. Kuratierte, vollständige DMPs setzen den Standard, an dem sich das System messen lassen muss. Ebenso entscheidend ist die Qualität des Prompt-Designs: Durch systematisches Feintuning werden Struktur, Präzision und Nachvollziehbarkeit der generierten Texte gezielt optimiert.
Aufbauend auf diesen Erfahrungen wurde 2025 ein zweiter Schwerpunkt gesetzt: der FDM-Assistent. Dieses dialogbasierte System unterstützt Forschende über den gesamten Lebenszyklus von Forschungsdaten – von der Planung und Speicherung bis zu rechtlichen und organisatorischen Fragen. Der Assistent kombiniert Retrieval Augmented Generation (RAG) mit einer kuratierten Wissensbasis, die Richtlinien, Best-Practice-Beispiele und HU-interne Informationen umfasst.
Das Ergebnis sind keine generischen KI-Antworten, sondern kontextgenaue Hinweise mit Verweisen auf konkrete Quellen und Ansprechpersonen innerhalb der Universität.
Technisch beruht der FDM-Assistent auf einer modularen Architektur: Eine zentrale Wissensschicht bündelt relevante Dokumente und Richtlinien. Die Dialogschicht analysiert Nutzendenanfragen und reichert sie dynamisch mit passendem Kontext an. Über Schnittstellen zu HU-internen Plattformen wird der Assistent nahtlos in bestehende Arbeitsumgebungen integriert. Sein Ziel ist eine skalierbare Beratung bei gleichbleibender inhaltlicher Qualität: Routinefragen werden automatisiert beantwortet, während komplexere Anliegen gezielt an menschliche FDM-Expert:innen weitergeleitet werden.
Damit entsteht eine neue Form hybrider Unterstützung – effizient, vertrauenswürdig und anpassungsfähig. Sie entlastet Forschende im Alltag, ohne die persönliche Beratung zu ersetzen.
Aktuell liegt der Schwerpunkt auf der Weiterentwicklung im RAGFlow-Framework. Hierbei werden verschiedene Dokumenttypen in einer zentralen Wissensdatenbank gebündelt, um Chat-Assistenten und Agenten mit validierten Informationen zu versorgen. Durch die Integration dieser Systeme in bestehende Infrastrukturen entsteht eine skalierbare Grundlage für automatisierte, kontextbezogene Beratung im FDM.
