Archiv für Kategorie CMS-Jahresbroschüre 2023/24

Das Daidalos-Projekt – eine NLP-Forschungsinfrastruktur in Exploration

Daidalos erforscht das Potential digitaler Forschungsmethoden für aktuelle Forschungsfragen der Klassischen Philologie. Dabei liegt der Fokus auf Methoden des Natural Language Processing (NLP). Das Projekt vereint ausgewählte Forschungswerkzeuge, autodidaktische Weiterbildungsbausteine und eine Anlaufstelle für Forschende der Klassischen Philologie in einer webbasierten Forschungsinfrastruktur.

Die Digitalisierung macht auch vor der Klassischen Philologie nicht halt. Bis vor einigen Jahrzehnten blieb den Forschenden nichts anderes übrig, als sich in mühevoller Handarbeit einen Weg durch ihre Texte zu bahnen. Obwohl diese Arbeitsweise beeindruckende und mustergültige Werke hervorbrachte, haben heute verfügbare digitale Forschungswerkzeuge das Potential, entscheidende Arbeitsschritte zeitsparender und weniger fehleranfällig zu erledigen.
Daidalos ist keinesfalls das erste klassisch-philologische Projekt mit einem Fokus auf digitale Forschungsmethoden (vgl. Scaife, AGLDT, Recogito, Logion). Sein Alleinstellungsmerkmal besteht zum einen darin, dass es versucht, existierende digitale Methoden der Textanalyse und der Ergebnisdarstellung in einer webbasierten Forschungsinfrastruktur zu vereinigen sowie diese auch für Projektexterne evidenzbasiert und nachvollziehbar zu evaluieren und weiterzuentwickeln. Zum anderen versteht sich das DFG-geförderte Daidalos-Projekt als Kontaktpunkt für interessierte Forschende (Community of Practice) und als Lernort, an dem Forschende ihre digitale Kompetenz (Digital Literacy) mithilfe verschiedener Lernbausteine autodidaktisch auf- und ausbauen können.

Für eine begründete Auswahl der von Daidalos angebotenen Textkorpora, Analysewerkzeuge, Visualisierungen und Lernbausteine evaluiert das Projekt-Team zunächst das Potential ausgewählter NLP-Methoden. Dies geschieht auf Grundlage von realen Forschungsfragen (z. B. zu Autorschaft, Intertextualität oder Diskursstrategien), die aus der Forschungsgemeinschaft an das Daidalos-Projekt herangetragen werden. Die Zusammenarbeit in diesen Forschungstandems ist wie folgt angelegt: In einem ersten Beratungsgespräch präsentieren die Forschenden ihr Forschungsinteresse, eine mögliche Forschungsfrage und das gewünschte Textkorpus. Das Daidalos-Team berät sie bei der Konkretisierung der Forschungsfrage und erklärt, welche Analysewerkzeuge (z. B. morphosyntaktische Tagger, Arbeit mit Word Embeddings) und Visualisierungsoptionen (z. B. annotierter Text, Graph) geeignet sein könnten. Die von Daidalos angebotenen Werkzeuge der maschinellen Sprachverarbeitung ermöglichen sowohl die Analyse linguistischer Erscheinungen (u. a. Wortarten, Kollokationen, Syntax) als auch literaturwissenschaftlicher Fragestellungen (u. a. Genremerkmale, Paraphrasensuche, antike Konzepte). Sobald die Analyseergebnisse vorliegen, übergibt das Daidalos-Team sie den Forschenden zur Beurteilung. In einem weiteren Gespräch evaluieren die Forschenden gemeinsam mit dem Daidalos-Team die Qualität der Ergebnisse und der Visualisierung. Bei Bedarf werden die Parameter angepasst und weitere Analysedurchgänge durchgeführt. Die aus den Forschungstandems gewonnenen Erkenntnisse werden als Use Cases zum Aufbau der webbasierten Infrastruktur und zur Gestaltung der Lerneinheiten genutzt.

Der interaktive Zugang zu antiken Texten soll nicht nur Forschungsfragen beantworten helfen, sondern auch Methodenreflexion fördern und User qualifizieren. Entsprechend bietet die Software folgende Inhalte:

  1. Demo-Workflows mit konfigurierbaren Elementen, z. B. Korpusauswahl, wobei die Konfiguration mittels kuratierter, authentischer Beispiele detailliert erklärt und reflektiert wird;
  2. eine domänenspezifische Oberfläche u. a. mit Interaktionen zu Forschungsinteresse und Methodenwahl; Speicherung von personalisierten Einstellungen; Übungen und Code-Snippets in Jupyter Notebooks;
  3. freie Konfiguration von Text- und Methodentriangulation, Einbindung von eigenem Quellcode für erfahrene Forschende.

28. August 2024 | Veröffentlicht von cmsredakteur | Kein Kommentar »
Veröffentlicht unter CMS-Jahresbroschüre 2023/24