Eine OCR-Pipeline für die Stapelverarbeitung gescannter historischer Zeitschriften ist auf Zenodo verfügbar und unter MIT-Lizenz zur Nachnutzung freigegeben.
Die Pipeline nutzt die Vision-API von Mistral AI und wurde für die Anforderungen historischer Druckerzeugnisse entwickelt. Sie bietet strukturierte Markdown-Ausgabe mit Erhalt des Dokumentlayouts, automatische Teilung großer PDF-Dateien sowie ein Checkpoint-System für unterbrechungssichere Verarbeitung. Mehrere Ausgabeformate (Markdown, Plain Text, JSON) werden unterstützt. Die Verarbeitung erfolgt über europäische Server mit Zero Data Retention und DSGVO-Konformität.
Das Tool wurde im Rahmen von Forschungsarbeiten zu DDR-Zeitschriften entwickelt und eignet sich für historische Zeitschriften und andere periodische Publikationen. Die Dokumentation umfasst Installationsanleitung, Systemarchitektur und Details zum Prompt Engineering.
DOI: 10.5281/zenodo.17631912
Repository: github.com/ma-wi-lo/pubs
Autor: Marco Lorenz
Zum Wintersemester 2025/26 übernimmt Denise Löwe erneut einen digitalen Lehrauftrag im Fachbereich Historische Bildungsforschung der Ruhr-Universität Bochum. In dem Seminar steht das Thema „Schulstrukturen im deutschen Bildungswesen – 200 Jahre Brüche und Kontinuitäten im Kontext von politischen Entwicklungen und Schulreformen“ im Mittelpunkt.
Am Dienstag, 25. & 26. November 2025 findet eine zweiteilige Veranstaltung an der BBF | Bibliothek für Bildungsgeschichtliche Forschung des DIPF in Berlin statt.
Am 25.11. von 18-20 Uhr wird es Vorträge zum Thema „From Networks to Narratives – Visualization of historical research data” von Tomas Vancisi (Universität Edinburgh), Florian Windhager (Weiterbildungsuniversität Krems) und Mathieu Jacomy (Universität Aalborg) geben. Sie stellen ihre aktuelle Forschung vor und diskutieren innovative Ansätze zur Visualisierung historischer Daten. Die Veranstaltung endet mit einem Umtrunk und Snacks.
Am 26.11. 10-16 Uhr wird der Gründer der Visualisierungssoftware Gephi, Mathieu Jacomy, einen Workshop geben.
Die Veranstaltungen finden in englischer Sprache statt. Um Anmeldung für beide Veranstaltungen an dhelab@dipf.de wird gebeten.
26.09.2025 von 12:00 bis 13:00 Uhr
Stefan Udelhofen (Bundesinstitut für Berufsbildung):
Historische Berufsbildungsforschung und/als Digital History?
Weitere Informationen unter https://bbf.dipf.de/de/aktuell/termine/dhelab-vortrag-2025-09
29.08.2025 von 12:00 bis 13:00 Uhr
Fabian Dombrowski (Leibniz-Institut für Bildungsmedien | Georg-Eckert-Institut (GEI)):
Spurenlese: Resultate digitaler Methoden in hermeneutischen Praxen am Beispiel SchulbuchEvolution & DigiRel
Weitere Informationen unter https://bbf.dipf.de/de/aktuell/termine/dhelab-vortrag-2025-08
Wir freuen uns über zwei Artikel, die heute erschienen und unter Mitarbeit von Linda Freyberg und Daniel Erdmann entstanden sind! Als Ergebnisse eines Booksprints ausgerichtet von der Kompetenzwerkstatt Digital Humanities rund um das Thema „Digital Humanities in wissenschaftlichen Bibliotheken“ sind sie in der aktuellen Ausgabe (Band 45, Heft 3) der ABI Technik zu lesen:
Daniel Erdmann, Linda Freyberg, Ben Kaden, Roman Knipping-Sorokin, Roman Kuhn, Stephanie Nitsche & Anke Taube: Labs und Makerspaces für wissenschaftliche Kontexte – Eine kollaborative Annäherung. https://doi.org/10.1515/abitech-2025-0044
Daniel Erdmann & Linda Freyberg: Digital History of Education Lab – im Spannungsfeld zwischen Bedarfsorientierung und Innovation. https://doi.org/10.1515/abitech-2025-0045
Wir hatten viel Spaß am Booksprint sowie bei der gemeinsamen Arbeit an den Texten mit den geschätzten Kolleg*innen von Vernetzungs- und Kompetenzstelle Open Access Brandenburg, digipop, Stabi Lab und DNBLab. Danke für den fruchtbaren Austausch! Fortsetzung folgt …