Auf dem Weg zur HU-Cloud
Nachdem der CMS ein Jahr zuvor die Möglichkeiten unterschiedlicher Cloud-Ansätze untersucht hat, konnten wir im Jahr 2014 die Evaluation abschließen und eine erste Testversion der HU-Cloud auf Basis der Open-Source-Software OpenStack in den Testbetrieb nehmen. Wir verstehen unter Cloud Computing die Abstrahierung von IT-Infrastrukturen in Software, um diese einfacher über Anwenderschnittstellen und APIs verteilt bereitstellen zu können. Die Nutzer können sich hierdurch später ihr Rechenzentrum nach Bedarf selbst zusammenstellen.
Dafür ist es auch erforderlich, die Abläufe im Hintergrund weitgehend zu automatisieren und so werden sich auch unsere Administrationsmethoden durch diese Technologie verändern: weg von der Konfiguration einzelner spezieller Server, hin zu der Entwicklung von Automatisierungsvorlagen. Von Bill Baker stammt in diesem Zusammenhang der Vergleich „Pet or Cattle“ und er vergleicht hierbei die klassische Server-Verwaltung mit der individuellen Haltung von Haustieren. Die neuen Entwicklungstätigkeiten für Dienste in der Cloud sieht er eher analog der Haltung von größeren Viehherden, bei der stets nur die Gesamtheit betrachtet wird.
Die Module der OpenStack-Plattform sind vielfältig: Es gibt z. B. Dienste für virtuelle Server, klassische Speicheranbindungen, Objektspeicher, Netzwerkfunktionen in Software, die Big-Data-Anwendung Hadoop, Automatisierung und Monitoring, oder Datenbanken as a Service sowie eine Weboberflächen mit der die Nutzer diese Dienste konfigurieren können.
Die Schnittstellen von OpenStack sind kompatibel zu denen von Amazon AWS und so sind Entwicklungen übertragbar.
Die Entscheidung für OpenStack hat sich bereits als günstig erwiesen. Die Open-Source-Software hat mittlerweile die größte Entwickler-Community aller vergleichbaren Systeme und entwickelt sich zurzeit – auch im Vergleich mit kommerziellen Systemen – mit einem wesentlich rascheren Tempo weiter. So können wir im Laufe der nächsten Jahre mehr und mehr Erfahrungen mit dieser Art eines virtuellen Rechenzentrums sammeln, um weitere Dienste zu integrieren und unseren Nutzern als Selbstbedienungsfunktionen anzubieten.
Forschungsdatenpolicy der HU beschlossen
Unter Federführung des Vizepräsidenten für Forschung wurde im Sommer 2012 die Forschungsdateninitiative der Humboldt-Universität ins Leben gerufen. Es handelt sich dabei um eine Gemeinschaftsaktivität vom Computer- und Medienservice (CMS), dem Servicezentrum für Forschung und der Universitätsbibliothek (UB), wobei die dafür geschaffene Projektstelle im CMS angesiedelt ist. Es ist das Ziel dieser Initiative, das Bewusstsein der Forschenden für den Umgang mit ihren Forschungsdaten, gemeint sind die Daten, die Ausgangspunkt und mögliche Ergebnisse der Forschung sind, zu schärfen und parallel dazu, einen Service zum Management der Daten zu entwickeln und zentral als Beitrag der Universität anzubieten.
Seit Beginn der Initiative wurde eine in Deutschland viel beachtete Umfrage bei allen Forschenden der HU zum Management ihrer Forschungsdaten durchgeführt, um so einen angemessenen Überblick zum Datenvolumen und einem möglichen Bedarf für anzubietende Serviceleistungen zu bekommen. Vielfältige Diskussionen mit den Forschergruppen, den Dekanen und letztlich im Akademischen Senat (AS) schlossen sich an und mündeten in dem Beschluss des AS am 08.07.2014 zu den „Grundsätzen des Umgangs mit Forschungsdaten an der HU“, in ergänzenden Handlungsanweisungen und einer Konzeption zum Aufbau einer Serviceinfrastruktur.
Parallel dazu werden in der gemeinsamen Arbeitsgruppe von CMS und UB zwei DFG-geförderte Forschungsprojekte zu dieser Thematik bearbeitet. Beide Projekte wurden von der DFG als so erfolgreich eingeschätzt, dass sie die Finanzierung für eine weitere Entwicklungsphase erhalten haben.
Beim Projekt re3data.org wurde gemeinsam mit den Projektpartnern aus Potsdam und Karlsruhe ein weltumspannendes Verzeichnis von Forschungsdatenrepositories entwickelt und mit Stand Ende 2014 wurden 1029 Repositorien evaluiert und in die Registry aufgenommen.
Gemeinsam mit dem Institut für deutsche Sprache und Linguistik wurde durch den CMS im Rahmen der ersten Phase des Projektes Laudatio auf der Basis der Open-Source-Software Fedora ein Repository für historische Textkorpora aufgebaut.
Forschungsdateninitiative: https://www.cms.hu-berlin.de/de/ueberblick/projekte/dataman
Projekt – Re3data.org: http://www.re3data.org
Projekt – Laudatio: http://www.laudatio-repository.org/