Für den geplanten Online-Speicher Dienst wurden verschiedene freie und kommerzielle Softwareprodukte und etablierte externe Angebote untersucht, die einem „Dropbox“-Ersatz sehr nahe kommen. Im Fokus der Untersuchung befanden sich schließlich die Softwareprodukte Seafile, ownCloud und PowerFolder.
Bei näherer Betrachtung stellte sich Seafile als die vielversprechendste Lösung dar, um die universitätsspezifischen Anforderungen an der HU Berlin erfüllen zu können.
Seafile Testumgebung: https://box.hu-berlin.de/
Die erforderlichen Funktionalitäten der zu testenden Softwareprodukte werden unter Anforderungen spezifiziert. Mögliche Anwendungsfälle an der HU werden unter Anwendungsszenarien beschrieben.
Nach Auswahl eines geeigneten Produkts soll der Online-Speicher Dienst stufenweise eingeführt werden, da Erfahrungen für den Betrieb einer solchen Lösung gesammelt werden müssen, um u.a. Mittel- und Personalaufwand besser abschätzen zu können.
Neben dem technischen Betrieb, der auch die Administration der (virtuellen) Server und die Wiederherstellung von Dateien und Ordner beinhaltet, muss auch die Unterstützung der Benutzer bei der Installation und Konfiguration der Client-Software und beim Umgang mit der Web-Schnittstelle durch Schulungen, Dokumentationen (Anleitungen, FAQs, usw.), Telefon- und E-Mail-Unterstützung abgesichert werden.
Stufe 1 – kleine Gruppe (Testphase)
In der ersten Stufe sollen ausgewählte Forschergruppen und das Personal des CMS für den Test des Produktes einbezogen werden.
Stufe 2 – Mitarbeiter/innen
Zu dieser Gruppe zählen wissenschaftliches Personal genauso wie Personal aus den zentralen Einrichtungen der HU.
Einen Sonderfall bilden das Präsidium und das Personal der Verwaltung, da hier eine erhöhte Schutzbedürftigkeit bezüglich der anfallenenden personenbezogenen Daten und beispielsweise Finanzdaten besteht (Dateien zu Berufungsverhandlungen, Mittelanträge usw.).
Der direkte Zugriff von außerhalb des HU-Netzes muss durch geeignete Maßnahmen, wie die Verwendung des VPN-Zugangs 1 der HU gesichert werden. Zusätzlich muss auch der Zugang innerhalb des HU-Netzes gesichert werden, etwa durch einen IP-Schutz 2.
Einen weiteren Sonderfall bilden externe bzw. HU-fremde Nutzer, die in Forschungsprojekten mit Forschern der HU zusammenarbeiten und Dateien austauschen. Dafür müssen spezielle Verfahren und Prozesse entworfen und implementiert werden.
Stufe 3 – Studierende
In der letzten Phase ist angedacht, den Online-Speicher Dienst allen Angehörigen der HU zu öffnen.
Technischer Aufbau – in Planung
Seafile Setup with OpenStack, CEPH storage and MySQL database / Galera Cluster
The CMS at HU currently builds an OpenStack Cloud 3 as Infrastructure as a Service (IaaS) environment backed by CEPH distributed object store 4.
The provided infrastructure is used to offer a Seafile Sync & Share service to our users.
The OpenStack Cloud currently consists of 4 compute nodes, each with 16 Cores and 128GB RAM, and 2 controller nodes, each with 12 Cores and 64GB RAM. For the CEPH server nodes 10 x 12 Cores, each 64G RAM with 5 TB net (16 TB gross) hard disk, 200GB SSD for CEPH journal and 3 CEPH monitor servers are used.
The Seafile setup consists of a loadbalancer node with 1 VCPU and 2GB RAM, 4 worker nodes with 4 VCPU and 4GB RAM, a database node with 1 VCPU and 2GB RAM and a background node for document preview and fulltext search with 1 VCPU and 2GB RAM.
The Seafile nodes are using CEPH backend storage directly through librados, independent from OpenStack. Seafile service is scaled horizontally on demand. To achieve this an ansible deployment stack is work in progress, that complies with the official Seafile cluster deployment recommendation to use one worker node as a golden image.
Based on the slight database requirements it is planned to use only a single MySQL database instance. This could be extended to a Galera database cluster 5 when necessary.
- VPN – Virtual Private Network, erlaubt das sichere Verbinden mit dem Netz der HU, d.h. ein Computer wird bei Verwendung einer VPN-Client-Software zu einen Teil des HU-Netzes, wobei sämtliche Daten verschlüsselt übertragen werden ↩
- Ein IP-Schutz erlaubt nur registrierten Computern mit entsprechender Internet-Adresse den Zugriff auf Ressourcen ↩
- OpenStack – An open source cloud operating system ↩
- CEPH – An open source distributed object store and file system ↩
- Galera Cluster for MySQL – An open source database cluster ↩