Zabbix ist seit einigen Jahren zur Überwachung von Server-Systemen am CMS im Einsatz. Die Energiekrise hat das Interesse am Energieverbrauch von Infrastruktur-Systemen geweckt, nicht nur um Sparpotentiale ausfindig, sondern auch die Wirksamkeit von Energiesparmaßnahmen sichtbar zu machen.
Aufwände
Der CMS setzt aufgrund von Rahmenverträgen überwiegend Dell-Produkte im Server-Umfeld ein. Das macht den Konfigurationsaufwand für Server-Systeme überschaubar, um die bestehenden Zabbix-Templates so zu erweitern, dass sich der Energieverbrauch abfragen, sammeln und aggregieren lässt.
Aufwändiger gestaltet sich die Verbrauchserfassung von Netzwerk-Geräten, da diese nicht immer solche Werte liefern und aufgrund der langen Laufzeit dieser Geräte sehr viele Generationen im Einsatz sind.
Datenquellen
Die Energieverbrauchsdaten sind beispielsweise über das Simple Network Management Protocol (SMNP) direkt aus Management-Schnittstellen der Geräte auslesbar. Alternativ lassen sich die Daten auch über das Intelligent Platform Management Interface (IPMI) oder die Dell Open-Manage-Software von Servern gewinnen.
Aus der Praxis
Die gesammelten Daten können auf Zabbix-Dashboards (Abb. 1) dargestellt werden, sind jedoch weder zuverlässig noch korrekt. Stromzähler in den Server-Racks sind sicher genauer, aber leider nicht vorhanden. Auf dem in Abb. 1 gezeigten Dashboard sind nur knapp die Hälfte der zentralen Server erfasst. Die Graphen stellen den stündlichen Verbrauch dar, der im Minuten-Rhythmus abgefragt wird, und dienen nur dazu, Stromverbrauchsschwankungen über die üblichen Tages- und Wochenverläufe zu erkennen. Daraus sollen Maßnahmen zur Senkung des Verbrauchs sichtbar werden.
Energiesparmaßnahmen im Serverbetrieb
Folgende Maßnahmen wurden und werden diskutiert und umgesetzt, um Strom zu sparen:
- maßvolle Server-Ausstattung bzgl. CPU-Kernzahl/-Arten, RAM, Festplatten-Anzahl und -Auswahl (SSDs statt Festplatten)
- Aktivierung der Energiesparoption im BIOS der Server
- Server-Virtualisierung zur Reduktion der Server-Hardware-Anzahl
- Abschaltung von Testsystemen und im Notfall auch von redundanten Diensten und Systemen
- nächtliches Abschalten von WLAN-Access-Points