Speicherplatz und Monitoring

Performance im Blick: der Speicherplatz im Blick

Gar nicht so selten ist von Kunden gesprächsweise zu hören, dass „mal wieder eine Festplatte vollgelaufen“ ist und niemand (auch kein Monitoring) das gemerkt hat. Das hat uns darauf gebracht, einmal zu schildern, was generell dabei passieren kann und was wir tun, damit das eben NICHT passiert.

Bei einem Webserver wirkt sich das meist derart aus, dass ein Login in das Content Management System nicht mehr möglich ist. Oder eine mehr  oder weniger kryptische Fehlermeldung statt der WebSite erscheint.
Meistens kann dann nicht mehr in die Datenbank oder in ein Logfile geschrieben werden, weil eben kein Speicherplatz mehr zur Verfügung steht. Monitoring umfasst meist nur das Antwortverhalten des eigentlichen Webservers.

Ein Mailserver wird keine eingehenden Mails mehr annehmen. Je nach Konfiguration wird der Versand schleppend oder gar nicht mehr funktionieren. Wenn AV-SPAM oder vergleichbare Werkzeuge verwendet werden, wird meist gar nichts mehr funktionieren und die versendeten Fehlermeldungen werden nicht direkt auf das Problem hinweisen. Die Fehlersuche gestaltet sich dann meist schwierig. Monitoring wird meist nur für POP, IMAP und SMTP betrieben.

In beiden Fällen wird sich der Server in einem undefinierten Zustand befinden. Und Daten werden verloren. Das positive: der Fehler wird recht bald bemerkt.

Wenn das Problem „mal wieder eine Festplatte vollgelaufen“ bei einem Datenserver oder gar bei einem Backup-System auftritt, wird es spannend.

Meist arbeiten diese Systeme automagisch vor sich hin und werden nur beachtet, wenn bereits ein Problem aufgetreten ist. Das kann zum Beispiel der Fall sein, dass eine Datei aus der Datensicherung restoriert werden soll. Da das (hoffentlich) selten vorkommt, wird auch ein Problem mit dem Backup-System  eher selten bemerkt werden. Ein weiterer Grund, warum der Prozess „Rück-Sicherung oder restore“ regelmässig überprüft und geübt werden muss.

Was passiert nun, wenn ein Backup-System volläuft? Ganz einfach: Datensicherungen werden nicht mehr angelegt oder aktualisiert. Wenn der Prozess protokolliert wird und der Admin die Protokolle list (was nicht der Standard ist), wird das Problem bemerkt. Wenn.

Wie kann es nu zu einer schnellen oder langsamen Daten-Vermehrung kommen?

Eine langsam fortschreitende Daten-Vermehrung ist ganz normal. Nutzer lassen Daten liegen, auch, wenn sie nicht mehr gebraucht werden, Dateien liegen in identischer Form an mehreren Orten (Daten-Dubletten), Logfiles werden grösser (dagegen hilft Rotation), Dateien werden ganz allgemein immer grösser (Video-, Graphik- und Textdateien).

Eine plötzliche Daten-Vermehrung hat meist andere Gründe. Hierbei handelt es sich häufig um „explodierende“ Logfiles, was auf ein aktuelles (Sicherheits-)Problem hindeutet. Aktuelle Einbruchs-Versuche schlagen sich in Logfiles nieder (wenn auf dem Server entsprechende Software arbeitet). Es kann sich aber auch um neu aufgetretene Probleme nach einem Software-Update handeln.

Was tun wir gegen solche Probleme?

Wir monitoren alle Systeme auf Erreichbarkeit. Das tun (hoffentlich) alle. Kritische Systeme werden zusätzlich auf wichtige Betriebs-Parameter überwacht. Das sind zum Beispiel alle Speicher-Systeme, bei denen das Unterschreiten von bestimmten Grenzwerten überwacht wird. Sollte das auftreten, wird dies dokumentiert und ein vordefinierter Prozess ausgelöst. Das kann eine SMS (in besonders kritischen Situationen) oder ein Mail sein.

So ist es uns möglich, proaktiv tätig zu werden, um beispielsweise das Vollaufen von Speicher-Systemen zu vermeiden.

Dieses erweiterte System-Monitoring wird überall dort eingesetzt, wo Kundenverträge „Managed Hosting“ beinhaltet. Und selbstverständlich verfahren wir bei allen eigenen Systemen derartig.