Speicherplatz und Monitoring

Performance im Blick: der Speicherplatz im Blick

Gar nicht so selten ist von Kunden gesprächsweise zu hören, dass „mal wieder eine Festplatte vollgelaufen“ ist und niemand (auch kein Monitoring) das gemerkt hat. Das hat uns darauf gebracht, einmal zu schildern, was generell dabei passieren kann und was wir tun, damit das eben NICHT passiert.

Bei einem Webserver wirkt sich das meist derart aus, dass ein Login in das Content Management System nicht mehr möglich ist. Oder eine mehr  oder weniger kryptische Fehlermeldung statt der WebSite erscheint.
Meistens kann dann nicht mehr in die Datenbank oder in ein Logfile geschrieben werden, weil eben kein Speicherplatz mehr zur Verfügung steht. Monitoring umfasst meist nur das Antwortverhalten des eigentlichen Webservers.

Ein Mailserver wird keine eingehenden Mails mehr annehmen. Je nach Konfiguration wird der Versand schleppend oder gar nicht mehr funktionieren. Wenn AV-SPAM oder vergleichbare Werkzeuge verwendet werden, wird meist gar nichts mehr funktionieren und die versendeten Fehlermeldungen werden nicht direkt auf das Problem hinweisen. Die Fehlersuche gestaltet sich dann meist schwierig. Monitoring wird meist nur für POP, IMAP und SMTP betrieben.

In beiden Fällen wird sich der Server in einem undefinierten Zustand befinden. Und Daten werden verloren. Das positive: der Fehler wird recht bald bemerkt.

Wenn das Problem „mal wieder eine Festplatte vollgelaufen“ bei einem Datenserver oder gar bei einem Backup-System auftritt, wird es spannend.

Meist arbeiten diese Systeme automagisch vor sich hin und werden nur beachtet, wenn bereits ein Problem aufgetreten ist. Das kann zum Beispiel der Fall sein, dass eine Datei aus der Datensicherung restoriert werden soll. Da das (hoffentlich) selten vorkommt, wird auch ein Problem mit dem Backup-System  eher selten bemerkt werden. Ein weiterer Grund, warum der Prozess „Rück-Sicherung oder restore“ regelmässig überprüft und geübt werden muss.

Was passiert nun, wenn ein Backup-System volläuft? Ganz einfach: Datensicherungen werden nicht mehr angelegt oder aktualisiert. Wenn der Prozess protokolliert wird und der Admin die Protokolle list (was nicht der Standard ist), wird das Problem bemerkt. Wenn.