Schadensbericht

Seit einigen Tagen kam es wiederholt zu Problemen bei der Auslieferung von div. Seiten. Vor allem bei den gehosteten WordPress Seiten gab es immer wieder starke Auslieferungsprobleme, auch im Administrations-Backend.

Wir konnten zunächst keine Ursache für diese Probleme ausmachen.

Am Freitag hat sich unser zentraler Switchstack geweigert, Pakete vernünftig weiter zu reichen. Durch einen Reboot konnten wir hier wieder für Entspannung sorgen. Jedoch hielten die Performance Probleme an.

Am Dienstag morgen mussten wir dann einen Totalausfall, von zwei Virtualisierungs-Servern verzeichnen. Ursache hierfür war eine fehlerhafte Firmware, der verbauten RAID Controller.

In einem Vororteinsatz im Rechenzentrum, wurden die Systeme mit neuer Firmware versehen und konnten danach wieder in Betrieb genommen werden. Die Performance-Probleme sind seither spürbar geringer geworden.

Lediglich das Wiki hat sich noch etwas störrig verhalten und ging gegen 22:30 am Dienstag Abend einfach schlafen. Es wurde von uns heute morgen geweckt und steht seit dem unter strenger Beobachtung.