10 - Hallo? Bist du noch da?

Unsichtbares Akkordeon
 

Es hätte Routine sein sollen und nun konnte niemand mehr mit den anderen reden.

Auflösung
 

2009 war T-Mobile mit über 40 Millionen Kunden der größte Handy-Netz-Anbieter in Deutschland. Dennoch ist am 21.04. gegen 16 Uhr dem Anbieter eine Panne geschehen, die bis dato als größte in die Geschichte eingehen sollte. Mit einem Schlag konnte sich kein Kunde mehr mit dem Netz verbinden. Weder Anrufe konnten verbunden noch SMS verschickt werden. Grund dafür war ein gleichzeitiger Ausfall aller drei Home Location Register (zu Deutsch: Verzeichnis des Heimatortes). Diese drei Server stellen zusammen eine verteilte Datenbank dar und sind ein zentraler Bestandteil eines jeden Mobilfunknetzes. Im Normalfall könnte das Netz weiterhin aufrecht erhalten bleiben, solange nur einer der drei Server noch aktiv ist. Doch wie kam es dazu, dass alle drei Server plötzlich abgestürzt sind?

Die Antwort wurde wenige Tage später über die Presse öffentlich gemacht. Auf allen drei Servern wurde gleichzeitig ein fehlerhaftes Software-Update aufgespielt. Deswegen konnten sich die Server nicht gegenseitig stützen, da jeder mit dem gleichen Problem zu kämpfen hatte. Erst gegen 20 Uhr desselben Tages, konnte man das Software-Update bereinigen und einen Großteil des Netzes wieder zum Laufen bekommen.

Da neue Software manchmal unerwartet reagieren kann, sollte sie niemals auf alle kritischen Punkte eines Systems gleichzeitig aufgespielt werden. Zu empfehlen ist ein schrittweises Vorgehen, idealerweise mit einem Probelauf in einer Testumgebung.

 
Quellen: