Globaler IT-Ausfall: Und jetzt?

von Jörg Schieb | 26.07.2024 | Digital

Der globale IT-Ausfall hatte weitgehende Auswirkungen

Das war er also, der erste weltweite globale IT-Ausfall – nicht total, aber filmreif. Wir sollten jetzt nicht wieder zum Alltag zurückkehren.

Das hatten wir so wirklich noch nicht: Fluglinien konnten ihre Flüge nicht einchecken, Hunderte Flüge gestrichen, Flughäfen im Chaos, Fernsehsender mussten Schwarzbild senden – auch viele Kassensysteme gingen nicht mehr und selbst einige Kliniken hatten Probleme.

Der globale IT-Ausfall war zweifellos der bislang größte seiner Art. Eine Firma, die bislang niemand kannte, hat die Welt in die Verzweiflung getrieben. Wie groß war das Problem wirklich, was steckte dahinter und was können und müssen wir vielleicht sogar daraus lernen?

Durch ausgefallene Windows-Rechner liegt der halbe Flugbetrieb lahm

Die genauen Hintergründe

Während manche Firmen immer noch mit den Nachwirkungen des IT-Ausfalls beschäftigt sind, haben andere den größten Schaden bereits beseitigt. Mittlerweile weiß man ja mehr: Wie ist es zum Schaden gekommen?

Es sind bekanntlich nur Windows-Rechner ausgefallen, deswegen haben viele gedacht: Microsoft sei mal wieder schuld. Aber es stellte sich schnell heraus, dass eine Software namens „Falcon Sensor“ das Schlamassel verursacht hat, von einer Firma namens „Crodwdstrike“, die eigentlich für IT-Sicherheit sorgen soll

Durch eine unglückliche Fehlkonfiguration, die per Updaten blitzschnell über die ganze Welt verteilt wurde, haben Windows-Rechner bei jedem Start einen Fehler verursacht. Endlosschleife.

Crowdstrike sagt, dass weltweit 8,5 Millionen Windows-Rechner betroffen waren. Nicht mal 1% aller Windows-Rechner. Aber es waren viele Kunden betroffen, vor allem große Firmen und Institutionen – und deswegen der Domino-Effekte. Es reichen manchmal einige wenige Rechner, damit ganze IT-Netzwerke lahm liegen.

Das genau ist der technische Fehler, der zum Chaos führte

Microsoft gibt der EU die Schuld

Mal wieder Windows, auch wenn Windows selbst nicht der Übeltäter war. Apple-Rechner hatten keine Probleme. Doch Microsoft sagt: Die EU ist schuld Wie das?

Das Wall Street Journal zitiert einen Unternehmenssprecher, der eine Vereinbarung mit der Europäischen Union als Mitursache bezeichnet.

Denn 2009 habe die EU den Microsoft-Hersteller aufgrund der engen Nähe von Windows und Internet Explorer gezwungen, sein Windows-Betriebssystem explizit zu öffnen, insbesondere auch für andere Anbieter von Sicherheits-Software.

Denn Microsoft bietet eine eigene Schutz-Software an, diese dürfe aber keine Vorteile zu den Schutzprogrammen anderer Hersteller haben. Und nun habe eben ein externes Sicherheitsprogramm diesen erheblichen Fehler verursacht.

Apple müsse sich nicht öffnen – das sei ungerecht, wird der Unternehmenssprecher zitiert. Und tatsächlich hat Apples Ökosystem diese Probleme nicht.

Es ist zwar eine etwas gewagte These, aber mit wahrem Kern: Wer einen Betriebssystem-Anbieter wie Microsoft zwingt, sein Betriebssystem zu öffnen, der zwingt ihn auch, Kontrolle abzugeben – und das ist in der Regel mit Sicherheitsrisiken verbunden.

Die vorherige Version zurückinstallieren

Die Lehren des IT-Ausfalls

Aus einem Desaster wie diesem müssen noch Lehren gezogen werden.

Der jüngste IT-Ausfall hat gezeigt, wie vulnerabel IT-Systeme weltweit sind – und damit auch unsere Infrastruktur. Das erste Learning muss zweifellos sein: Kein IT-System ist sicher – im Gegenteil, durch zunehmende Komplexität drohen künftig mehr Ausfälle –, und deshalb müssen wir uns vorbereiten.

Es braucht Resilienz: Das Akzeptieren des Unvermeidlichen und die Vorbereitung darauf. Mit Notfall-Systemen, die anspringen. Vor allem in der kritischen Infrastruktur muss sofort ein Ersatzsystem anspringen, das zumindest Grundaufgaben erledigt. Wie in einem Flugzeug: Das sind auch alle relevanten Systeme doppelt vorhanden.

Das Personal muss aber auch wissen, was in einem solchen Fall zu tun ist. Es müssen Übungen gemacht werden: Notsystem starten, Backup einspielen, weiterarbeiten. Es braucht Pläne, Übungen und Kontrollen durch Behörden.

Diesmal war es eine Panne. Das nächste Mal ein Hackangriff?

Der Domino-Effekte könnte genauso gut durch einen Hack verursacht werden. Was könnte für einen Hacker attraktiver sein, als einen Anbieter wie Crowd-Strike oder einen populären Cloud-Dienst anzugreifen und auf diese Weise hunderte, oft Tausende Systeme auf einmal zu erreichen – und sie zu infiltrieren?

Auch das dürfen wir nicht auf die leichte Schulter nehmen. Solche Attacken werden nun wahrscheinlicher, weil ja zu sehen war, wie „effektiv“ sie wären. Deshalb gilt umso mehr: Mehr in Sicherheit investieren, aber eben auch und vor allem in Resilienz. Und Mitarbeiter schulen.