Ein Weckruf für das Risikomanagement von Drittparteien?

Wir befassen uns mit der Unvermeidbarkeit von IT-Ausfällen und deren Auswirkungen auf die Widerstandsfähigkeit von Unternehmen. Anhand einer Fallstudie über den jüngsten CrowdStrike-Vorfall untersuchen wir verschiedene Störungen - von menschlichen Fehlern bis hin zu Cyberangriffen - und bieten Strategien zur Stärkung der Abwehrbereitschaft Ihres Unternehmens.

Geschrieben von
Andy Fernandez
Veröffentlicht am
25. Juli 2024
Auf sozialen Netzwerken teilen

Navigieren durch die Stürme der IT: Eine Serie über Ausfälle und organisatorische Resilienz

In der heutigen digitalen Landschaft lautet die Frage nicht, ob ein IT-Ausfall eintritt, sondern wann. Wie der jüngste Vorfall bei CrowdStrike gezeigt hat, können selbst globale Plattformen unvorhergesehenen Störungen zum Opfer fallen. Ob durch menschliches Versagen, Korruption oder sogar Cyberangriffe - dies wird auch in Zukunft passieren.  

Dieser Blogbeitrag ist der erste in einer Reihe, die sich mit den Risiken von Drittanbietern in den verschiedenen Technologien befasst, auf die wir alle angewiesen sind. Das Wichtigste ist, dass wir uns darauf konzentrieren, wie sich Unternehmen auf Herausforderungen vorbereiten und schützen können, die von einfachen menschlichen Fehlern bis hin zu bösartigen Akteuren reichen.

In dieser Serie werden wir uns mit verschiedenen Arten von Vorfällen befassen, von Cloud-Verletzungen bis hin zu Ransomware-Angriffen in der Lieferkette. Unser Ziel ist es, Sie mit dem Wissen und den Werkzeugen auszustatten, die Sie benötigen, um diese Störungen nicht nur zu überstehen, sondern gestärkt und widerstandsfähiger daraus hervorzugehen.

Der erste Beitrag befasst sich mit dem jüngsten CrowdStrike-Ausfall als Fallstudie und nutzt ihn als Sprungbrett, um allgemeinere Themen wie menschliches Versagen, Risikomanagement bei Dritten und die entscheidenden Schritte zu erörtern, die Unternehmen unternehmen müssen, um sich auf IT-Störungen vorzubereiten und darauf zu reagieren. Wir erforschen sofortige Abhilfemaßnahmen, die Bedeutung stabiler Systeme vor Ort und Strategien zur Bewertung und Verbesserung Ihrer Bereitschaft in Cloud- und SaaS-Umgebungen.

Während wir uns gemeinsam auf diese Reise begeben, möchte ich Ihnen ein paar gute Ratschläge geben. Bei der IT geht es bei der Vorbereitung nicht nur darum, Katastrophen zu verhindern, sondern auchdarum, die Fähigkeit zu entwickeln, gestärkt wieder aufzustehen, wenn sie unweigerlich eintreten. Lassen Sie uns damit beginnen, den CrowdStrike-Vorfall und die wertvollen Lektionen, die er für Unternehmen aller Größen bietet, zu analysieren.

CrowdStrike-Vorfall erklärt

Bei CrowdStrike-Kunden, die einen Falcon-Sensor für Windows (Version 7.11 und höher) einsetzen, kam es zu einem Systemabsturz. Dies geschah, nachdem CrowdStrike ein Update der Sensorkonfiguration für Windows-Systeme veröffentlicht hatte, das einen Systemabsturz und einen blauen Bildschirm des Todes (BSOD) auf den betroffenen Systemen auslöste. Dies hatte erhebliche Auswirkungen auf die Systeme weltweit und betraf große Fluggesellschaften, die Reisebranche, das Hotel- und Gaststättengewerbe, Krankenhäuser, den elektronischen Handel und vieles mehr. Dabei handelte es sich nicht um einen kriminellen Cyberangriff, sondern um einfaches menschliches Versagen. Einer von vielen, die sich mit dem jüngsten Ausfall befasst haben, ist Chris Evans von Architecting IT, der den folgendenKommentar veröffentlicht hat:Kritische Infrastrukturen und kollektive Verantwortung".  

Bild des Zitats des CEO und Gründers von HYCU Simon Taylor

Microsoft hat außerdem einen Leitfaden zur Behebung desCrowdStrike-Ausfallsfür die betroffenen Kunden veröffentlicht: "Helping Our Customers Through the CrowdStrike Outage".  

Größter IT-Ausfall der Geschichte" durch menschliches Versagen verursacht  

Menschliches Versagen ist unvermeidlich und betrifft alle Organisationen. Es ist nur so, dass dies bei einem kritischen Dienst eines Drittanbieters geschah, der weltweit Millionen von PCs und Systemen abdeckt. Dies ist jedoch weder der erste noch der letzte Ausfall oder Vorfall eines Drittanbieters, von dem Unternehmen weltweit betroffen sein werden. Die Lektion, die man hier lernt, ist, dass man gegen jeden Ausfall eines Drittanbieters gewappnet sein muss. Hier sind drei Schritte, die jedes Unternehmen unternehmen sollte:  

Schritt 1: Sofortige Abhilfe schaffen

CrowdStrike hat bereits einen Leitfaden zur Behebung des Problems und ein Video für Remote-Benutzer veröffentlicht, die von dem BSOD betroffen sind. Microsoft hat außerdem ein neues Recovery Tool mit zwei Reparaturoptionen veröffentlicht, um den Reparaturprozess zu beschleunigen. Bitte stellen Sie jedoch sicher, dass Sie nur den Anleitungen und Abhilfemaßnahmen von CrowdStrike und Microsoft folgen, da wir bereits beobachten, dass Cyberkriminelle aus diesem Vorfall Kapital schlagen und CrowdStrike-Kunden direkt angreifen.  

Schritt 2: Sicherstellung der Ausfallsicherheit Ihrer Produktionssysteme vor Ort

Die meiste Energie für das Risikomanagement von Drittanbietern wurde so sehr auf öffentliche Cloud- und SaaS-Anwendungen verwendet, dass wir unsere Rechenzentrumsdienste oft als selbstverständlich ansehen. Unabhängig davon, ob es sich um einen Systemabsturz eines Drittanbieters oder einen Cyberangriff handelt, sollte jedes Unternehmen, das kritische Anwendungen vor Ort betreibt, die folgenden Maßnahmen ergreifen:

  • Disaster Recovery Lösungen mit der Möglichkeit der Ausfallsicherung an einem anderen Standort oder in der öffentlichen Cloud
  • Umfassende Backups mit Punkt-zu-Punkt- oder Massenwiederherstellung, die anwendungsbezogen ist. Dies bedeutet die Möglichkeit einer punktuellen Wiederherstellung und einer schnellen Wiederherstellung.  
  • Unveränderliche Backups, die logisch getrennt sind, um eine sichere Kopie außerhalb des Unternehmens zu gewährleisten, die im Falle einer Massenkorruption oder eines Cyberangriffs zugänglich ist.  
  • Regelmäßige Ausfallsicherheitstests und Wiederherstellungen von DR- und Backup-Lösungen mit dokumentierten Protokollen und Runbooks, die mehreren Mitgliedern des IT-Teams zugänglich sind.

Schritt 3: Bewerten Sie Ihre Widerstandsfähigkeit und Bereitschaft für den Fall einer Störung durch Dritte bei SaaS und Cloud  

Ihre Cloud-Infrastruktur und SaaS-Anwendungen sind vollständig von Drittanbietern abhängig, die diese Dienste bereitstellen, die Verfügbarkeit aufrechterhalten und Ihre Daten auf Systemebene schützen. Diese Dienste sind jedoch auch dem Risiko von Ausfällen, Beschädigungen und Datenverlusten ausgesetzt. Diese Unternehmen bieten zwar eine solide Verfügbarkeit und Sicherheit, aber durch menschliches Versagen besteht immer ein Risiko für Dritte, das zu Ausfallzeiten, Datenverlust oder -beschädigung führt.  

Egal, ob Cloud-Kunden einen Datenverlust erleiden (z. B. ein Pensionsfonds, dessen Konto versehentlich von einem Anbieter gelöscht wurde) oder ob ein Cybersecurity-Unternehmen und seine Mieter von einem Angriff auf die Lieferkette betroffen sind - es wird immer wieder vorkommen, selbst bei Best-of-Breed-Lösungen.  

Um sich entsprechend vorzubereiten, müssen Sie das richtige Risikomanagement für Dritte sicherstellen. Die Europäische Union hat den Digital Operations Resilience (DORA)-Gesetzesentwurf veröffentlicht, der ausdrücklich fordert, dass Organisationen einen Rahmen für das Risikomanagement von Drittanbietern für IKT (z. B. SaaS- und Cloud-Anwendungen) haben müssen. Dieses umfassende Rahmenwerk unterstreicht die Notwendigkeit, Ihre Anwendungen vor den Risiken Dritter zu schützen. Einige der Anforderungen umfassen:  

  • Kontinuierliche Entdeckung von Vermögenswerten
  • Sicherungsrichtlinien  
  • Offsite-Datenaufbewahrung  
  • Belastbarkeitstests  
  • Dokumentierte Runbooks und Protokolle für Business Continuity und Incident Response  

Sehen Sie sich dieses On-Demand-Webinar über DORA-Compliance am Beispiel von Atlassian Cloud an. Hier wird die Verantwortung des Kunden gegenüber dem Anbieter hervorgehoben. Die in diesem Video besprochenen Grundsätze gelten für alle Ihre Cloud- und SaaS-Anwendungen.  

Schlussfolgerung: Seien Sie bereit, seien Sie widerstandsfähig.  

Die Teams von CrowdStrike und Microsoft tun alles in ihrer Macht Stehende, um Abhilfe zu schaffen und sicherzustellen, dass alle Unternehmen über die erforderlichen Tools verfügen, um zu einem unterbrechungsfreien Betrieb zurückzukehren und eine maximale Betriebszeit zu erreichen. Dieses Szenario kann und wird jedoch bei vielen Anbietern auftreten, von Sicherheits- und Cloud-Lösungen bis hin zu Ihren Geschäftsanwendungen.  

Das Wichtigste ist, dass Sie sich darüber im Klaren sind, dass dieser Fall eintreten wird und dass Ihr Unternehmen die notwendigen Maßnahmen ergriffen hat, um Ihre Daten zu schützen und wiederherzustellen, wenn es soweit ist.  

Weitere Informationen:  

Shive Raja Kopfsprung

Direktorin für Produktmanagement

Andy Fernandez ist Direktor für Produktmanagement bei HYCU, einem Unternehmen von Atlassian Ventures. Andys gesamte berufliche Laufbahn konzentrierte sich auf Datensicherung und Disaster Recovery für kritische Anwendungen. Zuvor hatte er Produkt- und GTM-Positionen bei Zerto und Veeam inne. Jetzt konzentriert sich Andy darauf, sicherzustellen, dass Unternehmen kritische SaaS- und Cloud-Anwendungen über ITSM und DevOps schützen. Wenn er nicht gerade an der Datensicherung arbeitet, besucht Andy gerne Live-Konzerte, erkundet die lokalen kulinarischen Orte und geht an den Strand.

Erleben Sie die SaaS-Datenschutzplattform Nr. 1

Testen Sie HYCU selbst und werden Sie überzeugt.