Es wird zu Serverausfällen kommen, und das wird auch den Besten von uns passieren. Etwas anderes zu glauben ist gleichbedeutend damit, ein Auto ohne Airbags zu fahren, weil die Hersteller versprochen haben, dass ihre Autos nie einen Unfall haben werden.
Im Jahr 2017 kam es bei den zuverlässigen Amazon Web Services (AWS) zu einem vierstündigen Ausfall, der sich auf alle Unternehmen auswirkte, die AWS als Back-End-Anbieter nutzten. Vier Stunden scheinen keine große Zeitspanne zu sein, um ein System dieses Ausmaßes wiederherzustellen. Für AWS-Kunden wie Netflix, auf deren Website rund um die Uhr zugegriffen wird, waren dies jedoch vier sehr teure Stunden.
Wie schützen Sie also Ihre Organisation und die Kunden, die sich auf ihre Erreichbarkeit verlassen? Wenn Sie mit einem Anbieter von Verfügbarkeitslösungen arbeiten, ist es wichtig, herauszufinden, welches System die schnellste Wiederherstellungszeit bietet. Oder am besten noch, welches System dafür sorgt, dass Ihre Kunden nicht einmal merken, dass das Auto abgestürzt ist, wenn Ihr Server ausfällt.
Der Leitfaden für Einkäufer zur Vermeidung von Ausfallzeiten erörtert die sechs Fragen, die Sie stellen sollten, um Ausfallzeiten - einschließlich Serverausfälle - zu vermeiden. Der Leitfaden empfiehlt, Fragen zu stellen wie z.B.: "Wie wird bei einem Serverausfall der normale Verarbeitungsbetrieb von Anwendungen wiederhergestellt und wie lange dauert es? Der Leitfaden vergleicht auch die verschiedenen Stufen von Ausfallzeiten, die bei bestimmten Systemen zu erwarten sind.
"Wenn Sie sich auf eigenständige Server verlassen, könnte Ihre Wiederherstellungszeit angesichts des hohen Maßes an menschlicher Interaktion, das für die Wiederherstellung der Anwendungen und Daten aus dem Backup erforderlich ist, zwischen Minuten und Tagen liegen - vorausgesetzt, Sie haben Ihr System regelmäßig gesichert.
Bei Hochverfügbarkeits-Clustern wird die Verarbeitung während eines Serverausfalls unterbrochen, und die Wiederherstellung kann zwischen Minuten und Stunden dauern, je nachdem, wie lange es dauert, die Dateiintegrität zu überprüfen, Datenbanken zurückzusetzen und Transaktionsprotokolle nach Wiederherstellung der Verfügbarkeit wieder abzuspielen. Wenn der Cluster in der anfänglichen Planungsphase richtig dimensioniert wurde, sollten die Benutzer keine langsamere Anwendungsperformance erleben, während der fehlerhafte Server außer Betrieb ist; es kann jedoch sein, dass sie einige Transaktionen mithilfe einer Journaldatei erneut ausführen müssen, sobald die normale Verarbeitung wieder aufgenommen wird.
Fehlertolerante Lösungen verhindern proaktiv Ausfallzeiten mit vollständig replizierten Komponenten, die jeden Single Point of Failure eliminieren. Einige Plattformen verwalten ihre replizierten Komponenten automatisch und führen die gesamte Verarbeitung im Gleichschritt aus.
Da replizierte Komponenten die gleichen Anweisungen zur gleichen Zeit ausführen, gibt es keine Unterbrechung der Verarbeitung - selbst wenn eine Komponente ausfällt. Dies bedeutet, dass im Gegensatz zu einem eigenständigen Server oder einem Hochverfügbarkeits-Cluster die fehlertolerante Lösung weiterhin funktioniert, während ein Problem gelöst wird.
Laden Sie die gesamte Prävention von Ausfallzeiten Einkaufsführer und entdecken Sie die verbleibenden fünf Fragen, die Sie stellen sollten, um Ausfallzeiten zu vermeiden.