Home Verfügbarkeit Server-Ausfälle: Schneller wiederherstellen

Es wird zu Serverausfällen kommen, und das wird auch den Besten von uns passieren. Etwas anderes zu glauben ist gleichbedeutend damit, ein Auto ohne Airbags zu fahren, weil die Hersteller versprochen haben, dass ihre Autos nie einen Unfall haben werden.

Im Jahr 2017 kam es bei den zuverlässigen Amazon Web Services (AWS) zu einem vierstündigen Ausfall, der sich auf alle Unternehmen auswirkte, die AWS als Back-End-Anbieter nutzten. Vier Stunden scheinen keine große Zeitspanne zu sein, um ein System dieses Ausmaßes wiederherzustellen. Für AWS-Kunden wie Netflix, auf deren Website rund um die Uhr zugegriffen wird, waren dies jedoch vier sehr teure Stunden.

Wie schützen Sie also Ihre Organisation und die Kunden, die sich auf ihre Erreichbarkeit verlassen? Wenn Sie mit einem Anbieter von Verfügbarkeitslösungen arbeiten, ist es wichtig, herauszufinden, welches System die schnellste Wiederherstellungszeit bietet. Oder am besten noch, welches System dafür sorgt, dass Ihre Kunden nicht einmal merken, dass das Auto abgestürzt ist, wenn Ihr Server ausfällt.

Der Einkaufsführer zur Vermeidung von Ausfallzeiten werden die sechs Fragen erörtert, die Sie stellen sollten, um Ausfallzeiten zu vermeiden – auch bei Serverausfällen. Der Leitfaden empfiehlt, Fragen zu stellen wie: “Wie sieht im Falle eines Serverausfalls der Prozess zur Wiederherstellung des normalen Verarbeitungsbetriebs von Anwendungen aus und wie lange dauert er?” Der Leitfaden vergleicht auch die verschiedenen Stufen von Ausfallzeiten, die bei bestimmten Systemen zu erwarten sind.

“Wenn Sie sich auf Standalone-Server verlassen, kann die Wiederherstellungszeit von Minuten bis zu Tagen reichen, da ein hohes Maß an menschlicher Interaktion erforderlich ist, um die Anwendungen und Daten aus dem Backup wiederherzustellen – vorausgesetzt, Sie haben Ihr System regelmäßig gesichert.
Bei Hochverfügbarkeits-Clustern wird die Verarbeitung während eines Serverausfalls unterbrochen, und die Wiederherstellung kann zwischen Minuten und Stunden dauern, je nachdem, wie lange es dauert, die Dateiintegrität zu prüfen, Datenbanken zurückzusetzen und Transaktionsprotokolle wieder abzuspielen, sobald die Verfügbarkeit wiederhergestellt ist. Wenn der Cluster in der anfänglichen Planungsphase richtig dimensioniert wurde, sollten die Benutzer während des Ausfalls des fehlerhaften Servers keine langsamere Anwendungsleistung feststellen; es kann jedoch sein, dass sie einige Transaktionen mithilfe einer Journaldatei erneut ausführen müssen, sobald die normale Verarbeitung wieder aufgenommen wird.
Fehlertolerante Lösungen verhindern Ausfallzeiten proaktiv durch vollständig replizierte Komponenten, die jeden einzelnen Fehlerpunkt ausschließen. Einige Plattformen verwalten ihre replizierten Komponenten automatisch und führen die gesamte Verarbeitung im Gleichschritt aus.
Da die replizierten Komponenten die gleichen Befehle zur gleichen Zeit ausführen, gibt es keine Unterbrechung der Verarbeitung – selbst wenn eine Komponente ausfällt. Das bedeutet, dass die fehlertolerante Lösung im Gegensatz zu einem eigenständigen Server oder einem Hochverfügbarkeitscluster weiter funktioniert, während ein Problem behoben wird.

Laden Sie den gesamten Einkaufsführer zur Vermeidung von Ausfallzeiten und erfahren Sie, welche fünf Fragen Sie sich stellen sollten, um Ausfallzeiten zu vermeiden.

VERWANDTE BEITRÄGE