Auf dem digitalen Marktplatz von heute sind die Erwartungen der Kunden so hoch wie noch nie. Die Toleranz für Transaktionsverzögerungen und Lücken beim Service-Level ist sehr gering, sodass selbst kurze digitale Ausfallzeiten Verluste im Hinblick auf Produktivität, Umsatz und Kundenbindung bedeuten können. Aus diesem Grund benötigt jede Organisation einen zuverlässigen DR-Plan (Disaster Recovery).

In einem solchen Notfallwiederherstellungsplan ist festgelegt, wie – und wie schnell – Sie Daten nach einem Vorfall wiederherstellen können, der unerwartet den Zugriff auf wichtige Anwendungen und Daten unmöglich macht. Dadurch schafft er Ihnen die Möglichkeit, schnell wieder online zu sein und so den Schaden für Ihr Unternehmen zu minimieren.

 

Wichtige Wiederherstellungsziele

Zu den Komponenten eines DR-Plans gehören zwei wichtige Parameter, die festlegen, wie lange Ihr Unternehmen offline sein und wie viel Datenverlust es tolerieren kann. Dabei handelt es sich um das Recovery Time Objective (RTO) und das Recovery Point Objective (RPO).

  • RTO ist das Ziel, das Ihr Unternehmen für die maximale Zeitspanne festlegt, die die Wiederherstellung des normalen Betriebs nach einem Ausfall oder Datenverlust dauern darf.

  • RPO ist Ihr Ziel für die maximale Datenmenge, deren Verlust das Unternehmen tolerieren kann. Dieser Parameter wird gemessen als die Zeit ab dem Moment, in dem ein Fehler auftritt, bis zurück zu Ihrem letzten gültigen Daten-Backup. Wenn zum Beispiel jetzt ein Ausfall auftritt und die letzte vollständige Datensicherung 24 Stunden zurückliegt, beträgt das RPO 24 Stunden. 

Abgleich von RTOs/RPOs mit Anwendungen

Sie werden wahrscheinlich unterschiedliche RTOs und RPOs für die verschiedenen Anwendungen erstellen, die Ihr Unternehmen zum Generieren von Daten verwendet. Je geschäftskritischer eine Anwendung ist, desto niedriger (näher bei null) sollten RTO und RPO sein. Je weniger kritisch eine Anwendung ist, desto größer sind die Toleranzen.

Um die richtigen RTOs und RPOs für Ihr Unternehmen zu berechnen, sollten Sie sich mit den Leitern der Geschäftsbereiche und der Geschäftsleitung beraten, um die Anwendungen und Systeme zu identifizieren, die Ihr Geschäft voranbringen und die meisten Einnahmen generieren. Diese sind am wichtigsten, um den Betrieb aufrechtzuerhalten. Für sie sollten niedrige RTOs und RPOs festgelegt werden. Sobald Sie diese Analyse der Auswirkungen auf Ihr Unternehmen (Business-Impact-Analyse) erstellt haben, können Sie Ihre Systeme auf Basis ihrer Wichtigkeit in verschiedene Ebenen einteilen und für jede Ebene angemessene Wiederherstellungsziele festlegen.

 

Ausführung: Abwägung von Wichtigkeit und Kosten

Je strenger die RTO- und RPO-Vorgaben sind, desto teurer kann es sein, sie zu erreichen.  Wenn Sie z. B. jeden Tag ein vollständiges Daten-Backup durchführen, um das RPO zu senken, verbrauchen Sie mehr Speicher- und Netzwerkressourcen als bei einem wöchentlichen Backup. Das treibt die Kosten in die Höhe.

Um die Kosten in den Griff zu bekommen, sollten Sie Ihre gewünschten RTO/RPO-Werte auf Basis Ihrer Wichtigkeitsebenen ermitteln und dann nach Möglichkeiten suchen, diese Werte im Rahmen Ihrer Disaster-Recovery-Strategie so kostengünstig wie möglich zu erreichen.

Zum Beispiel:

  • Wie häufig sollten geschäftskritische Daten gesichert werden? Die kontinuierliche Datenreplikation vom Primärspeicher auf den stets aktiven sekundären Speicher ist ein Weg zu hoher Verfügbarkeit. Diese Konfiguration erfordert allerdings hochleistungsfähige Speichersysteme und maximale Netzwerkbandbreite, sodass sie teuer werden kann. Sobald vollständige Daten-Backups durchgeführt wurden, könnten Sie in Zukunft inkrementelle Backups durchführen. Dabei werden nur neue und geänderte Daten gesichert, um kürzere Backup-Fenster sicherzustellen und gleichzeitig die Kosten niedrig zu halten.

  • Wo werden die Backup-Kopien für einen schnellen und einfachen Zugriff aufbewahrt?  Ein Cloud-Backup-Speicherort kann kostengünstiger sein als der Aufbau und die Wartung eines kompletten sekundären IT-Stacks mit eigenen Geräten, eigenem Stellplatz und eigener Stromversorgung. Daten-Backups können jedoch auch lokal in einem anderen Gebäude oder in einem sekundären Rechenzentrum gespeichert werden. Sie können auch im primären Rechenzentrum, aber im Sinne einer örtlichen Verteilung in einem separaten Raum oder zumindest in einem anderen Rack gespeichert werden. Zu beachten ist, dass solche Backups im Falle von Naturkatastrophen, die einen ganzen Standort, eine Stadt oder eine Region betreffen, weniger effektiv sind als die Verwendung von geografisch verteilten Standorten für die Speicherung von Datenkopien.

Einige lokale Backup-Konfigurationen verwenden virtualisierte Speichercluster, die Datenbanken und Dateiservices auf mehrere Knoten verteilen, die jeweils mehrere Workloads gleichzeitig sichern können. Wenn mehr Kapazität benötigt wird, wird ein Knoten hinzugefügt. Je größer das Cluster, desto mehr Daten können parallel eingelesen werden und desto kürzer ist das Backup-Zeitfenster. Wenn diese Systeme mit Public-Cloud-Infrastrukturservices integriert werden, wird es möglich, für Vielfalt und Datenschutz eine hybride Cloud-Umgebung zu nutzen.

  • Welche anderen Maßnahmen sind im Falle einer Störung erforderlich, um die Systeme wieder online zu bringen, und wie viel Zeit nimmt dies in Anspruch? Beispielsweise könnte es sein, dass Sie beschädigte Komponenten ersetzen, Software neu programmieren und Systemtests durchführen müssen, bevor Sie Ihren Betrieb wieder aufnehmen können. In einem Cloud-Szenario müssen Sie sich nicht um die Hardware kümmern, aber das Nutzen der Cloud kann den Arbeitsaufwand für die IP-Neuzuordnung/Rekonfiguration erhöhen. Besteht Ihr DR-Plan aus einem Failover auf einen zweiten Datensatz oder aus einer Wiederherstellung an Ort und Stelle? Das sind Fragen, die Sie beantworten müssen, damit ein Plan entwickelt und ausgeführt werden kann.

Möchten Sie mehr erfahren? Erfahren Sie, wie Sie RTOs von nahezu null erreichen können, um den Datenzugriff und den Wiederherstellungsprozess zur Wiederaufnahme des Geschäftsbetriebs deutlich zu beschleunigen.

Unterschiede zwischen RPO und RTO

Das Ziel für die Wiederherstellungszeit (Recovery Time Objective, RTO) ist die angestrebte Zeitspanne für die Ausfallzeit im Falle eines IT-Ausfalls, während das Ziel für den Wiederherstellungspunkt (Recovery Point Objective, RPO) die maximale Zeitspanne ab dem letzten Datenwiederherstellungspunkt ist.