現代のビジネスにおいてデータは生命線であり、予期しないITシステムのダウンタイムは、生産性、売上、顧客体験(CX)、収益に悪影響を及ぼす可能性があります。そのため、自然災害、機器の故障、停電、サイバー攻撃といった事態に見舞われ、ITリソースが停止した場合に備え、企業は、データを復旧し、データの損失を最小限に抑え、事業を継続するための信頼できる手段を確保しておくことが不可欠です。
これまでは、失われたデータを迅速に復旧できるよう日頃からの備えとして企業全体のデータバックアップを管理・同期するには、多大なコストと複雑な作業を伴っていました。幸いなことに、クラウドを活用したサービスとしての障害復旧(DRaaS)ソリューションの登場により、復旧作業の手間を軽減でき、データの復旧時間も短縮できます。本番環境のワークロードに影響を与えず、グローバルなデータ重複排除によりネットワークやストレージの無駄なコストを削減できる、WANに最適化されたレプリケーションを備えたクラウドベースDRaaSは、企業にとって導入を検討すべきソリューションです。
DRaaSソリューションを導入することで、障害発生時に迅速な復旧に必要なオーケストレーションとリソースが利用可能となり、バックアップデータをサードパーティーサービスプロバイダーやパブリッククラウドインフラに複製することもできます。DRaaSクラウドプロバイダーは、通常、短い目標復旧時間(RTO)と目標復旧時点(RPO)でデータとアプリケーションを復旧でき、しかもDR専用のネットワーク、ストレージ、コンピューティングリソースを備えた第2のデータセンターインフラに多額の設備投資を行う必要はありません。一般にDRaaSプロバイダーはサービスレベル契約(SLA)を提供しているため、重要なITリソースの復旧時間が保証されます。
データの保管やバックアップに使用される従来型のクラウドサービスでは、複数の顧客が共通のインフラを利用するため、一般にSLAは提供されません。従来型のクラウドサービスでは、他のユーザーとネットワーク帯域幅やサーバーリソースを争うことになると、データへの再アクセスに予想以上の時間がかかる可能性があります。一方、DRaaS専用のクラウドプロバイダーを利用すると、ビジネスをわずか数分で再稼働させられます。
データのバックアップは、DRaaSによる復旧戦略の一部にすぎません。サービスとしてのバックアップ(BaaS)ソリューションを利用すれば、データのバックアップコピーをオンラインで保存・同期できます。BaaSは、プライマリサイトのデータが消失した場合やランサムウェア攻撃を受けた場合に備え、完全なデータを別の場所に保管し、必要に応じてアクセスできるようにするサービスです。ただし、障害発生後の全面的な業務復旧には対応していません。一方、DRaaSでは、インフラ、アプリケーション、データ、コンピューター処理、ネットワークといったITスタック全体がクラウドに移行します。障害が発生しても、完全にミラーリングされたインフラへ素早くフェールオーバーすることで、通常どおり業務を継続できます。
企業のITチームは、プロバイダーが提供するクラウドベースのバックアップ・管理用インターフェースを通じて、バックアップしたい仮想マシン(VM)と物理サーバーを選択します。DRaaSは、IT拠点内の選択されたサーバーのスナップショットをバックグラウンドで定期的に作成し、拠点障害時の復旧に備えます。
クラウドを活用した障害対策モデルでは、スナップショットとアプリケーションの保存が有料であることが多く、プライマリサイトとクラウド型DRサイト間のデータ同期にも料金が発生します。通常、使用料が発生するのは、障害発生時のフェールオーバーにVMを稼働させる必要がある場合など、サーバーへのアクセス時に限られます。
繰り返しになりますが、XaaSモデルを活用すると、ほとんど使用しないITスタック全体の完全な複製を構築するための機器を自社でそろえる必要がありません。DRaaSプロバイダーは、データ、アプリケーション、インフラの迅速な復旧に必要なすべての手順を計画・自動化します。
プランの選択。DRaaSプロバイダーは、従来のクラウドサブスクリプションや、障害発生時のみに料金が発生する従量課金モデルなど、さまざまな支払い方法を用意しています。ソリューションによっては、自社のDR環境に保持したい責任の範囲を選択できる場合もあります。
SLAの検証。大半のDRaaSプロバイダーはSLAを提供していますが、SLAの内容を検証し、自社の求める復旧時間の要件を満たしているかどうかを確認することが重要です。アプリケーションによって目標復旧時間が異なる場合があります。例えば、24時間停止しても問題ないアプリケーションもあれば、数秒のダウンタイムでも致命的な損害につながるアプリケーションもあります。さらに、プロバイダーと利用企業の両方が同時に自然災害に見舞われた場合に、復旧時間にどのような影響が生じるかも調べる必要があります。
場所を問わない即時復旧 エンタープライズアプリケーションとデータが、プライベートデータセンター、パブリッククラウド、エッジコンピューティングサイトに分散されるにつれ、環境全体の再構築がより複雑になります。利用中のプロバイダーが、マルチクラウド環境におけるクラウド間のレプリケーションに対応しているかどうかを確認してください。
DRaaS環境が想定どおりに動作することを定期的に確認するために、どのようなプロセスを採用すべきでしょうか? DRの準備状況を定期的に検証するには、業務を中断せずにテストを実施できる体制が求められます。利用中のDRaaSプロバイダーがそのようなオプションを提供しているかどうか、また、その利用料金がいくらかを確認してください。料金が発生する可能性はありますが、定期的なテストはDRにおいて重要な要素です。クラウドベースのアプローチの場合、従来のようなITスタックのレプリケーションよりもコストを抑えられます。
場所を問わない即時復旧の仕組みについて詳しく見る。
目標復旧時点(RPO)とは、重要なデータのバックアップが作成される頻度を指します。また、目標復旧時間(RTO)とは、ITシステムのダウンタイムにより業務が「中断」しても許容される最大の時間を指します。
IT障害復旧における最善の方法は、改変できないバックアップを確保しながら、漏れのない障害復旧戦略とバックアップ展開計画を策定し、それらを定期的にテストすることです。
企業が障害復旧計画をテストする5つの方法をご紹介します。
ドキュメントテスト – バックアップに関する文書と計画書を確認します
ウォークスルーテスト – データ侵害やランサムウェア感染が発生した際の対応手順をバックアップチームが一通り確認します
シミュレーションテスト – テストサーバー上で問題を再現し、チームの対応と想定されるダウンタイムを検証します
並列テスト – 本番サーバーのテスト環境に「修正」を適用する前に、バックアップサーバーで問題を再現してテストを行います
障害復旧テスト – 模擬的な攻撃やデータ侵害の状況下で、システムをバックアップに切り替えるテストを行います