クラウドプラットフォームでのデータ管理は、アプリケーションやファイルストレージをクラウドに移行する際に避けられない課題のひとつです。しかし、1つまたは複数のクラウドプラットフォームにデータを置くことで、データ管理やセキュリティ上の課題はさらに増大します。従来のオンプレミス環境と比べて、クラウドでは複雑性や新たなリスクが生じます。クラウドデータを保護し、その整合性を維持するには、これらの課題に適切に対応する必要があります。
クラウドデータ管理とは? この質問に答える前に、より基本的な問いに立ち戻ってみましょう。そもそも「データ管理とは何か」ということです。データ管理には基本的に、データを利用可能に保ち、バックアップし、その整合性を損なう可能性のある悪意ある攻撃から守るための、一連のプラクティスとプロセスを指します。
クラウドデータ管理は、従来のデータ管理と基本的には同じ考え方に基づきますが、いくつか重要な違いがあります。クラウドストレージ(場合によっては複数のクラウドプラットフォーム)にデータが置かれている場合、オンプレミスやプライベートクラウドに保存されたデータと直接紐付いていないことがあります。たとえば、企業のシステムやデータベースはオンプレミスで運用しつつ、データのバックアップや災害復旧対策にはクラウドを活用するケースが考えられます。
クラウドデータ管理では、こうした課題に対応するための専用ソリューションを用いることがあります。このようなソリューションは、複数のプラットフォームやオンプレミス環境にまたがるデータの管理・保護を効率的に行うことが可能です。これはデータストレージ管理のためのソリューションである場合もありますが、すべての製品がクラウドベースのデータを適切に扱う機能を備えているわけではありません。
クラウド移行やデジタル変革が進む現代において、クラウドデータ管理の重要性はますます高まっています。クラウドデータ管理を適切に行うことで、クラウドコンピューティングやクラウドネイティブアプリケーション、さらにクラウド上のバックアップやデータリポジトリを最大限に活用しつつ、クラウド特有のリスクからデータを守ることができます。
クラウドデータは、オンプレミスに保存されている従来のデータと何が違うのでしょうか? データ自体に違いはありません。どこにホストされていようと、1バイトは1バイトです。違いが出るのは、アクセスの仕方、プラットフォームの多様性、そして管理責任の範囲といった点です。
従来のデータ環境では、ほとんどの場合、完全な制御が可能な複数のプラットフォームにデータがあり、たとえば自社所有のまたはレンタルのデータセンターで、Linux上で動作しているOracleなどが挙げられます。そして、そのデータの管理とセキュリティに関するすべての業務は、会社の担当者が行います。
対照的に、クラウドデータは、Amazon Web Services (AWS)やMicrosoft Azure、Google Cloud Platform (GCP) ストレージサービスなどの複数の階層に分散している場合があります。これらのクラウドプラットフォームに保存されるデータには、構造化データベースや、メール、ドキュメント、メディアファイル、分析用の「データレイク」などの非構造化ファイルが含まれる場合があります。
各クラウドプラットフォームには、それぞれ独自のデータ管理機能やデータセキュリティ機能、設定があります。従来のオンプレミス環境とは異なり、クラウドではストレージインフラの管理やセキュリティ保護はクラウドプロバイダーが担当します。しかし、クラウドに保存されるデータの保護はユーザー側の責任となります(これを「責任共有モデル」と呼ぶことがあります)。誰がどの責任を負うかが不明確になると、データ管理やセキュリティにギャップが生じ、データの整合性や可用性に悪影響を及ぼす可能性があります。
また、クラウドデータストレージの管理範囲は、従来のストレージよりも複雑になりがちです。たとえば、プライベートクラウドを運用している場合には、独自のデータ管理・セキュリティ要件が存在し、責任の割り当ても異なる場合があります。また、専門ベンダーが運営するプライベートクラウドにデータが保存されている場合もあります。たとえば、サードパーティプロバイダーのデータセンターでホストされているマネージドSAP環境に企業資源計画(ERP)のデータが保存されているケースです。
このようなハイブリッドアーキテクチャでは、すべてのクラウドデータを簡単かつ統一的に確認できる可視性が求められます。具体的には、データがどこにあるのか、どのように保存されているのか、そしてどのように保護されているのかを把握できることが重要です。さらに、複数の個別ソリューションを使って手作業で対応するのは避けるべきです。それではトラブルのもとになります。理想的には、クラウドデータ管理とセキュリティを「単一の画面(single pane of glass)」で一元的に把握できる統合ソリューションを利用し、すべてのクラウドデータに対する可視性と管理権限を確保することです。
適切に行われるクラウドデータ管理は、企業にさまざまなメリットをもたらします。
まず基本的な利点として、データに悪影響を与えることなく、クラウドのメリットを最大限に活用できる点があります。クラウドのスケーラビリティや俊敏性(アジリティ)を享受できるほか、オンプレミスのインフラストラクチャに投資したり、電力・冷却・メンテナンス・人件費などの継続的なコストを負担したりする必要がなくなるため、経済的なメリットもあります。さらに、データを安全かつ適切に管理された状態で維持できることも大きな利点です。
適切なクラウドデータ管理は、ビジネスの回復力(レジリエンス)を高めるという重要なメリットも提供します。クラウドデータ管理を行う企業やその製品は通常、自動バックアップと障害復旧サービスを提供しています。これにより、バックアップ管理者は複数のクラウドやオンプレミス環境全体で、バックアップの監視や自動化を行い、データ復旧プロセスのテストを実施できるようになります。Rubrikのように、ソリューションに不変のデータスナップショットを提供する機能が含まれていれば、ランサムウェア攻撃に対する強力な防御策となります。データストレージソリューションの更新も同様に自動化可能です。
これにより、データ品質も向上することが期待できます。複数のクラウドプラットフォームにデータを分散させると、データセットが分断されるリスクが生じます。2つの重複した記録をどのように整理すればよいかが分からなくなったり、それが不可能になる場合もあります。たとえば、顧客が住所を変更し、その変更がクラウドデータベースAに反映されている一方で、クラウドデータベースBには古い住所が残っている場合、どちらのデータが最新かを確信するのは難しい、あるいは不可能になることがあります。クラウドデータ管理ソリューションは、こうした重複データの整理を助け、データ品質や整合性の問題を未然に防ぐことができます。この機能は、マスターデータ管理(MDM)の機能セットの一部として提供されることもあります。
クラウドには、データライフサイクルに悪影響を与えるリスクもあります。たとえば、7年以上経過したデータを削除するという社内ポリシーがある場合は、すべてのクラウド環境でそのポリシーを徹底する必要があります。徹底しなければ、誰も存在に気づかないまま古いデータがストレージに残ってしまうリスクがあります。 そしてそれが、コンプライアンスの問題や法的責任につながってしまう可能性があります。効果的なクラウドデータ管理ソリューションは、このような悪影響を防ぐのに役立ちます。
クラウドデータ管理はまた、デジタル変革においても役割を果たします。変革によって、さまざまな新しい構成やホスティング環境にソフトウェア、デバイス、データが導入されると、データ管理やセキュリティの課題が生じます。たとえば、デジタル変革プロジェクトで多数のモノのインターネット(IoT)デバイスを使用する場合、これらのデバイスは便利なクラウドプラットフォームにデータを保存することがあります。そのデータを管理・保護するのはユーザーの責任ですが、適切なクラウドデータ管理ツールがなければ困難な作業となる可能性があります。
また、デジタル変革の取り組みでは、複数のクラウドプラットフォーム上に存在する多様なデータセットを分析できることが重要になる場合があります。 その目的のために、異なるクラウドに分散したデータをクラウドデータウェアハウスに集約したい場合もあるでしょう。データがどこにあっても監視できるデジタルセキュリティポスチャ管理ソリューションを含め、統合されたデータセットを管理できなければ、分析において重要な洞察を見逃したり、デジタル変革の成果が十分に得られなかったりする可能性があります。
主要なパブリッククラウドプラットフォームのそれぞれでは、独自のクラウドデータ管理機能を提供しています。機能セットにより異なりますが、少なくともそれぞれが独自のプラットフォーム上で一定レベルのデータ管理とセキュリティを提供しています。(Azureクラウド上のMicrosoft Purviewなど)一部のプラットフォームでは、マルチクラウドおよびオンプレミスのデータガバナンスを提供しています。たとえば、Purviewはクラウド内のデータをマッピングし、さまざまなデータ資産がどこにホストされているかを特定できます。それにより、機密データがどのように管理されているかを理解できます。
しかし、このようなソリューションがいかに優れていても、あるクラウドプラットフォームを使用して別のプラットフォーム上のデータを管理することには、欠点が生じる可能性があります。互換性の問題が発生したり、チームのメンバーが別のクラウドプラットフォームでの作業に慣れている場合に学習曲線に対応できなかったりすることもあります。
クラウドデータ管理を効果的に運用するには、専用のツールセットを慎重に導入する必要があります。最初のステップの1つは、データ検出です。このプロセスにより、データのありかがわかります。伝統ある衣料品メーカーであり、Rubrikの顧客でもあるCarharttは、データ検出にRubrikの機密データ監視ソリューションを活用しました。CarharttのITチームは、このツールを使用してデータの精密な監視を実施しました。攻撃で侵害される可能性のある機密データと、そのデータが存在する場所を特定することができました。
クラウドデータ管理を効果的に機能させるには、すべての要素を比較的簡単に統合できる仕組みが必要です。これはすなわちAPIの活用を意味します。Rubrikのようなソリューションは「APIファースト」のアーキテクチャで設計されており、クラウドプラットフォーム、データベース、データガバナンスソリューション、データセキュリティツールなどと接続可能です。さらに、多くのクラウドデータ管理ソリューションには、サービスレベル契約(SLA)ポリシーを定義し、適用するための統合的な仕組みも備わっています。
Carharttの場合、このソリューションはRubrikの複数製品を統合して構成されており、異常検知、脅威ハンティング、機密データ監視などの機能を含み、Microsoft Sentinelとも統合されていました。このセットアップにより、Carharttはすべてのシステムのすべてのデータを一元的に把握できるようになったのです。
クラウドデータセキュリティは、クラウドデータ管理におけるより重要な課題の1つです。データセキュリティとデータ管理は別々の作業ですが、密接に関連しています。実際、一部のクラウドデータセキュリティタスクにはデータ管理が含まれ、その逆の場合もあります。たとえば、データがどこにあり、それへのアクセスがどのように管理されているかを理解することは、データガバナンスとセキュリティの両方に直接関係します。
プライバシーは、クラウドデータセキュリティの重要な分野であり、この分野においてはクラウドデータ管理ツールが欠かせません。これは多くの場合、コンプライアンスに関わる問題です。たとえば、GDPRとCCPAでは、消費者の個人を特定できる情報(PII)を保存する企業に対し、保有するデータを追跡し、侵害から保護するために最善を尽くし、削除要求に応じることなどが求められています。これらのセキュリティやコンプライアンス面での目標を実現するには、クラウドデータ管理ソリューションが必要な場合があります。
クラウドデータセキュリティも、クラウドでのデータ管理におけるベストプラクティスの重要な要素です。効果的なクラウドデータ管理ソリューションは、PIIなどの機密データの検出と分類を自動化します。また、ユーザーIDとデータ資産をマッピングして、データアクセスのルールを有効にします。そして、プライバシーポリシーの遵守を促進し、データを保護する制御を統合的に管理します。
クラウドでのデータ管理にはさまざまな課題があります。まず優先すべきは、データプライバシーに関する懸念です。クラウドデータ管理ソリューションは、この課題に対応できる機能を備えている必要があります。たとえば、PII(個人識別情報)や健康記録など、データプライバシーリスクを生じさせる情報を検出する機能などです。
データ損失も、特にハイブリッド環境やマルチクラウド環境で発生し得る問題の1つです。クラウドデータセットの管理を適切に調整しないと、データが上書きされて永久に失われる可能性があります。クラウドデータ管理ソリューションは、重複データの分析や同様のプロセスを通じて、このような問題の発生を防ぎます。
サイバー攻撃によるサービス停止やデータ損失も、関連する大きな課題です。たとえば、ランサムウェア攻撃では、身代金が支払われるまでデータが暗号化され、使用できなくなる可能性があります。さらにリスクとして、復号化プロセスが正しく機能しない場合もあります。(そもそも、攻撃者が誠実である保証はありません。) その場合、データは完全に失われてしまいます。Rubrikは、不変バックアップを備えたソリューションを提供しており、Zscalerと統合することでデータ損失防止機能を実現します。バックアップは暗号化や変更が一切できないため、ランサムウェアの脅威に対する強力な対策となります。
また、クラウドデータ管理は、データ保存や運用にかかるコスト面の課題解決にも役立ちます。特に複数のクラウドに重複データを保存している場合、クラウドストレージの料金は膨れ上がる可能性があります。何をバックアップしているかを把握していないと、同様の問題がバックアップ管理にも生じます。クラウドデータ管理ソリューションを活用すれば、コストを最適化したクラウドデータ保存戦略を立てることが可能です。
クラウドデータ管理の未来は、まさに今、私たちの目の前で形になりつつあります。注目すべき進展の1つは、人工知能(AI)や機械学習がクラウドデータ管理のワークロードに統合されることです。AIはまだ初期段階にありますが、クラウドデータ管理者の作業の自動化や意思決定の質を向上させる可能性はすでに明らかです。たとえば、AIを活用すれば、データ分析で使用するクラウドデータセットの選択や保存をより効率的に行えるようになるかもしれません。
また、エッジコンピューティング、特にエッジクラウドの登場は、クラウドにおけるデータ管理の方法に大きな変化をもたらす可能性を秘めています。エッジコンピューティングでは、クラウドデータ管理のパラダイムを覆し、少数の大規模クラウドプラットフォームではなく、多数の小規模データセンター拠点でデータが必要になります。これにより、クラウドデータ管理ソリューションには分散型のデータ管理を提供することが求められるようになります。
貴社のデータは、複数のクラウドやハイブリッド環境にまたがって存在していることが多く、そのため管理やセキュリティの確保は一層難しくなります。しかし、クラウドデータ管理を軽視することはできません。適切に取り組まなければ、コンプライアンス違反やセキュリティリスク、データの整合性・可用性の低下、さらにはコストの増大といった問題に直面することになります。
そこで活躍するのがクラウドデータ管理ソリューションです。こうしたソリューションを導入すれば、データの所在や状態を自動で把握でき、機密情報や規制対象データも含め、どこに何が保存されているかを一目で確認できます。バックアップや復元も重要です。クラウドデータはランサムウェア攻撃に対して脆弱であり (2023年にはクラウド利用者が毎月サイバー攻撃の標的になったと報告されています) 、他にもデータの可用性に影響するさまざまな要因があります。将来は非常に期待できます。クラウド上にますます多くのデータが集まる中で、AIなどの技術はクラウドデータの管理やセキュリティを、より効率的かつ効果的に進める手段として大きな可能性を秘めています。