La gestion des données sur les plateformes cloud est un corolaire naturel et inévitable de la migration des applications et du stockage de fichiers vers ces environnements dématérialisés. Cependant, stocker des données sur une ou plusieurs plateformes cloud crée des défis plus importants en matière de gestion et de sécurité. Par rapport à l’infrastructure traditionnelle sur site, le cloud introduit une complexité et de nouveaux risques qui doivent être pris en compte si vous voulez protéger vos données et maintenir leur intégrité.
Qu’est-ce que la gestion des données cloud ? Avant de répondre, il convient de prendre le temps de répondre à une autre question plus fondamentale : qu’est-ce que la gestion des données en général ? En substance, il s’agit d’un ensemble de pratiques et de processus permettant de s’assurer que vos données sont disponibles, sauvegardées et protégées contre des acteurs malveillants susceptibles de porter atteinte à leur intégrité.
La gestion des données cloud est analogue à la gestion traditionnelle des données, à quelques différences près. Si vos données sont stockées dans le cloud (parfois sur plusieurs plateformes), il se peut qu’elles ne soient pas liées à des instances de données stockées on-prem ou dans des clouds privés. Par exemple, vous pouvez garder vos systèmes d’entreprise et vos bases de données on-prem, mais utiliser le cloud pour la sauvegarde des données et la reprise après sinistre.
La gestion des données cloud peut impliquer l’utilisation d’une solution spécifique. Une telle solution est capable de surmonter les difficultés de la gestion et de la sécurisation des données sur plusieurs plateformes et instances sur site. Il peut s’agir d’une solution de gestion du stockage des données, mais toutes ne disposent pas des fonctionnalités nécessaires pour traiter de manière adéquate les données basées sur le cloud.
À l’heure de la migration vers le cloud et de la transformation digitale, la gestion des données cloud est plus importante que jamais. Elle vous permet d’exploiter tout le potentiel du cloud et des applications cloud natives, ainsi que de vos sauvegardes et référentiels de données dans le cloud, sans exposer vos données aux risques propres à ces environnements.
En quoi les données cloud diffèrent-elles des données traditionnelles stockées sur site ? Les données elles-mêmes ne sont pas différentes. Un octet est un octet, quel que soit l’endroit où il est hébergé. Les différences se situent au niveau de l’accès, de la diversité des plateformes et des responsabilités.
Dans un environnement data traditionnel, il est très probable que vos données se trouvent sur quelques plateformes que vous contrôlez entièrement, par exemple dans une base de données Oracle sous Linux, dans un data center que vous possédez ou que vous louez. Vos équipes s’occupent de tous les aspects de la gestion et de la sécurisation de ces données.
En revanche, les données cloud peuvent être réparties sur plusieurs niveaux de stockage Amazon Web Services (AWS), Microsoft Azure et Google Cloud Platform (GCP). Les données stockées sur ces plateformes cloud peuvent inclure des bases de données structurées et des fichiers non structurés (e-mails, documents, fichiers médias et data lakes pour l’analytique).
Chaque plateforme cloud possède ses propres fonctions et paramètres de gestion et de sécurité des données. Contrairement à une configuration on-prem classique, le fournisseur de services cloud (CSP) est responsable de la gestion et de la sécurisation de l’infrastructure de stockage. Cependant, c’est à vous que revient la responsabilité de sécuriser vos données stockées dans le cloud. C’est ce que l’on appelle le modèle de responsabilité partagée. S’il y a confusion quant à qui s’occupe de quoi, des failles peuvent apparaître dans la gestion et la sécurité des données, lesquelles peuvent avoir un impact négatif sur l’intégrité et la disponibilité de vos données.
Le périmètre du stockage de données cloud peut également être plus complexe que celui du stockage traditionnel. Vous pouvez par exemple gérer un cloud privé, qui aura ses propres exigences en matière de gestion et de sécurité des données, mais dont les responsabilités seront réparties différemment. Les données peuvent également être stockées dans des clouds privés gérés par des fournisseurs spécialisés, par exemple les données d’une application ERP stockées dans une instance SAP gérée et hébergée dans le data center d’un prestataire tiers.
Dans ces architectures hybrides, il est indispensable de disposer d’une visibilité simple et universelle sur l’ensemble des données cloud. Vous devrez savoir où se trouvent vos données, comment elles sont stockées et comment elles sont protégées. Mais pas question de relever ce défi à l’aide de multiples solutions manuelles. Ou vous irez droit dans le mur. Dans l’idéal, il vous faut une visibilité et un contrôle sur l’ensemble de vos données cloud, le tout grâce à une solution unifiée qui offre une console unique pour la gestion et la sécurité des données cloud.
Une bonne gestion des données cloud confère toute une série d’avantages à une organisation.
D’une manière fondamentale, vous pouvez profiter des nombreux avantages du cloud sans en subir les effets néfastes sur vos données. Ainsi, vous bénéficiez de la scalabilité et de l’agilité du cloud, ainsi que de ses avantages économiques liés à l’absence d’investissement dans une infrastructure sur site et des frais d’exploitation associés (énergie, refroidissement, maintenance et personnel). Quant à vos données, elles restent en sécurité et bien gérées.
La résilience de l’entreprise est un autre avantage majeur d’une bonne gestion des données cloud. Les produits de gestion des données cloud proposent généralement des sauvegardes automatisées et des fonctionnalités de reprise après sinistre. Ils permettent aux administrateurs de sauvegardes de superviser et d’automatiser les sauvegardes et de tester les processus de récupération des données sur plusieurs clouds et instances on-prem. Si, comme Rubrik, la solution fournit des snapshots immuables des données, cela peut constituer une mesure importante contre les attaques de ransomware. Les mises à jour des solutions de stockage de données peuvent être automatisées de la même manière.
La qualité des données devrait également s’améliorer. L’un des risques liés à la répartition des données sur différentes plateformes cloud est la désagrégation potentielle des jeux de données. Il peut en effet être difficile, voire impossible, de savoir comment réconcilier deux enregistrements en double. Par exemple, si un client a changé d’adresse et que ce changement est reflété dans la base de données cloud A, mais que la base de données cloud B contient toujours l’ancienne adresse, comment pouvez-vous être sûr que la base de données A contiendra l’enregistrement le plus récent ? Une solution de gestion des données cloud peut vous aider à dédupliquer et à éviter les problèmes de qualité et d’intégrité des données. Cela peut faire partie d’un ensemble de fonctions MDM (Master Data Management).
Le cloud peut également perturber le cycle de vie des données. Par exemple, si votre entreprise a pour politique de supprimer les données datant de plus de sept ans, il est nécessaire d’appliquer cette politique à tous les clouds que vous utilisez. Si vous ne le faites pas, vous risquez de conserver des données anciennes dont personne ne saura qu’elles sont encore disponibles. Des problèmes de conformité et de responsabilité civile pourraient également en résulter. Une solution efficace de gestion des données cloud vous aidera à éviter ces effets néfastes.
La gestion des données cloud joue également un rôle dans la transformation digitale. Le déploiement de logiciels, d’équipements, d’appareils et de données dans toute une série de nouvelles configurations et d’environnements d’hébergement engendre des difficultés de gestion et de sécurité des données. Par exemple, si votre projet de transformation digitale implique l’utilisation de nombreux appareils IoT, ces équipements pourront stocker des données sur des plateformes cloud pour des questions pratiques. Ce sera alors à vous de gérer et de sécuriser ces données, une tâche qui peut s’avérer difficile sans les bons outils de gestion des données cloud.
Dans le même ordre d’idées, la transformation digitale peut dépendre de la capacité à analyser divers jeux de données répartis sur différentes plateformes cloud. Dans cette optique, vous pourrez alors éventuellement rassembler des données provenant de clouds disparates dans un même data warehouse dans le cloud. Si vous n’êtes pas en mesure de gérer un jeu de données consolidé – y compris en utilisant une solution de gestion de la posture de sécurité digitale pour surveiller les données où qu’elles se trouvent – vous risquez de passer à côté d’insights essentiels qui pourront faire échouer vos efforts.
Chacune des grandes plateformes de cloud public offre ses propres fonctions de gestion des données cloud. Bien que leurs fonctionnalités varient, elles permettent au minimum un certain niveau de gestion et de sécurité des données sur leur propre plateforme. À l’image de Microsoft Purview sur le cloud Azure, certaines plateformes offrent une gouvernance des données multicloud et on-prem. Par exemple, Purview peut cartographier les données dans vos clouds et déterminer où vous hébergez les différents actifs data (data assets). À partir de là, vous pouvez obtenir des informations sur la manière dont vous gérez les données sensibles.
Aussi utile soit-elle, l’utilisation d’une plateforme cloud pour gérer les données d’une autre plateforme peut présenter un inconvénient. Des incompatibilités peuvent survenir, et la courbe d’apprentissage peut également être très abrupte pour certains membres de votre équipe habitués à travailler sur une autre plateforme cloud.
Une bonne gestion des données cloud passe par l’implémentation d’un ensemble d’outils spécialement conçus à cet effet. L’une des premières étapes est la recherche de données (data discovery). Ce processus vous permet de savoir où se trouvent vos données. Pour Carhartt, célèbre marque de vêtements et client Rubrik, cette découverte s’est opérée grâce à la solution Sensitive Data Monitoring de Rubrik. L’équipe informatique de Carhartt a utilisé cet outil pour effectuer une surveillance précise de ses données. Elle a ainsi pu déterminer quelles données sensibles pouvaient être compromises lors d’une attaque et où ces données se trouvaient.
De même, la gestion des données cloud ne peut fonctionner que s’il existe un moyen relativement simple d’en intégrer toutes les composantes. Cela passe donc par des API et des solutions comme Rubrik, dont l’architecture « API-First » est conçue pour connecter les plateformes cloud, les bases de données, les solutions de gouvernance des données, les outils de sécurité des données, et plus encore. Les solutions de gestion des données cloud contiennent aussi souvent un mécanisme unifié pour la définition et l’application des accords de niveau de service (SLA).
Dans le cas de Carhartt, la solution comprenait un ensemble intégré de produits Rubrik (notamment Anomaly Detection, Threat Hunting et Sensitive Data Monitoring), tous intégrés à Microsoft Sentinel. Cette configuration a permis à l’entreprise d’avoir une vue centralisée de toutes les données de tous ses systèmes.
La sécurité des données cloud est l’un des défis les plus pressants en matière de gestion de ces données. Bien que la sécurité et la gestion des données constituent des disciplines distinctes, elles n’en sont pas moins étroitement liées. En effet, certaines tâches liées à la sécurité des données cloud impliquent la gestion de données et vice versa. Par exemple, comprendre où se trouvent vos données et comment l’accès à celles-ci est géré est directement lié à la gouvernance et à la sécurité des données.
La protection de la vie privée est l’un des domaines de la sécurité des données cloud où des outils de gestion spécialisés peuvent être essentiels. La plupart du temps, il s’agit d’une question de conformité. Par exemple, le RGPD européen et le CCPA californien exigent des entreprises qui stockent les données à caractère personnel (DCP) de consommateurs qu’elles assurent un suivi des données en leur possession, qu’elles fassent tout ce qui est en leur pouvoir pour les protéger d’éventuelles compromissions, qu’elles honorent les demandes de suppression de ces données, etc. Une solution de gestion des données cloud peut être essentielle pour atteindre ces objectifs de sécurité et de conformité.
La sécurité des données cloud entre également en ligne de compte dans les bonnes pratiques de gestion de ces données. Une solution efficace automatisera la découverte et la classification des données sensibles telles que les DCP. Elle mettra également en correspondance les identités des utilisateurs et les ressources data afin d’établir des règles d’accès aux données. Enfin, elle facilitera l’application des politiques de confidentialité et orchestrera les contrôles visant à protéger les données.
La gestion des données cloud présente de nombreux défis. Les préoccupations relatives à la confidentialité de ces données devraient figurer en tête de liste. C’est pourquoi une solution de gestion des données cloud doit offrir des fonctionnalités qui répondent à cette préoccupation, par exemple en découvrant les DCP et d’autres formes de données sensibles (dossiers médicaux, etc.), lesquelles représentent un risque en matière de confidentialité.
La perte de données représente un autre problème potentiel, en particulier dans les environnements hybrides ou multiclouds. Sans une coordination minutieuse de la gestion des jeux de données cloud, des données peuvent être écrasées et définitivement perdues. Une solution de gestion des données cloud permettra d’éviter ce genre d’incident grâce à l’analyse des doublons et à d’autres processus du même genre.
Les pannes et les pertes de données dues aux cyberattaques représentent des défis similaires. Une attaque par ransomware, par exemple, peut chiffrer des données et ne les libérer qu’après paiement d’une rançon. Le risque, c’est que le processus de déchiffrement ne fonctionne pas (qui a dit que les hackers étaient des gens honnêtes ?). Vos données disparaissent alors purement et simplement. Rubrik propose une solution avec sauvegardes immuables. Quant à son intégration à Zscaler, elle permet d’offrir des fonctionnalités de prévention des pertes de données. Ces dernières ne peuvent être ni chiffrées, ni modifiées de quelque manière que ce soit, et constituent donc une bonne parade à la menace des ransomwares.
La gestion des données cloud peut également vous aider à relever les défis liés aux coûts de stockage et de gestion des données. Les frais de stockage de données dans le cloud peuvent en effet vite s’accumuler, en particulier lorsque vous stockez des jeux de données en double sur plusieurs clouds. Les sauvegardes présentent un défi similaire si vous ne gardez pas le contrôle de ce que vous sauvegardez. Une solution de gestion des données cloud devra donc vous aider à déterminer une approche économiquement optimale pour le stockage des données dans le cloud.
L’avenir de la gestion des données cloud se dessine sous nos yeux. L’intégration de l’intelligence artificielle (IA) et du machine learning (ML) aux processus de gestion des données cloud constitue en ce sens une évolution intéressante. L’IA n’en est qu’à ses débuts, mais son potentiel est déjà évident pour améliorer l’automatisation et la prise de décisions pour les responsables de données cloud. Par exemple, l’IA pourrait faciliter la sélection et le stockage de jeux de données dans le cloud à des fins d’analytique.
L’Edge Computing en général, et les Edge Clouds en particulier, promettent également de changer la façon dont nous gérons les données dans le cloud. L’edge (ou « périphérie » en français) inverse le paradigme de la gestion des données cloud, obligeant les entreprises à gérer les données dans de nombreux petits data centers, au lieu de quelques grandes plateformes cloud. Les solutions de gestion des données cloud sont donc appelées à assurer une gestion décentralisée des données.
Vos données sont probablement réparties sur plusieurs clouds et dans des environnements hybrides. Cette réalité complique leur gestion et leur sécurisation. Cela ne doit pourtant pas vous empêcher de prendre très au sérieux la gestion des données cloud. À défaut, vous vous exposerez à des risques de sécurité, de non-conformité; d’atteinte à l’intégrité et à la disponibilité des données, sans oublier les coûts élevés qui en découlent.
Une solution de gestion des données cloud peut vous apporter la solution Elle automatise des processus tels que la recherche de données pour vous indiquer où sont stockées vos données (y compris les données sensibles ou celles soumises à réglementation). La sauvegarde et la restauration font également partie du tableau, car les données cloud sont vulnérables aux attaques de ransomware (en 2023, les tenants cloud ont déclaré qu’ils étaient la cible d’une cyberattaque par mois), entre autres facteurs susceptibles d’affecter la disponibilité des données. L’avenir semble néanmoins prometteur, car des technologies telles que l’IA pourraient rendre la gestion et la sécurité des données cloud plus efficaces et plus efficientes à mesure que le cloud héberge de plus en plus de données.