Depuis des années, HYCU est la solution de protection des données la plus complète pour Google Cloud Google Cloud. HYCU protège plus de services Google Cloud que toute autre solution ou service de sauvegarde. En reconnaissance de cette innovation de longue date pour les utilisateurs de Google Cloud , Google a nommé HYCU PartenaireGoogle Cloud de l'année pour la sauvegarde et la restauration des données lors de Google Cloud Next 24 à Las Vegas pour son engagement continu à élever la barre de la résilience et de la récupération des joyaux de la couronne des clients, leurs données.
Google Cloud est souvent surnommé "The Data Cloud" (le nuage de données), en raison de son portefeuille de données extrêmement robuste. Google BigQuery est la pièce maîtresse de la stratégie de Google en matière de données. Il s'agit d'une plateforme de données unifiée qui permet aux utilisateurs de stocker, d'analyser et de visualiser plusieurs pétaoctets de données multimodales.
BiqQuery est un service entièrement géré qui prend en charge les données structurées et non structurées, y compris les formats de table ouverts ; il prend en charge plusieurs moteurs de traitement ; il traite les données sur plusieurs nuages ; il ingère les données par lots et par flux en temps réel (IOT, flux de médias sociaux, événements, etc.).
À l'ère de l'IA, il est important de noter que l'IA vient là où se trouvent les données et non l'inverse. Avec BigQuery ML, les modèles d'IA se démocratisent et sont accessibles à toute personne possédant des compétences SQL de base. BigQuery devient ainsi l'une des charges de travail les plus stratégiques pour toutes les entreprises. De nombreux leaders industriels tels que Walmart, Spotify, Wayfair, Home Depot, Ford et Palo Alto Networks s'appuient sur BigQuery comme plateforme de données de choix.
Pour s'assurer que votre Google BigQuery soient protégées de manière adéquate à travers de multiples domaines de défaillance, vous aurez besoin d'une sauvegarde et d'une restauration de classe entreprise qui soient complètes dans ce qu'elles protègent, cohérentes à travers les ensembles de données dépendants et granulaires pendant la restauration. HYCU R-Cloud est la première et la seule solution de sauvegarde d'entreprise à ajouter la prise en charge de la sauvegarde et de la restauration pour Google BigQuery. Nous avons des clients qui protègent les données BigQuery à plusieurs To/minute.
L'innovation pour BigQuery fait un pas en avant, HYCU supporte maintenant les Atomic Backup Sets pour BigQuery. Les jeux de sauvegarde atomiques sont conçus pour garantir la cohérence des vues et des requêtes de données réparties sur plusieurs ensembles de données dans BigQuery. Qu'il s'agisse d'ensembles de données dépendants de différentes sources ou de vues croisées entre différents ensembles de données, les organisations sont désormais protégées contre la perte de données bien plus longtemps que la fenêtre de voyage dans le temps d' une semaine dont disposent les utilisateurs de BigQuery avec une copie cohérente.
Pourquoi la protection des données est importante pour BigQuery
La première raison pour laquelle vous devez protéger vos données BigQuery est la prévention de la perte de données. La perte de données dans Google BigQuery peut survenir pour un certain nombre de raisons, il est donc essentiel d'être conscient des risques. Voici quelques scénarios courants :
- Défaillances au niveau de la zone et au niveau inférieur: Des problèmes de matériel ou de réseau dans une zone spécifique peuvent rendre vos données indisponibles, voire les perdre, si elles ne sont pas répliquées dans d'autres zones.
- Défaillances régionales: Des événements majeurs tels que des catastrophes naturelles peuvent affecter une région entière. Si vos sauvegardes ne sont stockées que dans cette région, vous risquez de perdre l'accès à vos données au moment où vous en avez le plus besoin.
- Bugs dans le code SQL: De petites erreurs dans les requêtes SQL peuvent accidentellement supprimer ou corrompre des données si des mesures de protection ne sont pas mises en place.
- Erreur humaine: Les suppressions accidentelles ou les mauvaises configurations peuvent entraîner des pertes de données involontaires.
- Menaces d'initiés: Des personnes autorisées peuvent intentionnellement supprimer ou divulguer des données, ce qui présente de graves risques pour la sécurité de vos données.
La connaissance de ces risques vous permet de prendre des mesures pour protéger vos données dans BigQuery.
Le coût élevé de la recréation de votre ensemble de données BigQuery
Traditionnellement, les entrepôts de données sont une copie de données transformées provenant de sources multiples, et beaucoup se demandent pourquoi ils doivent être sauvegardés. Cependant, il est important de prendre en compte le temps et les coûts nécessaires pour recréer l'entrepôt en cas de perte durable de données. Les coûts comprennent :
- ETL (extraction, transformation, chargement)
- Streaming
- API
- Services de canalisation, évacuation, etc.
En outre, avec des systèmes à grande échelle comme BigQuery, de nombreux clients s'appuient sur le flux d'événements en temps réel pour alimenter l'entrepôt de données et, bien souvent, il ne serait même pas possible de le recréer car leur seule copie de données est stockée sous la forme d'un ensemble de données BigQuery.
Bien que les fonctions de voyage dans le temps et d'instantané soient disponibles par le biais du service, la protection des sept derniers jours nécessite une sauvegarde. Les réglementations modernes telles que DORA exigent un domaine de défaillance plus large pour les applications critiques. La plupart des secteurs réglementés, comme les soins de santé et les services financiers, sont également soumis à des exigences de conformité, de conservation à long terme et de durabilité.
Pourquoi des ensembles de sauvegarde atomiques ?
Bien que BigQuery puisse facilement traiter des ensembles de données massifs, il est courant que les utilisateurs de BigQuery segmentent leurs données en plusieurs ensembles. Cette segmentation leur permet de mieux contrôler :
- Organisation et gestion des données
- Contrôle d'accès granulaire
- Optimisation des performances et des requêtes
- Gestion des coûts des requêtes
- Gestion du cycle de vie des données et de l'expiration des enregistrements
Même avec des ensembles de données segmentés, BigQuery offre plusieurs moyens d'analyser et d'exploiter les données à travers ces ensembles de données grâce à des requêtes fédérées, des jointures entre ensembles de données, des vues, etc. Les vues sont des tables virtuelles qui permettent d'encapsuler des requêtes complexes et de les présenter comme des tables simples. Les vues sont des tableaux virtuels qui permettent d'encapsuler des requêtes complexes et de les présenter sous la forme de simples tableaux. Elles sont particulièrement utiles pour créer des requêtes réutilisables qui peuvent être partagées par différentes équipes et deviennent souvent la principale méthode de consommation des données par les utilisateurs de BigQuery.
Lors de la sauvegarde, il est donc important que ces ensembles de données sous-jacents soient protégés par une version datant du même moment afin de rendre ces vues fiables. Un autre point important à noter est qu'au fur et à mesure que ces ensembles de données s'agrandissent, les sauvegardes traditionnelles créent des fenêtres d'incohérence plus grandes, ce qui rend ces ensembles de sauvegardes atomiques plus critiques.
Il est également important de noter que l'exportation de données à partir de BigQuery n'inclut pas les données de voyage dans le temps et qu'il n'est pas possible de revenir à un point cohérent. Par conséquent, il est essentiel de pouvoir créer une cohérence coordonnée au moment de la sauvegarde.
Les ensembles atomiques de sauvegarde sont une nouvelle fonctionnalité puissante qui permet aux utilisateurs de regrouper des ensembles de données et de s'assurer qu'ils sont sauvegardés au même moment dans l'ensemble de l'ensemble. Cette fonction est particulièrement utile pour maintenir l'intégrité des données dans des ensembles de données connexes.
Avantages de l'utilisation de jeux de sauvegarde atomiques
- Intégrité des données: Garantit que les ensembles de données liés sont cohérents les uns par rapport aux autres, en évitant les divergences qui peuvent résulter de l'exportation d'ensembles de données à des moments différents. Les vues qui font référence à des tables dans d'autres ensembles de données sont courantes et l'exportation de ces ensembles de données dépendants ensemble permet d'obtenir une meilleure cohérence.
- Gestion simplifiée: Le regroupement d'ensembles de données facilite la gestion et l'organisation de vos exportations de données.
- Fiabilité accrue: En protégeant les ensembles de données au même moment, vous réduisez le risque de discordance des données et améliorez la fiabilité de votre analyse de données.
Est-il facile de réaliser des ensembles de sauvegardes atomiques ?
Chez HYCU, nous nous efforçons toujours de faciliter la tâche des clients. La création d'ensembles de sauvegarde atomique est aussi simple que la création d'un label Atomic-Backup-set avec les ensembles de données associés étiquetés. Cette étiquette vous permet de définir quels ensembles de données doivent être regroupés. Lorsqu'une sauvegarde est lancée, tous les ensembles de données ayant la même valeur de label Atomic-Backup-set seront protégés en utilisant le même point dans le temps, garantissant ainsi un regroupement cohérent de vos données. Aujourd'hui, ce regroupement n'est disponible que pour les ensembles de données BigQuery hébergés dans la même région.
Premiers pas avec les jeux de sauvegarde atomiques
Pour commencer à utiliser les jeux de sauvegarde atomiques dans vos sauvegardes BigQuery, suivez ces étapes simples :
- Label Your Datasets: Add the Atomic-Backup-set label to the datasets you want to be protected together. HYCU will display a new group in the R-Cloud UI using the format <project name>_<region name>_<Atomic-Backup-set name>
-

- Associer lapolitique: Associez votre politique de sauvegarde souhaitée au nouveau groupe dans HYCU R-Cloud. Lorsque la politique lance la sauvegarde pour BigQuery, HYCU regroupera et sauvegardera automatiquement les ensembles de données BigQuery avec la même étiquette Atomic-Backup-set au même moment.

Récupération des ensembles de données BigQuery
Vos options de restauration restent flexibles. Vous pouvez continuer à restaurer des ensembles de données et des tables individuels, dans le même projet ou dans un projet différent portant le même nom ou un nouveau nom. Tout ensemble de données faisant partie de l'ensemble de sauvegarde atomique aura des points de récupération qui ont été protégés au même moment. Lorsque vous restaurez des ensembles de données, les vues et les routines sont également restaurées.
Conclusion
L'introduction par HYCU des ensembles de sauvegardes atomiques dans les exportations BigQuery constitue une avancée significative dans la gestion des données. En tirant parti des groupes de cohérence et des sauvegardes atomiques, vous pouvez vous assurer que vos ensembles de données BigQuery sont cohérents, fiables et plus faciles à gérer. Que vous traitiez des analyses de données à grande échelle, des tendances, de l'exploration sur des données historiques, ou que vous ayez simplement besoin de maintenir l'intégrité des données, les jeux de sauvegarde atomiques fournissent une solution robuste pour répondre à vos besoins.