Google
4 min leer

Detenga la pérdida de datos en BigQuery con las nuevas copias de seguridad atómicas de HYCU

Escrito por
Sathya Sankaran
Publicado el
13 de febrero de 2025
Compartir en redes sociales

Durante años, HYCU ha sido la solución de protección de datos más completa para Google Cloud de Google Cloud. HYCU protege más servicios de Google Cloud Cloud que cualquier otra solución o servicio de copia de seguridad. En reconocimiento a esta innovación de larga data para los usuarios Google Cloud , Google nombró a HYCU Socio deGoogle Cloud del Año para Backup y DR en Google Cloud Next 24 en Las Vegas por su compromiso continuo para elevar el nivel de resiliencia y recuperación de las joyas de la corona de los clientes, sus datos.  

Google Cloud a menudo recibe el cariñoso nombre de "La Nube de los Datos", por su cartera de datos extremadamente robusta. Google BigQuery es la pieza central de la estrategia de datos de Google y es la plataforma de datos unificada que permite a los usuarios almacenar, analizar y visualizar varios petabytes de datos multimodales.

BiqQuery es un servicio totalmente gestionado que admite datos estructurados y no estructurados, incluidos los formatos de tablas abiertas; admite varios motores de procesamiento; procesa datos en varias nubes; ingiere datos por lotes y a través de secuencias en tiempo real (IOT, fuentes de redes sociales, eventos, etc.).  

En la era de la IA, es importante señalar que la IA viene a donde están los datos y no al revés. Con BigQuery ML, los modelos de IA se democratizan y se hacen accesibles a cualquier persona con conocimientos básicos de SQL. Esto convierte a BigQuery en una de las cargas de trabajo más estratégicas para todas las empresas. Muchos líderes del sector como Walmart, Spotify, Wayfair, Home Depot, Ford y Palo Alto Networks confían en BigQuery como su plataforma de datos preferida.

Para asegurarse de que su Google BigQuery estén adecuadamente protegidos en múltiples dominios de fallo, necesitará una copia de seguridad y recuperación de clase empresarial que sea exhaustiva en lo que protege, coherente en los conjuntos de datos dependientes y granular durante la recuperación. HYCU R-Cloud es la primera y única solución de copia de seguridad empresarial que añade soporte de copia de seguridad y recuperación para Google BigQuery. Tenemos clientes que protegen los datos de BigQuery a varios TB/minuto.

Llevando la innovación para BigQuery un paso adelante, HYCU ahora soporta Atomic Backup Sets para BigQuery. Los conjuntos de copias de seguridad atómicas están diseñados para garantizar vistas y consultas coherentes de datos distribuidos en varios conjuntos de datos en BigQuery. Ya se trate de conjuntos de datos dependientes de diferentes fuentes o de vistas de referencia cruzada entre diferentes conjuntos de datos, las organizaciones están ahora protegidas contra la pérdida de datos durante mucho más tiempo que la ventana Time Travel de una semana disponible para los usuarios de BigQuery con una copia coherente.

Por qué la protección de datos es importante para BigQuery

La principal razón por la que debe proteger sus datos de BigQuery es para evitar la pérdida de datos. La pérdida de datos en Google BigQuery puede ocurrir por varias razones, por lo que es crucial ser consciente de los riesgos. Estos son algunos escenarios comunes:

  • Fallos a nivel de zona y a nivel inferior: Los problemas de hardware o de red en una zona específica pueden hacer que sus datos no estén disponibles o incluso se pierdan si no se replican en otras zonas.
  • Fallos regionales: Los grandes acontecimientos, como las catástrofes naturales, pueden afectar a toda una región. Si tus copias de seguridad solo se almacenan allí, podrías perder el acceso a tus datos cuando más los necesitas.
  • Errores en el código SQL: Los pequeños errores en las consultas SQL pueden borrar o corromper datos accidentalmente si no se toman medidas de seguridad.
  • Error humano: Los borrados accidentales o los errores de configuración pueden provocar pérdidas de datos involuntarias.
  • Amenazas internas: Las personas autorizadas pueden borrar o filtrar datos intencionadamente, lo que supone un grave riesgo para la seguridad de tus datos.

Ser consciente de estos riesgos le ayudará a tomar medidas para proteger sus datos en BigQuery.

El elevado coste de recrear su conjunto de datos BigQuery

Tradicionalmente, los almacenes de datos son una copia de datos transformados procedentes de múltiples fuentes, y muchos se preguntan por qué es necesario hacer copias de seguridad de ellos. Sin embargo, una consideración importante es tener en cuenta el tiempo y los costes que conlleva recrear el almacén si se produce una pérdida sostenida de datos. Los costes incluyen:

  • ETL (extracción, transformación y carga)
  • Streaming
  • API
  • Servicios de tuberías, salidas y mucho más.  

Además, con sistemas de escalado masivo como BigQuery, muchos clientes confían en el streaming de eventos en tiempo real para poblar el almacén de datos y muchas veces recrearlo ni siquiera sería posible porque su única copia de datos se almacena como un conjunto de datos de BigQuery.

Aunque el servicio dispone de las funciones Time Travel y Snapshot, la protección de más de siete días requiere una copia de seguridad. Las normativas modernas , como DORA, exigen un dominio de fallo mayor para las aplicaciones críticas. La mayoría de los sectores regulados, como el sanitario y el financiero, también están sujetos a requisitos de conformidad, retención a largo plazo y durabilidad.  

¿Por qué conjuntos atómicos de copia de seguridad?

Aunque BigQuery puede manejar fácilmente conjuntos de datos masivos, es habitual que los usuarios de BigQuery segmenten sus datos en varios conjuntos de datos. Esta segmentación les ofrece un mejor control sobre:  

  • Organización y gestión de datos
  • Control de acceso granular
  • Rendimiento y optimización de consultas
  • Gestión de costes de consulta
  • Gestión del ciclo de vida de los datos/expiración de registros

Incluso con conjuntos de datos segmentados, BigQuery ofrece varias formas de analizar y extraer datos a través de estos conjuntos de datos mediante consultas federadas, uniones entre conjuntos de datos, vistas, etc. Las vistas son tablas virtuales que permiten encapsular consultas complejas y presentarlas como tablas simples. Esto resulta especialmente útil para crear consultas reutilizables que puedan compartirse entre distintos equipos y, a menudo, se convierte en el método principal a través del cual los usuarios de BigQuery consumen los datos.  

Por lo tanto, durante la copia de seguridad es importante que estos conjuntos de datos subyacentes estén protegidos con una versión del mismo punto en el tiempo para que estas vistas sean fiables. Otro punto clave a tener en cuenta es que a medida que estos conjuntos de datos se hacen más grandes, las copias de seguridad tradicionales crean una ventana de inconsistencia más grande y, por lo tanto, hacen que estos conjuntos de copias de seguridad atómicas sean más críticos.

También es importante tener en cuenta que la exportación de datos desde BigQuery no incluye los datos de Time Travel y no se puede retroceder hasta un punto consistente. Como resultado, tener la capacidad de crear una coherencia coordinada en el momento de la copia de seguridad es de vital importancia.

Los conjuntos de copia de seguridad atómicos son una nueva y potente función que permite a los usuarios agrupar conjuntos de datos y garantizar que se realice una copia de seguridad de todos ellos en el mismo momento. Esto resulta especialmente útil para mantener la integridad de los datos en conjuntos de datos relacionados.

Ventajas del uso de conjuntos de copia de seguridad atómicos

  1. Integridad de los datos: Garantiza que los conjuntos de datos relacionados sean coherentes entre sí, evitando las discrepancias que pueden surgir al exportar conjuntos de datos en momentos diferentes. Las vistas que hacen referencia a tablas de otros conjuntos de datos son comunes y la exportación conjunta de estos conjuntos de datos dependientes ayuda a lograr una mayor coherencia.
  1. Gestión simplificada: La agrupación de conjuntos de datos facilita la gestión y organización de las exportaciones de datos.
  1. Mayor fiabilidad: Al proteger los conjuntos de datos en el mismo momento, se reduce el riesgo de que los datos no coincidan y se mejora la fiabilidad del análisis de datos.

¿Es fácil crear conjuntos de copias de seguridad atómicas?

En HYCU, siempre nos esforzamos por ponérselo fácil a los clientes. La creación de conjuntos de copias de seguridad atómicas es tan sencilla como crear una etiqueta Atomic-Backup-set con los conjuntos de datos asociados etiquetados. Esta etiqueta permite definir qué conjuntos de datos deben agruparse. Cuando se inicia una copia de seguridad, todos los conjuntos de datos con el mismo valor de etiqueta Atomic-Backup-set se protegerán utilizando el mismo punto en el tiempo, lo que garantiza la agrupación coherente de sus datos. Actualmente, esta agrupación sólo está disponible para los conjuntos de datos de BigQuery alojados en la misma región.  

Primeros pasos con los conjuntos de copia de seguridad atómicos

Para empezar a utilizar Atomic Backup Sets en sus copias de seguridad de BigQuery, siga estos sencillos pasos:

  1. Label Your Datasets: Add the Atomic-Backup-set label to the datasets you want to be protected together. HYCU will display a new group in the R-Cloud UI using the format <project name>_<region name>_<Atomic-Backup-set name>
  1. ‍AsociarPolítica: Asocie su política de copia de seguridad deseada al nuevo grupo en HYCU R-Cloud. Cuando la política inicie la copia de seguridad para BigQuery, HYCU agrupará y realizará automáticamente la copia de seguridad de los conjuntos de datos de BigQuery con la misma etiqueta Atomic-Backup-set en el mismo momento.

Recuperación de conjuntos de datos BigQuery

Sus opciones de recuperación siguen siendo flexibles. Puede seguir restaurando conjuntos de datos y tablas individuales, en el mismo proyecto o en un proyecto diferente con el mismo nombre o con un nombre nuevo. Cualquier conjunto de datos que forme parte del conjunto de copia de seguridad atómica tendrá puntos de recuperación protegidos en el mismo momento. Cuando se restauran conjuntos de datos, las vistas y rutinas también se restauran junto con él.  

Conclusión

La introducción de HYCU de conjuntos de copias de seguridad atómicas en las exportaciones de BigQuery es un importante paso adelante en la gestión de datos. Al aprovechar las agrupaciones de coherencia y las copias de seguridad atómicas, puede garantizar que sus conjuntos de datos de BigQuery sean coherentes, fiables y más fáciles de gestionar. Tanto si se trata de análisis de datos a gran escala, tendencias, minería de datos históricos o simplemente necesita mantener la integridad de los datos, los conjuntos de copias de seguridad atómicas ofrecen una solución sólida para satisfacer sus necesidades.

Recursos adicionales

Shive Raja Headshot

Jefe de Productos Cloud

Sathya Sankaran es un experimentado ejecutivo de tecnología en la nube que actualmente ocupa el cargo de Jefe de Productos en la Nube en HYCU. Anteriormente, como fundador y director general de CloudCasa by Catalogic, lanzó y amplió con éxito una plataforma pionera de copia de seguridad como servicio para cargas de trabajo Kubernetes, llevándola a alcanzar el liderazgo del mercado. Con más de una década de experiencia en la nube y la protección de datos, Sankaran ha demostrado un talento para identificar oportunidades de mercado y ofrecer soluciones innovadoras que aborden los desafíos críticos en la infraestructura de la nube.

Experimente la plataforma de protección de datos SaaS número 1

Pruebe HYCU usted mismo y conviértase en un creyente.