04 agosto 2021

5.2 Replica (Replication)

 Best practices for Amazon RDS PostgreSQL replication | AWS Database Blog

5.2.1  Definicion

La replicación de datos es el proceso de copiar y almacenar datos empresariales en múltiples ubicaciones. El proceso de replicación puede ser único o continuo, según los requisitos de la organización; este último tiene como objetivo garantizar que los datos replicados se actualicen periódicamente y sean coherentes con la fuente.

El propósito principal de la replicación de datos es mejorar la disponibilidad y accesibilidad de los datos y la solidez y consistencia del sistema.


IMAGEN 4: Replication

5.2.3  ¿Cómo funciona la replicación de datos?

La replicación de datos funciona copiando datos de una ubicación a otra, por ejemplo, entre dos hosts locales en la misma ubicación o en ubicaciones diferentes. Por ejemplo, la replicación de datos en el almacenamiento se copia de un sistema de red de almacenamiento a otro.

Puede replicar datos a pedido, a granel o por lotes según un cronograma. Además, la replicación también se puede realizar en tiempo real a medida que se ingresan, alteran o borran los datos en el sistema de abastecimiento principal.

Los datos se pueden duplicar mediante varios procedimientos de replicación; Los tres procedimientos comunes de replicación de datos incluyen:

Replicación completa

Implica copiar datos completos desde el origen al sistema de destino, incluida la información nueva, modificada y actual. Sin embargo, esta técnica de replicación de datos requiere más potencia de procesamiento y aumenta la carga en la red. Además, el costo generalmente aumenta a medida que mantener la coherencia se vuelve difícil al copiar grandes volúmenes de datos.

Replicación parcial

En esta técnica de replicación de datos, solo se replica una parte de los datos, como los datos actualizados. Por lo tanto, es más rápido que la replicación de la tabla completa porque trata con un volumen comparativamente más pequeño, lo que reduce la carga de la red y los problemas de consistencia.

Replicación basada en registros

Esta técnica de replicación de datos solo es viable para bases de datos como se hace usando archivos de registro binarios presentes en la base de datos. Lee datos directamente de los archivos de registro, lo que reduce la carga en el sistema de producción. Esta técnica se acerca más a la replicación de datos en tiempo real.

5.2.4 Desventajas de la replicación de datos

Mantener datos consistentes en ubicaciones dispares a menudo es agotador en términos de recursos. Por lo tanto, algunos de los desafíos comunes de la replicación de datos:

Mayores costos

Mantener duplicados de los mismos datos en varias ubicaciones da como resultado un mayor almacenamiento y gastos generales del procesador.

Las limitaciones de tiempo

La ejecución y el manejo del proceso de replicación requieren un tiempo comprometido de un equipo interno para garantizar que los datos copiados sean consistentes con los datos de origen originales.

Ancho de Banda

Preservar la coherencia entre las réplicas de datos puede aumentar el tráfico de red.

Latencia o interrupciones del servicio

La latencia o las interrupciones del servicio durante la transferencia de datos pueden generar dificultades en la replicación de datos. El proceso

Datos inconsistentes

La sincronización de actualizaciones entre entornos distribuidos es complicada porque la copia de datos de varias fuentes en diferentes intervalos de tiempo puede provocar que algunos conjuntos de datos no estén sincronizados con el resto.

Esto podría ser temporal, que duraría unas pocas horas, o sus datos podrían desincronizarse por completo.

Para enfrentar este desafío, los administradores de bases de datos deben asegurarse de que los datos se actualicen de manera consistente. El proceso de replicación de datos debe planificarse, implementarse, evaluarse y pulirse cuidadosamente según sea necesario para mejorar el proceso.

 

5.2.5  Ventajas de la replicación de datos

Las ventajas de la replicación de datos son la accesibilidad de los datos a varios hosts o centros de datos y la simplificación del intercambio de datos entre sistemas a gran escala al dividir la carga de la red entre sistemas heterogéneos.

Su empresa puede esperar experimentar las siguientes ventajas al implementar servicios de replicación de datos:

Fiabilidad y disponibilidad de datos

La replicación de datos garantiza un fácil acceso a los datos. Esto es particularmente útil para organizaciones multinacionales, repartidas en diferentes lugares. Por lo tanto, en caso de una falla de hardware o cualquier otro problema en una ubicación, los datos aún están disponibles para otros sitios.

Recuperación de Desastres

El principal beneficio de la replicación de datos aparece en términos de recuperación ante desastres y protección de datos. Garantiza que se mantenga una copia de seguridad coherente en caso de un desastre, una catástrofe de hardware o una infracción del sistema, que puede comprometer los datos.

Por lo tanto, si un sistema deja de funcionar debido a alguno de los motivos mencionados anteriormente, puede acceder a los datos desde una ubicación diferente.

Rendimiento del servidor

La replicación de datos también puede mejorar y aumentar rendimiento del servidor. Cuando las empresas ejecutan numerosas copias de datos en diferentes servidores, los usuarios pueden acceder a los datos mucho más rápido. Además, cuando todas las operaciones de lectura de datos se dirigen a una réplica, los administradores pueden reducir los ciclos de procesamiento en el servidor principal para operaciones de escritura más exhaustivas en recursos.

Mejor rendimiento de red

Mantener copias de los mismos datos en varias ubicaciones puede reducir acceso a los datos latencia, ya que puede recuperar los datos requeridos desde la ubicación donde se ejecuta la transacción.

Por ejemplo, los usuarios de países asiáticos o europeos pueden tener problemas de latencia al acceder a los centros de datos australianos. Sin embargo, colocar una réplica de estos datos en algún lugar cercano al usuario puede mejorar los tiempos de acceso mientras se equilibra la carga en la red.

Soporte de análisis de datos

Por lo general, las empresas basadas en datos duplican datos de numerosas fuentes en sus almacenes de datos, como almacenes de datos o lagos de datos, para alimentar su Inteligencia de Negocio. Esto hace que sea más fácil para el equipo de análisis disperso en varias ubicaciones emprender proyectos compartidos.

Rendimiento mejorado del sistema de prueba

La replicación simplifica la distribución y sincronización de datos para sistemas de prueba que requieren accesibilidad rápida para una toma de decisiones más rápida.

5.2.6 Replicar datos: el proceso pasó a paso

Puede aprovechar las ventajas de la replicación de datos si existe una copia de datos coherente en toda la organización. A continuación, se muestra un desglose de los pasos que ayudan a lograr el proceso de replicación de datos en tiempo real:

  1. El primer paso es reducir los datos. sistema de origen y destino.
  2. Luego, elija tablas y columnas que se copiarán de la fuente.
  3. Luego, identifique con qué frecuencia deben realizarse actualizaciones.
  4. Ahora seleccione una técnica de replicación de datos (completa, parcial o basada en registros).
  5. A continuación, escriba un código personalizado o utilice un software de replicación de datos empresariales para realizar el proceso.
Por último, supervise de cerca cómo se están utilizando los datos. Extraído, filtrado, transformado y cargado para garantizar la calidad.

No hay comentarios.:

Publicar un comentario