Existen diversos flujos de trabajo para los que hace falta distribuir los datos entre distintas geodatabases y sincronizar los cambios realizados a los datos de cada una de ellas. A continuación, se ofrece una guía para ayudarle a determinar la mejor forma de utilizar datos distribuidos, réplicas de geodatabase y sincronización para el sistema.
Introducción a datos distribuidos ofrece un buen punto de partida para comprender la replicación de geodatabase y otros métodos para trabajar con datos distribuidos. Escenarios de datos distribuidos enumera una serie de casos de uso comunes donde se puede utilizar la replicación de geodatabase. Si la replicación de geodatabase parece ser el método más apropiado para su sistema, el próximo paso es crear una réplica.
Crear réplicas
A continuación, descubrirá cómo determinar la mejor forma de crear réplicas para su sistema:
- Determinar qué réplicas se requieren: en algunos casos, puede que necesite crear solo una o dos réplicas, mientras que en otros se necesitan muchas réplicas. Por ejemplo, se necesitan muchas réplicas si distribuye datos para que los equipos de campo trabajen con ellos en sus dispositivos móviles in situ. En los casos donde desea mantener dos geodatabases corporativas sincronizadas, es posible que solo necesite una réplica. Consulte Arquitectura de replicación de geodatabase para obtener más información sobre qué son las réplicas y cómo funcionan en una geodatabase.
- Decidir el tipo de replicación: el tema tipos de replicación describe los tipos de replicación disponibles. Es posible que el sistema requiera que utilice distintos tipos de réplicas en distintos escenarios. Por ejemplo, es posible que desee utilizar una replicación doble para sincronizarla con otra oficina y una replicación unidireccional para actualizar la geodatabase de publicación de mapas.
- Crear sus réplicas: utilice la herramienta de geoprocesamiento Crear réplica para crear sus réplicas. Esta herramienta es ideal en los casos donde necesita crear réplicas con regularidad. Por ejemplo, se puede construir un modelo para crear réplicas de check-out diariamente para cada miembro del personal de campo.
- Integrar la replicación en los flujos de trabajo de versionado: la replicación de geodatabase se crea sobre el versionado tradicional. Durante la creación de réplicas, se define una versión de réplica en la réplica principal y en la secundaria. Esta es la versión desde la que se envían y reciben los cambios durante la sincronización. Consulte el tema Replicación y versionado para obtener más información.
Debido a que la versión de réplica es el conducto a través del cual se sincronizan los cambios, planifique cómo trabajará con las versiones de réplica antes de crear una réplica. Por ejemplo, puede planificar la ejecución de una validación de los cambios recibidos durante la sincronización antes de integrarlos al flujo de trabajo principal. Se puede realizar analizando el contenido de la versión de réplica después de una sincronización y, posteriormente, conciliándolo y publicándolo en la versión de trabajo normal. La versión predeterminada también se puede utilizar como la versión de réplica. Esto resulta útil en los casos donde desea que los cambios tomen directamente el valor predeterminado durante la sincronización.
- Definir los datos que se van a replicar: la replicación de geodatabase permite replicar algunos o todos los datasets en la geodatabase corporativa. También permite definir qué entidades o filas se van a replicar utilizando filtros y clases de relación. Durante la creación, los filtros siempre se aplican primero y, después, las clases de relación se utilizan para incorporar entidades y filas adicionales. Consulte Preparar datos para la replicación para obtener más información.
Tenga en cuenta sus necesidades futuras al definir los datos que se van a replicar. Por ejemplo, las réplicas dobles y unidireccionales se crean una vez y se sincronizan varias veces. Los filtros que define en la creación de réplicas también se aplican durante la sincronización. Con el tiempo, sus necesidades pueden cambiar y requerir un área de réplica más grande. Además, es importante considerar el tipo de datos que se replica. Para mantener la integridad de los datos, se aplican reglas adicionales al replicar tipos de datos complejos, como topologías. Los siguientes temas de ayuda describen estas reglas y muestran ejemplos: Topologías, Clases de relación, Datos ráster, Terrenos y Datasets de red. Para ver consideraciones adicionales a la hora de definir los datos a replicar, consulte Replicación con datasets de geodatabase avanzados.
- Considerar las opciones de creación de réplicas: se han agregado algunas opciones para que el proceso de creación de réplicas sea lo más eficaz posible. Estas opciones están diseñadas para trabajar en casos específicos y se pueden o no aplicar al flujo de trabajo. Revise la siguiente lista para ver si puede aprovechar estas opciones:
- Reutilizar esquema: especifique una geodatabase de destino que ya tenga un esquema para los datos que está replicando. Esto ahorra tiempo, ya que se puede omitir la creación del esquema cuando se crea una réplica. Esto opción solo se aplica a las réplicas de check-out/check-in, pero se debe utilizar siempre que sea posible.
- Replicar datos relacionados: durante la creación de réplicas, primero se aplican los filtros y después se procesan las clases de relación para determinar los datos que se van a replicar. Puede elegir desactivar el procesamiento de clases de relación, lo cual le ahorrará tiempo. Si elige desactivar el procesamiento de clases de relación, las clases de relación aún se incluyen pero no se procesan durante la creación y la sincronización. Hay una opción disponible para desactivar el procesamiento de todas las clases de relación en la herramienta de geoprocesamiento Crear réplica.
- Utilizar el archivado para registrar cambios: cuando se utiliza el archivado para registrar cambios en lugar de las tablas delta asociadas con el versionado, no se crean versiones del sistema. Por tanto, los procesos reconciliar y enviar y comprimir no se ven afectados, con lo que se consigue una administración de la versión y de la réplica independientes. Esto también posibilita que el programa de sincronización sea más flexible.
Nota:
Esta opción no habilita el archivado y requiere que los datos se registren como versionado tradicional con el archivado habilitado. Las réplicas se deben crear desde la versión predeterminada cuando se utiliza esta opción.
Sincronizar réplicas
Una vez que se crea una réplica, puede comenzar a sincronizar los cambios entre las geodatabases de réplica. Para que su sistema funcione eficazmente, es importante crear una estrategia para sincronizar los cambios. Consulte ¿Qué es la sincronización? para obtener más información.
Se debe tener en cuenta lo siguiente al determinar la mejor estrategia para su sistema:
- Métodos de sincronización: primero determine el mejor método de sincronización para sus necesidades. Estas son algunas opciones:
- Sincronización manual: si solo trabaja con un número reducido de réplicas y tiene pensado sincronizar los cambios solo en algunas ocasiones, utilice la herramienta de geoprocesamiento Sincronizar cambios de ArcGIS Pro.
- Sincronización automatizada mediante agentes: en un sistema donde hay muchas réplicas, sincronizaciones frecuentes o ambas, debe tener en cuenta creación de un agente de replicación. Los agentes de replicación se conectan automáticamente a las geodatabases replicadas y realizar sincronizaciones. En este caso, los usuarios finales no deben sincronizar sus bases datos en forma explícita, ya que la sincronización ocurre automáticamente.
- Sincronización con herramientas de geoprocesamiento: con las herramientas de geoprocesamiento, puede crear modelos para sincronizar réplicas con conexiones de geodatabase locales o conexiones a objetos de servidor de geodatos que se ejecutan en Internet. Estos modelos se pueden exportar a secuencias de comandos de Python y se pueden ejecutar a través de Python. Los comandos para ejecutar las secuencias de comandos se pueden agregar al software de programación, como el programador de Windows, para que se puedan ejecutar en forma regular. Por ejemplo, es posible que desee programar una sincronización entre dos geodatabases corporativas una vez por semana fuera de horas pico.
- Sincronización y conflictos: si las ediciones realizadas en los datos de una réplica entran en conflicto con las ediciones que se sincronizan desde la réplica relativa, deberá decidir cómo solucionar el conflicto. Es posible aplicar una política de conciliación para solucionar los conflictos automáticamente. Revise Sincronización y versionado para ver si puede suponer un problema para su sistema.
- Datos que se están sincronizando: para las réplicas de check-out, se sincronizan todos los cambios de los datos de la réplica secundaria. Para las réplicas dobles y unidireccionales, sólo se aplican los cambios que cumplen con los requisitos de los filtros y las clases de relación. El panel Administrar réplicas se puede utilizar para determinar los filtros y las reglas de clase de relación que se aplicaron a cada dataset replicado. Para mantener la integridad de los datos, se aplican reglas adicionales al sincronizar tipos de datos complejos, como topologías. El procesamiento de clases de relación también se puede agregar a los datos que se están sincronizando. Revise los siguientes temas para familiarizarse con la sincronización de distintos tipos de datos: Sincronizar topología y Sincronizar datos relacionados.
Los metadatos para los datos que decida replicar se copiarán durante el proceso de creación de la réplica. Sin embargo, los cambios en los metadatos no se aplican durante la sincronización de la réplica.
- Volumen de datos: cuando sincroniza, solo se aplican los cambios realizados desde la última sincronización. ArcGIS filtra todos los cambios que ya se enviaron y fueron reconocidos. Además, una vez que se envía un cambio, nunca se devuelve a la réplica original. De este modo, los volúmenes de datos se recortan sólo a la cantidad necesaria.
Planifique la frecuencia de sincronización para que corresponda con el índice en el que los cambios se aplican a los datos. Si no realiza sincronizaciones con la suficiente frecuencia para el volumen de cambios, el proceso puede demandar mucho tiempo. También se recomienda la sincronización durante las horas de menor demanda.
- Orden de sincronización de réplicas: si trabaja con varias réplicas, el orden de sincronización puede ser importante. Por ejemplo, supongamos que ha creado varias réplicas bidireccionales desde una única geodatabase corporativa. Una estrategia para sincronizar estas réplicas podría ser que cada réplica secundaria se sincronice en ambas direcciones con la principal. Aquí, la secundaria envía los cambios a la principal, y la principal envía los cambios a la secundaria. Otra estrategia podría ser que cada réplica secundaria primero envíe sus cambios a la principal. La principal incorpora todos los cambios y los vuelve a enviar a cada réplica secundaria. En el primer caso, la réplica principal solo envía sus cambios junto con los recibidos de réplicas que ya se han sincronizado, mientras que en el segundo caso, también envía los cambios incorporados a partir del resto de réplicas. Según los requisitos del sistema, una estrategia puede ser más apropiada que la otra.
- Cambios del esquema: la replicación de geodatabase está diseñada para admitir cambios en el esquema. Significa que las sincronizaciones seguirán funcionando incluso si se realizan cambios de esquema en los datos replicados. En general, es mejor mantener los cambios de esquema a un mínimo nivel.
- Solucionar errores: durante el proceso de sincronización, pueden ocurrir errores por diversos motivos. La red informática puede fallar o se puede intentar sincronizar una réplica que esté en conflicto. El sistema está diseñado para permanecer en un estado uniforme. Se revierten los cambios y se rechazan los cambios inadecuados en los datos. El registro de actividad de réplica se puede utilizar para buscar los errores que hayan ocurrido y determinar qué hacer para lograr una recuperación. En la mayoría de los casos, el sistema se recuperará automáticamente de los errores si continúa sincronizando los cambios. Las réplicas además contienen información de generación, que indica cuántos conjuntos de cambios se han enviado y cuántos se han recibido. Consulte Administrar réplicas para obtener más información.