Las herramientas Generar vínculos de Rubbersheet, Transferir atributos y Detectar cambios de entidades utilizan técnicas de concordancia de entidades para identificar las entidades correspondientes y producir distintos resultados. A continuación se describe el proceso de concordancia de entidades y la información correspondiente incluida en la tabla de concordancias.
Proceso de concordancia de entidades
Establecer la concordancia de entidades consiste en encontrar entidades correspondientes a partir de dos datasets similares en función de una distancia de búsqueda. Uno de los datasets se denomina "origen" y el otro "destino", especialmente cuando se utiliza la concordancia de entidades para derivar vínculos de "rubbersheet" o para transferir atributos de los datos de origen a los de destino. Estos datasets se superponen entre sí, pero no están perfectamente alineados debido a la recopilación inconsistente de datos, a cambios a lo largo del tiempo o a otras razones. La figura 1 muestra un ejemplo de calles en las que las entidades de origen proceden de un proveedor de datos comercial y las entidades de destino son creadas y mantenidas por el gobierno municipal.

El proceso de concordancia de entidades analiza la topología de origen y destino, detecta ciertos patrones de entidades, establece una concordancia de patrones y una concordancia de entidades dentro de los patrones. La precisión de la concordancia de entidades depende de la similitud, la complejidad y la calidad de los datos. En general, cuanto más similares sean los dos datasets, mejores serán los resultados de la concordancia. Por lo general, se puede lograr un alto porcentaje de concordancias satisfactorias, aunque pueden producirse incertidumbres y errores que requieran una inspección posterior y correcciones.
Los atributos de las entidades pueden ayudar a determinar la concordancia correcta en la concordancia de entidades. Si se especifican uno o más pares de campos concordantes, las entidades concordantes espacialmente se comprueban utilizando los campos concordantes. Por ejemplo, si una entidad de origen concuerda espacialmente con dos entidades de destino candidatas, pero una de las entidades de destino tiene valores de atributo concordantes y la otra no, se utiliza la primera como concordancia final. La condición de concordancia de atributos afecta al nivel de confianza de la concordancia de entidades.
Tabla de concordancia
Las herramientas Generar vínculos de Rubbersheet, Transferir atributos y Detectar cambios de entidades pueden producir tablas de concordancias. La tabla de concordancias proporciona información completa sobre las concordancias de entidades con los siguientes campos para ayudar a comprender el resultado y facilitar la inspección posterior y el análisis posterior:
- SRC_FID— ID de la entidad de origen. El valor es -1 para una entidad de origen no concordante.
- TGT_FID— ID de la entidad de destino. El valor es -1 para una entidad de destino no concordante.
- FM_GRP— ID de grupo único para entidades concordantes y -1 para entidades de origen y destino no concordantes.
- FM_MN— Relaciones de concordancia entre las entidades de origen y destino en el formato m:n, donde m y n son el número de entidades de origen y entidades de destino en un grupo de concordancias, respectivamente. Por ejemplo, 1:1 es una concordancia de uno a uno, y 3:2 es una concordancia de tres a dos. Para entidades de origen o destino no concordantes, el valor de este campo es N/A (no aplicable).
- FM_CONF— Este campo almacena los siguientes valores que representan el nivel de confianza de la concordancia de entidades:
- 100: concordancia confirmada por los campos de concordancia especificados.
- 75: concordancia no confirmada por los campos de concordancia especificados, ya sea porque no se han especificado campos de concordancia o porque no se han encontrado valores en los campos de concordancia especificados.
- 50: concordancia con una diferencia en el valor de campo en los campos de concordancia especificados.
- 0: entidades de origen y destino no concordadas.
La siguiente sección contiene ejemplos de escenarios de concordancia de entidades y la información de concordancia en las tablas de concordancias. Para simplificar, se asume una concordancia de atributos para todas las entidades concordantes, lo que se refleja en el campo FM_CONF con el valor 100.
Grupos de concordancia y relaciones de concordancia
Dado que la concordancia de entidades se basa en la topología de las entidades y los patrones espaciales en los que se reconoce que una o más entidades de origen y una o más entidades de destino tienen una estructura topológica o un patrón espacial concordantes, estas se convierten en un grupo concordante. Dentro de cada grupo de concordancias, la relación de concordancia se define por el número de entidades de origen (m) frente al número de entidades de destino (n), tal y como se explica a continuación y se ilustra en la figura 2:
- Concordancia de uno a uno (1:1)
Una entidad de origen concuerda con una entidad de destino, y ambas pertenecen al mismo grupo de concordancias.
- Concordancia de uno a muchos (1:m)
Una entidad de origen concuerda con varias entidades de destino, y todas ellas pertenecen al mismo grupo de concordancias.
- Concordancia de muchos a uno (m:1)
Varias entidades de origen concuerdan con una entidad de destino, y todas ellas pertenecen al mismo grupo de concordancias.
- Concordancia de muchos a muchos (m:n)
Varias entidades de origen concuerdan con varias entidades de destino y todas ellas pertenecen al mismo grupo de concordancias.
