Comparación de herramientas de superposición clásica con herramientas de superposición por pares

Las herramientas de superposición clásica (Zona de influencia, Recortar, Disolver, Borrar, Integrar e Intersecar) y las herramientas de superposición por pares (Zona de influencia por pares, Recortar por pares, Disolver por pares, Borrar por pares, Integrar por pares e Intersecar por pares) están diseñadas para maximizar el rendimiento y la precisión del análisis durante el procesamiento de datasets muy grandes y complejos en un solo escritorio. Varias diferencias funcionales y de rendimiento entre las herramientas de funcionalidad similar determinan la herramienta que debe utilizar en su flujo de trabajo. Existen consideraciones adicionales que afectan a todas las herramientas de geoprocesamiento que repercuten en la precisión de la salida y el rendimiento del análisis dependiendo de la herramienta que se esté utilizando.

Comparación de herramientas

El conjunto de herramientas Superposición por pares proporciona varias herramientas alternativas a las herramientas de superposición tradicionales.

Zona de influencia por pares y Zona de influencia

A continuación, se comparan las herramientas Zona de influencia por pares y Zona de influencia:

  • Ambas herramientas utilizan el procesamiento en paralelo. Para la herramienta Zona de influencia por pares, se habilita el procesamiento en paralelo de forma predeterminada. Para la herramienta Zona de influencia, se habilita a través del entorno Factor de procesamiento en paralelo.
  • Las entidades de salida de la herramienta Zona de influencia por pares son menos suaves que las entidades de salida creadas por la herramienta Zona de influencia de forma predeterminada.
  • La herramienta Zona de influencia por pares le permite controlar la suavidad de las entidades de salida de la zona de influencia. Consulte la documentación de la herramienta para el parámetro Desviación máxima de desplazamiento.
  • La herramienta Zona de influencia proporciona opciones de zona de influencia de salida como tipo lateral y tipo final.

Recortar y Recortar por pares

  • Ambas herramientas utilizan el procesamiento en paralelo. Para la herramienta Recortar por pares, se habilita el procesamiento en paralelo de forma predeterminada. Para la herramienta Recortar, se habilita a través del entorno Factor de procesamiento en paralelo.

Disolver y Disolver por pares

  • La salida de estas herramientas es similar y las herramientas se pueden utilizar de forma intercambiable.
  • La herramienta Disolver por pares utiliza el procesamiento en paralelo de forma predeterminada. La herramienta Disolver no tiene funcionalidades paralelas.

Borrar y Borrar por pares

  • La salida de estas herramientas es similar y las herramientas se pueden utilizar de forma intercambiable.
  • Ambas herramientas utilizan el procesamiento en paralelo. Para la herramienta Borrar por pares, se habilita el procesamiento en paralelo de forma predeterminada. Para la herramienta Borrar, se habilita el procesamiento en paralelo a través del entorno Factor de procesamiento en paralelo.

Integrar e Integrar por pares

  • La herramienta Integrar por pares utiliza el procesamiento en paralelo de forma predeterminada.
  • La tolerancia interna de la herramienta Integrar por pares es ligeramente mayor que la herramienta Integrar debido a las diferencias en los motores subyacentes que realizan la integración.

Intersecar e Intersecar por pares

  • La salida de estas herramientas es fundamentalmente diferente entre sí. Las herramientas no se pueden utilizar de forma intercambiable sin evaluar el flujo de trabajo y cómo se debe cambiar para tener en cuenta las distintas salidas. Para obtener más información, consulte Cómo funciona Intersecar por pares.
  • Ambas herramientas utilizan el procesamiento en paralelo. Para la herramienta Intersecar por pares, se habilita el procesamiento en paralelo de forma predeterminada. Para la herramienta Intersecar, se habilita a través del entorno Factor de procesamiento en paralelo.

Consideraciones funcionales y de rendimiento para todas las herramientas de análisis

A la hora de decidir cuáles de estas herramientas complementarias se deben utilizar en el flujo de trabajo, ambas herramientas suelen ser aceptables. Sin embargo, la siguiente información puede ayudarle a comprender las diferencias entre las herramientas al elegir cuál utilizar.

Consideraciones funcionales

La consideración principal a la hora de decidir qué herramienta utilizar es si su salida satisface las necesidades de su proyecto. Algunas de las herramientas comparables crean una salida equivalente mientras que otras no. Las diferencias clave en la salida de la herramienta se han señalado en la sección anterior. Consulte la documentación de cada herramienta para obtener unos detalles completos al comparar la herramienta que se va a utilizar.

Para todas las herramientas, se debe evitar la proyección al vuelo durante el análisis. La proyección al vuelo se utiliza cuando las entradas de la herramienta no comparten la misma referencia espacial. La proyección al vuelo también se utiliza al configurar entornos de geoprocesamiento que modifican el sistema de coordenadas de salida (Sistema de coordenadas de salida, Tolerancia XY, Resolución XY, etc.). La proyección al vuelo puede provocar imprecisiones de los datos desalineados entre capas. Para obtener más información, consulte Sistemas de coordenadas y proyecciones.

La resolución XY y la tolerancia XY tienen un impacto funcional en la salida generada por todas las herramientas. Para obtener más información, consulte Conceptos básicos de clases de entidad. Se ha realizado un trabajo ingente durante muchas décadas para determinar la resolución XY y la tolerancia XY adecuadas que se utilizarán para generar el resultado más preciso al procesar los datos en su referencia espacial asignada. Se recomienda utilizar la resolución XY y la tolerancia XY predeterminadas para la referencia espacial de los datos de entrada y que no los modifique durante la generación de datos o el uso de entornos de geoprocesamiento durante el análisis. Para evitar resultados de análisis inexactos, también se recomienda no utilizar el parámetro de la herramienta Tolerancia XY.

  • Cada herramienta puede implementar la tolerancia XY con leves diferencias. Por ejemplo, algunos algoritmos son iterativos, lo que significa que la tolerancia se aplica varias veces durante el análisis. El impacto de modificar la tolerancia XY de su valor predeterminado a un valor mayor o menor de multiplica. Cuanto más se aleje el valor de tolerancia XY utilizado del valor predeterminado, más probable será que surjan problemas.
  • Modificar la tolerancia XY incorrectamente puede provocar un error, un análisis impreciso, un movimiento de entidad, errores topológicos, etc.
  • Modificar la resolución XY incorrectamente puede provocar que los datos sean inexactos en la salida y los resultados del análisis también sean incorrectos. Al modificar la resolución XY para que sea menor que la predeterminada, se aumenta el tamaño de la entidad. Puede dar lugar a cambios en el modo en que se procesan los datos. Para las herramientas de superposición clásica, este aumento de tamaño puede dar lugar a más ordenamiento de teselas de los datos para completar el análisis dentro de los recursos disponibles, lo que provoca un aumento en el número de vértices introducidos en la entidad que cruzan los límites de las teselas. Consulte Procesamiento en teselas de datasets grandes para obtener más información.

La geometría de la entidad de entrada debe ser válida. Todas las herramientas que procesan la geometría se ven afectadas por una mala geometría que da lugar a fallos, análisis impreciso, inmovilización del proceso, bloqueo o, en el peor de los casos, ninguna indicación del problema. Es su responsabilidad asegurarse de que todos los datos de entrada contienen una geometría válida. Más información sobre la verificación y reparación de geometrías.

  • Las herramientas de superposición clásica pueden ser sensibles a geometrías no válidas.

Consideraciones de rendimiento

El rendimiento de todas las herramientas de geoprocesamiento varía según el tamaño y la complejidad de los datos de entrada. Existen algunas tendencias que pueden ayudarle a elegir una herramienta que trata el escenario de forma más eficiente.

Áreas de superposición masiva

Ejemplo de salida de la herramienta Intersección compleja

Las áreas de superposición masiva de líneas y polígonos pueden impedir el rendimiento de las herramientas de superposición principal clásica.

En el caso de polígonos de salida de zona de influencia densamente empaquetados, los polígonos de zona de influencia pueden superponerse a un punto en el que seleccionar una sola área en los datos devuelva una selección de decenas o incluso cientos de miles de entidades de zona de influencia. Para las herramientas de superposición principal, como Intersecar o Borrar, la determinación de cada polígono único creado a partir de esta superposición es costosa. Las herramientas de superposición por pares pueden ser mejores opciones para este escenario.

En el caso de las líneas de intersección densamente empaquetadas, cada punto de intersección y superposición viene determinado por las herramientas de superposición clásica (Intersecar, Borrar y Recortar a alguna extensión). Puede ser costoso en casos graves. Las herramientas de superposición por pares pueden ser mejores opciones para este escenario.

Si el análisis se basa en la búsqueda de cada instancia de superposición (por ejemplo, al utilizar las herramientas Intersecar o Combinación), debe utilizar las herramientas de superposición clásica. Sin embargo, si sus decenas de miles o cientos de miles de entidades de entrada dan como resultado una salida de cientos de millones de entidades de salida que representan cada incidente único de superposición, es posible que tenga que reconsiderar su planteamiento para dar sentido a los resultados de la operación de superposición. Una reevaluación del objetivo de su análisis puede revelar que es posible que el análisis deba aproximarse a otra escala de diferente tamaño y escala para comprender mejor el resultado del análisis. Dividir los datos en áreas de interés más razonables puede mejorar el rendimiento de las herramientas de superposición clásica cuando la superposición de las entidades de entrada es extrema.

Consideraciones para entidades extremadamente grandes

Ni las herramientas de superposición clásica ni las herramientas de superposición por pares son capaces de admitir un volumen de entidades que desborda los recursos del equipo que procesa los datos.

  • Estas entidades son tan grandes que no se pueden alojar en el equipo donde está realizando el análisis. A menudo, son el resultado de una operación De ráster a polígono o Disolver que se realizó en un equipo que tenía más recursos disponibles que el equipo que realizó el análisis.
  • Es posible que estas entidades no se dibujen o solo se dibujen parcialmente.
  • El uso de estas entidades con una herramienta de geoprocesamiento puede provocar una inmovilización aparente del procesamiento, errores de memoria, salida incorrecta o incluso, en casos graves, un bloqueo.
  • Una entidad puede ser demasiado grande en un equipo y no en otro. Que una entidad se considere demasiado grande depende de la cantidad de RAM disponible en el equipo que realiza el análisis. Cuanta más RAM tenga un equipo, más grande puede ser una entidad antes de causar problemas.
  • El tamaño máximo que puede tener una entidad individual en la geodatabase es de 2 GB.
  • Cuando se dispone de entidades que son demasiado grandes para ser procesadas, se deben dividir utilizando la herramienta Subdividir para que el análisis sea correcto. Otras herramientas que se utilizan tradicionalmente para manipular las entidades existentes probablemente no editarán una entidad con millones de vértices.

Las entidades que son demasiado grandes pueden causar problemas durante el procesamiento, pero es posible realizar tareas sencillas con ellas. Contienen un gran número de vértices, pero no son tan grandes como para causar problemas por sí solos. Sin embargo, son lo suficientemente grandes como para evitar el rendimiento y provocar fallos en las herramientas de superposición clásica y de superposición por pares.

  • Estas entidades se dibujan y se pueden utilizar en análisis simples sin problema, pero incluso durante estas operaciones simples, puede producirse una desventaja de rendimiento notable y un aumento de la huella de memoria.
  • En algunos casos, si estas entidades abarcan una gran parte del área de interés, a menudo es necesario duplicar la entidad en la memoria para el procesamiento (en particular para el procesamiento en paralelo). Esto finalmente puede provocar una reducción de la cantidad de recursos disponibles en el equipo. Es posible que se produzca una degradación y un fallo en el rendimiento importantes.
  • Estas entidades provocan la degradación del rendimiento tanto en las herramientas de superposición clásica como en las herramientas de superposición por pares. Las herramientas de superposición por pares, con un planteamiento más sencillo para analizar los datos y, por lo general, con una huella de memoria más pequeña para hacerlo, pueden dar cabida a este tipo de entidades de forma más correcta.
  • Si tiene estas entidades muy grandes en sus datos, es posible que desee reevaluar sus objetivos de análisis. Considere si necesita una precisión milimétrica para su análisis del análisis de línea de costa del continente o para definir los límites de migración de pájaros.
  • Hay dos métodos para que el análisis sea más correcto cuando los datos contienen entidades tan grandes. Si no necesita que el nivel de precisión esté representado en los datos, tiene la opción de simplificar los datos (usando Simplificar polígono o herramientas similares). Para mantener la precisión de las entidades, puede dividir las entidades en partes más pequeñas. Si la entidad tiene muchas partes, la herramienta De multiparte a parte simple puede disminuir el tamaño de la entidad lo suficientemente para que se realice correctamente con el análisis. Si no es así, se puede utilizar la herramienta Subdividir para dividir la entidad antes del análisis. Las entidades que están dañadas se pueden volver a ensamblar más adelante en el flujo de trabajo utilizando Disolver o Disolver por pares con un Id. único asignado a cada entidad antes de que se divida.

Consideraciones de referencia espacial y proyección al vuelo

Si está utilizando una herramienta de geoprocesamiento con dos entradas que tienen referencias espaciales diferentes, la mayoría de las herramientas establecen el sistema de coordenadas de salida en la primera entrada y los datos de la segunda entrada con una referencia espacial diferente se proyectan en este sistema de coordenadas para el análisis. Cambiar dinámicamente la proyección al vuelo puede provocar una degradación del rendimiento (y dar lugar a imprecisiones de datos desalineados entre capas). Siempre que sea posible, para un rendimiento fiable y una precisión de salida, todas las entradas deben compartir la misma referencia espacial.