Comparar capas de estadísticas geográficas (Geostatistical Analyst)

Disponible con una licencia de Geostatistical Analyst.

Resumen

Compara y clasifica capas de estadísticas geográficas mediante criterios personalizables basados en estadísticas de validación cruzada.

Los resultados de interpolación se pueden clasificar según un único criterio (como la precisión de predicción más alta o el sesgo más bajo), las clasificaciones de promedio ponderado de varios criterios o la ordenación jerárquica de varios criterios (donde los empates en cada uno de los criterios se rompen por los criterios posteriores de la jerarquía). También se pueden usar criterios de exclusión se pueden usar para excluir los resultados de interpolación de la comparación que no cumplen con los estándares de calidad mínimos. La salida es una tabla que resume las estadísticas de validación cruzada y clasificaciones para cada resultado de la interpolación. Opcionalmente, puede generar una capa de estadísticas geográficas del resultado de interpolación con la clasificación más alta para usarla en flujos de trabajo posteriores.

Ilustración

Ilustración de la herramienta Comparar capas de estadísticas geográficas
Los resultados de interpolación se comparan y clasifican.

Uso

  • La validación cruzada es un método estadístico basado en "dejar un elemento fuera" para evaluar los resultados de la interpolación. El método elimina secuencialmente cada punto del dataset y utiliza los puntos restantes para predecir el valor del punto excluido. A continuación, la predicción de la validación cruzada se compara con el valor real del punto oculto, y la diferencia entre ambos es el error de validación cruzada (el error puede ser positivo o negativo). El motivo de la validación cruzada es que, si el resultado de interpolación es eficaz a la hora de predecir los valores de los puntos ocultos, también debe ser eficaz a la hora de predecir valores desconocidos en ubicaciones nuevas, lo cual es el objetivo de la interpolación. Todos los criterios utilizados por esta herramienta se basan en estadísticas de resumen de los resultados de la validación cruzada.

    Aunque evaluar los resultados de interpolación mediante estadísticas de resumen de validación cruzada es una forma cómoda y eficaz de comparar varios resultados de interpolación, no reemplaza al conocimiento experto de los datos ni a la investigación interactiva de los resultados. La revisión de gráficos y los errores individuales de validación cruzada suele revelar patrones en los resultados que no resultan obvios con las estadísticas de resumen. Por ejemplo, a menudo existen patrones espaciales en los errores de validación cruzada donde algunas áreas están subestimadas y otras áreas están sobrestimadas; es posible que los patrones de este tipo no se representen mediante estadísticas de resumen.

    Más información sobre cómo utilizar la validación cruzada para evaluar los resultados de interpolación

  • El parámetro Método de comparación tiene tres opciones para comparar las estadísticas de validación cruzada de los resultados de interpolación. Cada opción tiene sus ventajas y desventajas:

    • Criterio único: se utiliza un criterio único para comparar y clasificar los resultados. Puede clasificar los resultados por precisión de predicción más alta, sesgo más bajo, error más bajo con los peores valores posibles, precisión de error estándar más alta o precisión más alta. El criterio se proporciona en el parámetro Criterio.
      • Ventajas: esta opción es un método simple y común para comparar los resultados de interpolación que se sabe que son estables y coherentes. También es útil para elegir entre los resultados que son muy similares.
      • Desventajas: los resultados de la interpolación muchas veces funcionan bien con algunos criterios, pero no con otros; por ejemplo, al tener una precisión de predicción alta, pero también un sesgo alto. En este caso, al clasificar por un único criterio, se asignarán clasificaciones altas a resultados que son inestables o confusos. Cuando se clasifica por un único criterio, se recomienda utilizar varias opciones del parámetro Criterios de exclusión para garantizar que los resultados inestables o confusos se eliminen antes de la comparación.
    • Ordenación jerárquica con tolerancias: la ordenación jerárquica se utiliza para comparar y clasificar los resultados. Se especifican varios criterios en orden de prioridad (el de mayor prioridad primero) en el parámetro Jerarquía de criterios. Los resultados de interpolación se clasifican por el primer criterio, y los empates se rompen por el segundo criterio. Los empates en el segundo criterio se rompen por el tercer criterio, y así sucesivamente. Este proceso se modela después de Orden personalizado y la ordenación jerárquica en el software de hoja de cálculo (ordenar por A, luego por B, luego por C, etc.). Sin embargo, las estadísticas de validación cruzada son valores continuos y generalmente no tienen empates exactos, de modo que se pueden especificar tolerancias (porcentaje o absoluto) para crear empates en cada uno de los criterios.
      • Ventajas: esta opción utiliza varios criterios y tiene en cuenta las diferencias relativas de las estadísticas de validación cruzada. Por ejemplo, si un resultado de interpolación es mucho mejor que el resto según el criterio de mayor prioridad, el resultado de la interpolación recibirá la clasificación más alta independientemente de los criterios posteriores de la jerarquía.
      • Desventajas: la eficacia de la ordenación jerárquica depende de los valores de tolerancia proporcionados. Si las tolerancias son demasiado pequeñas, es posible que no se utilicen algunos criterios porque no hay empates que romper. Si las tolerancias son demasiado grandes, puede haber muchos empates en las clasificaciones porque muchos resultados están dentro de las tolerancias de los demás.
    • Clasificación de promedio ponderado: la clasificación de promedio ponderado de varios criterios se utiliza para comparar y clasificar los resultados. En el parámetro Criterios ponderados se especifican varios criterios y las ponderaciones asociadas. Los resultados de interpolación se clasifican independientemente por cada uno de los criterios, y se utiliza un promedio ponderado de las clasificaciones para determinar las clasificaciones finales. Los criterios con ponderaciones más grandes tendrán más influencia en las clasificaciones finales, por lo que se pueden utilizar para indicar la preferencia de ciertos criterios sobre otros.
      • Ventajas: esta opción utiliza varios criterios, permite preferencias de algunos criterios sobre otros y siempre utiliza todos los criterios en la comparación.
      • Desventajas: se ignoran las diferencias relativas en los valores de las estadísticas de validación cruzada. Por ejemplo, todos los valores de error cuadrático medio pueden estar dentro de una tolerancia muy pequeña entre sí (lo que indica que todos los resultados tienen una precisión de predicción aproximadamente igual), pero se seguirán clasificando de 1 a N por precisión de predicción (para los N resultados de interpolación). Sin embargo, los valores de error medio pueden variar en grandes cantidades entre los resultados (lo que indica que los resultados tienen grandes diferencias en sus sesgos), pero también se clasificarán de 1 a N según el criterio de sesgo. El promedio ponderado utiliza solo las clasificaciones de los criterios, por lo que las diferencias relativas en las estadísticas de validación cruzada se ignoran en la clasificación.

  • Las capas de estadísticas geográficas de entrada se pueden crear en Geostatistical Wizard o mediante las herramientas del conjunto de herramientas Interpolación.

  • La salida es una tabla que resume las estadísticas de validación cruzada, descripciones de los resultados de interpolación y clasificaciones, y se puede incluir en una presentación o informe. Las estadísticas de validación cruzada solo se incluirán en la tabla si se aplican al menos a un resultado de interpolación. Por ejemplo, si solo se utilizan la ponderación de distancia inversa y las funciones de base radial, la tabla de salida no contendrá un campo de valores de error estándar promedio porque estos métodos no calculan errores estándar. Si una estadística se aplica a algunos resultados de interpolación, pero no a otros, el valor será nulo para los resultados a los que no se aplica la estadística. Además, si alguna de las capas de estadísticas geográficas de entrada se creó con la herramienta Kriging bayesiano empírico, EBK Regression Prediction o Kriging bayesiano empírico 3D, se incluirán varias estadísticas de validación cruzada en la tabla que no se utilizan en ningún criterio de esta herramienta; se incluirán con fines informativos y tendrán valores nulos para todos los demás métodos de interpolación. Si se utiliza la clasificación de promedio ponderado, las clasificaciones de todos los criterios proporcionados y su promedio ponderado también se incluirán en la tabla.

    Opcionalmente, puede usar el parámetro Generar capa de estadísticas geográficas con la clasificación más alta para crear una copia de la capa de estadísticas geográficas de entrada con la clasificación más alta. Es útil en scripts de ModelBuilder y Python para propagar automáticamente el mejor resultado de interpolación a las herramientas posteriores.

  • Mientras se ejecuta la herramienta, los mensajes de geoprocesamiento y los mensajes de la barra de progreso muestran el resultado de interpolación actual que se está calculando. Una vez calculados y comparados todos los resultados, las clasificaciones se imprimen como mensajes de geoprocesamiento. Las clasificaciones también están disponibles en la tabla de validación cruzada de salida.

  • La herramienta Interpolación exploratoria realiza las mismas comparaciones de validación cruzada que esta herramienta, pero genera varios resultados de interpolación automáticamente a partir de los puntos de entrada y un campo antes de compararlos y clasificarlos.

  • En la siguiente tabla se enumeran los criterios disponibles, las estadísticas de validación cruzada que los mide y las fórmulas utilizadas para asignar una puntuación a cada resultado de interpolación (las puntuaciones más bajas son mejores). Las clasificaciones de los criterios se determinan ordenando las puntuaciones de cada resultado de interpolación.

    Nota:

    Para tres de los criterios, la puntuación es igual a la estadística de validación cruzada.

    CriteriosEstadística de validación cruzadaFórmula de puntuación

    Precisión de predicción más alta

    Error cuadrático medio

    Los resultados se clasifican por el error cuadrático medio más bajo.

    Score = RootMeanSquareError

    Sesgo más bajo

    Error medio

    Los resultados se clasifican por el error medio más cercano a cero.

    Score = AbsoluteValue( MeanError )

    Error más bajo con los peores valores posibles

    Error absoluto máximo

    Los resultados se clasifican por el error absoluto máximo más bajo.

    Score = MaximumAbsoluteError

    Precisión de error estándar más alta

    Error cuadrático medio estandarizado

    Los resultados se clasifican por el error cuadrático medio estandarizado más cercano a uno.

    Score = AbsoluteValue( RMSStdError - 1 )

    Precisión más alta

    Error estándar promedio

    Los resultados se clasifican por el error estándar promedio más bajo.

    Score = AverageStandardError

  • Si hay empates en cualquier criterio, todos los resultados del empate reciben la misma clasificación, igual a la mayor de las clasificaciones compartidas entre ellos (donde una clasificación más alta significa un número de clasificación más bajo). Por ejemplo, ordenados de mejor a peor, los valores de error cuadrático medio (12, 14, 14, 15, 16, 16, 18) recibirán las clasificaciones (1, 2, 2, 4, 5, 5, 7) por el criterio de precisión de la predicción. Las clasificaciones 3 y 6 se omiten por los valores empatados.

    Se pueden producir empates en varias fases de las comparaciones. Los empates son más habituales cuando se utiliza la ordenación jerárquica, porque todos los resultados dentro de la tolerancia se consideran empatados entre sí, y todos los resultados fuera de la tolerancia también se consideran empatados entre sí. Los empates también son comunes en la clasificación de promedio ponderado cuando los resultados de la interpolación tienen clasificaciones variables según distintos criterios, lo que puede dar lugar a promedios ponderados iguales en las clasificaciones. Aunque es inusual, también pueden producirse empates en comparaciones de criterios únicos (por ejemplo, si todos los puntos tienen un valor constante). Los empates por un solo criterio también afectarán a la clasificación de promedio ponderado si los criterios se usan en el promedio ponderado.

  • En la ordenación jerárquica, proporcione las tolerancias relativas a la puntuación del criterio en lugar de la estadística de validación cruzada. Para los criterios en los que la puntuación es igual a la estadística (precisión de predicción más alta, error más bajo con los peores valores posibles y precisión más alta), los valores de tolerancia apropiados generalmente son claros. Por ejemplo, si el valor de error cuadrático medio más bajo de los resultados de interpolación es 200, una tolerancia de porcentaje de 10 incluirá todos los resultados con valores de error cuadrático medio menores o iguales que 220: 200 + (10/100) x 200 = 220. Del mismo modo, una tolerancia absoluta de 15 incluirá todos los resultados con valores de error cuadrático medio menores o iguales que 215: 200 + 15 = 215.

    Sin embargo, para los criterios en los que la puntuación no es igual al valor de la estadística (sesgo más bajo y precisión de error estándar más alta), los valores de tolerancia adecuados son menos claros. Para la estadística de error medio, el sesgo se puntúa por el valor absoluto del error medio. Esto significa, por ejemplo, que los valores de error medio -4 y 6 tienen una diferencia relativa del 50 por ciento porque son un 50 por ciento diferentes en el valor absoluto: ABS(-4) + (50/100) x ABS(-4) = ABS(6). Del mismo modo, su diferencia absoluta es 2: ABS(-4) + 2 = ABS(6).

    Para la estadística de error cuadrático medio estandarizado, la precisión de error estándar se puntúa por la diferencia absoluta entre el valor de error cuadrático medio estandarizado y el valor ideal de 1. Significa, por ejemplo, que los valores de error cuadrático medio estandarizado 0,2 y 2,4 tienen una diferencia relativa del 75 por ciento. Para comprender por qué, al comparar los valores 0,2 y 2,4, este último está 1,75 veces más lejos (un aumento del 75 por ciento) del valor ideal de 1 que el anterior (diferencias absolutas de 0,8 y 1,4, respectivamente): ABS(0.2 - 1) + (75/100) x ABS(0.2 - 1) = ABS(2.4 - 1). Del mismo modo, su diferencia absoluta es 0,6: ABS(0.2 - 1) + 0.6 = ABS(2.4 - 1).

  • Varios criterios requieren que todas las capas de estadísticas geográficas de entrada sean compatibles con el tipo de salida de error estándar. Si alguna capa de estadísticas geográficas no permite errores estándar, varias opciones de varios parámetros dejarán de estar disponibles. Estas opciones están relacionadas con la precisión de error estándar, la precisión, la estadística de error cuadrático medio estandarizado o la estadística de error estándar promedio. En la pestaña contextual Capa de estadísticas geográficas, en el grupo Dibujo, el menú Tipo de visualización muestra los tipos de salida admitidos por una capa de estadísticas geográficas.

    Más información sobre qué métodos de interpolación permiten errores estándar de predicciones

  • La opción Reducción de error del porcentaje mínimo del parámetro Criterios de exclusión es particularmente útil cuando no conoce los valores o el rango de los puntos que se interpolan (por ejemplo, en un entorno automatizado). Esta opción excluye los resultados de interpolación que no sean bastante más precisos que un modelo no espacial de línea base que predice el valor promedio global en todas las ubicaciones del mapa. Esta precisión relativa se mide comparando el valor del error cuadrático medio con la desviación estándar de los valores de los puntos que se interpolan, y el error cuadrático medio debe ser al menos el porcentaje especificado más bajo que la desviación estándar para incluirlo en la comparación. Por ejemplo, un valor de 10 significa que el error cuadrático medio debe ser al menos un 10 por ciento más bajo que la desviación estándar para incluirlo en la comparación y clasificación.

    Diferentes disciplinas tienen diferentes estándares respecto a las reducciones de errores admisibles en los resultados de interpolación. En las ciencias físicas con mediciones con un muestreo denso, los errores a menudo se reducen en más del 90 por ciento. Sin embargo, en las ciencias sociales, para los investigadores muchas veces resultan significativas reducciones de errores de solo el 10-20 por ciento.

  • Para que las comparaciones sean significativas y justas, se recomienda utilizar los mismos puntos y campo al crear cada capa de estadísticas geográficas de entrada. Si alguna de las capas no comparte la misma fuente de datos, la herramienta devolverá un mensaje de advertencia.

Parámetros

EtiquetaExplicaciónTipo de datos
Capas de estadísticas geográficas de entrada

Las capas de estadísticas geográficas que representan los resultados de interpolación. Se comparará y clasificará cada capa.

Geostatistical Layer
Tabla de validación cruzada de salida

La tabla de salida que contiene estadísticas de validación cruzada y clasificaciones para cada resultado de interpolación. Las clasificaciones finales de los resultados de interpolación se almacenan en el campo RANK.

Table
Generar capa de estadísticas geográficas con la clasificación más alta
(Opcional)

La capa de estadísticas geográficas de salida del resultado de interpolación con la clasificación más alta. Este resultado de interpolación tendrá el valor 1 en el campo RANK de la tabla de validación cruzada de salida. Si hay empates para el resultado de interpolación con la clasificación más alta o si todos los resultados se excluyen por criterios de exclusión, la capa no se creará aunque se proporcione un valor. La herramienta devolverá mensajes de advertencia si esto sucede.

Geostatistical Layer
Método de comparación
(Opcional)

Especifica el método que se utilizará para comparar y clasificar los resultados de interpolación.

  • Criterio únicoSe usará un único criterio para comparar y clasificar los resultados, como la precisión de predicción más alta o el sesgo más bajo. Se utiliza el criterio del parámetro Criterio.
  • Ordenación jerárquica con toleranciasSe utilizará la ordenación jerárquica para comparar los resultados. Se especifican varios criterios en orden de prioridad (el de mayor prioridad primero) en el parámetro Jerarquía de criterios. Los resultados de interpolación se clasifican por el primer criterio, y los empates se rompen por el segundo criterio. Los empates en el segundo criterio se rompen por el tercer criterio, y así sucesivamente. Las estadísticas de validación cruzada son valores continuos y generalmente no tienen empates exactos, de modo que se pueden especificar tolerancias (porcentaje o absoluto) para crear empates en cada uno de los criterios.
  • Clasificación de promedio ponderadoLa clasificación de promedio ponderado de varios criterios se utilizará para comparar los resultados. Con el parámetro Criterios ponderados se especifican varios criterios y las ponderaciones asociadas. Los resultados de interpolación se clasifican independientemente por cada uno de los criterios, y se utiliza un promedio ponderado de las clasificaciones para determinar las clasificaciones finales. Los criterios con ponderaciones más grandes tendrán más influencia en las clasificaciones finales, por lo que se pueden utilizar ponderaciones para indicar la preferencia de ciertos criterios sobre otros.
String
Criterio
(Opcional)

Especifica el criterio que se utilizará para clasificar los resultados de interpolación.

  • Precisión de predicción más altaLos resultados se clasificarán por el error cuadrático medio más bajo. Esta opción mide la precisión de la coincidencia entre las predicciones de validación cruzada y los valores reales, de media. Esta es la opción predeterminada.
  • Sesgo más bajoLos resultados se clasificarán por el error medio más cercano a cero. Esta opción mide el grado en que las predicciones de validación cruzada predicen los valores reales en exceso o defecto, de media. Los resultados de interpolación con errores medios positivos sistemáticamente predicen los valores reales (sesgo positivo) en exceso, y los resultados con errores medios negativos sistemáticamente predicen los valores reales (sesgo negativo) en defecto.
  • Error más bajo con los peores valores posiblesLos resultados se clasificarán por el error absoluto máximo más bajo. Esta opción mide solo la única predicción de validación cruzada menos precisa (positivo o negativo). Resulta útil cuando lo que más le preocupa son las situaciones con los peores valores posibles en lugar de la precisión de las condiciones típicas.
  • Precisión de error estándar más altaLos resultados se clasificarán por el error cuadrático medio estandarizado más cercano a uno. Esta opción mide el grado de coincidencia entre la variabilidad de las predicciones de validación cruzada y los errores estándar estimados. Resulta útil si tiene pensado crear intervalos de confianza o márgenes de error para las predicciones.
  • Precisión más altaLos resultados se clasificarán por el error estándar medio más bajo. Al crear intervalos de confianza o márgenes de error para los valores predichos, los resultados con mayor precisión tendrán intervalos más reducidos alrededor de las predicciones. No mide si los errores estándar se estiman con precisión, solo que los errores estándar son pequeños. Al utilizar esta opción, se recomienda incluir los valores de error cuadrático medio estandarizado mínimo y máximo como criterios de exclusión para garantizar que los errores estándar sean precisos y exactos.
String
Jerarquía de criterios
(Opcional)

La jerarquía de los criterios que se utilizará para la ordenación jerárquica con tolerancias. Proporcione varios criterios en orden de prioridad, siendo el primero el más importante. Los resultados de interpolación se clasifican por el primer criterio, y los empates se rompen por el segundo criterio. Los empates en el segundo criterio se rompen por el tercer criterio, y así sucesivamente. Las estadísticas de validación cruzada son valores continuos y generalmente no tienen empates exactos, de modo que se utilizan tolerancias para inducir a empates en los criterios. Para cada fila, especifique un criterio en la primera columna, un tipo de tolerancia (porcentaje o absoluto) en la segunda columna y un valor de tolerancia en la tercera columna. Si no se proporciona un valor de tolerancia, no se utilizará ninguna tolerancia; resulta de gran utilidad para la fila final, de modo que no haya empates para el resultado de interpolación con la clasificación más alta.

Para cada fila (nivel de la jerarquía), están disponibles los siguientes criterios:

  • Error cuadrático medio (Precisión): los resultados se clasificarán por la precisión más alta.
  • Error medio (Sesgo): los resultados se clasificarán por el sesgo más bajo.
  • Error absoluto máximo (Error con los peores valores posibles): los resultados se clasificarán por el error más bajo con los peores valores posibles.
  • RMSE estandarizado (Precisión de error estándar): los resultados se clasificarán por la precisión de error estándar más alta.
  • Error estándar medio (Precisión): los resultados se clasificarán por la precisión más alta.

Por ejemplo, puede especificar un valor de Error cuadrático medio (Precisión) con una tolerancia del 5 por ciento en la primera fila y un valor de Error medio (Sesgo) sin tolerancia en la segunda fila. Estas opciones clasificarán primero los resultados de interpolación por el error cuadrático medio más bajo (precisión de predicción más alta), y todos los resultados de interpolación cuyos valores de error cuadrático medio se encuentren dentro del 5 por ciento del resultado más preciso serán considerados empates por la precisión de la predicción. Entre los resultados empatados, el resultado con un error medio más cercano a cero (sesgo más bajo) recibirá la clasificación más alta.

Value Table
Criterios ponderados
(Opcional)

Los diversos criterios con ponderaciones que se utilizarán para clasificar los resultados de la interpolación. Para cada fila, proporcione un criterio y una ponderación. Los resultados de interpolación se clasificarán independientemente por cada uno de los criterios, y se utilizará un promedio ponderado de las clasificaciones para determinar las clasificaciones finales de los resultados de interpolación.

  • Precisión de predicción más alta: los resultados se clasificarán por el error cuadrático medio más bajo.
  • Sesgo más bajo: los resultados se clasificarán por el error medio más cercano a cero.
  • Error con los peores valores posibles: los resultados se clasificarán por el error absoluto máximo más bajo.
  • Precisión de error estándar más alta: los resultados se clasificarán por el error cuadrático medio estandarizado más cercano a uno.
  • Precisión más alta: los resultados se clasificarán por el error estándar medio más bajo.

Value Table
Criterios de exclusión
(Opcional)

Los criterios y los valores asociados que se utilizarán para excluir los resultados de interpolación de la comparación. Los resultados excluidos no recibirán clasificaciones y tendrán el valor No en el campo Included de la tabla de validación cruzada de salida.

  • Error cuadrático medio máximo: los resultados se excluirán si el error cuadrático medio supera el valor especificado. El valor no puede ser negativo. Esta opción mide la precisión de predicción.
  • Error absoluto máximo: los resultados se excluirán si el error absoluto máximo supera el valor especificado. El valor no puede ser negativo. Esta opción mide el peor error posible.
  • Error cuadrático medio estandarizado máximo: los resultados se excluirán si el error cuadrático medio estándar supera el valor especificado. El valor debe ser mayor o igual que 1. Esta opción mide la precisión de error estándar.
  • Error cuadrático medio estandarizado mínimo: los resultados se excluirán si el error cuadrático medio estandarizado no supera el valor especificado. El valor debe estar comprendido entre 0 y 1. Esta opción mide la precisión de error estándar.
  • Error medio máximo: los resultados se excluirán si el error medio supera el valor especificado. El valor no puede ser negativo. Esta opción mide el sesgo.
  • Error medio mínimo: los resultados se excluirán si el error medio no supera el valor especificado. El valor no puede ser positivo. Esta opción mide el sesgo.
  • Error estándar promedio máximo: los resultados se excluirán si el error estándar promedio supera el valor especificado. El valor no puede ser negativo. Esta opción mide la precisión.
  • Reducción de error del porcentaje mínimo: los resultados se excluirán si el resultado de interpolación no es bastante más preciso que un modelo no espacial de línea base que predice el valor medio global en todas las ubicaciones del mapa. Esta precisión relativa se mide comparando el valor del error cuadrático medio con la desviación estándar de los valores de los puntos que se interpolan, y el error cuadrático medio debe ser al menos el porcentaje especificado más bajo que la desviación estándar para incluirlo en la comparación. Por ejemplo, un valor de 10 significa que el error cuadrático medio debe ser al menos un 10 por ciento más bajo que la desviación estándar para incluirlo en la comparación y clasificación. El valor debe estar comprendido entre 0 y 100. Esta opción mide la precisión de predicción.

Value Table

arcpy.ga.CompareGeostatisticalLayers(in_geostat_layers, out_cv_table, {out_geostat_layer}, {comparison_method}, {criterion}, {criteria_hierarchy}, {weighted_criteria}, {exclusion_criteria})
NombreExplicaciónTipo de datos
in_geostat_layers
[in_geostat_layer1,in_geostat_layer2,...]

Las capas de estadísticas geográficas que representan los resultados de interpolación. Se comparará y clasificará cada capa.

Geostatistical Layer
out_cv_table

La tabla de salida que contiene estadísticas de validación cruzada y clasificaciones para cada resultado de interpolación. Las clasificaciones finales de los resultados de interpolación se almacenan en el campo RANK.

Table
out_geostat_layer
(Opcional)

La capa de estadísticas geográficas de salida del resultado de interpolación con la clasificación más alta. Este resultado de interpolación tendrá el valor 1 en el campo RANK de la tabla de validación cruzada de salida. Si hay empates para el resultado de interpolación con la clasificación más alta o si todos los resultados se excluyen por criterios de exclusión, la capa no se creará aunque se proporcione un valor. La herramienta devolverá mensajes de advertencia si esto sucede.

Geostatistical Layer
comparison_method
(Opcional)

Especifica el método que se utilizará para comparar y clasificar los resultados de interpolación.

  • SINGLESe usará una única estadística de validación cruzada para comparar y clasificar los resultados, como la precisión de predicción más alta o el sesgo más bajo. Se utiliza el criterio del parámetro criterion.
  • SORTINGSe utilizará la ordenación jerárquica para comparar los resultados. Se especifican varios criterios en orden de prioridad (el de mayor prioridad primero) en el parámetro criteria_hierarchy. Los resultados de interpolación se clasifican por el primer criterio, y los empates se rompen por el segundo criterio. Los empates en el segundo criterio se rompen por el tercer criterio, y así sucesivamente. Las estadísticas de validación cruzada son valores continuos y generalmente no tienen empates exactos, de modo que se pueden especificar tolerancias (porcentaje o absoluto) para crear empates en cada uno de los criterios.
  • AVERAGE_RANKLa clasificación de promedio ponderado de varios criterios se utilizará para comparar los resultados. En el parámetro weighted_criteria se especifican varios criterios y las ponderaciones asociadas. Los resultados de interpolación se clasifican independientemente por cada uno de los criterios, y se utiliza un promedio ponderado de las clasificaciones para determinar las clasificaciones finales. Los criterios con ponderaciones más grandes tendrán más influencia en las clasificaciones finales, por lo que se pueden utilizar ponderaciones para indicar la preferencia de ciertos criterios sobre otros.
String
criterion
(Opcional)

Especifica el criterio que se utilizará para clasificar los resultados de interpolación.

  • ACCURACYLos resultados se clasificarán por el error cuadrático medio más bajo. Esta opción mide la precisión de la coincidencia entre las predicciones de validación cruzada y los valores reales, de media. Esta es la opción predeterminada.
  • BIASLos resultados se clasificarán por el error medio más cercano a cero. Esta opción mide el grado en que las predicciones de validación cruzada predicen los valores reales en exceso o defecto, de media. Los resultados de interpolación con errores medios positivos sistemáticamente predicen los valores reales (sesgo positivo) en exceso, y los resultados con errores medios negativos sistemáticamente predicen los valores reales (sesgo negativo) en defecto.
  • WORST_CASELos resultados se clasificarán por el error absoluto máximo más bajo. Esta opción mide solo la única predicción de validación cruzada menos precisa (positivo o negativo). Resulta útil cuando lo que más le preocupa son las situaciones con los peores valores posibles en lugar de la precisión de las condiciones típicas.
  • STANDARD_ERRORLos resultados se clasificarán por el error cuadrático medio estandarizado más cercano a uno. Esta opción mide el grado de coincidencia entre la variabilidad de las predicciones de validación cruzada y los errores estándar estimados. Resulta útil si tiene pensado crear intervalos de confianza o márgenes de error para las predicciones.
  • PRECISIONLos resultados se clasificarán por el error estándar medio más bajo. Al crear intervalos de confianza o márgenes de error para los valores predichos, los resultados con mayor precisión tendrán intervalos más reducidos alrededor de las predicciones. No mide si los errores estándar se estiman con precisión, solo que los errores estándar son pequeños. Al utilizar esta opción, se recomienda incluir los valores de error cuadrático medio estandarizado mínimo y máximo como criterios de exclusión para garantizar que los errores estándar sean precisos y exactos.
String
criteria_hierarchy
[[criteria1, tol_type1, tol_val1], [criteria2, tol_type2, tol_val2],...]
(Opcional)

La jerarquía de los criterios que se utilizará para la ordenación jerárquica con tolerancias. Proporcione varios criterios en orden de prioridad, siendo el primero el más importante. Los resultados de interpolación se clasifican por el primer criterio, y los empates se rompen por el segundo criterio. Los empates en el segundo criterio se rompen por el tercer criterio, y así sucesivamente. Las estadísticas de validación cruzada son valores continuos y generalmente no tienen empates exactos, de modo que se utilizan tolerancias para inducir a empates en los criterios. Para cada fila, especifique un criterio en la primera columna, un tipo de tolerancia (porcentaje o absoluto) en la segunda columna y un valor de tolerancia en la tercera columna. Si no se proporciona un valor de tolerancia, no se utilizará ninguna tolerancia; resulta de gran utilidad para la fila final, de modo que no haya empates para el resultado de interpolación con la clasificación más alta.

Para cada fila (nivel de la jerarquía), están disponibles los siguientes criterios:

  • ACCURACY: los resultados se clasificarán por la precisión más alta.
  • BIAS: los resultados se clasificarán por el sesgo más bajo.
  • WORST_CASE: los resultados se clasificarán por el error más bajo con los peores valores posibles.
  • STANDARD_ERROR: los resultados se clasificarán por la precisión de error estándar más alta.
  • PRECISION: los resultados se clasificarán por la precisión más alta.

Por ejemplo, puede especificar un valor de ACCURACY con una tolerancia del 5 por ciento en la primera fila y un valor de BIAS sin tolerancia en la segunda fila. Estas opciones clasificarán primero los resultados de interpolación por el error cuadrático medio más bajo (precisión de predicción más alta), y todos los resultados de interpolación cuyos valores de error cuadrático medio se encuentren dentro del 5 por ciento del resultado más preciso serán considerados empates por la precisión de la predicción. Entre los resultados empatados, el resultado con un error medio más cercano a cero (sesgo más bajo) recibirá la clasificación más alta.

Value Table
weighted_criteria
[[criteria1, weight1], [criteria2, weight2],...]
(Opcional)

Los diversos criterios con ponderaciones que se utilizarán para clasificar los resultados de la interpolación. Para cada fila, proporcione un criterio y una ponderación. Los resultados de interpolación se clasificarán independientemente por cada uno de los criterios, y se utilizará un promedio ponderado de las clasificaciones para determinar las clasificaciones finales de los resultados de interpolación.

  • ACCURACY: los resultados se clasificarán por el error cuadrático medio más bajo.
  • BIAS: los resultados se clasificarán por el error medio más cercano a cero.
  • WORST_CASE: los resultados se clasificarán por el error absoluto máximo más bajo.
  • STANDARD_ERROR: los resultados se clasificarán por el error cuadrático medio estandarizado más cercano a uno.
  • PRECISION: los resultados se clasificarán por el error estándar medio más bajo.

Value Table
exclusion_criteria
[[criteria1, value1], [criteria2, value2],...]
(Opcional)

Los criterios y los valores asociados que se utilizarán para excluir los resultados de interpolación de la comparación. Los resultados excluidos no recibirán clasificaciones y tendrán el valor No en el campo Included de la tabla de validación cruzada de salida.

  • MAX_RMSE: los resultados se excluirán si el error cuadrático medio supera el valor especificado. El valor no puede ser negativo. Esta opción mide la precisión de predicción.
  • MAX_WORST_CASE: los resultados se excluirán si el error absoluto máximo supera el valor especificado. El valor no puede ser negativo. Esta opción mide el peor error posible.
  • MAX_STD_RMSE: los resultados se excluirán si el error cuadrático medio estándar supera el valor especificado. El valor debe ser mayor o igual que 1. Esta opción mide la precisión de error estándar.
  • MIN_STD_RMSE: los resultados se excluirán si el error cuadrático medio estandarizado no supera el valor especificado. El valor debe estar comprendido entre 0 y 1. Esta opción mide la precisión de error estándar.
  • MAX_MEAN_ERROR: los resultados se excluirán si el error medio supera el valor especificado. El valor no puede ser negativo. Esta opción mide el sesgo.
  • MIN_MEAN_ERROR: los resultados se excluirán si el error medio no supera el valor especificado. El valor no puede ser positivo. Esta opción mide el sesgo.
  • MAX_ASE: los resultados se excluirán si el error cuadrático medio supera el valor especificado. El valor no puede ser negativo. Esta opción mide la precisión.
  • MIN_PERC_ERROR: los resultados se excluirán si el resultado de interpolación no es bastante más preciso que un modelo no espacial de línea base que predice el valor medio global en todas las ubicaciones del mapa. Esta precisión relativa se mide comparando el valor del error cuadrático medio con la desviación estándar de los valores de los puntos que se interpolan, y el error cuadrático medio debe ser al menos el porcentaje especificado más bajo que la desviación estándar para incluirlo en la comparación. Por ejemplo, un valor de 10 significa que el error cuadrático medio debe ser al menos un 10 por ciento más bajo que la desviación estándar para incluirlo en la comparación y clasificación. El valor debe estar comprendido entre 0 y 100. Esta opción mide la precisión de predicción.

Value Table

Muestra de código

Ejemplo 1 de CompareGeostatisticalLayers (ventana de Python)

En el siguiente script de Python se muestra cómo utilizar la función CompareGeostatisticalLayers.

# Compare Simple kriging, EBK, and Kernel Interpolation results
# Rank results by highest prediction accuracy
# Exclude results with error reductions under 25%

myGALayers = ["Simple Kriging", "EBK", "Kernel Interpolation"]
outTable = "outCVtable"
outGALayer = "Result With Highest Rank"
compMethod = "SINGLE"
criterion = "ACCURACY"
exclCrit = [["MIN_PERC_ERROR", 25]]
arcpy.ga.CompareGeostatisticalLayers(myGALayers, outTable, outGALayer,
         compMethod, criterion, None, None, exclCrit)
Ejemplo 2 de CompareGeostatisticalLayers (script independiente)

En el siguiente script de Python se muestra cómo utilizar la función CompareGeostatisticalLayers.

# Compare various interpolation results
# Rank results by highest weighted average rank
# Rank same results by hierarchical sorting

# Import system modules
import arcpy

# Check out the ArcGIS Geostatistical Analyst extension license
arcpy.CheckOutExtension("GeoStats")

# Allow overwriting output
arcpy.env.overwriteOutput = True

### Set shared parameters
# Set input and output locations
directory = "C:/data/"
outgdb = directory + "out.gdb/"
arcpy.env.workspace = directory
# Three interpolation results to compare
myGALayers = ["EBK", "Universal Kriging", "Kernel Interpolation"]
# Exclude results with error reductions under 25%
exclCrit = [["MIN_PERC_ERROR", 25]]
# Output geostatistical layer with highest rank
outGALayer = "Result With Highest Rank"

### Set weighted average rank parameters
# Output table of ranks and cross validation results
outTable = outgdb + "outWeightedAverageTable"
# Use weighted average rank
compMethod = "AVERAGE_RANK"
# Use all criteria with highest weight to prediction accuracy
weightedCrit = [
            ["ACCURACY", 3],
            ["BIAS", 1],
            ["WORST_CASE", 1],
            ["STANDARD_ERROR", 1],
            ["PRECISION", 1]
               ]

# Compare using weighted average rank
arcpy.ga.CompareGeostatisticalLayers(myGALayers, outTable, outGALayer,
         compMethod, None, None, weightedCrit, exclCrit)



### Set hierarchical sorting parameters
# Output table of ranks and cross validation results
outTable = outgdb + "outHierSortTable"
# Use hierarchical sorting with tolerances
compMethod = "SORTING"
# Compare using highest prediction accuracy with a 10% tolerance
# Break ties by lowest bias
hierCrit = [
            ["ACCURACY", "PERCENT", 10],
            ["BIAS", "PERCENT", None]
           ]

# Compare using hierarchical sorting with tolerances
arcpy.ga.CompareGeostatisticalLayers(myGALayers, outTable, outGALayer,
         compMethod, None, hierCrit, None, exclCrit)

Información de licenciamiento

  • Basic: Requiere Geostatistical Analyst
  • Standard: Requiere Geostatistical Analyst
  • Advanced: Requiere Geostatistical Analyst

Temas relacionados