Interpolación exploratoria (Geostatistical Analyst)

Resumen

Genera varios resultados de interpolación a partir de entidades de punto de entrada y un campo. Los resultados de la interpolación se comparan a continuación y se clasifican mediante criterios personalizables basados en estadísticas de validación cruzada.

Los resultados de interpolación se pueden clasificar según un único criterio (como la precisión de predicción más alta o el sesgo más bajo), las clasificaciones de promedio ponderado de varios criterios o la ordenación jerárquica de varios criterios (donde los empates en cada uno de los criterios se rompen por los criterios posteriores de la jerarquía). También se pueden usar criterios de exclusión se pueden usar para excluir los resultados de interpolación de la comparación que no cumplen con los estándares de calidad mínimos. La salida es una tabla que resume las estadísticas de validación cruzada y clasificaciones para cada resultado de la interpolación. Opcionalmente, puede generar una capa de estadísticas geográficas del resultado de interpolación con la clasificación más alta para usarla en flujos de trabajo posteriores.

Ilustración

Ilustración de la herramienta Interpolación exploratoria
Se generan, comparan y clasifican varios métodos de interpolación.

Uso

  • La validación cruzada es un método estadístico basado en "dejar un elemento fuera" para evaluar los resultados de la interpolación. El método elimina secuencialmente cada punto del dataset y utiliza los puntos restantes para predecir el valor del punto excluido. A continuación, la predicción de la validación cruzada se compara con el valor real del punto oculto, y la diferencia entre ambos es el error de validación cruzada (el error puede ser positivo o negativo). El motivo de la validación cruzada es que, si el resultado de interpolación es eficaz a la hora de predecir los valores de los puntos ocultos, también debe ser eficaz a la hora de predecir valores desconocidos en ubicaciones nuevas, lo cual es el objetivo de la interpolación. Todos los criterios utilizados por esta herramienta se basan en estadísticas de resumen de los resultados de la validación cruzada.

    Aunque evaluar los resultados de interpolación mediante estadísticas de resumen de validación cruzada es una forma cómoda y eficaz de comparar varios resultados de interpolación, no reemplaza al conocimiento experto de los datos ni a la investigación interactiva de los resultados. La revisión de gráficos y los errores individuales de validación cruzada suele revelar patrones en los resultados que no resultan obvios con las estadísticas de resumen. Por ejemplo, a menudo existen patrones espaciales en los errores de validación cruzada donde algunas áreas están subestimadas y otras áreas están sobrestimadas; es posible que los patrones de este tipo no se representen mediante estadísticas de resumen.

    Más información sobre cómo utilizar la validación cruzada para evaluar los resultados de interpolación

  • El parámetro Método de comparación tiene tres opciones para comparar las estadísticas de validación cruzada de los resultados de interpolación. Cada opción tiene sus ventajas y desventajas:

    • Criterio único: se utiliza un criterio único para comparar y clasificar los resultados. Puede clasificar los resultados por precisión de predicción más alta, sesgo más bajo, error más bajo con los peores valores posibles, precisión de error estándar más alta o precisión más alta. El criterio se proporciona en el parámetro Criterio.
      • Ventajas: esta opción es un método simple y común para comparar los resultados de interpolación que se sabe que son estables y coherentes. También es útil para elegir entre los resultados que son muy similares.
      • Desventajas: los resultados de la interpolación muchas veces funcionan bien con algunos criterios, pero no con otros; por ejemplo, al tener una precisión de predicción alta, pero también un sesgo alto. En este caso, al clasificar por un único criterio, se asignarán clasificaciones altas a resultados que son inestables o confusos. Cuando se clasifica por un único criterio, se recomienda utilizar varias opciones del parámetro Criterios de exclusión para garantizar que los resultados inestables o confusos se eliminen antes de la comparación.
    • Ordenación jerárquica con tolerancias: la ordenación jerárquica se utiliza para comparar y clasificar los resultados. Se especifican varios criterios en orden de prioridad (el de mayor prioridad primero) en el parámetro Jerarquía de criterios. Los resultados de interpolación se clasifican por el primer criterio, y los empates se rompen por el segundo criterio. Los empates en el segundo criterio se rompen por el tercer criterio, y así sucesivamente. Este proceso se modela después de Orden personalizado y la ordenación jerárquica en el software de hoja de cálculo (ordenar por A, luego por B, luego por C, etc.). Sin embargo, las estadísticas de validación cruzada son valores continuos y generalmente no tienen empates exactos, de modo que se pueden especificar tolerancias (porcentaje o absoluto) para crear empates en cada uno de los criterios.
      • Ventajas: esta opción utiliza varios criterios y tiene en cuenta las diferencias relativas de las estadísticas de validación cruzada. Por ejemplo, si un resultado de interpolación es mucho mejor que el resto según el criterio de mayor prioridad, el resultado de la interpolación recibirá la clasificación más alta independientemente de los criterios posteriores de la jerarquía.
      • Desventajas: la eficacia de la ordenación jerárquica depende de los valores de tolerancia proporcionados. Si las tolerancias son demasiado pequeñas, es posible que no se utilicen algunos criterios porque no hay empates que romper. Si las tolerancias son demasiado grandes, puede haber muchos empates en las clasificaciones porque muchos resultados están dentro de las tolerancias de los demás.
    • Clasificación de promedio ponderado: la clasificación de promedio ponderado de varios criterios se utiliza para comparar y clasificar los resultados. En el parámetro Criterios ponderados se especifican varios criterios y las ponderaciones asociadas. Los resultados de interpolación se clasifican independientemente por cada uno de los criterios, y se utiliza un promedio ponderado de las clasificaciones para determinar las clasificaciones finales. Los criterios con ponderaciones más grandes tendrán más influencia en las clasificaciones finales, por lo que se pueden utilizar para indicar la preferencia de ciertos criterios sobre otros.
      • Ventajas: esta opción utiliza varios criterios, permite preferencias de algunos criterios sobre otros y siempre utiliza todos los criterios en la comparación.
      • Desventajas: se ignoran las diferencias relativas en los valores de las estadísticas de validación cruzada. Por ejemplo, todos los valores de error cuadrático medio pueden estar dentro de una tolerancia muy pequeña entre sí (lo que indica que todos los resultados tienen una precisión de predicción aproximadamente igual), pero se seguirán clasificando de 1 a N por precisión de predicción (para los N resultados de interpolación). Sin embargo, los valores de error medio pueden variar en grandes cantidades entre los resultados (lo que indica que los resultados tienen grandes diferencias en sus sesgos), pero también se clasificarán de 1 a N según el criterio de sesgo. El promedio ponderado utiliza solo las clasificaciones de los criterios, por lo que las diferencias relativas en las estadísticas de validación cruzada se ignoran en la clasificación.

  • La salida es una tabla que resume las estadísticas de validación cruzada, descripciones de los resultados de interpolación y clasificaciones, y se puede incluir en una presentación o informe. Las estadísticas de validación cruzada solo se incluirán en la tabla si se aplican al menos a un resultado de interpolación. Por ejemplo, si solo se utilizan la ponderación de distancia inversa y las funciones de base radial, la tabla de salida no contendrá un campo de valores de error estándar promedio porque estos métodos no calculan errores estándar. Si una estadística se aplica a algunos resultados de interpolación, pero no a otros, el valor será nulo para los resultados a los que no se aplica la estadística. Además, si se elige Kriging bayesiano empírico como Método de interpolación, se incluirán varias estadísticas de validación cruzada en la tabla que no se utilizan en ningún criterio de esta herramienta; se incluirán con fines informativos y tendrán valores nulos para todos los demás métodos de interpolación. Si se utiliza la clasificación de promedio ponderado, las clasificaciones de todos los criterios y su promedio ponderado también se incluirán en la tabla.

    Opcionalmente, puede usar el parámetro Generar capa de estadísticas geográficas con la clasificación más alta para crear una capa de estadísticas geográficas con los resultados de interpolación que presenten la clasificación más alta. De esta forma, puede asignar el mejor resultado de la interpolación y utilizarlo en otros flujos de trabajo.

  • Mientras se ejecuta la herramienta, los mensajes de geoprocesamiento y los mensajes de la barra de progreso muestran el resultado de interpolación actual que se está calculando. Una vez calculados y comparados todos los resultados, las clasificaciones se imprimen como mensajes de geoprocesamiento. Las clasificaciones también están disponibles en la tabla de validación cruzada de salida.

  • La herramienta Comparar capas geoestadísticas realiza las mismas comparaciones de validación cruzada que esta herramienta, pero realiza las comparaciones sobre resultados de interpolación previamente creados (capas geoestadísticas).

  • En la siguiente tabla se enumeran los criterios disponibles, las estadísticas de validación cruzada que los mide y las fórmulas utilizadas para asignar una puntuación a cada resultado de interpolación (las puntuaciones más bajas son mejores). Las clasificaciones de los criterios se determinan ordenando las puntuaciones de cada resultado de interpolación.

    Nota:

    Para tres de los criterios, la puntuación es igual a la estadística de validación cruzada.

    CriteriosEstadística de validación cruzadaFórmula de puntuación

    Precisión de predicción más alta

    Error cuadrático medio

    Los resultados se clasifican por el error cuadrático medio más bajo.

    Score = RootMeanSquareError

    Sesgo más bajo

    Error medio

    Los resultados se clasifican por el error medio más cercano a cero.

    Score = AbsoluteValue( MeanError )

    Error más bajo con los peores valores posibles

    Error absoluto máximo

    Los resultados se clasifican por el error absoluto máximo más bajo.

    Score = MaximumAbsoluteError

    Precisión de error estándar más alta

    Error cuadrático medio estandarizado

    Los resultados se clasifican por el error cuadrático medio estandarizado más cercano a uno.

    Score = AbsoluteValue( RMSStdError - 1 )

    Precisión más alta

    Error estándar promedio

    Los resultados se clasifican por el error estándar promedio más bajo.

    Score = AverageStandardError

  • Si hay empates en cualquier criterio, todos los resultados del empate reciben la misma clasificación, igual a la mayor de las clasificaciones compartidas entre ellos (donde una clasificación más alta significa un número de clasificación más bajo). Por ejemplo, ordenados de mejor a peor, los valores de error cuadrático medio (12, 14, 14, 15, 16, 16, 18) recibirán las clasificaciones (1, 2, 2, 4, 5, 5, 7) por el criterio de precisión de la predicción. Las clasificaciones 3 y 6 se omiten por los valores empatados.

    Se pueden producir empates en varias fases de las comparaciones. Los empates son más habituales cuando se utiliza la ordenación jerárquica, porque todos los resultados dentro de la tolerancia se consideran empatados entre sí, y todos los resultados fuera de la tolerancia también se consideran empatados entre sí. Los empates también son comunes en la clasificación de promedio ponderado cuando los resultados de la interpolación tienen clasificaciones variables según distintos criterios, lo que puede dar lugar a promedios ponderados iguales en las clasificaciones. Aunque es inusual, también pueden producirse empates en comparaciones de criterios únicos (por ejemplo, si todos los puntos tienen un valor constante). Los empates por un solo criterio también afectarán a la clasificación de promedio ponderado si los criterios se usan en el promedio ponderado.

  • En la ordenación jerárquica, proporcione las tolerancias relativas a la puntuación del criterio en lugar de la estadística de validación cruzada. Para los criterios en los que la puntuación es igual a la estadística (precisión de predicción más alta, error más bajo con los peores valores posibles y precisión más alta), los valores de tolerancia apropiados generalmente son claros. Por ejemplo, si el valor de error cuadrático medio más bajo de los resultados de interpolación es 200, una tolerancia de porcentaje de 10 incluirá todos los resultados con valores de error cuadrático medio menores o iguales que 220: 200 + (10/100) x 200 = 220. Del mismo modo, una tolerancia absoluta de 15 incluirá todos los resultados con valores de error cuadrático medio menores o iguales que 215: 200 + 15 = 215.

    Sin embargo, para los criterios en los que la puntuación no es igual al valor de la estadística (sesgo más bajo y precisión de error estándar más alta), los valores de tolerancia adecuados son menos claros. Para la estadística de error medio, el sesgo se puntúa por el valor absoluto del error medio. Esto significa, por ejemplo, que los valores de error medio -4 y 6 tienen una diferencia relativa del 50 por ciento porque son un 50 por ciento diferentes en el valor absoluto: ABS(-4) + (50/100) x ABS(-4) = ABS(6). Del mismo modo, su diferencia absoluta es 2: ABS(-4) + 2 = ABS(6).

    Para la estadística de error cuadrático medio estandarizado, la precisión de error estándar se puntúa por la diferencia absoluta entre el valor de error cuadrático medio estandarizado y el valor ideal de 1. Significa, por ejemplo, que los valores de error cuadrático medio estandarizado 0,2 y 2,4 tienen una diferencia relativa del 75 por ciento. Para comprender por qué, al comparar los valores 0,2 y 2,4, este último está 1,75 veces más lejos (un aumento del 75 por ciento) del valor ideal de 1 que el anterior (diferencias absolutas de 0,8 y 1,4, respectivamente): ABS(0.2 - 1) + (75/100) x ABS(0.2 - 1) = ABS(2.4 - 1). Del mismo modo, su diferencia absoluta es 0,6: ABS(0.2 - 1) + 0.6 = ABS(2.4 - 1).

  • Varios criterios exigen que todos los resultados de la interpolación admitan el tipo de salida de error estándar. De forma predeterminada, las opciones de los parámetros de Métodos de interpolación permiten todas las opciones para todos los parámetros. Sin embargo, si se especifica la opción Ponderación de distancia inversa. Funciones de base radial o Interpolación polinómica global, varias opciones de varios parámetros no estarán disponibles, ya que estos métodos no permiten calcular los errores estándar de las predicciones. Las opciones que no están disponibles están relacionadas con la precisión de error estándar, la precisión, la estadística de error cuadrático medio estandarizado o la estadística de error estándar promedio.

    Más información sobre qué métodos de interpolación permiten calcular errores estándar de predicciones

  • La opción Reducción de error del porcentaje mínimo del parámetro Criterios de exclusión es particularmente útil cuando no conoce los valores o el rango de los puntos que se interpolan (por ejemplo, en un entorno automatizado). Esta opción excluye los resultados de interpolación que no sean bastante más precisos que un modelo no espacial de línea base que predice el valor promedio global en todas las ubicaciones del mapa. Esta precisión relativa se mide comparando el valor del error cuadrático medio con la desviación estándar de los valores de los puntos que se interpolan, y el error cuadrático medio debe ser al menos el porcentaje especificado más bajo que la desviación estándar para incluirlo en la comparación. Por ejemplo, un valor de 10 significa que el error cuadrático medio debe ser al menos un 10 por ciento más bajo que la desviación estándar para incluirlo en la comparación y clasificación.

    Diferentes disciplinas tienen diferentes estándares respecto a las reducciones de errores admisibles en los resultados de interpolación. En las ciencias físicas con mediciones con un muestreo denso, los errores a menudo se reducen en más del 90 por ciento. Sin embargo, en las ciencias sociales, para los investigadores muchas veces resultan significativas reducciones de errores de solo el 10-20 por ciento.

  • Cada opción del parámetro Métodos de interpolación genera entre 1 y 5 resultados de interpolación. De forma predeterminada, se generan 11 resultados. Si se eligen todas las opciones, se generarán 20 resultados. La siguiente tabla muestra los 20 valores posibles del campo Description del valor de Tabla de validación cruzada de salida junto con más detalles acerca del resultado. Para investigar más a fondo cualquiera de los resultados, la tercera columna proporciona los pasos para crear una capa geoestadística del resultado mediante Geostatistical Wizard.

    Nota:

    En las instrucciones para crear el resultado de la interpolación, se supone que se ha abierto Geostatistical Wizard, se ha elegido el método de interpolación en el panel de la izquierda y se han proporcionado los puntos y el campo en el panel de la derecha. Para el kriging simple, ordinario y universal, el tipo de kriging se especifica en la segunda página del asistente; en la primera página, utilice Kriging/CoKriging para los tres tipos. Si las instrucciones comienzan en una página concreta del asistente, haga clic en Siguiente para llegar a esa página sin cambiar ningún parámetro. Al final de las instrucciones, haga clic en Finalizar y en Aceptar para agregar el resultado de la interpolación al mapa.

    Valor de campoDescripciónCreación

    Kriging simple - Predeterminado

    Un modelo de kriging simple con parámetros predeterminados. De forma predeterminada, el kriging simple utiliza una transformación.

    No se necesitan cambios.

    Kriging simple - Optimizado

    Un modelo de kriging simple con parámetros optimizados.

    En la página de semivariograma (página 4), haga clic en el botón Optimizar modelo Optimizar.

    Kriging simple - Tendencia

    Un modelo de kriging simple con eliminación de tendencias y sin transformación.

    En la segunda página, cambie Tipo de transformación a Ninguno, y cambie Orden de eliminación de tendencias a Primero.

    Kriging simple - Tendencia y transformación

    Un modelo de kriging simple con eliminación de tendencias y con una transformación.

    En la segunda página, cambie Orden de eliminación de tendencias a Primero.

    Kriging ordinario - Predeterminado

    Un modelo de kriging ordinario con parámetros predeterminados.

    No se necesitan cambios.

    Kriging ordinario - Optimizado

    Un modelo de kriging ordinario con parámetros optimizados.

    En la página de semivariograma (página 4), haga clic en el botón Optimizar modelo Optimizar.

    Kriging universal - Predeterminado

    Un modelo de kriging universal con eliminación de tendencias de primer orden y parámetros predeterminados.

    En la segunda página, cambie Orden de eliminación de tendencias a Primero.

    Kriging universal - Optimizado

    Un modelo universal de kriging con eliminación de tendencias de primer orden y parámetros optimizados.

    En la segunda página, cambie Orden de eliminación de tendencias a Primero. En la página de semivariograma (página 4), haga clic en el botón Optimizar modelo Optimizar.

    Kriging bayesiano empírico - Predeterminado

    Un modelo de kriging bayesiano empírico con parámetros predeterminados.

    No se necesitan cambios.

    Kriging bayesiano empírico - Avanzado

    Un modelo de kriging bayesiano empírico avanzado que utiliza subconjuntos más amplios, eliminación de tendencias y más superposición y simulaciones.

    En la segunda página, cambie los siguientes parámetros a los valores mostrados:

    • Tamaño de subconjunto: 200
    • Factor de superposición: 300
    • Número de simulaciones: 2
    • Transformación: Empirica
    • Tipo de semivariograma: K de Bessel sin tendencia

    Interpolación de kernel (polinómica local)

    Un modelo de interpolación kernel (polinómina local) con parámetros predeterminados.

    No se necesitan cambios. Tanto Interpolación kernel como Interpolación polinómica local están disponibles en la primera página. Estos métodos utilizan la interpolación kernel, pero puede esperar resultados similares de la interpolación polinomial local, ya que los métodos son similares.

    Ponderación de distancia inversa - Predeterminado

    Un modelo de ponderación de distancia inversa con un valor de potencia igual a 2 (predeterminado).

    No se necesitan cambios.

    Ponderación de distancia inversa - Optimizada

    Un modelo de ponderación de distancia inversa con un valor de potencia optimizado.

    En la segunda página, haga clic en el botón Optimizar Optimizar que aparece junto al parámetro Potencia.

    Funciones de base radial - Spline completamente regularizada

    Un modelo de funciones de base radial que utiliza una función kernel de spline completamente regularizada.

    No se necesitan cambios. La spline completamente regularizada es la función kernel predeterminada para las funciones de base radial.

    Funciones de base radial - Spline con tensión

    Un modelo de funciones de base radial mediante una spline con función kernel de tensión.

    En la segunda página, cambie el parámetro Función kernel a Spline con tensión.

    Funciones de base radial - Multicuadrático

    Un modelo de funciones de base radial que utiliza una función kernel multicuadrática.

    En la segunda página, cambie el parámetro Función kernel a Multicuadrático.

    Funciones de base radial - Multicuadrático inverso

    Un modelo de funciones de base radial que utiliza una función kernel multicuadrática inversa.

    En la segunda página, cambie el parámetro Función kernel a Multicuadrático inverso.

    Funciones de base radial - Spline de lámina delgada

    Un modelo de funciones de base radial que utiliza una función kernel de lámina delgada.

    En la segunda página, cambie el parámetro Función kernel a Spline de lámina delgada.

    Interpolación polinómica global - Segundo orden

    Un modelo global de interpolación polinómica con tendencia de segundo orden (cuadrática).

    En la segunda página, cambie el parámetro Orden de los polinomios a 2.

    Interpolación polinómica global - Tercer orden

    Un modelo global de interpolación polinómica con tendencia de tercer orden (cúbica).

    En la segunda página, cambie el parámetro Orden de los polinomios a 3.

Parámetros

EtiquetaExplicaciónTipo de datos
Entidades de entrada

Los puntos de entrada que representan las ubicaciones de los puntos que se desea interpolar.

Feature Layer
Campo de valor

El campo que contiene los valores que se desea interpolar.

Field
Tabla de validación cruzada de salida

La tabla de salida que contiene estadísticas de validación cruzada y clasificaciones para cada resultado de interpolación. Las clasificaciones finales de los resultados de interpolación se almacenan en el campo RANK.

Table
Generar capa de estadísticas geográficas con la clasificación más alta
(Opcional)

La capa de estadísticas geográficas de salida del resultado de interpolación con la clasificación más alta. Este resultado de interpolación tendrá el valor 1 en el campo RANK de la tabla de validación cruzada de salida. Si hay empates para el resultado de interpolación con la clasificación más alta o si todos los resultados se excluyen por criterios de exclusión, la capa no se creará aunque se proporcione un valor. La herramienta devolverá mensajes de advertencia si esto sucede.

Geostatistical Layer
Métodos de interpolación
(Opcional)

Especifica los métodos de interpolación que se realizarán sobre las entidades de entrada y el campo de valores. Para cada método especificado, se generarán entre 1 y 5 resultados de interpolación. De forma predeterminada, se generan todos los métodos, excepto la ponderación de distancia inversa, las funciones de base radial y el polinomio global (debido a que estos métodos no permiten crear errores estándar de predicción). De forma predeterminada, se generarán 11 resultados de interpolación. Si se especifican todas las opciones, se generarán 20 resultados de interpolación.

  • Kriging simpleSe generarán cuatro resultados de kriging simples: predeterminado, optimizado, eliminación de tendencias y transformación con eliminación de tendencias.
  • Kriging ordinarioSe generarán dos resultados de kriging ordinario: predeterminado y optimizado.
  • Kriging universalSe generarán dos resultados de kriging universal: predeterminado y optimizado.
  • Kriging bayesiano empíricoSe generarán dos resultados de kriging bayesiano empírico: predeterminado y avanzado.
  • Interpolación de kernel (polinómica local)Se generará un resultado de interpolación kernel predeterminado (polinomio local).
  • Ponderación de distancia inversaSe generarán dos resultados de ponderación de distancia inversa: predeterminada y optimizada.
  • Funciones de base radialSe generarán cinco resultados de funciones de base radial, uno para cada una de las cinco funciones kernel.
  • Interpolación polinómica globalSe generarán dos resultados globales de interpolación polinómica: tendencia lineal (primer orden) y cuadrática (segundo orden).
String
Método de comparación
(Opcional)

Especifica el método que se utilizará para comparar y clasificar los resultados de interpolación.

  • Criterio únicoSe usará un único criterio para comparar y clasificar los resultados, como la precisión de predicción más alta o el sesgo más bajo. Se utiliza el criterio del parámetro Criterio.
  • Ordenación jerárquica con toleranciasSe utilizará la ordenación jerárquica para comparar los resultados. Se especifican varios criterios en orden de prioridad (el de mayor prioridad primero) en el parámetro Jerarquía de criterios. Los resultados de interpolación se clasifican por el primer criterio, y los empates se rompen por el segundo criterio. Los empates en el segundo criterio se rompen por el tercer criterio, y así sucesivamente. Las estadísticas de validación cruzada son valores continuos y generalmente no tienen empates exactos, de modo que se pueden especificar tolerancias (porcentaje o absoluto) para crear empates en cada uno de los criterios.
  • Clasificación de promedio ponderadoLa clasificación de promedio ponderado de varios criterios se utilizará para comparar los resultados. Con el parámetro Criterios ponderados se especifican varios criterios y las ponderaciones asociadas. Los resultados de interpolación se clasifican independientemente por cada uno de los criterios, y se utiliza un promedio ponderado de las clasificaciones para determinar las clasificaciones finales. Los criterios con ponderaciones más grandes tendrán más influencia en las clasificaciones finales, por lo que se pueden utilizar ponderaciones para indicar la preferencia de ciertos criterios sobre otros.
String
Criterio
(Opcional)

Especifica el criterio que se utilizará para clasificar los resultados de interpolación.

  • Precisión de predicción más altaLos resultados se clasificarán por el error cuadrático medio más bajo. Esta opción mide la precisión de la coincidencia entre las predicciones de validación cruzada y los valores reales, de media. Esta es la opción predeterminada.
  • Sesgo más bajoLos resultados se clasificarán por el error medio más cercano a cero. Esta opción mide el grado en que las predicciones de validación cruzada predicen los valores reales en exceso o defecto, de media. Los resultados de interpolación con errores medios positivos sistemáticamente predicen los valores reales (sesgo positivo) en exceso, y los resultados con errores medios negativos sistemáticamente predicen los valores reales (sesgo negativo) en defecto.
  • Error más bajo con los peores valores posiblesLos resultados se clasificarán por el error absoluto máximo más bajo. Esta opción mide solo la única predicción de validación cruzada menos precisa (positivo o negativo). Resulta útil cuando lo que más le preocupa son las situaciones con los peores valores posibles en lugar de la precisión de las condiciones típicas.
  • Precisión de error estándar más altaLos resultados se clasificarán por el error cuadrático medio estandarizado más cercano a uno. Esta opción mide el grado de coincidencia entre la variabilidad de las predicciones de validación cruzada y los errores estándar estimados. Resulta útil si tiene pensado crear intervalos de confianza o márgenes de error para las predicciones.
  • Precisión más altaLos resultados se clasificarán por el error estándar medio más bajo. Al crear intervalos de confianza o márgenes de error para los valores predichos, los resultados con mayor precisión tendrán intervalos más reducidos alrededor de las predicciones. No mide si los errores estándar se estiman con precisión, solo que los errores estándar son pequeños. Al utilizar esta opción, se recomienda incluir los valores de error cuadrático medio estandarizado mínimo y máximo como criterios de exclusión para garantizar que los errores estándar sean precisos y exactos.
String
Jerarquía de criterios
(Opcional)

La jerarquía de los criterios que se utilizará para la ordenación jerárquica con tolerancias. Proporcione varios criterios en orden de prioridad, siendo el primero el más importante. Los resultados de interpolación se clasifican por el primer criterio, y los empates se rompen por el segundo criterio. Los empates en el segundo criterio se rompen por el tercer criterio, y así sucesivamente. Las estadísticas de validación cruzada son valores continuos y generalmente no tienen empates exactos, de modo que se utilizan tolerancias para inducir a empates en los criterios. Para cada fila, especifique un criterio en la primera columna, un tipo de tolerancia (porcentaje o absoluto) en la segunda columna y un valor de tolerancia en la tercera columna. Si no se proporciona un valor de tolerancia, no se utilizará ninguna tolerancia; resulta de gran utilidad para la fila final, de modo que no haya empates para el resultado de interpolación con la clasificación más alta.

Para cada fila (nivel de la jerarquía), están disponibles los siguientes criterios:

  • Error cuadrático medio (Precisión): los resultados se clasificarán por la precisión más alta.
  • Error medio (Sesgo): los resultados se clasificarán por el sesgo más bajo.
  • Error absoluto máximo (Error con los peores valores posibles): los resultados se clasificarán por el error más bajo con los peores valores posibles.
  • RMSE estandarizado (Precisión de error estándar): los resultados se clasificarán por la precisión de error estándar más alta.
  • Error estándar medio (Precisión): los resultados se clasificarán por la precisión más alta.

Por ejemplo, puede especificar un valor de Error cuadrático medio (Precisión) con una tolerancia del 5 por ciento en la primera fila y un valor de Error medio (Sesgo) sin tolerancia en la segunda fila. Estas opciones clasificarán primero los resultados de interpolación por el error cuadrático medio más bajo (precisión de predicción más alta), y todos los resultados de interpolación cuyos valores de error cuadrático medio se encuentren dentro del 5 por ciento del resultado más preciso serán considerados empates por la precisión de la predicción. Entre los resultados empatados, el resultado con un error medio más cercano a cero (sesgo más bajo) recibirá la clasificación más alta.

Value Table
Criterios ponderados
(Opcional)

Los diversos criterios con ponderaciones que se utilizarán para clasificar los resultados de la interpolación. Para cada fila, proporcione un criterio y una ponderación. Los resultados de interpolación se clasificarán independientemente por cada uno de los criterios, y se utilizará un promedio ponderado de las clasificaciones para determinar las clasificaciones finales de los resultados de interpolación.

  • Precisión de predicción más alta: los resultados se clasificarán por el error cuadrático medio más bajo.
  • Sesgo más bajo: los resultados se clasificarán por el error medio más cercano a cero.
  • Error con los peores valores posibles: los resultados se clasificarán por el error absoluto máximo más bajo.
  • Precisión de error estándar más alta: los resultados se clasificarán por el error cuadrático medio estandarizado más cercano a uno.
  • Precisión más alta: los resultados se clasificarán por el error estándar medio más bajo.

Value Table
Criterios de exclusión
(Opcional)

Los criterios y los valores asociados que se utilizarán para excluir los resultados de interpolación de la comparación. Los resultados excluidos no recibirán clasificaciones y tendrán el valor No en el campo Included de la tabla de validación cruzada de salida.

  • Error cuadrático medio máximo: los resultados se excluirán si el error cuadrático medio supera el valor especificado. El valor no puede ser negativo. Esta opción mide la precisión de predicción.
  • Error absoluto máximo: los resultados se excluirán si el error absoluto máximo supera el valor especificado. El valor no puede ser negativo. Esta opción mide el peor error posible.
  • Error cuadrático medio estandarizado máximo: los resultados se excluirán si el error cuadrático medio estándar supera el valor especificado. El valor debe ser mayor o igual que 1. Esta opción mide la precisión de error estándar.
  • Error cuadrático medio estandarizado mínimo: los resultados se excluirán si el error cuadrático medio estandarizado no supera el valor especificado. El valor debe estar comprendido entre 0 y 1. Esta opción mide la precisión de error estándar.
  • Error medio máximo: los resultados se excluirán si el error medio supera el valor especificado. El valor no puede ser negativo. Esta opción mide el sesgo.
  • Error medio mínimo: los resultados se excluirán si el error medio no supera el valor especificado. El valor no puede ser positivo. Esta opción mide el sesgo.
  • Error estándar promedio máximo: los resultados se excluirán si el error estándar promedio supera el valor especificado. El valor no puede ser negativo. Esta opción mide la precisión.
  • Reducción de error del porcentaje mínimo: los resultados se excluirán si el resultado de interpolación no es bastante más preciso que un modelo no espacial de línea base que predice el valor medio global en todas las ubicaciones del mapa. Esta precisión relativa se mide comparando el valor del error cuadrático medio con la desviación estándar de los valores de los puntos que se interpolan, y el error cuadrático medio debe ser al menos el porcentaje especificado más bajo que la desviación estándar para incluirlo en la comparación. Por ejemplo, un valor de 10 significa que el error cuadrático medio debe ser al menos un 10 por ciento más bajo que la desviación estándar para incluirlo en la comparación y clasificación. El valor debe estar comprendido entre 0 y 100. Esta opción mide la precisión de predicción.

Value Table

arcpy.ga.ExploratoryInterpolation(in_features, value_field, out_cv_table, {out_geostat_layer}, {interp_methods}, {comparison_method}, {criterion}, {criteria_hierarchy}, {weighted_criteria}, {exclusion_criteria})
NombreExplicaciónTipo de datos
in_features

Los puntos de entrada que representan las ubicaciones de los puntos que se desea interpolar.

Feature Layer
value_field

El campo que contiene los valores que se desea interpolar.

Field
out_cv_table

La tabla de salida que contiene estadísticas de validación cruzada y clasificaciones para cada resultado de interpolación. Las clasificaciones finales de los resultados de interpolación se almacenan en el campo RANK.

Table
out_geostat_layer
(Opcional)

La capa de estadísticas geográficas de salida del resultado de interpolación con la clasificación más alta. Este resultado de interpolación tendrá el valor 1 en el campo RANK de la tabla de validación cruzada de salida. Si hay empates para el resultado de interpolación con la clasificación más alta o si todos los resultados se excluyen por criterios de exclusión, la capa no se creará aunque se proporcione un valor. La herramienta devolverá mensajes de advertencia si esto sucede.

Geostatistical Layer
interp_methods
[interp_methods,...]
(Opcional)

Especifica los métodos de interpolación que se realizarán sobre las entidades de entrada y el campo de valores. Para cada método especificado, se generarán entre 1 y 5 resultados de interpolación. De forma predeterminada, se generan todos los métodos, excepto la ponderación de distancia inversa, las funciones de base radial y el polinomio global (debido a que estos métodos no permiten crear errores estándar de predicción). De forma predeterminada, se generarán 11 resultados de interpolación. Si se especifican todas las opciones, se generarán 20 resultados de interpolación.

  • SIMPLE_KRIGINGSe generarán cuatro resultados de kriging simples: predeterminado, optimizado, eliminación de tendencias y transformación con eliminación de tendencias.
  • ORDINARY_KRIGINGSe generarán dos resultados de kriging ordinario: predeterminado y optimizado.
  • UNIVERSAL_KRIGINGSe generarán dos resultados de kriging universal: predeterminado y optimizado.
  • EBKSe generarán dos resultados de kriging bayesiano empírico: predeterminado y avanzado.
  • KERNEL_INTERPOLATIONSe generará un resultado de interpolación kernel predeterminado (polinomio local).
  • IDWSe generarán dos resultados de ponderación de distancia inversa: predeterminada y optimizada.
  • RBFSe generarán cinco resultados de funciones de base radial, uno para cada una de las cinco funciones kernel.
  • GPISe generarán dos resultados globales de interpolación polinómica: tendencia lineal (primer orden) y cuadrática (segundo orden).
String
comparison_method
(Opcional)

Especifica el método que se utilizará para comparar y clasificar los resultados de interpolación.

  • SINGLESe usará una única estadística de validación cruzada para comparar y clasificar los resultados, como la precisión de predicción más alta o el sesgo más bajo. Se utiliza el criterio del parámetro criterion.
  • SORTINGSe utilizará la ordenación jerárquica para comparar los resultados. Se especifican varios criterios en orden de prioridad (el de mayor prioridad primero) en el parámetro criteria_hierarchy. Los resultados de interpolación se clasifican por el primer criterio, y los empates se rompen por el segundo criterio. Los empates en el segundo criterio se rompen por el tercer criterio, y así sucesivamente. Las estadísticas de validación cruzada son valores continuos y generalmente no tienen empates exactos, de modo que se pueden especificar tolerancias (porcentaje o absoluto) para crear empates en cada uno de los criterios.
  • AVERAGE_RANKLa clasificación de promedio ponderado de varios criterios se utilizará para comparar los resultados. En el parámetro weighted_criteria se especifican varios criterios y las ponderaciones asociadas. Los resultados de interpolación se clasifican independientemente por cada uno de los criterios, y se utiliza un promedio ponderado de las clasificaciones para determinar las clasificaciones finales. Los criterios con ponderaciones más grandes tendrán más influencia en las clasificaciones finales, por lo que se pueden utilizar ponderaciones para indicar la preferencia de ciertos criterios sobre otros.
String
criterion
(Opcional)

Especifica el criterio que se utilizará para clasificar los resultados de interpolación.

  • ACCURACYLos resultados se clasificarán por el error cuadrático medio más bajo. Esta opción mide la precisión de la coincidencia entre las predicciones de validación cruzada y los valores reales, de media. Esta es la opción predeterminada.
  • BIASLos resultados se clasificarán por el error medio más cercano a cero. Esta opción mide el grado en que las predicciones de validación cruzada predicen los valores reales en exceso o defecto, de media. Los resultados de interpolación con errores medios positivos sistemáticamente predicen los valores reales (sesgo positivo) en exceso, y los resultados con errores medios negativos sistemáticamente predicen los valores reales (sesgo negativo) en defecto.
  • WORST_CASELos resultados se clasificarán por el error absoluto máximo más bajo. Esta opción mide solo la única predicción de validación cruzada menos precisa (positivo o negativo). Resulta útil cuando lo que más le preocupa son las situaciones con los peores valores posibles en lugar de la precisión de las condiciones típicas.
  • STANDARD_ERRORLos resultados se clasificarán por el error cuadrático medio estandarizado más cercano a uno. Esta opción mide el grado de coincidencia entre la variabilidad de las predicciones de validación cruzada y los errores estándar estimados. Resulta útil si tiene pensado crear intervalos de confianza o márgenes de error para las predicciones.
  • PRECISIONLos resultados se clasificarán por el error estándar medio más bajo. Al crear intervalos de confianza o márgenes de error para los valores predichos, los resultados con mayor precisión tendrán intervalos más reducidos alrededor de las predicciones. No mide si los errores estándar se estiman con precisión, solo que los errores estándar son pequeños. Al utilizar esta opción, se recomienda incluir los valores de error cuadrático medio estandarizado mínimo y máximo como criterios de exclusión para garantizar que los errores estándar sean precisos y exactos.
String
criteria_hierarchy
[[criteria1, tol_type1, tol_val1], [criteria2, tol_type2, tol_val2],...]
(Opcional)

La jerarquía de los criterios que se utilizará para la ordenación jerárquica con tolerancias. Proporcione varios criterios en orden de prioridad, siendo el primero el más importante. Los resultados de interpolación se clasifican por el primer criterio, y los empates se rompen por el segundo criterio. Los empates en el segundo criterio se rompen por el tercer criterio, y así sucesivamente. Las estadísticas de validación cruzada son valores continuos y generalmente no tienen empates exactos, de modo que se utilizan tolerancias para inducir a empates en los criterios. Para cada fila, especifique un criterio en la primera columna, un tipo de tolerancia (porcentaje o absoluto) en la segunda columna y un valor de tolerancia en la tercera columna. Si no se proporciona un valor de tolerancia, no se utilizará ninguna tolerancia; resulta de gran utilidad para la fila final, de modo que no haya empates para el resultado de interpolación con la clasificación más alta.

Para cada fila (nivel de la jerarquía), están disponibles los siguientes criterios:

  • ACCURACY: los resultados se clasificarán por la precisión más alta.
  • BIAS: los resultados se clasificarán por el sesgo más bajo.
  • WORST_CASE: los resultados se clasificarán por el error más bajo con los peores valores posibles.
  • STANDARD_ERROR: los resultados se clasificarán por la precisión de error estándar más alta.
  • PRECISION: los resultados se clasificarán por la precisión más alta.

Por ejemplo, puede especificar un valor de ACCURACY con una tolerancia del 5 por ciento en la primera fila y un valor de BIAS sin tolerancia en la segunda fila. Estas opciones clasificarán primero los resultados de interpolación por el error cuadrático medio más bajo (precisión de predicción más alta), y todos los resultados de interpolación cuyos valores de error cuadrático medio se encuentren dentro del 5 por ciento del resultado más preciso serán considerados empates por la precisión de la predicción. Entre los resultados empatados, el resultado con un error medio más cercano a cero (sesgo más bajo) recibirá la clasificación más alta.

Value Table
weighted_criteria
[[criteria1, weight1], [criteria2, weight2],...]
(Opcional)

Los diversos criterios con ponderaciones que se utilizarán para clasificar los resultados de la interpolación. Para cada fila, proporcione un criterio y una ponderación. Los resultados de interpolación se clasificarán independientemente por cada uno de los criterios, y se utilizará un promedio ponderado de las clasificaciones para determinar las clasificaciones finales de los resultados de interpolación.

  • ACCURACY: los resultados se clasificarán por el error cuadrático medio más bajo.
  • BIAS: los resultados se clasificarán por el error medio más cercano a cero.
  • WORST_CASE: los resultados se clasificarán por el error absoluto máximo más bajo.
  • STANDARD_ERROR: los resultados se clasificarán por el error cuadrático medio estandarizado más cercano a uno.
  • PRECISION: los resultados se clasificarán por el error estándar medio más bajo.

Value Table
exclusion_criteria
[[criteria1, value1], [criteria2, value2],...]
(Opcional)

Los criterios y los valores asociados que se utilizarán para excluir los resultados de interpolación de la comparación. Los resultados excluidos no recibirán clasificaciones y tendrán el valor No en el campo Included de la tabla de validación cruzada de salida.

  • MAX_RMSE: los resultados se excluirán si el error cuadrático medio supera el valor especificado. El valor no puede ser negativo. Esta opción mide la precisión de predicción.
  • MAX_WORST_CASE: los resultados se excluirán si el error absoluto máximo supera el valor especificado. El valor no puede ser negativo. Esta opción mide el peor error posible.
  • MAX_STD_RMSE: los resultados se excluirán si el error cuadrático medio estándar supera el valor especificado. El valor debe ser mayor o igual que 1. Esta opción mide la precisión de error estándar.
  • MIN_STD_RMSE: los resultados se excluirán si el error cuadrático medio estandarizado no supera el valor especificado. El valor debe estar comprendido entre 0 y 1. Esta opción mide la precisión de error estándar.
  • MAX_MEAN_ERROR: los resultados se excluirán si el error medio supera el valor especificado. El valor no puede ser negativo. Esta opción mide el sesgo.
  • MIN_MEAN_ERROR: los resultados se excluirán si el error medio no supera el valor especificado. El valor no puede ser positivo. Esta opción mide el sesgo.
  • MAX_ASE: los resultados se excluirán si el error cuadrático medio supera el valor especificado. El valor no puede ser negativo. Esta opción mide la precisión.
  • MIN_PERC_ERROR: los resultados se excluirán si el resultado de interpolación no es bastante más preciso que un modelo no espacial de línea base que predice el valor medio global en todas las ubicaciones del mapa. Esta precisión relativa se mide comparando el valor del error cuadrático medio con la desviación estándar de los valores de los puntos que se interpolan, y el error cuadrático medio debe ser al menos el porcentaje especificado más bajo que la desviación estándar para incluirlo en la comparación. Por ejemplo, un valor de 10 significa que el error cuadrático medio debe ser al menos un 10 por ciento más bajo que la desviación estándar para incluirlo en la comparación y clasificación. El valor debe estar comprendido entre 0 y 100. Esta opción mide la precisión de predicción.

Value Table

Muestra de código

Ejemplo 1 de ExploratoryInterpolation (ventana de Python)

En el siguiente script de Python se muestra cómo utilizar la función ExploratoryInterpolation.

# Interpolate points using Simple Kriging, Universal Kriging, and EBK
# Rank results by highest prediction accuracy
# Exclude results with error reductions under 25%

inPoints = "myPoints"
inField = "myField"
outTable = "outCVtable"
outGALayer = "Result With Highest Rank"
interpMethods = ["SIMPLE_KRIGING", "UNIVERSAL_KRIGING", "EBK"]
compMethod = "SINGLE"
criterion = "ACCURACY"
exclCrit = [["MIN_PERC_ERROR", 25]]
arcpy.ga.ExploratoryInterpolation(inPoints, inField, outTable, outGALayer,
         interpMethods, compMethod, criterion, None, None, exclCrit)
Ejemplo 2 de ExploratoryInterpolation (script independiente)

En el siguiente script de Python se muestra cómo utilizar la función ExploratoryInterpolation.

# Interpolate points and a field using various interpolation methods
# Rank results by highest weighted average rank
# Rank same results by hierarchical sorting

# Import system modules
import arcpy

# Check out the ArcGIS Geostatistical Analyst extension license
arcpy.CheckOutExtension("GeoStats")

# Allow overwriting output
arcpy.env.overwriteOutput = True

### Set shared parameters
# Set input and output locations
directory = "C:/data/"
ingdb = directory + "data.gdb/"
outgdb = directory + "out.gdb/"
arcpy.env.workspace = directory
# Input points
inPoints = ingdb + "myPoints"
# Input field
inField = "myField"
# List of interpolation methods
interpMethods = ["SIMPLE_KRIGING", "UNIVERSAL_KRIGING", "EBK"]
# Exclude results with error reductions under 25%
exclCrit = [["MIN_PERC_ERROR", 25]]
# Output geostatistical layer with highest rank
outGALayer = "Result With Highest Rank"

### Set weighted average rank parameters
# Output table of ranks and cross validation results
outTable = directory + "outWeightedAverageTable"
# Use weighted average rank
compMethod = "AVERAGE_RANK"
# Use all criteria with highest weight to prediction accuracy
weightedCrit = [
            ["ACCURACY", 3],
            ["BIAS", 1],
            ["WORST_CASE", 1],
            ["STANDARD_ERROR", 1],
            ["PRECISION", 1]
               ]

# Compare using weighted average rank
arcpy.ga.ExploratoryInterpolation(inPoints, inField, outTable, outGALayer,
         interpMethods, compMethod, None, None, weightedCrit, exclCrit)



### Set hierarchical sorting parameters
# Output table of ranks and cross validation results
outTable = directory + "outHierSortTable"
# Use hierarchical sorting with tolerances
compMethod = "SORTING"
# Compare using highest prediction accuracy with a 10% tolerance
# Break ties by lowest bias
hierCrit = [
            ["ACCURACY", "PERCENT", 10],
            ["BIAS", "PERCENT", None]
           ]

# Compare using hierarchical sorting with tolerances
arcpy.ga.ExploratoryInterpolation(inPoints, inField, outTable, outGALayer,
         interpMethods, compMethod, None, hierCrit, None, exclCrit)

Información de licenciamiento

  • Basic: Requiere Geostatistical Analyst
  • Standard: Requiere Geostatistical Analyst
  • Advanced: Requiere Geostatistical Analyst

Temas relacionados