Vecindades de búsqueda

Disponible con una licencia de Geostatistical Analyst.

Puede asumir que, a medida que las ubicaciones se alejan de la ubicación de predicción, los valores medidos tienen menos autocorrelación espacial con la ubicación de predicción. Dado que estos puntos tienen poco o ningún efecto en el valor predicho, se pueden eliminar del cálculo de ese punto de predicción concreto definiendo una vecindad de búsqueda. También es posible que las ubicaciones distantes tengan una influencia perjudicial en el valor predicho si se encuentran en un área que tiene características distintas de las de la ubicación de predicción. Una tercera razón para usar vecindades de búsqueda es la velocidad del cómputo. Si tiene 2.000 ubicaciones de datos, la matriz sería demasiado grande para invertir y no sería posible generar un valor predicho. Cuanto menor sea la vecindad de búsqueda, más rápidamente se pueden generar los valores predichos. Como resultado, es una práctica habitual limitar el número de puntos utilizados en una predicción especificando una vecindad de búsqueda.

La forma especificada de la vecindad restringe hasta dónde y en qué lugar se buscarán los valores medidos que se usarán en la predicción. Otros parámetros adicionales restringen las ubicaciones que se utilizan en la vecindad de búsqueda. La vecindad de búsqueda se puede modificar cambiando su tamaño y su forma o cambiando el número de vecinos que incluye.

La forma de la vecindad se ve influenciada por los datos de entrada y la superficie que está intentando crear. Si no hay influencias direccionales en la autocorrelación espacial de los datos (consulte Tener en cuenta las influencias direccionales para obtener más información), deseará utilizar los puntos por igual en todas las direcciones y la forma de la vecindad de búsqueda es un círculo. Sin embargo, si hay autocorrelación direccional o una tendencia en los datos, es posible que desee que la forma de la vecindad sea una elipse orientada con el eje mayor paralelo a la dirección de la autocorrelación de largo alcance (la dirección en la que los valores de los datos son más similares).

La vecindad de búsqueda se puede especificar en Geostatistical Wizard, como se muestra en el siguiente ejemplo:

  • Tipo de vecindad: estándar
  • Máximo de vecinos = 4
  • Mínimo de vecinos = 2
  • Tipo de sector (estrategia de búsqueda): cuatro sectores con desplazamiento de 45°; radio = 182955,6

Vecindad de búsqueda
Paso de vecindad de búsqueda

Los pesos que se utilizan para estimar el valor en la ubicación marcada por el punto de mira en la vista previa de superficie se muestran en la imagen anterior. Los puntos de datos con los mayores pesos se resaltan en rojo.

Una vez que se especifica una forma de vecindad, puede restringir qué ubicaciones contenidas en la forma se deben usar. Puede definir el número de vecinos máximo y mínimo que se debe incluir y dividir la vecindad en sectores para garantizar que se incluyen valores de todas las direcciones. Si divide la vecindad en sectores, el número de vecinos máximo y mínimo especificado se aplica a cada sector.

Hay varios tipos de sectores diferentes que se pueden utilizar:

  • Un sector
  • Elipse con cuatro sectores
  • Elipse con cuatro sectores y un desplazamiento de 45 grados
  • Ocho sectores

Kriging usa la configuración de datos especificada por la vecindad de búsqueda junto con el modelo de semivariograma ajustado; los pesos de las ubicaciones medidas se pueden determinar. Mediante los pesos y los valores medidos, se puede realizar una predicción para la ubicación de la predicción. Este proceso se realiza para cada ubicación del área de estudio con el fin de crear una superficie continua. Otros métodos de interpolación siguen el mismo proceso, pero los pesos se determinan con técnicas en las que no interviene ningún modelo de semivariograma.

La cantidad máxima de vecinos que se pueden utilizar depende del método de interpolación. Para un solo sector, la cantidad máxima de vecinos para cada método es la siguiente:

  • Interpolación de área: 200 vecinos
  • Interpolación de difusión con barreras: sin límite en el número de vecinos
  • Kriging bayesiano empírico: 64 vecinos
  • EBK Regression Prediction: 64 vecinos
  • Interpolación polinómica global: no utiliza ninguna vecindad de búsqueda
  • Distancia inversa ponderada: 1.000 vecinos
  • Interpolación kernel con barreras: sin límite en el número de vecinos
  • Kriging (distinto de kriging bayesiano empírico): 200 vecinos
  • Interpolación polinómica local: 1.000 vecinos
  • Funciones de base radial: 64 vecinos

El número máximo de vecinos se ve afectado cuando se utilizan distintos números de sectores; por ejemplo, cuando se utilizan cuatro sectores, se divide el número de vecinos entre cuatro, para ocho sectores, se divide el número entre ocho.

La opción Suavizar interpolación crea tres elipses. La elipse central utiliza los valores Semieje mayor y Semieje menor. La elipse interior utiliza estos valores de semieje multiplicados por 1 menos el valor del factor de suavizado, mientras que la elipse exterior utiliza los valores de semieje multiplicados por 1 más el factor de suavizado. Todos los puntos dentro de estas tres elipses se utilizan en la interpolación. Los puntos dentro de la elipse más pequeña tienen pesos asignados a ellos de la misma manera que para la interpolación estándar (por ejemplo, si el método utilizado es la interpolación ponderada por el inverso de la distancia, los puntos dentro de la elipse interior se ponderan en función de su distancia desde la ubicación de predicción). Los puntos que se encuentran entre la elipse interior y la elipse exterior obtienen pesos según se describe para los puntos que se encuentran dentro de la elipse interior, pero los pesos se multiplican por un valor sigmoideo que disminuye desde 1 (para puntos situados justo fuera de la elipse interior) a 0 (para puntos situados justo fuera de la elipse exterior). Los puntos de datos fuera de la elipse exterior tienen peso cero en la interpolación. A continuación, se muestra un ejemplo de esto:

Vista previa de superficie con pesos de puntos de datos
Vista previa de superficie con pesos de puntos de datos

Las excepciones a las descripciones anteriores son las siguientes:

  • Interpolación de área, que solo admite un sector.
  • El kriging bayesiano empírico y EBK Regression Prediction, que requieren una vecindad de búsqueda circular; por lo tanto, Semieje mayor y Semieje menor se han reemplazado por Radio. El valor del radio representa la longitud del radio del círculo de búsqueda.
  • Kriging bayesiano empírico 3D, que requiere una vecindad de búsqueda 3D y admite 1, 4, 6, 8, 12 y 20 sectores.

En Geostatistical Analyst, los pesos de todos los modelos sin kriging vienen definidos por funciones analíticas a priori basadas en la distancia desde la ubicación de predicción. La mayoría de los modelos de kriging predicen un valor usando la suma ponderada de los valores de las ubicaciones cercanas. Kriging usa el semivariograma para definir los pesos que determinan la contribución de cada punto de datos a la predicción de los nuevos valores en las ubicaciones sin muestrear. Debido a esto, la vecindad de búsqueda predeterminada utilizada en kriging se construye usando los rangos mayor y menor del modelo de semivariograma.

Se espera que una superficie continua se cree a partir de datos continuos, como las observaciones de temperatura. Sin embargo, todos los interpoladores con una vecindad de búsqueda local generan predicciones (y errores estándar de la predicción) que pueden ser sustancialmente diferentes para las ubicaciones cercanas si las vecindades locales son distintas. Para ver una representación gráfica de por qué sucede, consulte Suavizar interpolación.

Nota:

Un modelo que utilice la opción de suavizar interpolación no puede predecir valores si la vecindad de búsqueda no contiene ningún punto de datos, por lo que puede haber áreas del mapa que queden vacías.

Temas relacionados