Utilizar la interpolación de áreas para realizar predicciones polígono a polígono

Disponible con una licencia de Geostatistical Analyst.

Complejidad: PrincipianteRequisitos de datos: Usar sus propios datosObjetivo: El objetivo de este ejercicio es mostrar cómo utilizar la interpolación de área para realizar predicciones de polígonos a polígonos. Este ejercicio también mostrará cómo predecir valores para aquellos polígonos en los que falten datos.

Introducción

Este ejercicio demuestra cómo utilizar la interpolación de área para tomar los datos recopilados en un conjunto de polígonos (los polígonos de origen) y predecir los valores de datos de un nuevo conjunto de polígonos (los polígonos de destino). Los datos de este ejercicio están relacionados con las tasas de obesidad entre los estudiantes de quinto grado del área de Los Ángeles (por motivos de privacidad, se han modificado los datos originales). De cada distrito escolar, se tomaron muestras de cada alumno de quinto grado y se registró el número de alumnos obesos y no obesos (recuerde que no se dispone de datos de la totalidad de los 14 distritos escolares). El objetivo de este ejercicio es tomar las tasas de obesidad recopiladas en el nivel del distrito escolar y predecir los índices de obesidad de los grupos de bloques censales dentro de los distintos distritos. Además, predecirá las tasas de obesidad en los 14 distritos escolares en los que faltan datos.

El siguiente gráfico muestra los distritos escolares de Los Ángeles simbolizados por las tasas de obesidad durante el quinto grado. Las tasas bajas aparecen en azul (que indica las tasas inferiores al 22,5 por ciento) y las tasas de obesidad altas aparecen en rojo (que indica las tasas superiores al 44,7 por ciento), con los colores verde, amarillo y naranja entre estos dos extremos. Los polígonos negros son las zonas en las que faltan datos. A la derecha, se encuentran los grupos de bloques del área de Los Ángeles en los que se desea predecir la tasa de obesidad durante el quinto grado.

Distritos escolares de Los Ángeles (izquierda) y grupos de bloques (derecha)
Distritos escolares de Los Ángeles (izquierda) y grupos de bloques (derecha)

La interpolación de área es un proceso de dos pasos. Primero, se crea una superficie de predicción a partir de los polígonos de origen y, a continuación, esa superficie de predicción se promedia dentro de los polígonos de destino.

Crear una superficie de predicción de tasas de obesidad

El primer paso del flujo de trabajo de interpolación de área es crear una superficie de predicción a partir de las tasas de obesidad recopiladas en los distritos escolares. Dado que la interpolación de área requiere que el modelo se ajuste de forma interactiva, la superficie de predicción se debe crear en Geostatistical Wizard.

Abrir Geostatistical Wizard

  1. Inicie ArcGIS Pro y compruebe que tiene una licencia válida para ArcGIS Geostatistical Analyst extension.
  2. Haga clic en la pestaña Análisis de la cinta y haga clic en el icono Geostatistical Wizard.

Elegir el método e identificar los datos de entrada

  1. En Métodos de estadísticas geográficas, haga clic en Interpolación de área.
  2. Junto a Tipo, elija Índice, ya que le interesa predecir las tasas (es decir, los índices) de obesidad (por ejemplo, en lugar de recuentos de población).
  3. Junto a Dataset de origen, elija child_obesity para especificar la clase de entidad poligonal que contiene las tasas de obesidad de los distritos escolares.
  4. Junto a Campo de recuento, elija 5th_obese.

    Este campo contiene el número de alumnos obesos de quinto grado.

  5. Junto a Campo de población, elija 5th_total.

    Este campo contiene el número total de alumnos de quinto grado.

  6. Deje los valores predeterminados para el segundo dataset, ya que no utilizará ninguna variable secundaria en este ejercicio.

    Panel 1 de Geostatistical Wizard para la interpolación de área
    Panel 1 de Geostatistical Wizard para la interpolación de área

  7. Haga clic en Siguiente para comenzar a crear el modelo de interpolación de área.

Ajustar la variografía

Ahora está viendo la página de variografía. En todo el flujo de trabajo de interpolación de área, este paso es el que más tiempo requiere y es el más importante para obtener unas predicciones precisas. El objetivo es cambiar los parámetros de la derecha para que la mayoría de covarianzas empíricas (cruces azules) caigan dentro de los intervalos de confianza (barras rojas). Si el modelo se especifica correctamente, se espera que aproximadamente el 90 por ciento de las covarianzas empíricas caigan dentro de los intervalos de confianza.

El gráfico que aparece a continuación muestra que el modelo predeterminado no es adecuado; la mayoría de las covarianzas empíricas no caen dentro de los intervalos de confianza. Se requiere un poco de trabajo para que el modelo quede ajustado.

Panel 2 de Geostatistical Wizard
Panel 2 de Geostatistical Wizard
  1. Puede ver que las covarianzas empíricas se vuelven negativas a una distancia de aproximadamente 12.000 metros. Quiere decir que debe empezar cambiando Tamaño de intervalo a 1000 y mantener Número de intervalos en 12. (El producto de estos dos parámetros debe ser aproximadamente igual a la distancia a la cual las covarianzas empíricas empiezan a ser negativas).

    La curva de covarianza mostrada a continuación tiene mejor aspecto, pero el modelo aún se puede mejorar. La covarianza empírica grande en el eje y resulta problemática.

    Panel 2 de Geostatistical Wizard
    Panel 2 de Geostatistical Wizard

  2. Para intentar mejorar este resultado, en Modelo, cambie el tipo de modelo a K de Bessel.

    Este modelo parece ajustarse muy bien a los datos; la mayoría de las covarianzas empíricas caen dentro de los intervalos de confianza y unas cuantas quedan justo fuera de los intervalos. Sin embargo, para confirmar que este modelo sea adecuado, debe comprobar los resultados de la validación cruzada.

    Panel 2 de Geostatistical Wizard
    Panel 2 de Geostatistical Wizard

  3. Haga clic en Siguiente para ver el panel Vecindad de búsqueda.

Modificar la vecindad de búsqueda

El panel Vecindad de búsqueda muestra una vista previa de la superficie de las tasas de obesidad en el quinto grado. Al hacer clic en un punto de la vista previa de superficie, puede obtener la tasa de obesidad predicha en ese punto. Por ejemplo, en el gráfico siguiente, la ubicación del punto de mira tiene un valor predicho de 0,333177. Significa que el modelo predice que cualquier estudiante de quinto grado de esa ubicación presenta aproximadamente una probabilidad del 33 por ciento de ser obesa.

Panel 3 de Geostatistical Wizard
Panel 3 de Geostatistical Wizard
  1. Haga clic en Siguiente para mostrar el panel Validación cruzada.

Examinar las estadísticas de validación cruzada

  1. Haga clic en la pestaña Diagrama cuantil-cuantil normal.

    Panel 4 de Geostatistical Wizard
    Panel 4 de Geostatistical Wizard

    Puede ver que el valor Root-Mean-Square Standardized es de 1,1475. Es bueno que así sea, ya que este número debería estar cerca de 1 en una situación ideal. El diagrama cuantil-cuantil normal también revela que los errores estándar están cerca de estar distribuidos normalmente porque los puntos quedan cerca de la línea de uno a uno. Este es el modelo que utilizará para realizar su predicción.

  2. Haga clic en Finalizar y, a continuación, haga clic en Aceptar en el cuadro de diálogo Informe de método.

    La superficie de predicción de la tasa de obesidad se muestra en el mapa. Dependiendo de su análisis, es posible que esta superficie de tasa de obesidad sea todo lo que necesite. En ese caso, el flujo de trabajo puede terminar aquí. Sin embargo, desea predecir las tasas de obesidad de los alumnos de quinto grado en el nivel de grupo de bloques, de modo que seguirá hasta la segunda mitad de este flujo de trabajo de interpolación de área.

    Superficie de tasa de obesidad para estudiantes de quinto grado de Los Ángeles
    Superficie de tasa de obesidad para los alumnos de quinto grado de Los Ángeles

    Nota:

    La capa del gráfico anterior se ha recortado al área de interés y se ha cambiado su nombre a 5th grade obesity.

Predecir tasas de obesidad en grupos de bloques censales

Una vez creada una superficie de predicción adecuada con la interpolación de área, la superficie se puede usar para predecir las tasas de obesidad en el quinto grado en los grupos de bloques de Los Ángeles mediante la herramienta de geoprocesamiento De capa de interpolación de área a polígonos.

  1. Haga clic con el botón derecho en la capa 5th grade obesity, expanda el menú Exportar capa y elija A polígonos para abrir el cuadro de diálogo de la herramienta De capa de interpolación de área a polígonos.

    Predecir a polígonos

    Nota:

    La herramienta De capa de interpolación de área a polígonos también está disponible desde el conjunto de herramientas Trabajar con capas de estadísticas geográficas de la caja de herramientas Herramientas de Geostatistical Analyst.

  2. Compruebe que Capa de estadísticas geográficas de interpolación de área de entrada tenga seleccionada la capa 5th degree obesity.
  3. Haga clic en la flecha desplegable Entidades poligonales de entrada y, a continuación, haga clic en LA_blocks para especificar la clase de entidad poligonal de los grupos de bloques de Los Ángeles.
  4. Haga clic en el botón Examinar de Clase de entidad poligonal de salida, vaya a la ubicación en la que desea guardar la salida y escriba LA_blocks_obesity como nombre de la clase de entidad poligonal de salida.
  5. Compruebe que Incorporar todos los campos de las entidades de entrada esté activado, ya que desea traspasar todos los campos de la clase de entidad LA_blocks.

    Cuadro de diálogo de la herramienta de geoprocesamiento De capa de interpolación de área a polígonos
    Cuadro de diálogo de la herramienta de geoprocesamiento De capa de interpolación de área a polígonos

  6. Haga clic en Aceptar para ejecutar la herramienta.

    Se agrega al mapa la clase de entidad poligonal que contiene las predicciones de las tasas de obesidad de quinto grado en los grupos de bloques de Los Ángeles. El campo que contiene las tasas de obesidad predichas está etiquetado como Predicho. Además, los errores estándar de la predicción se almacenan en un campo etiquetado como StdError.

    Tasas de obesidad predichas para alumnos de quinto grado en grupos de bloques de Los Ángeles
    Tasas de obesidad predichas para alumnos de quinto grado en grupos de bloques de Los Ángeles

    Nota:

    La simbología del gráfico anterior se ha importado de las tasas de obesidad de los distritos escolares para conseguir una comparación visual equitativa.

  7. También puede simbolizar los grupos de bloques mediante el error estándar de las tasas de obesidad predichas. Los errores estándar se almacenan en el campo StdError de LA_blocks_obesity. De esta forma, puede crear márgenes de error para las tasas de obesidad predichas.

    Los errores estándar bajos se simbolizan en tonos más claros de rojo. Los grupos de bloques más grandes tienden a presentar errores estándar más pequeños, ya que las áreas más grandes cuentan con más información asociada y, en consecuencia, la incertidumbre de las predicciones es menor.

    Errores estándar para las tasas de obesidad en los grupos de bloques de Los Ángeles
    Errores estándar para las tasas de obesidad en los grupos de bloques de Los Ángeles

Con esto se completa el flujo de trabajo para predecir las tasas de obesidad de quinto grado en los grupos de bloques de Los Ángeles a partir de las tasas muestreadas en los distritos escolares.

Predecir las tasas de obesidad en los distritos escolares en los que faltan datos

Para predecir las tasas de obesidad de los distritos escolares en los que faltan datos, volverá a utilizar la herramienta de geoprocesamiento De capa de interpolación de área a polígonos.

  1. Haga clic con el botón derecho en la capa 5th grade obesity, expanda el menú Exportar capa y elija A polígonos para abrir el cuadro de diálogo de la herramienta De capa de interpolación de área a polígonos.

    Predecir a polígonos

  2. Compruebe que Capa de estadísticas geográficas de interpolación de área de entrada tenga seleccionada la capa 5th degree obesity.
  3. Haga clic en la flecha de lista desplegable Entidades poligonales de entrada y, a continuación, haga clic en Missing_zones para especificar la clase de entidad poligonal de los distritos escolares en los que faltan datos.
  4. Haga clic en el botón Examinar de Clase de entidad poligonal de salida, vaya a la ubicación en la que desea guardar la salida y escriba Missing_zones_obesity como nombre de la clase de entidad poligonal de salida.
  5. Compruebe que Incorporar todos los campos de las entidades de entrada esté activado, ya que desea traspasar todos los campos de la clase de entidad Missing_zones.

    Cuadro de diálogo de la herramienta de geoprocesamiento De capa de interpolación de área a polígonos
    Cuadro de diálogo de la herramienta de geoprocesamiento De capa de interpolación de área a polígonos

  6. Haga clic en Aceptar para ejecutar la herramienta.

    Se agrega al mapa la clase de entidad poligonal que contiene las predicciones de las tasas de obesidad de quinto grado en los distritos escolares de Los Ángeles de los que no se tienen datos. El campo que contiene las tasas de obesidad predichas está etiquetado como Predicho. Además, los errores estándar de la predicción se almacenan en un campo etiquetado como StdError.

    Tasas de obesidad predichas para alumnos de quinto grado de los distritos escolares ausentes
    Tasas de obesidad predichas para alumnos de quinto grado de los distritos escolares ausentes

    Nota:

    La simbología se ha importado de las tasas de obesidad de los distritos escolares.

Ha completado el flujo de trabajo para predecir las tasas de obesidad en quinto grado en los distritos escolares de Los Ángeles en los que faltaban datos.

Puede cerrar ArcGIS Pro sin guardar los resultados.

Referencia acerca de los datos

  • Rosenshein, L. "The Local Nature of a National Epidemic: Childhood Overweight and the Accessibility of Healthy Food." tesis de Máster, Universidad George Mason, Departamento de Geografía y Ciencias de la Geoinformación, Fairfax, Virginia, EE. UU., 2010.

Temas relacionados