Predecir con archivo de modelo de estadística espacial (Estadística espacial)—ArcGIS Pro

Resumen

Predice valores continuos o de categorías con un modelo de estadísticas espaciales entrenado (archivo .ssm).

Más información sobre los archivos de modelo de estadística espacial

Uso

A continuación se ofrecen escenarios de uso de esta herramienta de ejemplo:
- Para un modelo de clasificación y regresión basadas en bosque entrenado sobre la presencia de posidonia mediante numerosas variables explicativas medioambientales representadas como atributos y rásteres, además de las distancias hasta fábricas aguas arriba y puertos importantes, es posible predecir la presencia futura de posidonia basándose en proyecciones futuras de esas variables explicativas medioambientales.
- Un modelo entrenado por un experto se puede compartir con otras personas para hacer predicciones sin compartir datos confidenciales. Por ejemplo, un modelo sobre los niveles de plomo en sangre en niños y el Id. de parcela fiscal de sus viviendas, combinada con atributos a nivel de parcela (por ejemplo, la antigüedad de la vivienda), datos a nivel de censo (por ejemplo, niveles de ingresos y de estudios) y datasets nacionales que reflejen los vertidos tóxicos de plomo y compuestos de plomo, es posible predecir el riesgo de exposición al plomo para las parcelas sin datos sobre el nivel de plomo en sangre. Estas predicciones de riesgos pueden impulsar las políticas y los programas de educación del área.
- Un ecólogo de la vida salvaje ha recopilado datos de campo para ubicaciones de presencia observadas de una especie en peligro. Necesita estimar la presencia de la especie en un área de estudio más amplia y compartir su trabajo con otros investigadores. Mediante las ubicaciones de presencia conocidas y con factores subyacentes como rásteres, el ecólogo puede modelar la presencia de la especie utilizando predicciones de solo presencia y compartir el modelo entrenado sin compartir información confidencial sobre la presencia de la especie. El modelo se puede usar para crear un mapa de las ubicaciones predichas donde es más probable que se encuentren la especie.
El valor del parámetro Archivo de modelo de entrada es un archivo de .ssm creado por varias herramientas del conjunto de herramientas Modelado de relaciones espaciales de la caja de herramientas Estadísticas espaciales. Puede crear el archivo de modelo con las herramientas Regresión lineal generalizada, Clasificación y regresión basadas en bosques y aumentadas y Predicción de solo presencia (MaxEnt) especificando el valor del parámetro Archivo de modelo entrenado de salida en cada herramienta.
Consulte Cómo funciona Regresión lineal generalizada, Cómo funciona Clasificación y regresión basadas en bosques y aumentadas y Cómo funciona Predicción de solo presencia para obtener más información sobre cómo cada modelo hace predicciones para cada tipo de modelo.
Si usa la opción Predecir a entidades del parámetro Tipo de predicción, use el parámetro Entidad predicha de salida para crear una clase de entidad con las predicciones. Si usa la opción Predecir a ráster, utilice el parámetro Superficie de predicción de salida para crear un ráster de los valores predichos.
Para predecir a ráster, el archivo .ssm se debe entrenar solo con rásteres.
Se requiere una licencia de Extensión ArcGIS Spatial Analyst para utilizar un archivo .ssm entrenado con rásteres.
Nota:
Se recomienda que ejecute la herramienta Describir archivo de modelo de estadística espacial antes de ejecutar esta herramienta para obtener información sobre los nombres, tipos, descripciones y unidades de las variables para preparar los datos según corresponda. También puede utilizar el diagnóstico del modelo para evaluar la calidad del archivo de modelo de entrada.
Las variables explicativas pueden provenir de campos, calcularse a partir de entidades de distancia o extraerse de rásteres. La combinación de las variables explicativas debe coincidir con el archivo de modelo de entrada.
Si una variable explicativa o ráster se marca como de categorías al crear el archivo de modelo, el parámetro De categorías se activará y tratará la variable coincidente como de categorías. Puede utilizar la herramienta Describir archivo de modelo de estadística espacial antes de ejecutar esta herramienta para determinar las variables que son de categorías en el archivo de modelo.
Las variables de entrenamiento y predicción deben ser tipos de campo similares. Por ejemplo, todos los tipos de campo numérico pueden emparejarse con todos los demás tipos de campo numérico, pero si el campo de entrenamiento es texto, la variable de predicción correspondiente también deberá ser texto.
Nota:
Se recomienda que defina las unidades de variable antes de hacer coincidir las variables de entrenamiento y predicción. Si el archivo de modelo entrenado y las unidades de la variable de predicción son diferentes, los resultados pueden ser incorrectos. Por ejemplo, si entrena un modelo con una variable de ingresos en dólares estadounidenses, pero hace coincidir esa variable con los ingresos de rupias indias al realizar predicciones, el rango de variables puede ser incoherente entre las variables de entrenamiento y de predicción, lo que genera variables predichas imprecisas.
Esta herramienta también crea mensajes y gráficos que describen el rendimiento del modelo. Para acceder a los mensajes, pase el cursor sobre la barra de progreso y haga clic en el botón emergente o expanda la sección de mensajes del panel Geoprocesamiento. También puede acceder a los mensajes de una ejecución anterior de la herramienta a través del historial de geoprocesamiento. Los mensajes incluyen diagnósticos del modelo y otra información acerca del modelo.
En los mensajes de geoprocesamiento, la tabla Parámetros de modelo describe la variable y el tipo de campo que se van a predecir y las variables explicativas utilizadas para crear el modelo. La tabla también contiene unidades (si se ha definido con la herramienta Establecer propiedades del archivo de modelo de estadística espacial) para cada variable, con el fin de garantizar que se alineen con las variables de predicción cuando se use el modelo para realizar predicciones.
Precaución:
Se recomienda que evalúe el diagnóstico del modelo antes de confiar en los resultados de predicción. Si un modelo se entrenó sin retener ningún dato de validación, no es posible evaluar la precisión de las predicciones.
Precaución:
Al ejecutar la herramienta con ArcPy, el orden y el caso de las variables proporcionadas en las tablas de los valores de los parámetros Variables explicativas coincidentes, Entidades de distancia coincidentes y Rásteres explicativos coincidentes son importantes. Por ejemplo, si tiene dos variables explicativas que representan la temperatura y la humedad, y el valor de temperatura se espera antes del valor de humedad, debe proporcionar las variables en ese orden. Utilice las salidas derivadas de la herramienta Describir archivo de modelo de estadística espacial para obtener el orden correcto de las variables almacenadas en el archivo de modelo de entrada.
Utilice el parámetro Campo para comparar con predicciones para evaluar cómo se comparan las predicciones del modelo con los valores reales observados. Si tiene un campo en las entidades de predicción de entrada con valores observados como true, establézcalo como el valor del parámetro Campo para comparar con predicciones. Esto agregará métricas de evaluación a los mensajes de geoprocesamiento y cambiará la simbología a residuos para la regresión y el estado de precisión para la clasificación.
Cuando se especifica el parámetro Campo para comparar predicciones, la simbología de salida serán los residuos para los análisis de regresión o representará si las predicciones han sido correctas o incorrectas para los análisis de clasificación.
Cuando se especifica el parámetro Campo para comparar predicciones, los mensajes de geoprocesamiento tendrán una tabla de Datos de validación adicional con métricas de evaluación, como la precisión para la clasificación y el R cuadrado para la predicción.

Parámetros

Etiqueta	Explicación	Tipo de datos
Archivo de modelo de entrada	El archivo de modelo de estadística espacial que se utilizará para realizar nuevas predicciones.	File
Tipo de predicción	Especifica el modo de operación que se utilizará. La herramienta puede predecir nuevas entidades o crear una superficie de ráster de predicción. Predecir a entidades—Se generarán predicciones o clasificaciones para las entidades. Se deben proporcionar variables explicativas para que coincidan con las variables utilizadas para entrenar el archivo de modelo de entrada. La salida de esta opción será una clase de entidad y diagnósticos del modelo en la ventana de mensajes. Predecir a ráster—Se generará un ráster de predicción para el área en la que se intersecan los rásteres explicativos. Se deben proporcionar rásteres explicativos para que coincidan con los rásteres utilizados para entrenar el archivo de modelo de entrada. La salida de esta opción será una superficie de predicción y diagnósticos del modelo en la ventana de mensajes.	String
Entidades de predicción de entrada (Opcional)	Clase de entidad que representa las ubicaciones en las que se realizarán predicciones. Esta clase de entidad también debe contener las variables explicativas proporcionadas como campos que se correspondan con las utilizadas para entrenar el modelo de entrada.	Feature Layer
Entidades predichas de salida (Opcional)	La clase de entidad de salida que contiene los resultados de predicción.	Feature Class
Ráster predicho de salida (Opcional)	El ráster de salida que contiene los resultados de predicción. El tamaño de celda predeterminado será el tamaño de celda máximo de los rásteres de entrada.	Raster Dataset
Variables explicativas coincidentes (Opcional)	Una lista de las variables explicativas del modelo de entrada y los campos correspondientes de las entidades de predicción de entrada. Para cada variable explicativa de la columna Training, proporcione el campo de predicción correspondiente en la columna Prediction. La columna Categorical especifica si la variable es de categorías o continua.	Value Table
Entidades de distancia coincidentes (Opcional)	Una lista de las entidades de distancia explicativas del modelo de entrada y las entidades de distancia de predicción correspondientes. Para cada entidad de distancia explicativa de la columna Training, proporcione la entidad de distancia de predicción correspondiente en la columna Prediction.	Value Table
Rásteres explicativos coincidentes (Opcional)	Una lista de los rásteres explicativos del modelo de entrada y los rásteres de predicción correspondientes. Para cada ráster explicativo de la columna Training, proporcione el ráster de predicción correspondiente en la columna Prediction. La columna Categorical especifica si el ráster es de categorías o continuo.	Value Table
Campo para comparar con las predicciones (Opcional)	Un campo del valor del parámetro Entidades de predicción de entrada que contiene los valores reales observados de la variable predicha en la herramienta original que creó el archivo .ssm. Si se especifica el campo, se incluirán métricas de evaluación en los mensajes de la herramienta de geoprocesamiento para evaluar la precisión con la que el modelo predice los valores reales.	Field

arcpy.stats.PredictUsingSSMFile(input_model, prediction_type, {features_to_predict}, {output_features}, {output_raster}, {explanatory_variable_matching}, {explanatory_distance_matching}, {explanatory_rasters_matching}, {field_to_compare})

Nombre	Explicación	Tipo de datos
input_model	El archivo de modelo de estadística espacial que se utilizará para realizar nuevas predicciones.	File
prediction_type	Especifica el modo de operación que se utilizará. La herramienta puede predecir nuevas entidades o crear una superficie de ráster de predicción. PREDICT_FEATURES—Se generarán predicciones o clasificaciones para las entidades. Se deben proporcionar variables explicativas para que coincidan con las variables utilizadas para entrenar el archivo de modelo de entrada. La salida de esta opción será una clase de entidad y diagnósticos del modelo en la ventana de mensajes. PREDICT_RASTER—Se generará un ráster de predicción para el área en la que se intersecan los rásteres explicativos. Se deben proporcionar rásteres explicativos para que coincidan con los rásteres utilizados para entrenar el archivo de modelo de entrada. La salida de esta opción será una superficie de predicción y diagnósticos del modelo en la ventana de mensajes.	String
features_to_predict (Opcional)	Clase de entidad que representa las ubicaciones en las que se realizarán predicciones. Esta clase de entidad también debe contener las variables explicativas proporcionadas como campos que se correspondan con las utilizadas para entrenar el modelo de entrada.	Feature Layer
output_features (Opcional)	La clase de entidad de salida que contiene los resultados de predicción.	Feature Class
output_raster (Opcional)	El ráster de salida que contiene los resultados de predicción. El tamaño de celda predeterminado será el tamaño de celda máximo de los rásteres de entrada.	Raster Dataset
explanatory_variable_matching [[pred1, train1, cat1], [pred2, train2, cat2],...] (Opcional)	Una lista de las variables explicativas del modelo de entrada y los campos correspondientes de las entidades de predicción de entrada. Para cada variable explicativa de la columna Training, proporcione el campo de predicción correspondiente en la columna Prediction. La columna Categorical especifica si la variable es de categorías o continua.	Value Table
explanatory_distance_matching [[pred1, cat1], [pred2, cat2],...] (Opcional)	Una lista de las entidades de distancia explicativas del modelo de entrada y las entidades de distancia de predicción correspondientes. Para cada entidad de distancia explicativa de la columna Training, proporcione la entidad de distancia de predicción correspondiente en la columna Prediction.	Value Table
explanatory_rasters_matching [[pred1, train1, cat1], [pred2, train2, cat2],...] (Opcional)	Una lista de los rásteres explicativos del modelo de entrada y los rásteres de predicción correspondientes. Para cada ráster explicativo de la columna Training, proporcione el ráster de predicción correspondiente en la columna Prediction. La columna Categorical especifica si el ráster es de categorías o continuo.	Value Table
field_to_compare (Opcional)	Un campo del valor del parámetro features_to_predict que contiene los valores reales observados de la variable predicha en la herramienta original que creó el archivo .ssm. Si se especifica el campo, se incluirán métricas de evaluación en los mensajes de la herramienta de geoprocesamiento para evaluar la precisión con la que el modelo predice los valores reales.	Field

Muestra de código

Ejemplo 1 de PredictUsingSSMFile (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función PredictUsingSSMFile.


arcpy.stats.PredictUsingSSMFile(
      "PredictAsthma_Forest.ssm", "PREDICT_FEATURES", 
      "MedicareSpendingData", "Predicted_features", None, 
      "AVERAGE_HCC_SCORE_2010_CAT AVERAGE_HCC_SCORE_2010_CAT true;HOSPBEDSD_INT HOSPBEDSD_INT false;PERCENT_ASTHMA_2010_DBL PERCENT_ASTHMA_2010_DBL false", 
      "Distance_Hospital DF_POLY", "EVANDMAND_RASTER EVANDMAND #")

Ejemplo 2 de PredictUsingSSMFile (script independiente)

El siguiente script independiente de Python muestra cómo utilizar la función PredictUsingSSMFile.

# Predict to Raster using the Predict using spatial statistics model file tool 

# Import system modules.
import arcpy
import os

# Set workspace.
arcpy.env.workspace = r"C:\Analysis"
arcpy.env.overwriteOutput = True

# Read the explanatory raster order and variable names using Describe Spatial 
# Statistics Model File tool.
in_model = "Suitability.ssm"
desc_result = arcpy.stats.DescribeSSMFile(in_model)

# Print the list of explanatory rasters.
print(desc_result[2])

# Split the explanatory raster strings into a list of variable names.
exp_ras = desc_result[2].split(";")

# Set Parameters for prediction.
prediction_type="PREDICT_RASTER"
out_raster= "suitability_predicted_raster.tif"
match_exp_ras0 = "Climate_Bio2050.tif"
match_exp_ras1 = "Climate_Temp2050.tif"
match_exp_ras2 = "Climate_Solar2050.tif"
match_rasters = [[match_exp_ras0, exp_ras[0], None], 
                 [match_exp_ras1, exp_ras[1], None], 
                 [match_exp_ras2, exp_ras[2], None]]

# Run tool.
arcpy.stats.PredictUsingSSMFile(in_model, prediction_type, "", "", out_raster, 
                "", "", match_rasters)

Entornos

Sistema de coordenadas de salida, Factor de procesamiento en paralelo, Tamaño de celda, Extensión, Método de proyección de tamaño de celda, Máscara, Generador de números aleatorios, Alinear ráster

Casos especiales

Generador de números aleatorios: El tipo de generador de números aleatorios que se utiliza siempre es Mersenne Twister.

Información de licenciamiento

Basic: Limitado
Standard: Limitado
Advanced: Limitado

Temas relacionados

¿Algún comentario sobre este tema?