Predicción de solo presencia (MaxEnt) (Estadística espacial)

Resumen

Modela la presencia de un fenómeno dadas las localizaciones de presencia conocidas y las variables explicativas utilizando un enfoque de máxima entropía (MaxEnt). La herramienta proporciona características de salida y rastreos que incluyen la probabilidad de presencia y pueden aplicarse a problemas en los que solo se conoce la presencia y no se conoce la ausencia.

Más información sobre cómo funciona la herramienta de predicción de solo presencia (MaxEnt)

Ilustración

Ilustración de la herramienta de predicción de solo presencia (MaxEnt)

Uso

  • La herramienta funciona con tres entradas principales para crear un modelo de predicción de presencia: ubicaciones de presencia conocidas, un área de estudio en la que la presencia es posible y variables explicativas.

    • El valor del parámetroEntidades de puntos de entrada se utiliza para designar ubicaciones de presencia conocidas de un fenómeno de interés.
    • El área de estudio se caracteriza por puntos de fondo. Los puntos de fondo son ubicaciones distribuidas en el área de estudio donde la presencia del fenómeno de interés puede ser posible, pero se desconoce. Estos los puede crear automáticamente la herramienta o se pueden incluir manualmente con las entidades de puntos de entrada activando el parámetro Contiene puntos de fondo.
    • La herramienta acepta variables explicativas en forma de rásteres, campos y entidades de distancia.

  • La herramienta puede ejecutarse en los dos modos especificados por el parámetro Contiene puntos de fondo:

    • Desactivado: la herramienta se ejecutará solo con puntos de presencia y solo aceptará variables explicativas de orígenes de ráster.
    • Activado: la herramienta se ejecutará con puntos de presencia y de fondo y permitirá que los orígenes de variables explicativas incluyan rásteres, campos de las entidades de punto de entrada y entidades de distancia.

  • La herramienta requiere al menos dos puntos de presencia en las entidades de puntos de entrada para crear un modelo. Si las entidades de entrada contienen puntos de fondo, la herramienta también requiere al menos dos puntos de fondo para crear un modelo.

  • El parámetro Entidades de distancia de entrenamiento explicativas está inactivo si el parámetro Contiene puntos de fondo está desactivado. Para incluir las distancias a las entidades como variables explicativas para datos solo de presencia, los rásteres de distancia se pueden calcular con la herramienta Acumulación de distancia y los rásteres de distancia se pueden incluir en el parámetro Rásteres de entrenamiento explicativos.

  • La resolución espacial de los valores del parámetro Rásteres de entrenamiento explicativos es importante en los siguientes aspectos:

    • Los tamaños de celda tienen un impacto significativo sobre el tiempo de procesamiento. Cuanto mayor sea la resolución del ráster, mayor será el tiempo de procesamiento.
    • La herramienta utilizará los centroides de las celdas de los rásteres para generar puntos de fondo cuando se utilicen datos de silo presencia(el parámetro Contiene puntos de fondo está desactivado). La proporción de puntos de fondo respecto a la presencia de puntos afecta al modelo; se recomienda tener en cuenta el tamaño de las celdas de los rásteres e interrogar a los puntos de fondo resultantes utilizando el parámetro Entidades entrenadas de salida para garantizar que las suposiciones sobre el área de estudio sean adecuadas para su pregunta.
      Nota:

      La herramienta Volver a muestrear se puede utilizar para disminuir la resolución espacial de los rásteres de entrenamiento explicativos.

  • El área de estudio definida, ya sea desde el parámetro Área de estudio o desde las ubicaciones de las entidades de puntos de entrada que incluyen puntos de fondo, contribuye al resultado del modelo. La extensión utilizada determinará qué celdas ráster se utilizan como puntos de fondo. Esto establece las condiciones del entorno que se comparan con las condiciones de presencia y establece una tasa de ocurrencia relativa, que afecta a los resultados de la predicción.

  • Utilice el parámetro Peso relativo de precedencia a fondo para especificar el significado de los puntos de fondo. Use un valor de 100 cuando los puntos de fondo representen ubicaciones con presencia desconocida. Utilice un valor de 1 cuando los puntos de fondo representen ubicaciones con ausencia observada.

    • El valor afecta al funcionamiento del modelo y a las predicciones resultantes de la herramienta. Cuando el valor es cercano a 100, el modelo penaliza cada punto de presencia mal clasificado 100 veces más que cada punto de fondo mal clasificado (suponiendo que no hay ninguna clasificación correcta del fondo) y se aplica el enfoque tradicional MaxEnt. Cuando el valor es 1, el modelo penaliza cada presencia y punto de fondo por igual y es similar a la regresión logística.
    • Se debe utilizar con cuidado un valor de 1 cuando se usa el modo de solo presencia (el parámetro Contiene puntos de fondo está desactivado), ya que la herramienta genera puntos de fondo que se tratan como ausencia y se ponderan de igual manera para proporcionar los puntos de presencia.

  • El sesgo del muestreo es inherente a la mayoría de los datos de presencia y afecta a los resultados del análisis. El parámetro Simplificación espacial se puede utilizar para ayudar a reducir este impacto. Sin embargo, aunque la simplificación espacial es una solución útil para reducir los efectos del sesgo del muestreo, se recomienda utilizar datos de estudios estructurados para minimizar aún más el impacto del sesgo en el muestreo.

  • Los diagnósticos de clasificación están disponibles en los mensajes de geoprocesamiento y en el gráfico Porcentajes de resultados de clasificación que se proporciona con la capa resultante del valor del parámetro Entidades entrenadas de salida. El gráfico muestra una comparación de las clasificaciones observadas y previstas y se puede usar para evaluar la capacidad del modelo de predecir el rendimiento de puntos de presencia conocidos. Por ejemplo, puede evaluar la capacidad del modelo de predecir la presencia centrándose en la parte de puntos de presencia mal clasificados en las entidades de puntos de entrada de entrenamiento. En los casos de uso en los que la predicción sobre puntos de fondo es importante, el gráfico también se puede usar para ver y seleccionar los puntos de fondo que se predice que tienen presencia.

  • La herramienta puede utilizarse de dos maneras. Puede centrarse en el entrenamiento y la evaluación de modelos candidatos, o puede centrarse en predecir probabilidades de presencia a través de un nuevo dataset.

    • Entrenar y evaluar modelos candidatos: ejecute la herramienta sin especificar las salidas para evaluar los diagnósticos del modelo incluidos en los mensajes de geoprocesamiento. Cuando los resultados del diagnóstico parezcan adecuados, especifique un valor del parámetro Entidades entrenadas de salida y utilice los gráficos de diagnóstico de clasificación para evaluar aún más el rendimiento de la predicción en los datos de entrenamiento. Los gráficos incluidos en los valores de los parámetros Tabla de sensibilidad de salida y Tabla de curvas de respuesta de salida son métricas de diagnóstico para los datos de entrenamiento y también resultarán útiles a medida que realiza ajustes y encuentra un modelo adecuado.
    • Predicción: especifique los parámetros de la categoría del parámetro Salidas de predicción para aplicar el modelo a nuevas ubicaciones que no forman parte de los datos de entrenamiento. Los valores de los parámetros Entidades de predicción de entrada y Entidades de predicción de salida representan nuevas ubicaciones de puntos en las que se necesita una predicción. Además de entidades de puntos, se puede crear una superficie de predicción especificando un valor del parámetro Ráster de predicción de salida. Las entidades de predicción y los rásteres de predicción se deben usar junto con las variables explicativas coincidentes en la misma forma que se usó en los datos de entrenamiento (entidades de ráster, campos o distancia).

  • La simplificación espacial puede dar lugar a que los datos de entrenamiento no incluyan todas las entidades de puntos de entrada. Para probar el rendimiento del modelo en todos los puntos cuando se utiliza la simplificación espacial, proporcione la misma clase de entidad para los parámetros Entidades de puntos de entrada y Entidades de predicción de entrada.

  • La herramienta especifica los sistemas de coordenadas para las salidas respetando el sistema de coordenadas de un dataset de entidades utilizado en la ruta de salida. De lo contrario, la herramienta utilizará el sistema de coordenadas especificado en el entorno Sistema de coordenadas de salida. Si no especifica un dataset de entidades o una configuración del entorno, la herramienta utiliza los siguientes enfoques para cada salida:

    • Para los valores de los parámetros Entidades de entrenamiento de salida y Ráster de entrenamiento de salida, la herramienta utiliza el sistema de coordenadas del valor del parámetro Entidades de puntos de entrada.
    • Para el valor del parámetro Entidades de predicción de salida, la herramienta usa el sistema de coordenadas del valor del parámetro Entidades de predicción de entrada.
    • Para el valor del parámetro Ráster de predicción de salida, la herramienta usa el sistema de coordenadas definido por el valor del parámetro Entidades de predicción de salida. Si no se especifican las entidades de predicción de salida, la herramienta usa el sistema de coordenadas del primer ráster proporcionado en el parámetro Rásteres explicativos coincidentes.

  • Las opciones del parámetro Expansiones de variables explicativas (Funciones de base) tienen restricciones. Las opciones Paso suavizado (Bisagra) y Paso discreto (Umbral) se excluyen mutuamente; cuando se selecciona una, no se puede seleccionar la otra. Cuando se especifica una variable explicativa como De categorías, solo se utilizará la opción Original (Lineal).

  • Si el parámetro Transformación de probabilidad de precedencia (Función de vínculo) se ha definido como Logística, se recomienda proporcionar valores cercanos a 1 en el parámetro Peso relativo de la presencia al fondo. La opción Logística es adecuada cuando los puntos de fondo representan ubicaciones de ausencia conocidas y, si se conocen las ausencias, deben ponderarse igual a las ubicaciones de presencia.

  • Si el parámetro Esquema de remuestreo se ha definido como Aleatorio, la herramienta agrupará los datos y validará el rendimiento del modelo en un subconjunto de los datos agrupados. Cada grupo de entrenamiento está sujeto a los mismos requisitos de datos que el modelo más amplio: se requieren al menos dos puntos de presencia y de fondo. Si estos requisitos no se cumplen después de 10 intentos, la herramienta dejará de intentar la validación cruzada y advertirá que la validación cruzada no es posible.

Parámetros

EtiquetaExplicaciónTipo de datos
Entidades de puntos de entrada

Entidades de puntos que representan los lugares en los que se sabe que se produce un fenómeno de interés.

Feature Layer
Contiene puntos de fondo
(Opcional)

Especifica si las entidades de puntos de entrada contienen puntos de fondo.

Si los puntos de entrada no contienen puntos de fondo, la herramienta generará puntos de fondo utilizando celdas en los rásteres de entrenamiento explicativos. La herramienta usa los puntos de fondo para modelar las características del paisaje en ubicaciones desconocidas y compararlas con las características del paisaje en ubicaciones de presencia conocidas. Por lo tanto, los puntos de fondo se pueden considerar como el área de estudio. Por lo general, se trata de ubicaciones donde se desconoce la presencia de un fenómeno de interés. Sin embargo, si se conoce cualquier información acerca de los puntos de fondo, se puede utilizar el parámetro Peso relativo de la precedencia al fondo para indicarlo.

  • Activado: las entidades de puntos de entrada incluyen puntos de fondo.
  • Desactivado: las entidades de puntos de entrada no incluyen puntos de fondo. Esta es la opción predeterminada.
Boolean
Campo Indicador de presencia
(Opcional)

Campo de las entidades de puntos de entrada que contiene valores binarios que indican cada punto como presencia (1) o como fondo (0). El campo debe ser de tipo numérico (tipos Short, Long, Float o Double).

Field
Variables de entrenamiento explicativas
(Opcional)

Lista de campos que representan a las variables explicativas que ayudarán a predecir la probabilidad de presencia. Puede especificar si cada variable es de categorías o numérica. Active la casilla de verificación De categorías vara cada variables que represente una clase o una categoría (como cobertura de suelo).

Value Table
Entidades de distancia de entrenamiento explicativas
(Opcional)

Lista de capas de entidades o clases de entidades que se utilizará para crear automáticamente variables explicativas que representen la distancia desde las entidades de puntos de entrada hasta las entidades de distancia proporcionadas más cercanas. Si las entidades de distancia de entrenamiento explicativas de entrada son polígonos o líneas, los atributos de distancia se calculan como la distancia entre el segmento más cercano y el punto.

Feature Layer
Rásteres de entrenamiento explicativos
(Opcional)

Lista de rásteres que se utilizarán para crear automáticamente variables de entrenamiento explicativas en el modelo cuyos valores se extraen de rásteres. Para cada entidad (puntos de presencia y de fondo) de las entidades de puntos de entrada, el valor de la celda ráster se extrae de esa ubicación exacta.

Se utilizará remuestreo de ráster bilineal al extraer el valor de ráster en el caso de los rásteres continuos. La asignación de vecino más cercano se utilizará al extraer un valor de ráster desde rásteres de categorías.

Puede especificar si cada valor de ráster es de categorías o numérico. Seleccione la casilla de verificación De categorías para cada ráster que represente una clase o categoría (como cobertura de suelo).

Value Table
Expansiones de variables explicativas (Funciones de base)
(Opcional)

Especifica la función de base que se utilizará para transformar las variables explicativas proporcionadas para su uso en el modelo. Si se seleccionan varias funciones base, la herramienta producirá varias variables transformadas e intentará utilizarlas en el modelo.

  • Original (lineal)Se aplicará una transformación lineal a las variables de entrada. Esta es la configuración predeterminada
  • Interacción por pares (Producto)Se utilizará una multiplicación por pares sobre variables explicativas continuas, produciendo variables de interacción. Esta opción solo está disponible cuando se han proporcionado varias variables explicativas.
  • Paso suavizado (Bisagra)Los valores de la variable explicativa continua se convertirán en dos segmentos: un segmento estático (compuesto por ceros o unos) y un segmento de función lineal (aumento o disminución).
  • Paso discreto (Umbral)Los valores de la variable explicativa continua se convertirán en una variable binaria compuesta de ceros y otros.
  • Cuadrado (Cuadrática)Se devolverá el cuadrado de cada valor de variable explicativa continuo.
String
Número de nudos
(Opcional)

Número de nudos que utilizarán las expansiones de la variable explicativa de inicio y umbral. El valor controla cuántos umbrales se crean, que se utilizan para crear múltiples expansiones de variables explicativas utilizando cada umbral. El valor debe estar comprendido entre 2 y 50. El valor predeterminado es 10.

Long
Área de estudio
(Opcional)

Especifica el tipo de área de estudio que se utilizará para definir dónde es posible la presencia cuando las entidades de punto de entrada no contienen puntos de fondo.

  • Envoltura convexaSe utilizará el polígono convexo más pequeño que encierra todos los puntos de presencia en las entidades de puntos de entrada. Esta es la configuración predeterminada
  • Extensión de rásterSe utilizará la extensión de la intersección de los rásteres de entrenamiento explicativos.
  • Área de estudio poligonalSe utilizará un área de estudio personalizada definida por una clase de entidad poligonal.
String
Polígono de área de estudio
(Opcional)

Clase de entidad que contiene los polígonos que definen un área de estudio personalizada. Las entidades de puntos de entrada deben estar situadas dentro del área de estudio personalizada cubierta por las entidades poligonales. Un área de estudio puede estar compuesta por varios polígonos.

Feature Layer
Aplicar simplificación espacial
(Opcional)

Especifica si se va a aplicar la simplificación espacial a los puntos de presencia y fondo antes de entrenar el modelo.

La simplificación espacial ayuda a reducir el sesgo del muestreo quitando los puntos y garantizando que los puntos restantes tengan una distancia mínima de vecino más cercano, definida en el parámetro Cantidad mínima de vecinos más cercanos. La simplificación espacial también se aplica a los puntos de fondo ya sean proporcionados en entidades de puntos de entrada o generados por la herramienta.

  • Activado: se aplicará la simplificación espacial.
  • Desactivado: no se aplicará la simplificación espacial. Esta es la opción predeterminada.
Boolean
Distancia mínima al vecino más cercano
(Opcional)

Distancia mínima entre dos puntos de presencia cualesquiera o dos puntos de fondo cualesquiera cuando se aplica la simplificación espacial.

Linear Unit
Número de iteraciones para simplificación
(Opcional)

Número de ejecuciones que se utilizarán para encontrar la solución óptima de simplificación espacial, tratando de mantener el mayor número posible de puntos de presencia y de fondo, asegurando al mismo tiempo que no haya dos puntos de presencia o dos puntos de fondo dentro del valor especificado del parámetro Distancia mínima al vecino más cercano. El valor mínimo posible es 1 iteración y el máximo posible es 50 iteraciones. El valor predeterminado es 10.

Este parámetro solo se aplica a la simplificación espacial aplicada a los puntos de presencia y de fondo en las entidades de punto de entrada. La simplificación espacial que se aplica a los puntos de fondo generados a partir de celdas ráster se somete a simplificación espacial remuestreando las celdas ráster hasta el valor especificado en el parámetro Distancia mínima más cercana sin tener que iterar para una solución óptima.

Long
Peso relativo de la presencia al fondo
(Opcional)

Valor entre 1 y 100 que especifica el peso relativo de la información de los puntos de presencia con respecto a los puntos de fondo. El valor predeterminado es 100.

Un valor más alto indica que los puntos de presencia son la fuente de información principal; se desconoce si los puntos de fondo representan la presencia o ausencia y los puntos de fondo reciben un peso menor en el modelo. Un valor inferior indica que los puntos de fondo también aportan información valiosa que se puede utilizar junto con los puntos de presencia; se confía más en que los puntos de fondo representan la ausencia y su información puede utilizarse en el modelo como lugares de ausencia.

Long
Transformación de probabilidad de presencia (función de vínculo)
(Opcional)

Especifica la función que convertirá las salidas no delimitadas del modelo a un número entre 0 y 1. Este valor se puede interpretar como la probabilidad de presencia en la ubicación. Cada opción convierte el mismo valor continuo en una probabilidad diferente.

  • C-log-logLos puntos de fondo se tratarán como ubicaciones con presencia desconocida para calcular la probabilidad de presencia. Esta es la configuración predeterminada
  • LogísticaLos puntos de fondo se tratarán como ubicaciones de ausencia.
String
Valor límite de probabilidad de presencia
(Opcional)

Valor límite entre 0,01 y 0,99 que establece las probabilidades que corresponden a la presencia en la clasificación resultante. El valor límite se usa para ayudar a evaluar el rendimiento del modelo usando datos de entrenamiento y puntos de presencia conocidos. Los diagnósticos de clasificación se proporcionan en los mensajes de geoprocesamiento y en las entidades entrenadas de salida.

Double
Entidades de entrenamiento de salida
(Opcional)

Clase de entidad de salida que contendrá todas las entidades y variables explicativas utilizadas en el entrenamiento del modelo.

Feature Class
Ráster de entrenamiento de salida
(Opcional)

Ráster de salida con valores de celda que indican la probabilidad de presencia mediante la función de vínculo seleccionada. El tamaño de celda predeterminado es el máximo de los tamaños de celda de los rásteres de formación explicativos. Solo se puede crear un ráster de entrenamiento de salida si las entidades de punto de entrada no contienen puntos de fondo.

Raster Dataset
Tabla de curvas de respuesta de salida
(Opcional)

Tabla de salida que contendrá diagnósticos del modelo de entrenamiento que indican el efecto de cada variable explicativa sobre la probabilidad de presencia tras tener en cuenta los efectos promedio de todas las demás variables explicativas en el modelo.

La tabla tendrá hasta dos gráficos derivados de gráficos de dependencia parcial: un conjunto de gráficos de líneas para variables continuas y un conjunto de gráficos de barras para las variables de categoría.

Table
Tabla de sensibilidad de salida
(Opcional)

Tabla de salida que contendrá diagnósticos de precisión del modelo de entrenamiento a medida que el valor límite de presencia de probabilidad cambie de 0 a 1.

Table
Entidades de predicción de entrada
(Opcional)

Clase de entidad que representa las ubicaciones en las que se realizarán predicciones. La clase de entidad debe contener cualquier campo de variable explicativa proporcionado que se haya utilizado desde las entidades de puntos de entrada.

Cuando se utiliza la simplificación espacial, se pueden utilizar las entidades de los puntos de entrada originales como entidades de predicción de entrada para recibir una predicción para todo el dataset.

Feature Layer
Entidades de predicción de salida
(Opcional)

Clase de entidad de salida que contendrá los resultados del modelo de predicción aplicado a las entidades de predicción de entrada.

Feature Class
Ráster de predicción de salida
(Opcional)

Ráster de salida que contiene los resultados de predicción en cada celda de los rásteres explicativos coincidentes. El tamaño de celda predeterminado es el máximo de los tamaños de celda de los rásteres de formación explicativos.

Raster Dataset
Variables explicativas coincidentes
(Opcional)

Campos de variables explicativas coincidentes para las entidades de puntos de entrada y las entidades de predicción de entrada.

Value Table
Entidades de distancia coincidentes
(Opcional)

Entidades de distancia coincidentes para el entrenamiento y la predicción.

Value Table
Rásteres explicativos coincidentes
(Opcional)

Rásteres coincidentes para el entrenamiento y la predicción.

Value Table
Permitir predicciones fuera de los rangos de datos
(Opcional)

Especifica si la predicción permitirá extrapolación cuando los valores de la variable explicativa estén fuera del rango de valores utilizado en el entrenamiento.

  • Activado: la predicción permitirá la extrapolación más allá del rango de valores utilizados en el entrenamiento. Esta es la opción predeterminada.
  • Desactivado: la predicción no permitirá la extrapolación más allá del rango de valores utilizado en el entrenamiento.
Boolean
Esquema de remuestreo
(Opcional)

Especifica el método que se usará para realizar la validación cruzada del modelo de predicción. La validación cruzada revierte una parte de los datos durante el entrenamiento del modelo y los utiliza para probar el rendimiento del modelo una vez entrenado.

  • NingunoNo se realizará la validación cruzada. Esta es la configuración predeterminada
  • AleatorioLos puntos se dividirán aleatoriamente en grupos y cada grupo se excluirá una vez al realizar la validación cruzada. El parámetro Número de grupos especifica el número de grupos.
String
Número de grupos
(Opcional)

Número de grupos que se utilizarán en la validación cruzada para el esquema de remuestreo aleatorio. Un campo en las entidades entrenadas de salida indica el grupo al que se asignó cada punto. El valor predeterminado es 3. Se permite un mínimo de 2 grupos y un máximo de 10 grupos.

Long

arcpy.stats.PresenceOnlyPrediction(input_point_features, {contains_background}, {presence_indicator_field}, {explanatory_variables}, {distance_features}, {explanatory_rasters}, {basis_expansion_functions}, {number_knots}, {study_area_type}, {study_area_polygon}, {spatial_thinning}, {thinning_distance_band}, {number_of_iterations}, {relative_weight}, {link_function}, {presence_probability_cutoff}, {output_trained_features}, {output_trained_raster}, {output_response_curve_table}, {output_sensitivity_table}, {features_to_predict}, {output_pred_features}, {output_pred_raster}, {explanatory_variable_matching}, {explanatory_distance_matching}, {explanatory_rasters_matching}, {allow_predictions_outside_of_data_ranges}, {resampling_scheme}, {number_of_groups})
NombreExplicaciónTipo de datos
input_point_features

Entidades de puntos que representan los lugares en los que se sabe que se produce un fenómeno de interés.

Feature Layer
contains_background
(Opcional)

Especifica si las entidades de puntos de entrada contienen puntos de fondo.

Si los puntos de entrada no contienen puntos de fondo, la herramienta generará puntos de fondo utilizando celdas en los rásteres de entrenamiento explicativos. La herramienta usa los puntos de fondo para modelar las características del paisaje en ubicaciones desconocidas y compararlas con las características del paisaje en ubicaciones de presencia conocidas. Por lo tanto, los puntos de fondo se pueden considerar como el área de estudio. Por lo general, se trata de ubicaciones donde se desconoce la presencia de un fenómeno de interés. Sin embargo, si se conoce alguna información sobre los puntos de fondo, se puede utilizar el parámetro relative_weight para indicarlo.

  • PRESENCE_AND_BACKGROUND_POINTSLas entidades de puntos de entrada incluyen puntos de fondo.
  • PRESENCE_ONLY_POINTSLas entidades de puntos de entrada no incluyen puntos de fondo. Esta es la opción predeterminada.
Boolean
presence_indicator_field
(Opcional)

Campo de las entidades de puntos de entrada que contiene valores binarios que indican cada punto como presencia (1) o como fondo (0). El campo debe ser de tipo numérico (tipos Short, Long, Float o Double).

Field
explanatory_variables
[[Variable, Categorical],...]
(Opcional)

Lista de campos que representan a las variables explicativas que ayudarán a predecir la probabilidad de presencia. Puede especificar si cada variable es de categorías o numérica. Especifique la opción De categorías para cada variable que represente una clase o categoría (como cobertura de suelo).

Value Table
distance_features
[distance_features,...]
(Opcional)

Lista de capas de entidades o clases de entidades que se utilizará para crear automáticamente variables explicativas que representen la distancia desde las entidades de puntos de entrada hasta las entidades de distancia proporcionadas más cercanas. Si las entidades de distancia de entrenamiento explicativas de entrada son polígonos o líneas, los atributos de distancia se calculan como la distancia entre el segmento más cercano y el punto.

Feature Layer
explanatory_rasters
[[Variable, Categorical],...]
(Opcional)

Lista de rásteres que se utilizarán para crear automáticamente variables de entrenamiento explicativas en el modelo cuyos valores se extraen de rásteres. Para cada entidad (puntos de presencia y de fondo) de las entidades de puntos de entrada, el valor de la celda ráster se extrae de esa ubicación exacta.

Se utilizará remuestreo de ráster bilineal al extraer el valor de ráster en el caso de los rásteres continuos. La asignación de vecino más cercano se utilizará al extraer un valor de ráster desde rásteres de categorías.

Puede especificar si cada valor de ráster es de categorías o numérico. Especifique la opción De categorías para cada ráster que represente una clase o categoría (como cobertura de suelo).

Value Table
basis_expansion_functions
[basis_expansion_functions,...]
(Opcional)

Especifica la función de base que se utilizará para transformar las variables explicativas proporcionadas para su uso en el modelo. Si se seleccionan varias funciones base, la herramienta producirá varias variables transformadas e intentará utilizarlas en el modelo.

  • LINEARSe aplicará una transformación lineal a las variables de entrada. Esta es la configuración predeterminada
  • PRODUCTSe utilizará una multiplicación por pares sobre variables explicativas continuas, produciendo variables de interacción. Esta opción solo está disponible cuando se han proporcionado varias variables explicativas.
  • HINGELos valores de la variable explicativa continua se convertirán en dos segmentos: un segmento estático (compuesto por ceros o unos) y un segmento de función lineal (aumento o disminución).
  • THRESHOLDLos valores de la variable explicativa continua se convertirán en una variable binaria compuesta de ceros y otros.
  • QUADRATICSe devolverá el cuadrado de cada valor de variable explicativa continuo.
String
number_knots
(Opcional)

Número de nudos que utilizarán las expansiones de la variable explicativa de inicio y umbral. El valor controla cuántos umbrales se crean, que se utilizan para crear múltiples expansiones de variables explicativas utilizando cada umbral. El valor debe estar comprendido entre 2 y 50. El valor predeterminado es 10.

Long
study_area_type
(Opcional)

Especifica el tipo de área de estudio que se utilizará para definir dónde es posible la presencia cuando las entidades de punto de entrada no contienen puntos de fondo.

  • CONVEX_HULLSe utilizará el polígono convexo más pequeño que encierra todos los puntos de presencia en las entidades de puntos de entrada. Esta es la configuración predeterminada
  • RASTER_EXTENTSe utilizará la extensión de la intersección de los rásteres de entrenamiento explicativos.
  • STUDY_POLYGONSe utilizará un área de estudio personalizada definida por una clase de entidad poligonal.
String
study_area_polygon
(Opcional)

Clase de entidad que contiene los polígonos que definen un área de estudio personalizada. Las entidades de puntos de entrada deben estar situadas dentro del área de estudio personalizada cubierta por las entidades poligonales. Un área de estudio puede estar compuesta por varios polígonos.

Feature Layer
spatial_thinning
(Opcional)

Especifica si se va a aplicar la simplificación espacial a los puntos de presencia y fondo antes de entrenar el modelo.

La simplificación espacial ayuda a reducir el sesgo del muestreo quitando los puntos y garantizando que los puntos restantes tengan una distancia mínima de vecino más cercano, definida en el parámetro thinning_distance_band. La simplificación espacial también se aplica a los puntos de fondo ya sean proporcionados en entidades de puntos de entrada o generados por la herramienta.

  • THINNINGSe aplicará la simplificación espacial
  • NO_THINNINGNo se aplicará la simplificación espacial Esta es la opción predeterminada.
Boolean
thinning_distance_band
(Opcional)

Distancia mínima entre dos puntos de presencia cualesquiera o dos puntos de fondo cualesquiera cuando se aplica la simplificación espacial.

Linear Unit
number_of_iterations
(Opcional)

Número de ejecuciones que se utilizarán para encontrar la solución óptima de simplificación espacial, tratando de mantener el mayor número posible de puntos de presencia y de fondo, asegurando al mismo tiempo que no haya dos puntos de presencia o dos puntos de fondo dentro del valor especificado del parámetro thinning_distance_band. El valor mínimo posible es 1 iteración y el máximo posible es 50 iteraciones. El valor predeterminado es 10.

Este parámetro solo se aplica a la simplificación espacial aplicada a los puntos de presencia y de fondo en las entidades de punto de entrada. La simplificación espacial que se aplica a los puntos de fondo generados a partir de celdas ráster se somete a simplificación espacial remuestreando las celdas ráster hasta el valor especificado en el parámetro thinning_distance_band sin tener que iterar para una solución óptima.

Long
relative_weight
(Opcional)

Valor entre 1 y 100 que especifica el peso relativo de la información de los puntos de presencia con respecto a los puntos de fondo. El valor predeterminado es 100.

Un valor más alto indica que los puntos de presencia son la fuente de información principal; se desconoce si los puntos de fondo representan la presencia o ausencia y los puntos de fondo reciben un peso menor en el modelo. Un valor inferior indica que los puntos de fondo también aportan información valiosa que se puede utilizar junto con los puntos de presencia; se confía más en que los puntos de fondo representan la ausencia y su información puede utilizarse en el modelo como lugares de ausencia.

Long
link_function
(Opcional)

Especifica la función que convertirá las salidas no delimitadas del modelo a un número entre 0 y 1. Este valor se puede interpretar como la probabilidad de presencia en la ubicación. Cada opción convierte el mismo valor continuo en una probabilidad diferente.

  • CLOGLOGLos puntos de fondo se tratarán como ubicaciones con presencia desconocida para calcular la probabilidad de presencia. Esta es la configuración predeterminada
  • LOGISTICLos puntos de fondo se tratarán como ubicaciones de ausencia.
String
presence_probability_cutoff
(Opcional)

Valor límite entre 0,01 y 0,99 que establece las probabilidades que corresponden a la presencia en la clasificación resultante. El valor límite se usa para ayudar a evaluar el rendimiento del modelo usando datos de entrenamiento y puntos de presencia conocidos. Los diagnósticos de clasificación se proporcionan en los mensajes de geoprocesamiento y en las entidades entrenadas de salida.

Double
output_trained_features
(Opcional)

Clase de entidad de salida que contendrá todas las entidades y variables explicativas utilizadas en el entrenamiento del modelo.

Feature Class
output_trained_raster
(Opcional)

Ráster de salida con valores de celda que indican la probabilidad de presencia mediante la función de vínculo seleccionada. El tamaño de celda predeterminado es el máximo de los tamaños de celda de los rásteres de formación explicativos. Solo se puede crear un ráster de entrenamiento de salida si las entidades de punto de entrada no contienen puntos de fondo.

Raster Dataset
output_response_curve_table
(Opcional)

Tabla de salida que contendrá diagnósticos del modelo de entrenamiento que indican el efecto de cada variable explicativa sobre la probabilidad de presencia tras tener en cuenta los efectos promedio de todas las demás variables explicativas en el modelo.

La tabla tendrá hasta dos gráficos derivados de gráficos de dependencia parcial: un conjunto de gráficos de líneas para variables continuas y un conjunto de gráficos de barras para las variables de categoría.

Table
output_sensitivity_table
(Opcional)

Tabla de salida que contendrá diagnósticos de precisión del modelo de entrenamiento a medida que el valor límite de presencia de probabilidad cambie de 0 a 1.

Table
features_to_predict
(Opcional)

Clase de entidad que representa las ubicaciones en las que se realizarán predicciones. La clase de entidad debe contener cualquier campo de variable explicativa proporcionado que se haya utilizado desde las entidades de puntos de entrada.

Cuando se utiliza la simplificación espacial, se pueden utilizar las entidades de los puntos de entrada originales como entidades de predicción de entrada para recibir una predicción para todo el dataset.

Feature Layer
output_pred_features
(Opcional)

Clase de entidad de salida que contendrá los resultados del modelo de predicción aplicado a las entidades de predicción de entrada.

Feature Class
output_pred_raster
(Opcional)

Ráster de salida que contiene los resultados de predicción en cada celda de los rásteres explicativos coincidentes. El tamaño de celda predeterminado es el máximo de los tamaños de celda de los rásteres de formación explicativos.

Raster Dataset
explanatory_variable_matching
[[Prediction, Training],...]
(Opcional)

Campos de variables explicativas coincidentes para las entidades de puntos de entrada y las entidades de predicción de entrada.

Value Table
explanatory_distance_matching
[[Prediction, Training],...]
(Opcional)

Entidades de distancia coincidentes para el entrenamiento y la predicción.

Value Table
explanatory_rasters_matching
[[Prediction, Training],...]
(Opcional)

Rásteres coincidentes para el entrenamiento y la predicción.

Value Table
allow_predictions_outside_of_data_ranges
(Opcional)
  • ALLOWEDLa predicción permitirá la extrapolación más allá del rango de valores utilizados en el entrenamiento. Esta es la opción predeterminada.
  • NOT_ALLOWEDLa predicción no permitirá la extrapolación más allá del rango de valores utilizados en el entrenamiento.
Boolean
resampling_scheme
(Opcional)

Especifica el método que se usará para realizar la validación cruzada del modelo de predicción. La validación cruzada revierte una parte de los datos durante el entrenamiento del modelo y los utiliza para probar el rendimiento del modelo una vez entrenado.

  • NONENo se realizará la validación cruzada. Esta es la configuración predeterminada
  • RANDOMLos puntos se dividirán aleatoriamente en grupos y cada grupo se excluirá una vez al realizar la validación cruzada. El parámetro number_of_groups especifica el número de grupos.
String
number_of_groups
(Opcional)

Número de grupos que se utilizarán en la validación cruzada para el esquema de remuestreo aleatorio. Un campo en las entidades entrenadas de salida indica el grupo al que se asignó cada punto. El valor predeterminado es 3. Se permite un mínimo de 2 grupos y un máximo de 10 grupos.

Long

Muestra de código

Ejemplo 1 de PresenceOnlyPrediction (ventana de Python)

En el siguiente script de Python se muestra cómo utilizar la función PresenceOnlyPrediction.

# Import system modules 
import arcpy 

# Call Presence-only Prediction (MaxEnt)
arcpy.stats.PresenceOnlyPrediction(
    input_point_features=r"C:\MyData.gdb\Presence_Points", 
    contains_background="PRESENCE_ONLY_POINTS",
    presence_indicator_field=None,
    explanatory_variables=None,
    distance_features=None,
    explanatory_rasters=[[r"C:\MyData.gdb\Elevation", "false"], 
                         [r"C:\MyData.gdb\Canopy", "false"], 
                         [r"C:\MyData.gdb\ClimacticWaterDeficit", "false"], 
                         [r"C:\MyData.gdb\LandCoverClassification", "true"], 
                         [r"C:\MyData.gdb\UpperSlope", "false"],
                         [r"C:\MyData.gdb\LowerSlope", "false"]], 
    basis_expansion_functions="LINEAR;QUADRATIC;PRODUCT;HINGE",
    number_knots=10,
    study_area_type="CONVEX_HULL",
    study_area_polygon=None,
    spatial_thinning="THINNING",
    thinning_distance_band="500 Meters", 
    number_of_iterations=10
    relative_weight=100
    link_function="CLOGLOG"
    presence_probability_cutoff=0.5
    output_trained_features=r"C:\MyData.gdb\Out_Trained_Features"
    output_trained_raster=r"C:\MyData.gdb\Out_Trained_Raster"
    output_response_curve_table=r"C:\MyData.gdb\Out_Response_Curve_Table"
    output_sensitivity_table=r"C:\MyData.gdb\Out_Sensitivity_Table"
    features_to_predict=r"C:\MyData.gdb\In_Prediction_Features"
    output_pred_features=r"C:\MyData.gdb\Out_Prediction_Features"
    output_pred_raster=r"C:\MyData.gdb\Out_Prediction_Raster",
    explanatory_variable_matching=None
    explanatory_distance_matching=None
    explanatory_rasters_matching=[[r"C:\MyData.gdb\Prediction_Elevation", "false"], 
                                  [r"C:\MyData.gdb\Prediction_Canopy", "false"], 
                                  [r"C:\MyData.gdb\Prediction_ClimacticWaterDeficit", "false"], 
                                  [r"C:\MyData.gdb\Prediction_LandCoverClassification", "true"], 
                                  [r"C:\MyData.gdb\Prediction_UpperSlope", "false"],
                                  [r"C:\MyData.gdb\Prediction_LowerSlope", "false"]], 
    allow_predictions_outside_of_data_ranges="ALLOWED"
    resampling_scheme="RANDOM"
    number_of_groups=3)
Ejemplo 2 de PresenceOnlyPrediction (secuencia de comandos independiente)

En el siguiente script de Python se muestra cómo utilizar la función PresenceOnlyPrediction.

# This example is a simple run of the tool using presence-only points and 
# explanatory training rasters to train an initial model. No outputs are 
# specified, as the intent is to interrogate geoprocessing messages to gain 
# an initial sense of model performance. 

# Import system modules 
import arcpy 

try: 
    # Set the workspace and overwrite properties
    arcpy.env.workspace = r"C:\MyData.gdb" 
    arcpy.env.overwriteOutput = True 
    
    # Set the input point feature parameters
    in_point_features = "presence_observations"
    contains_background = "PRESENCE_ONLY_POINTS”
    
    # Set the explanatory Training variables, using only explanatory rasters
    # Note the categorical setting for the LandCoverClassification raster
    explanatory_rasters = [["Elevation", "false"], 
                           ["Canopy", "false"], 
                           ["ClimacticWaterDeficit", "false"], 
                           ["LandCoverClassification", "true"], 
                           ["UpperSlope", "false"],
                           ["LowerSlope", "false"]]
    
    # Set basis functions, adding quadratic to use the square of each variable
    basis_functions = "LINEAR;QUADRATIC"
    number_knots = 10

    # Set the study area
    study_area_type = "CONVEX_HULL"
    study_area_polygon = None
    
    # Set cross-validation options
    resampling_scheme = "RANDOM"
    number_of_groups = 3

    # Call the tool using the parameters defined above.
    arcpy.stats.PresenceOnlyPrediction(
        input_point_features=in_point_features,
        contains_background=contains_background,
        explanatory_rasters=explanatory_rasters,
        basis_expansion_functions=basis_functions,
        study_area_type=study_area_type,
        resampling_scheme=resampling_scheme,
        number_of_groups=number_of_groups)
Ejemplo 3 de PresenceOnlyPrediction (secuencia de comandos independiente)

En el siguiente script de Python se muestra cómo utilizar la función PresenceOnlyPrediction.

# This example uses presence and background points and explanatory 
# variables from rasters, fields, and distance features to train a 
# model, using additional parameters to apply basis functions, use 
# spatial thinning, perform cross-validation, and receive diagnostic 
# training outputs. 

# Import system modules 
import arcpy 

try: 
    # Set the workspace and overwrite properties
    arcpy.env.workspace = r"C:\MyData.gdb" 
    arcpy.env.overwriteOutput = True 

    ### MODEL INPUTS ###
    
    # Set the input point feature parameters
    in_point_features = "presence_observations"
    contains_background = "PRESENCE_AND_BACKGROUND_POINTS
    presence_indicator_field = "Presence"
    
    # Set the explanatory Training variables
    explanatory_fields = [["Survey_Region", "true"], 
                          ["Temperature", "false"], 
                          ["Humidity", "false"]]
    explanatory_rasters = [["Elevation", "false"], 
                           ["Canopy", "false"], 
                           ["ClimacticWaterDeficit", "false"], 
                           ["LandCoverClassification", "true"], 
                           ["UpperSlope", "false"],
                           ["LowerSlope", "false"]]
    explanatory_dist_features = [["Streams", "false"], 
                                 ["Lakes", "false"], 
                                 ["Roads", "false"]]                           
    
    ### MODEL CONFIGURATION ###

    # Set basis functions
    basis_functions = "LINEAR;QUADRATIC;PRODUCT;HINGE"
    number_knots = 10

    # Set the study area
    study_area_type = "CONVEX_HULL"
    study_area_polygon = None

    # Set spatial thinning 
    spatial_thinning = "THINNING"
    min_nearest_neighbor_distance = "500 Meters"
    number_of_iterations = 10

    # Set the relative weight of presence to background and link function, using background points as observed absence
    relative_weight = 1
    link_function = "LOGISTIC"

    # Set the presence probability cutoff
    cutoff = 0.3

    ### MODEL OUTPUTS AND VALIDATION ###

    # Set training outputs for model evaluation
    out_trained_features = "Out_Trained_Features"
    out_trained_raster = "Out_Trained_Raster"
    out_response_curve_table = "Out_Response_Curves"
    out_sensitivity_table = "Out_Sensitivty_Table"
    
    # Set cross-validation options
    resampling_scheme = "RANDOM"
    number_of_groups = 3

    # Call the tool using the parameters defined above.
    arcpy.stats.PresenceOnlyPrediction(
        input_point_features=in_point_features,
        contains_background=contains_background,
        explanatory_variables=explanatory_fields,
        explanatory_rasters=explanatory_rasters,
        distance_features=explanatory_dist_features,
        basis_expansion_functions=basis_functions,
        number_knots=number_knots,
        study_area_type=study_area_type,
        spatial_thinning=spatial_thinning,
        thinning_distance_band=min_nearest_neighbor_distance,
        number_of_iterations=number_of_iterations,
        relative_weight=relative_weight,
        link_function=link_function,
        presence_probability_cutoff=cutoff,
        output_trained_features=out_trained_features,
        output_trained_raster=out_trained_raster,
        output_response_curve_table=out_response_curve_table,
        output_sensitivity_table=out_sensitivity_table,
        resampling_scheme=resampling_scheme,
        number_of_groups=number_of_groups)

Entornos

Casos especiales

Factor de procesamiento en paralelo

El procesamiento en paralelo solo se usa al realizar predicciones.

Generador de números aleatorios

Siempre se utiliza el generador de números aleatorios de Mersenne Twister.

Información de licenciamiento

  • Basic: Limitado
  • Standard: Limitado
  • Advanced: Limitado

Temas relacionados