Análisis de puntos calientes (Gi* de Getis-Ord) (Estadística espacial)—Nuevas características y mejoras que se han agregado en esta versión.

Resumen

Dado un conjunto de entidades ponderadas, identifica puntos calientes y puntos fríos estadísticamente significativos mediante la estadística Gi* de Getis-Ord.

Más información sobre cómo funciona el Análisis de punto caliente (Gi* de Getis-Ord)

Ilustración

Uso

Esta herramienta identifica clústeres espaciales estadísticamente significativos de valores altos (puntos calientes) y valores bajos (puntos fríos). Crea una Clase de entidad de salida con una puntuación z, un valor P y un campo de bin de nivel de confianza (Gi_Bin) para cada entidad en la Clase de entidad de entrada.
Las puntuaciones z y los valores p son medidas de significancia estadística que indican si se rechazará la hipótesis nula, entidad por entidad. En efecto, indican si el clustering espacial de valores altos o bajos observado es más marcado de lo que se espera en una distribución aleatoria de esos mismos valores. Los campos de puntuación z y valor p no reflejan ninguna corrección FDR (Índice de descubrimientos falsos).
El campo Gi_Bin identifica puntos calientes y puntos fríos estadísticamente significativos independientemente de si se aplica o no la corrección FDR. Las entidades en los bins +/-3 reflejan una importancia estadística con un nivel de confianza del 99 por ciento; las entidades en los bins +/-2 bins reflejan una importancia estadística con un nivel de confianza del 95 por ciento; las entidades en los bins +/-1 bins reflejan una importancia estadística con un nivel de confianza del 90 por ciento; y el clustering para las entidades en el bin 0 no es estadísticamente significativo. Sin la corrección FDR, la importancia estadística se basa en los campos de valor p y puntuación z. Cuando se marca el parámetro opcional Aplicar corrección False Discovery Rate (FDR), los valores p críticos que determinan los niveles de confianza se reducen para dar cuenta de la realización de varias pruebas y la dependencia espacial.
Una puntuación z alta y un valor P pequeño para una entidad indican un clustering espacial de valores altos. Una puntuación z negativa baja y un valor P pequeño indican un clustering espacial de valores bajos. Mientras más alta (o más baja) sea la puntuación z, más intenso será el clustering. Una puntuación z cercana a cero indica que no hay un clustering espacial evidente.
La puntuación z está basada en el cálculo de la hipótesis nula de aleatorización. Para obtener más información sobre las puntuaciones z, consulte ¿Qué es una puntuación z? ¿Qué es un valor p?
Cuando la Clase de entidad de entrada no está proyectada (es decir, cuando las coordenadas se especifican en grados, minutos y segundos) o cuando el sistema de coordenadas de salida está establecido en un sistema de coordenadas geográficas, las distancias se calculan mediante mediciones de cuerda. Las mediciones de distancia de cuerda se utilizan porque se pueden calcular rápidamente y proporcionan estimaciones muy buenas de las verdaderas distancias geodésicas, al menos para los puntos separados un máximo de unos treinta 30 grados entre sí. Las distancias de cuerda se basan en un esferoide oblato. Dados dos puntos en la superficie de la Tierra, la distancia de cuerda entre ellos es la longitud de una línea, que atraviesa la Tierra tridimensional, para conectar estos dos puntos. Las distancias de cuerda se informan en metros.
Precaución:
Asegúrese de proyectar los datos si su área de estudio se extiende más allá de los 30 grados. Las distancias de cuerda no son una buena estimación de las distancias geodésicas más allá de 30 grados.
Cuando se utilizan distancias de cuerda en el análisis, el parámetro Banda de distancia o distancia de umbral, si se especifica, debe proporcionarse en metros.
Los centroides de entidad se utilizan en los cálculos de distancia para las entidades de línea y polígono. Para multipuntos, polilíneas o polígonos con varias partes, el centroide se calcula utilizando el centro medio ponderado de todas las partes de entidad. La ponderación para las entidades de punto es 1, para las entidades de línea es longitud y para las entidades de polígono es área.
El Campo de entrada debe contener una variedad de valores. La operación matemática para esta estadística requiere cierta variación en la variable analizada; no puede resolver si todos los valores de entrada son 1, por ejemplo. Si desea utilizar esta herramienta para analizar el patrón espacial de los datos de incidentes, considere la posibilidad de agregar los datos de incidentes o de usar la herramienta Análisis de punto caliente optimizado.
Nota:

Los datos de incidentes son puntos que representan eventos (delincuencia, accidentes de tráfico) u objetos (árboles, tiendas) donde el foco se centra en su presencia o ausencia en lugar de algún atributo de medición asociado con cada punto.
La herramienta Análisis de punto caliente optimizado consulta sus datos para seleccionar automáticamente la configuración de parámetros que optimizará los resultados de los puntos calientes. Agregará los datos del incidente, seleccionará una escala adecuada para el análisis y ajustará los resultados para la realización de varias pruebas y la dependencia espacial. Las opciones de parámetros que selecciona se escriben en forma de mensajes y pueden ayudarle a ajustar las preferencias de parámetros cuando utilice la herramienta. Esta herramienta le permite un control y una flexibilidad totales sobre la configuración de los parámetros.
Su elección del parámetro Conceptualización de relaciones espaciales deberá reflejar relaciones inherentes entre las entidades que analiza. Cuanto más pueda modelar de manera realista cómo interactúan mutuamente las entidades en el espacio, más precisos serán sus resultados. Las recomendaciones se describen en Seleccionar una conceptualización de relaciones espaciales: mejores prácticas. A continuación, se ofrecen más sugerencias:
- Banda de distancia fija
  Esta es la opción predeterminada. La Banda de distancia o Distancia de umbral garantizará que cada entidad tenga al menos un vecino. Es importante, pero en muchos casos este valor predeterminado no es la distancia más apropiada para el análisis. En Seleccionar un valor de banda de distancia fija se describen estrategias adicionales para seleccionar una escala apropiada (banda de distancia) para su análisis.
- Distancia inversa o Distancia inversa cuadrada
  Cuando se introduce cero para el parámetro Banda de distancia o distancia de umbral, se considera que todas las entidades son vecinas de las demás entidades; cuando este parámetro se deja en blanco, se aplica la distancia predeterminada.
  Los pesos de las distancias menores que 1 se vuelven inestables cuando se invierten. Por consiguiente, a los pesos de entidades separadas por menos de 1 unidad de distancia se les da un peso de 1.
  Para las opciones de distancia inversa (Distancia inversa, Distancia inversa cuadrada y Zona de indiferencia), se asignará un peso de uno a todos los pares de puntos coincidentes para evitar la división por cero. Esto garantiza que las entidades no sean excluidas del análisis.
Las opciones adicionales para el parámetro Conceptualización de relaciones espaciales, incluidas las relaciones espaciotemporales, están disponibles mediante la herramienta Generar matriz de ponderaciones espaciales. Para aprovechar estas opciones adicionales, cree un archivo de matriz de ponderaciones espaciales antes del análisis; seleccione Obtener ponderaciones espaciales a partir del archivo para el parámetro Conceptualización de relaciones espaciales y, para el parámetro Archivo de matriz de ponderaciones, especifique la ruta del archivo de ponderaciones espaciales que creó.
Se proporciona más información acerca del análisis clúster de espacio-tiempo en la documentación Análisis de espacio-tiempo.
Las capas del mapa se pueden utilizar para definir la Clase de entidad de entrada. Cuando se utiliza una capa con una selección, solo las entidades seleccionadas se incluyen en el análisis.
Si proporciona un Archivo de matriz de ponderaciones con una extensión .swm, esta herramienta espera un archivo de matriz de ponderaciones espaciales creado utilizando la herramienta Generar matriz de ponderaciones espaciales o Generar ponderaciones espaciales de red; de lo contrario, esta herramienta espera un archivo de matriz de ponderaciones espaciales con formato ASCII. En algunos casos, el comportamiento es diferente según el tipo de archivo de matriz de ponderaciones espaciales que se utiliza:
- Archivos de matriz de ponderaciones espaciales con formato ASCII:
  - Las ponderaciones se utilizan como están. Las relaciones de entidad a entidad que faltan se tratan como ceros.
  - La ponderación predeterminada para el potencial automático es cero, a menos que especifique un valor en el parámetro Campo auto potencial o incluya explícitamente las ponderaciones automáticas potenciales.
  - Se respetan las relaciones asimétricas, lo que permite que una entidad tenga una entidad vecina que, a su vez, no tenga un vecino. Esto significa que la entidad vecina se incluye en los cálculos de la media local para la entidad original, pero no en los cálculos de la media global.
  - Si los pesos están estandarizados por fila, es probable que los resultados sean incorrectos para el análisis en los conjuntos de selección. Si necesita ejecutar el análisis en un conjunto de selección, convierta el archivo de ponderaciones espaciales ASCII en un archivo .swm leyendo los datos ASCII en una tabla y utilizando la opción Convertir tabla con la herramienta Generar matriz de ponderaciones espaciales.
- Archivo de matriz de ponderaciones espaciales con formato SWM:
  - Si los pesos están estandarizados en filas, se volverán a estandarizar para los conjuntos de selección; de lo contrario, los pesos se utilizan como están.
  - El peso predeterminado para auto potencial es uno, a menos que especifique un valor del parámetro Campo auto potencial.
La ejecución del análisis con un archivo de matriz de ponderaciones espaciales con formato ASCII consume muchos recursos de memoria. Para los análisis de más de 5.000 entidades, plantéese convertir el archivo de matriz de ponderaciones espaciales con formato ASCII en un archivo con formato SWM. Primero coloque los pesos ASCII en una tabla con formato (por ejemplo, por medio de Excel). A continuación, ejecute la herramienta Generar matriz de ponderaciones espaciales utilizando Convertir tabla para el parámetro Conceptualización de relaciones espaciales. El resultado será un archivo de matriz de ponderaciones espaciales con formato .SWM.
La Clase de entidad de salida de esta herramienta se agrega automáticamente a la tabla de contenido con la representación en pantalla predeterminada aplicada al campo Gi_Bin. La representación cálida a fría está definida por un archivo de capas que se encuentra en <ArcGIS Pro>\Resources\ArcToolBox\Templates\Layers. Puede volver a aplicar la representación predeterminada, si es necesario, aplicando de nuevo la simbología de la capa.
La salida de esta herramienta incluye un histograma que representa gráficamente el valor del Campo de entrada, al que se puede acceder en la Clase de entidad de salida del panel Contenido.
El tema de ayuda Modelado de relaciones espaciales ofrece información adicional sobre los parámetros de esta herramienta.

Precaución:

Al utilizar shapefiles tenga en cuenta que no pueden almacenar valores nulos. Las herramientas u otros procedimientos que crean shapefiles a partir de entradas sin shapefiles pueden almacenar o interpretar valores nulos como cero. En algunos casos, los nulos se almacenan como valores negativos muy grandes en shapefiles. Esto puede ocasionar resultados inesperados. Consulte Consideraciones de geoprocesamiento para la salida del shapefile para obtener más información.

Heredado:

Estandarización de filas no tiene ningún efecto sobre esta herramienta: los resultados de Análisis de punto caliente (la estadística Getis-Ord Gi*) serán idénticos con o sin la estandarización de filas. Por consiguiente, el parámetro se deshabilita; sigue estando disponible como parámetro de herramienta solo para admitir la compatibilidad con versiones anteriores.

Cuando esta herramienta se utiliza en los scripts Python, el objeto resultado devuelto tras ejecutar la herramienta tiene las siguientes salidas:


Posición	Description	Tipo de datos
0	Clase de entidad de salida	Clase de entidad
1	Nombre de campo de resultados (GiZScore)	Campo
2	Nombre de campo de probabilidad (GiPValue)	Campo
3	Nombre de campo de Id. de origen (SOURCE_ID)	Campo

Sintaxis

arcpy.stats.HotSpots(Input_Feature_Class, Input_Field, Output_Feature_Class, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, {Distance_Band_or_Threshold_Distance}, {Self_Potential_Field}, {Weights_Matrix_File}, {Apply_False_Discovery_Rate__FDR__Correction}, {number_of_neighbors})

Parámetro	Explicación	Tipo de datos
Input_Feature_Class	La clase de entidad para la que se realizará el análisis de punto caliente.	Feature Layer
Input_Field	El campo numérico (número de víctimas, índice de delincuencia, puntuaciones de exámenes, etc.) que se va a evaluar.	Field
Output_Feature_Class	La clase de entidad de salida que recibirá los resultados de la puntuación z y el valor P.	Feature Class
Conceptualization_of_Spatial_Relationships	Especifica cómo se definirán las relaciones espaciales entre las entidades. INVERSE_DISTANCE —Las entidades vecinas tendrán mayor influencia sobre los cálculos de una entidad de destino que las entidades que están alejadas. INVERSE_DISTANCE_SQUARED —Es igual que INVERSE_DISTANCE, salvo en que la pendiente es más nítida, de modo que la influencia caerá de una forma más rápida y solo los vecinos más cercanos de la entidad de destino ejercerán una influencia sustancial en los cálculos de dicha entidad. FIXED_DISTANCE_BAND —Cada entidad se analizará dentro del contexto de las entidades vecinas. Las entidades vecinas que se encuentran dentro de la distancia crítica especificada (Distance_Band_or_Threshold) recibirán un peso de 1 e influyen en los cálculos de la entidad de destino. Las entidades vecinas fuera de la distancia crítica recibirán un peso de cero y no tienen influencia sobre los cálculos de una entidad de destino. ZONE_OF_INDIFFERENCE —Las entidades que se encuentran dentro de la distancia crítica especificada (Distance_Band_or_Threshold) de una entidad de destino recibirán un peso de 1 e influyen en los cálculos de esa entidad. Una vez que se excede la distancia crítica, los pesos (y la influencia que una entidad vecina tiene sobre los cálculos de una entidad de destino) disminuirán con la distancia. K_NEAREST_NEIGHBORS —Las entidades k más cercanas se incluirán en este análisis; k es un parámetro numérico especificado. CONTIGUITY_EDGES_ONLY —Solo las entidades de polígono vecinas que comparten un límite o que se superponen tendrán influencia sobre los cálculos de la entidad poligonal de destino. CONTIGUITY_EDGES_CORNERS —Las entidades poligonales que comparten un límite, comparten un nodo o se superponen tendrán influencia sobre los cálculos de la entidad poligonal de destino. GET_SPATIAL_WEIGHTS_FROM_FILE —Las relaciones espaciales se definirán por un archivo de ponderaciones espaciales especificadas. La ruta del archivo de ponderaciones espaciales se especifica mediante el parámetro Weights_Matrix_File.	String
Distance_Method	Especifica cómo se calcularán las distancias desde cada entidad hasta las entidades vecinas. EUCLIDEAN_DISTANCE —La distancia en línea recta entre dos puntos MANHATTAN_DISTANCE —La distancia entre dos puntos medida a lo largo de los ejes en ángulos rectos (manzana), calculada sumando la diferencia (absoluta) entre las coordenadas x e y	String
Standardization	La Estandarización de filas no tiene ningún efecto sobre esta herramienta: los resultados de Análisis de punto caliente (la estadística Getis-Ord Gi*) serán idénticos con o sin la estandarización de filas. El parámetro se deshabilita; sigue estando disponible como parámetro de herramienta solo para admitir la compatibilidad con versiones anteriores. NONE —No se aplica la estandarización de ponderaciones espaciales. ROW —No se aplica la estandarización de ponderaciones espaciales.	String
Distance_Band_or_Threshold_Distance (Opcional)	Especifica una distancia de valor límite para las opciones de distancia inversa y distancia fija. Las entidades que están fuera del valor límite especificado para una entidad de destino se ignorarán en el análisis de esa entidad. Sin embargo, para la ZONE_OF_INDIFFERENCE, la influencia de las entidades que están fuera de la distancia dada se reducirá con la distancia, mientras que aquellas que están dentro del umbral de distancia se considerarán por igual. El valor de distancia introducido debe coincidir con el del sistema de coordenadas de salida. En las conceptualizaciones de relaciones espaciales de la distancia inversa, un valor de 0 indica que no se aplicará una distancia de umbral; cuando este parámetro se deja en blanco, se calcula y se aplicará un valor de umbral predeterminado. El valor predeterminado es la distancia euclidiana, lo que garantiza que cada entidad tenga como mínimo un vecino. Este parámetro no tiene efecto cuando se selecciona la conceptualización espacial de contigüidad de polígono (CONTIGUITY_EDGES_ONLY o CONTIGUITY_EDGES_CORNERS) o bien GET_SPATIAL_WEIGHTS_FROM_FILE.	Double
Self_Potential_Field (Opcional)	El campo que representa el autopotencial: la distancia o el peso entre una entidad y ella misma.	Field
Weights_Matrix_File (Opcional)	La ruta a un archivo que contenga los pesos que definen las relaciones espaciales, y potencialmente temporales entre las entidades.	File
Apply_False_Discovery_Rate__FDR__Correction (Opcional)	APPLY_FDR —La importancia estadística se basará en la corrección del FDR. NO_FDR —La importancia estadística no se basará en la corrección del FDR; se basará en los campos de valor p y puntuación z. Esta es la opción predeterminada.	Boolean
number_of_neighbors (Opcional)	Un número entero que especifica el número de vecinos que se desea incluir en el análisis.	Long

Salida derivada

Nombre	Explicación	Tipo de datos
Results_Field	El nombre del campo de resultados (GiZScore).	Campo
Probability_Field	El nombre del campo de probabilidad (GiPValue).	Campo
Source_ID	El nombre de campo del Id. de origen (SOURCE_ID).	Campo

Muestra de código

Ejemplo 1 de HotSpots (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la herramienta HotSpotAnalysis.

import arcpy
arcpy.env.workspace = "C:/data"
arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp",
                     "GET_SPATIAL_WEIGHTS_FROM_FILE", "EUCLIDEAN_DISTANCE", 
                     "NONE", "#", "#", "euclidean6Neighs.swm", "NO_FDR")

Ejemplo 2 de HotSpots (script independiente)

El siguiente script de Phython independiente muestra cómo utilizar la herramienta HotSpotAnalysis.

# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the Hot Spot Analysis Tool (Local Gi*)
# Import system modules
import arcpy
# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True
# Local variables...
workspace = "C:/Data"
try:
    # Set the current workspace (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace
    # Copy the input feature class and integrate the points to snap
    # together at 500 feet
    # Process: Copy Features and Integrate
    cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp",
                         "#", 0, 0, 0)
    integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")
    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")
    # Add a unique ID field to the count feature class
    # Process: Add Field and Calculate Field
    af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
                     "NON_NULLABLE", "NON_REQUIRED", "#",
                     "911Count.shp")
    
    cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB")
    # Create Spatial Weights Matrix for Calculations
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",
                        "euclidean6Neighs.swm",
                        "K_NEAREST_NEIGHBORS",
                        "#", "#", "#", 6,
                        "NO_STANDARDIZATION") 
    # Hot Spot Analysis of 911 Calls
    # Process: Hot Spot Analysis (Getis-Ord Gi*)
    hs = arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp", 
                     "GET_SPATIAL_WEIGHTS_FROM_FILE",
                     "EUCLIDEAN_DISTANCE", "NONE",
                     "#", "#", "euclidean6Neighs.swm","NO_FDR")
except arcpy.ExecuteError:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

Entornos

Sistema de coordenadas de salida, Transformaciones geográficas, Espacio de trabajo actual, Espacio de trabajo temporal, Nombres de campos calificados, La salida tiene valores M, Resolución M, Tolerancia M, La salida tiene valores Z, Valor Z de salida predeterminado, Resolución Z, Tolerancia Z, Resolución XY, Tolerancia XY

Sistema de coordenadas de salida: La geometría de la entidad se proyecta al sistema de coordenadas de salida antes del análisis; por lo tanto, los valores introducidos para el parámetro Banda de distancia o distancia de umbral deben coincidir con los que se especificaron en el sistema de coordenadas de salida. Todos los cálculos matemáticos se basan en la referencia espacial del sistema de coordenadas de salida. Cuando el entorno del sistema de coordenadas de salida se basa en grados, minutos y segundos, las distancias geodésicas se calculan usando la distancia de cuerda en metros.

Información de licenciamiento

Basic: Sí
Standard: Sí
Advanced: Sí

Temas relacionados

¿Algún comentario sobre este tema?

Resumen

Ilustración

Uso

Precaución:

Nota:

Precaución:

Heredado:

Sintaxis

Salida derivada

Muestra de código

Entornos

Información de licenciamiento

Temas relacionados

En este tema