Generar matriz de ponderaciones espaciales (Estadística espacial)

Resumen

Construye un archivo de matriz de ponderaciones espaciales (.swm) para representar las relaciones espaciales entre entidades en un dataset.

Descubra cómo funciona Generar matriz de ponderaciones espaciales

Ilustración

Ponderaciones espaciales basadas en una contigüidad de polígonos
Relaciones espaciales basadas en una contigüidad de polígonos, Caso de la Reina: bordes o nodos compartidos

Uso

  • La salida de esta herramienta es un archivo de matriz de ponderaciones espaciales (.swm). Algunas herramientas, como Análisis de punto caliente, que requieren que especifique una Conceptualización de relaciones espaciales aceptarán un archivo de matriz de ponderaciones espaciales; seleccione Obtener ponderaciones espaciales a partir del archivo para el parámetro Conceptualización de relaciones espaciales y, para el parámetro Archivo de matriz de ponderaciones, especifique la ruta completa al archivo de ponderaciones espaciales que crea mediante esta herramienta.

  • Esta herramienta también informa sobre las características del archivo de matriz de ponderaciones espaciales resultante: número de entidades, conectividad, número mínimo, máximo y promedio de vecinos. Este resumen se escribe como mensajes en la parte inferior del panel Geoprocesamiento durante la ejecución de la herramienta. Puede acceder a los mensajes desplazándose sobre la barra de progreso, haciendo clic en el botón emergente o expandiendo la sección de mensajes en el panel Geoprocesamiento. También puede acceder a los mensajes de una herramienta ejecutada anteriormente a través del Historial de geoprocesamiento. En este resumen se indicará si todas las entidades tienen al menos un vecino. En general, especialmente con grandes datasets, un mínimo de 8 vecinos y un valor bajo para la conectividad de la entidad es deseable.

  • Para los análisis de espacio/tiempo, seleccione Ventana de espacio-tiempo para el parámetro Conceptualización de relaciones espaciales. El espacio se define especificando un valor Distancia de umbral; el tiempo se define especificando un Campo de Fecha/Hora y un Tipo de Fecha/Hora (como horas o días) así como un Valor de intervalo Fecha/Hora. El valor de intervalo Fecha/hora es un entero. Por ejemplo, si introduce 1000 pies, selecciona Horas y proporciona un Valor de intervalo Fecha/Hora de 3, las entidades que se encuentran a un máximo de 1000 pies y que están separadas por un máximo de 3 horas entre sí se consideran vecinas.

  • El archivo de matriz de ponderaciones espaciales (.swm) fue diseñado para permitirle generar, almacenar, reutilizar y compartir la conceptualización de las relaciones entre un conjunto de entidades. Para mejorar el rendimiento, el archivo se crea en un formato de archivo binario. Las relaciones de entidades se almacenan como una matriz dispersa, de manera que solo las relaciones distintas de cero se escriben en el archivo SWM . En general, las herramientas funcionarán bien incluso cuando el archivo SWM contiene más de 15 millones de relaciones distintas de cero. Si se detecta un error de memoria cuando se utiliza el archivo SWM; sin embargo, debe revisar cómo definir las relaciones de entidades. Como regla general, debe intentar obtener una matriz de ponderaciones espaciales donde cada entidad tenga al menos 1 vecino, la mayoría tienen aproximadamente 8 vecinos y ninguna entidad tiene más de aproximadamente 1,000 vecinos.

  • Los puntos coincidentes no se usan en el cálculo de la Distancia de umbral predeterminada.

  • Cuando se usan datos con coordenadas que incluyen un valor Z, la Distancia de umbral es una distancia 3D.

  • Cuando se usan datos con coordenadas que incluyen un valor Z, las únicas conceptualizaciones de relaciones espaciales admitidas son Distancia inversa, Distancia fija, K vecinos más próximos y Ventana de tiempo-espacio.

  • Si la Clase de entidad de entrada tiene Z habilitada, las unidades lineales del sistema de coordenadas verticales (VCS) deben coincidir con las unidades lineales del sistema de coordenadas horizontales. Si la Clase de entidad de entrada no tiene un sistema de coordenadas verticales, se asume que la unidad lineal vertical coincide con la unidad lineal horizontal.

  • Cuando la Clase de entidad de entrada no está proyectada (es decir, cuando las coordenadas se especifican en grados, minutos y segundos) o cuando el sistema de coordenadas de salida está establecido en un Sistema de coordenadas geográficas, las distancias se calculan mediante mediciones de cuerda. Las mediciones de distancia de cuerda se utilizan porque se pueden calcular rápidamente y proporcionan buenas estimaciones de las verdaderas distancias geodésicas, al menos para los puntos separados un máximo de unos treinta grados entre sí. Las distancias de cuerda se basan en un esferoide oblato. Dados dos puntos en la superficie de la Tierra, la distancia de cuerda entre ellos es la longitud de una línea, que atraviesa la Tierra tridimensional, para conectar estos dos puntos. Las distancias de cuerda se informan en metros.

    Precaución:

    Asegúrese de proyectar los datos si su área de estudio se extiende más allá de los 30 grados. Las distancias de cuerda no son una buena estimación de las distancias geodésicas más allá de 30 grados.

  • Cuando se utilizan distancias de cuerda en el análisis, el parámetro Distancia de umbral, si se especifica, debe proporcionarse en metros.

  • Los centroides de entidad se utilizan en los cálculos de distancia para las entidades de línea y polígono. Para multipuntos, polilíneas o polígonos con varias partes, el centroide se calcula utilizando el centro medio ponderado de todas las partes de entidad. La ponderación para las entidades de punto es 1, para las entidades de línea es longitud y para las entidades de polígono es área.

  • El Campo de ID único está vinculado a las relaciones de entidad que se derivan de la ejecución de esta herramienta. Por consiguiente, los valores del Campo de Id. único deben ser únicos para cada entidad y, por lo general, deben estar en un campo permanente que se mantiene con la clase de entidad. Si no tiene un campo de Id. único, puede crear uno agregando un nuevo campo de entero (Agregar campo) a la tabla de clases de entidad y calculando los valores de campos de modo que sean iguales al campo FID u OBJECTID (Calcular campo). Como los valores de los campos FID y OBJECTID pueden cambiar al copiar o editar una clase de entidad, estos campos no se pueden usar directamente para el parámetro Campo de ID único.

  • El parámetro Cantidad de vecinos puede invalidar el parámetro Distancia de umbral para las conceptualizaciones de relaciones espaciales de distancia inversa o fija. Si especifica una distancia de umbral de 10 millas y 3 para el parámetro Cantidad de vecinos, todas las entidades recibirán un mínimo de 3 vecinos aun cuando se deba incrementar la distancia de umbral para encontrarlos. La distancia de umbral sólo se incrementa en los casos en los que no se alcanza la cantidad mínima de vecinos.

  • La opción Convertir tabla para el parámetro Conceptualización de relaciones espaciales se puede utilizar para convertir un Archivo de matriz de ponderaciones espaciales ASCII en un archivo Archivo de matriz de ponderaciones espaciales con formato SWM. En primer lugar, deberá introducir los pesos de ASCII en una tabla formateada (con Excel, por ejemplo).

    Precaución:

    Si la tabla incluye los pesos para el auto potencial, estos se omitirán del archivo de salida SWM y se utilizará el valor del auto potencial predeterminado en el análisis. El valor del auto potencial predeterminado para la herramienta Análisis de punto caliente es de uno, pero este valor se puede sobrescribir si se especifica un valor para el Campo auto potencial; para las demás herramientas, el valor del auto potencial predeterminado es cero.

  • Para las entidades de polígono, casi siempre deseará elegir Fila para el parámetro Estandarización de filas. La estandarización de filas reduce el sesgo cuando la cantidad de vecinos que posee cada entidad es una función del esquema de agregación o proceso de muestreo, en lugar de reflejar la distribución espacial real de la variable que está analizando.

  • El tema de ayuda Modelado de relaciones espaciales ofrece información adicional sobre los parámetros de esta herramienta.

  • Las herramientas que pueden utilizar una geometría de entidad de proyecto de archivo de matriz de ponderaciones espaciales para el sistema de coordenadas de salida antes del análisis y todos los cálculos matemáticos se basan en el sistema de coordenadas de salida. Por consiguiente, si la configuración del sistema de coordenadas de salida no coincide con la referencia espacial de la clase de entidad de entrada, asegúrese, para todos los análisis que utilizan el archivo de matriz de ponderaciones espaciales, de que el sistema de coordenadas de salida coincide con la configuración que se utilizó cuando se creó el archivo de matriz de ponderaciones espaciales o proyecte la clase de entidad de entrada para que coincida con la referencia espacial asociada con el archivo de matriz de ponderaciones espaciales.

  • Precaución:

    Al utilizar shapefiles tenga en cuenta que no pueden almacenar valores nulos. Las herramientas u otros procedimientos que crean shapefiles a partir de entradas sin shapefiles pueden almacenar o interpretar valores nulos como cero. En algunos casos, los nulos se almacenan como valores negativos muy grandes en shapefiles. Esto puede ocasionar resultados inesperados. Consulte Consideraciones de geoprocesamiento para la salida del shapefile para obtener más información.

Sintaxis

arcpy.stats.GenerateSpatialWeightsMatrix(Input_Feature_Class, Unique_ID_Field, Output_Spatial_Weights_Matrix_File, Conceptualization_of_Spatial_Relationships, {Distance_Method}, {Exponent}, {Threshold_Distance}, {Number_of_Neighbors}, {Row_Standardization}, {Input_Table}, {Date_Time_Field}, {Date_Time_Interval_Type}, {Date_Time_Interval_Value}, Use_Z_values)
ParámetroExplicaciónTipo de datos
Input_Feature_Class

La clase de entidad para la cual se evaluarán las relaciones espaciales de las entidades.

Feature Class
Unique_ID_Field

Un campo de entero que contiene un valor diferente para cada entidad en la clase de entidad de entrada. Si no tiene un campo de Id. único, puede crear uno agregando un campo de tipo entero a la tabla de clases de entidad y calculando los valores de campo para que equivalgan a los campos FID o OBJECTID.

Field
Output_Spatial_Weights_Matrix_File

Ruta de acceso completa para el archivo de matriz de ponderaciones espaciales (.swm) que desea crear.

File
Conceptualization_of_Spatial_Relationships

Especifica cómo se conceptualizan las relaciones espaciales entre las entidades.

  • INVERSE_DISTANCEEl impacto que una entidad tiene sobre otra disminuye con la distancia.
  • FIXED_DISTANCEEn el análisis, se incluye todo lo que está dentro de una distancia crítica especificada de cada entidad y se excluye todo lo que está fuera de la distancia crítica.
  • K_NEAREST_NEIGHBORSLas entidades k más cercanas se incluyen en este análisis; k es un parámetro numérico especificado.
  • CONTIGUITY_EDGES_ONLYLas entidades de polígono que comparten un límite son vecinas.
  • CONTIGUITY_EDGES_CORNERSLas entidades de polígono que comparten un límite o un nodo son vecinas.
  • DELAUNAY_TRIANGULATIONSe crea una malla de triángulos no superpuestos a partir de los centroides de las entidades; las entidades asociadas con los nodos de triángulos que comparten aristas son vecinas.
  • SPACE_TIME_WINDOWLas entidades dentro de una distancia crítica especificada y el cada intervalo de tiempo especificado de cada uno son vecinos.
  • CONVERT_TABLELas relaciones espaciales se definen en una tabla.
String
Distance_Method
(Opcional)

Especifica cómo se calculan las distancias desde cada entidad hasta las entidades vecinas.

  • EUCLIDEANLa distancia en línea recta entre dos puntos
  • MANHATTANLa distancia entre dos puntos medida a lo largo de los ejes en ángulos rectos (manzana); se calcula al sumar la diferencia (absoluta) entre las coordenadas x e y
String
Exponent
(Opcional)

Parámetro para calcular la distancia inversa. Los valores típicos son 1 o 2.

Double
Threshold_Distance
(Opcional)

Especifica una distancia de valor límite para las conceptualizaciones de relaciones espaciales Distancia inversa y Distancia fija. Introduzca este valor utilizando las unidades que se especifican en el sistema de coordenadas de salida del entorno. Define el tamaño de la ventana de espacio para la conceptualización de relaciones espaciales Ventana de tiempo-espacio.

Un valor de cero indica que no se aplica ninguna distancia de umbral. Cuando este parámetro queda en blanco, se calcula un valor de umbral predeterminado basado en la extensión de la clase de entidad de salida y la cantidad de entidades.

Double
Number_of_Neighbors
(Opcional)

Un entero que refleja la cantidad mínima o la cantidad exacta de vecinos. Para K_NEAREST_NEIGHBORS, cada entidad tendrá exactamente esta cantidad de vecinos especificada. Para INVERSE_DISTANCE o FIXED_DISTANCE cada entidad tendrá como mínimo este número de vecinos (si es necesario, la distancia de umbral se ampliará temporalmente para garantizar que haya ese número de vecinos). Cuando se selecciona una de las Conceptualizaciones de relaciones espaciales de contigüidad, a cada polígono se le asigna este número mínimo de vecinos. Para los polígonos con una cantidad inferior a este número de vecinos contiguos, los vecinos adicionales estarán basados en la proximidad al centroide de la entidad.

Long
Row_Standardization
(Opcional)

Se recomienda la estandarización de filas siempre que la distribución de entidades esté potencialmente influenciada debido al diseño de muestreo o a un esquema de agregación impuesto.

  • ROW_STANDARDIZATIONLas ponderaciones espaciales son estandarizadas por fila. Cada ponderación se divide por la suma de sus filas. Esta es la opción predeterminada.
  • NO_STANDARDIZATIONNo se aplica la estandarización de ponderaciones espaciales.
Boolean
Input_Table
(Opcional)

Una tabla que contiene pesos numéricos que relacionan a cada entidad con las demás entidades en la clase de entidad de entrada. Los campos requeridos son: Clase de entidad de entrada, Campo de Id. único, NID (Id. de vecino) y PESO.

Table
Date_Time_Field
(Opcional)

Un campo de fecha con una marca de tiempo para cada entidad.

Field
Date_Time_Interval_Type
(Opcional)

Las unidades que se utilizan para medir el tiempo.

  • SECONDSSegundos
  • MINUTESMinutos
  • HOURSHoras
  • DAYSDías
  • WEEKSSemanas
  • MONTHS30 días
  • YEARSAños
String
Date_Time_Interval_Value
(Opcional)

Un entero que refleja el número de unidades de tiempo que comprende la ventana de tiempo.

Por ejemplo, si selecciona HOURS para Tipo de intervalo Fecha/Hora y 3 para Valor de intervalo Fecha/Hora, la ventana de tiempo será de 3 horas. Las entidades con la ventana espacial especificada y contenidas en la ventana de tiempo indicada serán vecinas.

Long
Use_Z_values
  • USE_Z_VALUESLos valores Z se usan en la construcción de la matriz de ponderaciones espaciales.
  • DO_NOT_USE_Z_VALUESLos valores Z se ignoran y solo las coordenadas X e Y se tienen en cuenta en la construcción de la matriz de ponderaciones espaciales. Esta es la opción predeterminada.
Boolean

Muestra de código

Ejemplo 1 de GenerateSpatialWeightsMatrix (ventana de Python)

La siguiente secuencia de comandos de la ventana de Python muestra cómo utilizar la herramienta GenerateSpatialWeightsMatrix.

import arcpy
arcpy.env.workspace = "C:/data"
arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID", "euclidean6Neighs.swm", "K_NEAREST_NEIGHBORS", "#", "#", "#", 6, "NO_STANDARDIZATION")
Ejemplo 2 de GenerateSpatialWeightsMatrix (secuencia de comandos independiente)

La siguiente secuencia de comandos de Python independiente muestra cómo utilizar la herramienta GenerateSpatialWeightsMatrix.

# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the Hot-Spot Analysis Tool (Local Gi*)
# Import system modules
import arcpy
# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True
# Local variables...
workspace = "C:/Data"
try:
    # Set the current workspace (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace
    # Copy the input feature class and integrate the points to snap
    # together at 500 feet
    # Process: Copy Features and Integrate
    cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp",
                         "#", 0, 0, 0)
    integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")
    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")
    # Add a unique ID field to the count feature class
    # Process: Add Field and Calculate Field
    af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
                     "NON_NULLABLE", "NON_REQUIRED", "#",
                     "911Count.shp")
    
    cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB")
    # Create Spatial Weights Matrix for Calculations
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",
                        "euclidean6Neighs.swm",
                        "K_NEAREST_NEIGHBORS",
                        "#", "#", "#", 6,
                        "NO_STANDARDIZATION") 
    # Hot Spot Analysis of 911 Calls
    # Process: Hot Spot Analysis (Getis-Ord Gi*)
    hs = arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp", 
                     "GET_SPATIAL_WEIGHTS_FROM_FILE",
                     "EUCLIDEAN_DISTANCE", "NONE",
                     "#", "#", "euclidean6Neighs.swm")
except:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

Entornos

Sistema de coordenadas de salida

La geometría de la entidad se proyecta en el sistema de coordenadas de salida antes del análisis. Por tanto, los valores introducidos para el parámetro Distancia de umbral deben coincidir con los que se especificaron en el sistema de coordenadas de salida. Todos los cálculos matemáticos se basan en la referencia espacial del sistema de coordenadas de salida. Cuando el entorno del sistema de coordenadas de salida se basa en grados, minutos y segundos, las distancias geodésicas se calculan usando la distancia de cuerda en metros.

Información de licenciamiento

  • Basic: Sí
  • Standard: Sí
  • Advanced: Sí

Temas relacionados