Comparer les conceptualisations de voisinage (Statistiques spatiales)

Synthèse

Sélectionne la matrice de pondérations spatiales (SWM) parmi un ensemble de matrices candidates représentant le mieux les modèles spatiaux (comme les tendances ou les agrégats) d’un ou plusieurs champs numériques.

Le fichier de matrice de pondérations spatiales en sortie peut alors être utilisé dans les outils qui acceptent les fichiers .swm comme valeurs des paramètres Type de voisinage ou Conceptualisation des relations spatiales, tels que les outils Association spatiale bivariée (statistique L de Lee), Analyse de points chauds (Getis-Ord Gi*), and Analyse des valeurs aberrantes et des agrégats (indice local de Moran Anselin).

L’outil sélectionne la matrice de pondérations spatiales en créant des composantes spatiales (appelées vecteurs propres de Moran) à partir de chaque matrice de pondérations spatiales candidate et en testant la manière dont les composantes représentent efficacement les modèles spatiaux des champs en entrée.

En savoir plus sur les vecteurs propres de Moran

Illustration

Illustration de l’outil Comparer les conceptualisations de voisinage

Utilisation

  • L’outil a pour finalité de suggérer un type de voisinage et une structure de pondération (parfois désignés sous le nom de conceptualisation des relations spatiales) qui représentent le plus fidèlement les modèles spatiaux des champs en entrée. Pour y parvenir, il teste la pondération spatiale qui produit les composantes spatiales permettant de prévoir le plus précisément les valeurs des champs en entrée. Le principe qui régit cette règle est que chaque composante spatiale possède un modèle spatial et que les composantes susceptibles de prédire avec la plus grande précision les champs en entrée sont ceux qui sont dotés de modèles les plus similaires par rapport aux champs en entrée. Toutefois, la matrice de pondérations spatiales suggérée ne saurait remplacer les connaissances personnelles ni l’expertise en matière de données et de processus. Il convient de considérer un grand nombre de points lors de la sélection d’une matrice de pondérations spatiales dans le cadre d’une analyse et cet outil n’utilise que la capacité des composantes spatiales à prévoir les champs en entrée afin de déterminer la matrice de pondérations spatiales suggérée. Dans certains cas, comme avec l’outil Analyse de points chauds (Getis-Ord Gi*), vous disposez d’autres méthodologies pour sélectionner la matrice de pondérations spatiales, telles que la bande de distance qui maximise l’autocorrélation spatiale des données (il s’agit de la façon dont l’outil Analyse de points chauds optimisée détermine les voisins et les pondérations). Il est recommandé d’essayer d’autres méthodologies pour choisir les voisinages et les pondérations spatiales et d’utiliser la méthode la plus conforme aux objectifs de l’analyse.

  • Indiquez tous les champs dans le paramètre Champs en entrée que vous prévoyez d’utiliser dans une analyse ultérieure à l’aide du fichier .swm en sortie. Par example, l’outil Analyse de points chauds (Getis-Ord Gi*) ne requiert qu’un seul champ alors que l’outil Association spatiale bivariée (statistique L de Lee) en a besoin de deux. Vous pouvez indiquer le fichier .swm en sortie dans le paramètre Fichier de matrice de pondérations après avoir spécifié l’option Extraire les pondérations spatiales à partir du fichier pour le paramètre Type de voisinage ou Conceptualisation des relations spatiales des outils d’analyse suivants.

  • Les matrices de pondérations spatiales suivantes ont été testées par l’outil :

    • Cinq bandes de distance, chacune avec des noyaux bicarrés, gaussiens et non pondérés (15 au total). La bande de distance la plus courte est la distance qui génère au moins un voisin pour chaque entité. La bande de distance la plus longue représente 20 % de l’étendue diagonale des entités en entrée. Les trois autres bandes de distance sont créées par incrémentation régulière entre les bandes de distance la plus courte et la plus longue. Pour les entités surfaciques, la distance séparant les centroïdes permet de déterminer les distances et les voisins.
    • Quatre nombres différents de voisins (8, 16, 32 et 64), chacun avec des noyaux bicarrés, gaussiens et non pondérés (12 au total). Les bandes passantes sont adaptatives et égales à la distance par rapport au (K+1)e voisin, pour K voisins. Si le nombre d’entités en entrée est inférieur à K, de nombreux voisins sont ignorés. Par exemple, s’il existe 50 entités en entrée, les trois matrices de pondérations spatiales qui utilisent les 64 voisins les plus proches sont ignorées. Pour les entités surfaciques, la distance séparant les centroïdes permet de déterminer les distances et les voisins.
    • Pour les entités ponctuelles, la matrice de pondérations spatiales finale est un voisinage de type triangulation de Delaunay. Pour les entités surfaciques, la matrice de pondérations spatiales finale est un voisinage de type contiguïté (tronçons et angles).

    Pour en savoir plus sur chaque voisinage et la pondération de noyau, consultez les rubriques Fonctionnement des résumés statistiques de voisinage et Modélisation de relations spatiales.

  • Les messages de géotraitement incluent la table Historique de recherche de voisinage qui donne des détails sur chaque matrice de pondérations spatiales testée (tels que le nombre de voisins et la structure de pondération) ainsi que la valeur R-carré ajusté de la matrice lorsqu’elle est utilisée pour prévoir les champs en entrée. La matrice de pondérations spatiales suggérée par l’outil correspond à celle qui compte la plus grande valeur R-carré ajusté. Elle est signalée en gras par un astérisque dans la table.

  • L’outil détermine la matrice suggérée à l’aide de la procédure suivante :

    1. Pour chaque matrice de pondérations spatiales, les vecteurs propres de Moran avec les valeurs propres les plus élevées (dont l’autocorrélation est la plus forte) sont générés. Le nombre de vecteurs propres est égal à 25 pour cent du nombre d’entités et peut aller jusqu’à un maximum de 100.
    2. Tout vecteur propre détenant des valeurs d’indice de Moran négatives (c’est-à-dire dont l’autocorrélation est négative) est expurgé.
    3. Chaque champ en entrée est prévu de manière individuelle grâce aux vecteurs propres en tant que variables explicatives dans un modèle de régression Moindres carrés ordinaires.
    4. La somme totale des carrés et la somme résiduelle des carrés de tous les champs sont agrégées ; une valeur R-carré ajusté combinée est calculée.
    5. La matrice de pondérations spatiales avec la plus grande valeur R carré ajusté est renvoyée.

    Une description complète de cette procédure est disponible dans la référence suivante :

    • Bauman, David, Thomas Drouet, Marie-Josée Fortin, and Stéphane Dray. 2018. "Optimizing the choice of a spatial weighting matrix in eigenvector-based methods." Ecology 99, no. 10: 2159-2166. https://doi.org/10.1002/ecy.2469.

Paramètres

ÉtiquetteExplicationType de données
Entités en entrée

Entités en entrée contenant les champs permettant de sélectionner le fichier SWM.

Feature Layer
Champs en entrée

Champs en entrée permettant de sélectionner le fichier SWM.

Field
Matrice de pondérations spatiales en sortie

Fichier .swm en sortie des voisins et pondérations sélectionnés par l’outil.

File
Champ d’ID unique

Champ d’ID unique du fichier .swm en sortie. Le champ doit être un entier et comporter une valeur unique pour chaque entité en entrée.

Field

arcpy.stats.CompareNeighborhoodConceptualizations(in_features, input_fields, out_swm, id_field)
NomExplicationType de données
in_features

Entités en entrée contenant les champs permettant de sélectionner le fichier SWM.

Feature Layer
input_fields
[input_fields,...]

Champs en entrée permettant de sélectionner le fichier SWM.

Field
out_swm

Fichier .swm en sortie des voisins et pondérations sélectionnés par l’outil.

File
id_field

Champ d’ID unique du fichier .swm en sortie. Le champ doit être un entier et comporter une valeur unique pour chaque entité en entrée.

Field

Exemple de code

Exemple 1 d’utilisation de la fonction CompareNeighborhoodConceptualizations (fenêtre Python)

Le script de fenêtre Python ci-dessous illustre l’utilisation de la fonction CompareNeighborhoodConceptualizations :

# Select the spatial weights matrix (SWM) that best describes the 
# spatial patterns of POP_SQMI.

arcpy.env.workspace = r"c:\data\project_data.gdb"

arcpy.stats.CompareNeighborhoodConceptualizations(
    in_features="states",
    input_fields="POP_SQMI",
    out_swm=r"c:\data\states.swm",
    id_field="unique_id_field"
)
Exemple 2 d’utilisation de la fonction CompareNeighborhoodConceptualizations (script autonome)

Le script autonome ci-dessous illustre l’utilisation de la fonction CompareNeighborhoodConceptualizations :

# Select the spatial weights matrix (SWM) that best describes 
# the spatial patterns of two analysis field. 

import arcpy

# Set the current workspace.
arcpy.env.workspace = r"c:\data\project_data.gdb"

# Run the tool.
arcpy.stats.CompareNeighborhoodConceptualizations(
    in_features="myFeatureClass",
    input_fields="myAnalysisField1;myAnalysis Field2",
    out_swm=r"myOutputSWM.swm",
    id_field="myUniqueIDField"
)

# Print the tool messages.
print(arcpy.GetMessages())

Environnements

Cet outil n’utilise pas d’environnement de géotraitement.

Informations de licence

  • Basic: Oui
  • Standard: Oui
  • Advanced: Oui

Rubriques connexes