Association spatiale bivariée (statistique L de Lee) (Statistiques spatiales)

Synthèse

Calcule l’association spatiale entre deux variables continues à l’aide de la statistique L de Lee.

La statistique L de Lee caractérise le degré de corrélation et le degré de structuration (la similarité de l’agrégation spatiale) des variables. La valeur sera comprise entre -1 et 1 et est conceptuellement similaire à un coefficient de corrélation, à ceci près qu’elle est ajustée pour tenir compte de l’autocorrélation spatiale des deux variables. Les valeurs de la statistique L de Lee proches de 1 indiquent que les variables sont fortement corrélées positivement et que chaque variable présente une autocorrélation spatiale élevée (les valeurs élevées et faibles des variables ont chacune tendance à s’agréger). Les valeurs proches de -1 indiquent que les variables sont fortement corrélées négativement et que chaque variable présente une autocorrélation spatiale fortement positive. Les valeurs proches de 0 indiquent que les variables ne sont ni corrélées, ni autocorrélées spatialement, ni les deux à la fois.

La statistique L de Lee peut être partitionnée pour chaque entité en entrée, appelée statistique L de Lee locale, qui montre l’association spatiale locale de l’entité et de ses voisins. Cela permet de déterminer les zones qui ont une association spatiale plus élevée ou plus basse que la statistique L de Lee. Les statistiques locales peuvent également être classées dans une des différentes catégories en fonction des valeurs des voisins de chaque entité. Les statistiques globales et locales sont testées à des fins de signification statistique à l’aide de permutations.

En savoir plus sur le fonctionnement de l’outil Association spatiale bivariée (statistique L de Lee)

Illustration

Illustration de l’outil Association spatiale bivariée (statistique L de Lee)
Les deux variables figurant sur la ligne supérieure comportent une association spatiale positive tandis que les deux variables de la ligne inférieure comportent une association spatiale négative.

Utilisation

  • Les deux variables d’analyse doivent être continues (elles ne doivent pas être binaires ni catégorielles) et avoir une relation linéaire. Si la relation n’est pas linéaire, utilisez l’outil Transformer un champ pour appliquer des transformations aux variables d’analyse afin de linéariser la relation et relancez l’outil avec les valeurs transformées.

  • L’outil renvoie différentes sorties qui permettent d’examiner l’association spatiale entre les deux variables d’analyse. Les messages de géotraitement affichent la statistique L de Lee et la valeur p alors que la classe d’entités en sortie contient des champs récapitulant les statistiques L de Lee locales, les valeurs p et les résultats de signification statistique. Lorsqu’elle est exécutée dans une carte active, la couche d’entités en sortie s’affiche en fonction des catégories d’association spatiale locales : Not Significant, High-High, Low-Low, High-Low et Low-High. Si, par exemple, la statistique L de Lee locale a une signification statistique d’au moins 90 pour cent, la première variable d’analyse est supérieure à la valeur moyenne et la deuxième variable d’analyse est inférieure à la valeur moyenne, et la catégorie est High-Low.

    En savoir plus sur les sorties de l’outil

  • Les valeurs p visant à examiner les associations globales et locales dans le cadre de leur signification statistique sont calculées à l’aide de permutations.

  • Utilisez au moins 50 entités en entrée et incluez au moins 8 voisins pour chaque entité.

  • Les voisinages de chaque entité incluent toujours l’entité. Si un fichier de pondérations spatiales est utilisé pour définir les voisins, une pondération de 1 est définie pour la pondération de l’entité par rapport à elle-même, même si la pondération n’est pas définie dans le fichier de pondérations spatiales. Les pondérations de chaque voisinage sont standardisées par lignes de sorte que leur somme soit égale à 1.

  • L’environnement Générateur de nombres aléatoires permet de reproduire les permutations et valeurs p. Si aucune valeur initiale n’est indiquée, les valeurs p globales et locales peuvent varier en raison du caractère aléatoire. Toutefois, si l’environnement Facteur de traitement parallèle est défini sur une valeur supérieure à 1 (valeur par défaut), les permutations ne sont pas cohérentes, même avec une valeur initiale constante du générateur de nombres aléatoires.

  • L’inversion de l’ordre des deux variables d’analyse ne modifie pas les statistiques L de Lee globales ou locales, mais les valeurs p peuvent varier en raison du caractère aléatoire des permutations. Les catégories High-Low et Low-High sont également inversées.

Paramètres

ÉtiquetteExplicationType de données
Entités en entrée

Entités en entrée contenant les champs des deux variables d’analyse.

Feature Layer
Champ d’analyse 1

Champ de la première variable d’analyse. Le champ doit être numérique.

Field
Champ d’analyse 2

Champ de la deuxième variable d’analyse. Le champ doit être numérique.

Field
Entités en sortie

Entités en sortie contenant les statistiques L de Lee locales, les catégories de l’association spatiale, les valeurs p et les moyennes pondérées des voisins de chaque entité.

Feature Class
Type de voisinage
(Facultatif)

Spécifie la manière dont les voisins de chaque entité est déterminée. L’entité est toujours incluse dans le voisinage et toutes les pondérations de voisinage sont standardisées de sorte que leur somme soit égale à 1.

  • Canal de distance constanteLes entités qui se trouvent à une distance critique donnée de chaque entité seront incluses comme voisines. Il s’agit de la valeur par défaut pour les entités ponctuelles.
  • K voisins les plus prochesLes k entités les plus proches sont incluses en tant que voisines.
  • Segments de contiguïté uniquementLes entités surfaciques qui partagent un segment seront incluses en tant que voisines.
  • Angles des segments de contiguïtéLes entités surfaciques qui partagent un segment ou un angle sont incluses en tant que voisines. Il s’agit de la valeur par défaut pour les entités surfaciques.
  • triangulation de DelaunayLes points dont la triangulation de Delaunay (polygones de Thiessen) partage un segment ou un angle sont inclus en tant que voisins.
  • Extraire les pondérations spatiales à partir du fichierLes voisins et pondérations sont définis par un fichier de pondérations spatiales.
String
Canal de distance
(Facultatif)

Canal de distance utilisé pour déterminer les voisins autour de l’entité focale. Si aucune valeur n’est indiquée, la distance correspond à la distance la plus courte pour laquelle chaque entité comporte au moins un autre voisin dans son voisinage. Pour les polygones, la distance séparant les centroïdes est utilisée pour déterminer les voisins.

Linear Unit
Nombre de voisins
(Facultatif)

Nombre de voisins autour de chaque entité à inclure en tant que voisins. La valeur n’inclut pas l’entité. En spécifiant la valeur 6, par exemple, vous utilisez l’entité et ses six voisins les plus proches (soit sept entités au total). La valeur par défaut est 8. La valeur doit au moins être égale à 2.

Long
Fichier de matrice de pondérations
(Facultatif)

Chemin d’accès et nom du fichier de matrice de pondérations spatiales définissant les voisins et les pondérations entre les entités.

File
Structure de pondération locale
(Facultatif)

Indique le schéma de pondération appliqué aux voisins lors du calcul des associations spatiales.

  • Non pondéréLes voisins ne seront pas pondérés. Il s’agit de l’option par défaut.
  • BicarréLes voisins sont pondérés en utilisant un noyau bicarré (quartique).
String
Bande passante de noyau
(Facultatif)

Bande passante pour le noyau bicarré. La bande passante définit la rapidité selon laquelle les pondérations diminuent en fonction de la distance. Les bandes passantes les plus grandes fournissent des pondérations relativement supérieures aux voisins les plus éloignés de l’entité. Pour le voisinage de k voisins les plus proches, la valeur par défaut (vide) utilise une bande passante adaptative qui est égale à la distance du (k+1)e voisin de l’entité focale. Pour le voisinage du canal de distance constante, la valeur par défaut (vide) utilise la même valeur que le canal de distance.

Linear Unit
Nombre de permutations
(Facultatif)

Indique le nombre de permutations à utiliser pour créer des distributions de référence lors du calcul des valeurs p globales et locales. Toutes les valeurs p sont calculées au moyen de tests bilatéraux d’hypothèses.

  • 99L’analyse utilisera 99 permutations. Avec 99 permutations, la plus petite valeur p possible est 0,02 et toutes les autres valeurs p sont des multiples de cette valeur.
  • 199L’analyse utilisera 199 permutations. Avec 199 permutations, la plus petite valeur p possible est 0,01 et toutes les autres valeurs p sont des multiples de cette valeur.
  • 499L’analyse utilisera 499 permutations. Avec 499 permutations, la plus petite valeur p possible est 0,004 et toutes les autres valeurs p sont des multiples de cette valeur.
  • 999L’analyse utilisera 999 permutations. Avec 999 permutations, la plus petite valeur p possible est 0,002 et toutes les autres valeurs p sont des multiples de cette valeur. Cette option est recommandée pour les tests dont le niveau de confiance est de 90 pour cent. Il s’agit de l’option par défaut.
  • 4999L’analyse utilisera 4 999 permutations. Avec 4 999 permutations, la plus petite valeur p possible est 0,0004 et toutes les autres valeurs p sont des multiples de cette valeur. Cette option est recommandée pour les tests dont le niveau de confiance est de 95 pour cent.
  • 9999L’analyse utilisera 9 999 permutations. Avec 9 999 permutations, la plus petite valeur p possible est 0,0002 et toutes les autres valeurs p sont des multiples de cette valeur. Cette option est recommandée pour les tests dont le niveau de confiance est de 99 pour cent.
Long

Sortie obtenue

ÉtiquetteExplicationType de données
Statistique L de Lee

Statistique L de Lee pour les variables d’analyse.

Double
Valeur p

Valeur p pour la statistique L de Lee.

Double
Corrélation de Pearson

Corrélation de Pearson entre les variables d’analyse.

Double

arcpy.stats.BivariateSpatialAssociation(in_features, analysis_field1, analysis_field2, out_features, {neighborhood_type}, {distance_band}, {num_neighbors}, {weights_matrix_file}, {local_weighting_scheme}, {kernel_bandwidth}, {num_permutations})
NomExplicationType de données
in_features

Entités en entrée contenant les champs des deux variables d’analyse.

Feature Layer
analysis_field1

Champ de la première variable d’analyse. Le champ doit être numérique.

Field
analysis_field2

Champ de la deuxième variable d’analyse. Le champ doit être numérique.

Field
out_features

Entités en sortie contenant les statistiques L de Lee locales, les catégories de l’association spatiale, les valeurs p et les moyennes pondérées des voisins de chaque entité.

Feature Class
neighborhood_type
(Facultatif)

Spécifie la manière dont les voisins de chaque entité est déterminée. L’entité est toujours incluse dans le voisinage et toutes les pondérations de voisinage sont standardisées de sorte que leur somme soit égale à 1.

  • DISTANCE_BANDLes entités qui se trouvent à une distance critique donnée de chaque entité seront incluses comme voisines. Il s’agit de la valeur par défaut pour les entités ponctuelles.
  • K_NEAREST_NEIGHBORSLes k entités les plus proches sont incluses en tant que voisines.
  • CONTIGUITY_EDGES_ONLYLes entités surfaciques qui partagent un segment seront incluses en tant que voisines.
  • CONTIGUITY_EDGES_CORNERSLes entités surfaciques qui partagent un segment ou un angle sont incluses en tant que voisines. Il s’agit de la valeur par défaut pour les entités surfaciques.
  • DELAUNAY_TRIANGULATIONLes points dont la triangulation de Delaunay (polygones de Thiessen) partage un segment ou un angle sont inclus en tant que voisins.
  • GET_SPATIAL_WEIGHTS_FROM_FILELes voisins et pondérations sont définis par un fichier de pondérations spatiales.
String
distance_band
(Facultatif)

Canal de distance utilisé pour déterminer les voisins autour de l’entité focale. Si aucune valeur n’est indiquée, la distance correspond à la distance la plus courte pour laquelle chaque entité comporte au moins un autre voisin dans son voisinage. Pour les polygones, la distance séparant les centroïdes est utilisée pour déterminer les voisins.

Linear Unit
num_neighbors
(Facultatif)

Nombre de voisins autour de chaque entité à inclure en tant que voisins. La valeur n’inclut pas l’entité. En spécifiant la valeur 6, par exemple, vous utilisez l’entité et ses six voisins les plus proches (soit sept entités au total). La valeur par défaut est 8. La valeur doit au moins être égale à 2.

Long
weights_matrix_file
(Facultatif)

Chemin d’accès et nom du fichier de matrice de pondérations spatiales définissant les voisins et les pondérations entre les entités.

File
local_weighting_scheme
(Facultatif)

Indique le schéma de pondération appliqué aux voisins lors du calcul des associations spatiales.

  • UNWEIGHTEDLes voisins ne seront pas pondérés. Il s’agit de l’option par défaut.
  • BISQUARELes voisins sont pondérés en utilisant un noyau bicarré (quartique).
String
kernel_bandwidth
(Facultatif)

Bande passante pour le noyau bicarré. La bande passante définit la rapidité selon laquelle les pondérations diminuent en fonction de la distance. Les bandes passantes les plus grandes fournissent des pondérations relativement supérieures aux voisins les plus éloignés de l’entité. Pour le voisinage de k voisins les plus proches, la valeur par défaut (vide) utilise une bande passante adaptative qui est égale à la distance du (k+1)e voisin de l’entité focale. Pour le voisinage du canal de distance constante, la valeur par défaut (vide) utilise la même valeur que le canal de distance.

Linear Unit
num_permutations
(Facultatif)

Indique le nombre de permutations à utiliser pour créer des distributions de référence lors du calcul des valeurs p globales et locales. Toutes les valeurs p sont calculées au moyen de tests bilatéraux d’hypothèses.

  • 99L’analyse utilisera 99 permutations. Avec 99 permutations, la plus petite valeur p possible est 0,02 et toutes les autres valeurs p sont des multiples de cette valeur.
  • 199L’analyse utilisera 199 permutations. Avec 199 permutations, la plus petite valeur p possible est 0,01 et toutes les autres valeurs p sont des multiples de cette valeur.
  • 499L’analyse utilisera 499 permutations. Avec 499 permutations, la plus petite valeur p possible est 0,004 et toutes les autres valeurs p sont des multiples de cette valeur.
  • 999L’analyse utilisera 999 permutations. Avec 999 permutations, la plus petite valeur p possible est 0,002 et toutes les autres valeurs p sont des multiples de cette valeur. Cette option est recommandée pour les tests dont le niveau de confiance est de 90 pour cent. Il s’agit de l’option par défaut.
  • 4999L’analyse utilisera 4 999 permutations. Avec 4 999 permutations, la plus petite valeur p possible est 0,0004 et toutes les autres valeurs p sont des multiples de cette valeur. Cette option est recommandée pour les tests dont le niveau de confiance est de 95 pour cent.
  • 9999L’analyse utilisera 9 999 permutations. Avec 9 999 permutations, la plus petite valeur p possible est 0,0002 et toutes les autres valeurs p sont des multiples de cette valeur. Cette option est recommandée pour les tests dont le niveau de confiance est de 99 pour cent.
Long

Sortie obtenue

NomExplicationType de données
lee_l

Statistique L de Lee pour les variables d’analyse.

Double
p_value

Valeur p pour la statistique L de Lee.

Double
corr

Corrélation de Pearson entre les variables d’analyse.

Double

Exemple de code

Exemple 1 d’utilisation de la fonction BivariateSpatialAssociation (fenêtre Python)

Le script ci-dessous pour la fenêtre Python illustre l’utilisation de la fonction BivariateSpatialAssociation.

# Calculate the Lee's L statistic using eight nearest neighbors
# and adaptive bandwidth.
arcpy.env.workspace = r"c:\data\project_data.gdb"
arcpy.stats.BivariateSpatialAssociation(
    in_features=r"myFeatureClass",
    analysis_field1="myAnalysisField1",
    analysis_field2="myAnalysisField2",
    out_features=r"myOutputFeatureClass",
    neighborhood_type="K_NEAREST_NEIGHBORS",
    distance_band=None,
    num_neighbors=8,
    weights_matrix_file=None,
    local_weighting_scheme="BISQUARE",
    kernel_bandwidth=None,
    num_permutations=9999
)
Exemple 2 d’utilisation de la fonction BivariateSpatialAssociation (script autonome)

Le script autonome ci-dessous illustre l’utilisation de la fonction BivariateSpatialAssociation.

# Calculate the Lee's L statistic for two analysis fields.  

import arcpy 

# Set the current workspace
arcpy.env.workspace = r"c:\data\project_data.gdb" 

# Run tool

arcpy.stats.BivariateSpatialAssociation(
    in_features=r"myFeatureClass",
    analysis_field1="myAnalysisField1",
    analysis_field2="myAnalysisField2",
    out_features=r"myOutputFeatureClass",
    neighborhood_type="CONTIGUITY_EDGES_CORNERS",
    distance_band=None,
    num_neighbors=None,
    weights_matrix_file=None,
    local_weighting_scheme="UNWEIGHTED",
    kernel_bandwidth=None,
    num_permutations=9999
)

# Print the messages. The messages include the Lee's L statistic, p-value, 
# Pearson correlations, and spatial smoothing scalars.

print(arcpy.GetMessages())

Informations de licence

  • Basic: Oui
  • Standard: Oui
  • Advanced: Oui

Rubriques connexes