Fonctionnement de l'analyse d'agrégat spatial multi-distances (fonction K de Ripley)

L’outil Analyse d’agrégat spatial multi-distances, basé sur la fonction K de Ripley, est une autre méthode pour analyser le modèle spatial de données ponctuelles d’incident. Une fonction caractéristique de cette méthode par rapport à d’autres dans ce jeu d’outils (Auto-corrélation spatiale et Hot Spot Analysis) est qu’elle récapitule la dépendance spatiale (agrégation ou dispersion des entités) sur une plage de distances. Dans de nombreuses études d’analyse du modèle des entités, la sélection d’une échelle d’analyse appropriée est nécessaire. Par exemple, un canal distance ou distance seuil (Distance Band or Threshold Distance) est souvent nécessaire pour l’analyse. Lors de l’exploration de motifs spatiaux à plusieurs distances et échelles spatiales, les motifs évoluent et reflètent souvent la dominance des effets de processus spatiaux particuliers. La fonction K de Ripley illustre comment l'agrégation ou la dispersion spatiale des centroïdes d'entité évolue lorsque la taille du voisinage change.

Lorsque vous utilisez cet outil, spécifiez le nombre de distances à évaluer et éventuellement une distance initiale et/ou un incrément de distance. Avec ces informations, l’outil calcule le nombre moyen d’entités voisines associées à chaque entité ; les entités voisines sont celles qui sont plus proches que la distance évaluée. Avec l’augmentation de la distance d’évaluation, chaque entité dispose en général d’un nombre croissant de voisins. Si le nombre moyen de voisins pour une distance d'évaluation particulière est plus élevé/important que la concentration moyenne d'entités dans l'ensemble de la zone d'étude, la distribution est considérée agrégée à cette distance.

Utilisez cet outil lorsque vous souhaitez examiner l'évolution de l'agrégation/dispersion de vos entités à différentes distances (différentes échelles d'analyse).

Calculs

Plusieurs variations de la fonction K de Ripley d’origine ont été suggérées. Ici, une transformation courante de la fonction K, souvent connue sous le nom de L(d), est implémentée :

Équation de transformation de la fonction K
Avec la transformation L(d), la valeur K attendue est égale à la distance.

Les valeurs par défaut pour Beginning Distance (Distance de départ) et Distance Increment (Incrément de distance) sont calculées de la façon suivante :

  • Nous connaissons toujours le nombre de canaux de distance (Number of Distance Bands) (la valeur par défaut est 10). Nous allons utiliser cette valeur d’itérations pour calculer un incrément de distance (Distance Increment) par défaut, si aucun incrément n’est fourni.
  • Nous calculons au départ une valeur de distance maximale correspondant à 25 % de la longueur d’étendue maximale d’un rectangle d’encadrement minimal des entités en entrée. Si la méthode de correction des bords (Boundary Correction Method) est Reduce analysis area (Réduire la zone d’analyse), la distance maximale est définie sur la valeur la plus importante entre 25 % de la longueur d’étendue maximale ou 50 % de la longueur d’étendue minimale du rectangle d’encadrement minimal.
  • Si une distance de départ (Beginning Distance) est fournie, l’incrément de distance (Distance Increment) est (Distance maximale - Distance de départ) / Itérations.
  • Si aucune distance de départ (Beginning Distance) n’est indiquée, l’incrément de distance (Distance Increment) est Distance maximale / Itérations et la distance de départ (Beginning Distance) est définie comme étant la valeur d’incrément de distance.

Interprétation des résultats non pondérés de la fonction K

Lorsque la valeur K observée est plus grande que la valeur K attendue pour une distance particulière, la distribution est plus agrégée qu'une distribution aléatoire à cette distance (échelle d'analyse). Lorsque la valeur K observée est plus petite que la valeur K attendue, la distribution est plus dispersée qu'une distribution aléatoire à cette distance. Lorsque la valeur K observée est plus grande que la valeur de l’enveloppe de confiance supérieure (HiConfEnv), l’agrégation spatiale pour cette distance est statistiquement significative. Lorsque la valeur K observée est plus petite que la valeur de l’enveloppe de confiance supérieure (LwConfEnv), la dispersion spatiale pour cette distance est statistiquement significative.

Si aucun champ de pondération (Weight Field) n’est spécifié, l’enveloppe de confiance est construite en distribuant aléatoirement des points dans la zone d’étude et en calculant k pour cette distribution. Chaque distribution aléatoire des points est appelée "permutation". Si 99 permutations sont sélectionnées par exemple, l’outil distribue aléatoirement l’ensemble de points 99 fois pour chaque itération. Après avoir distribué les points 99 fois, l’outil sélectionne pour chaque distance la valeur k ayant présenté la plus grande déviation au-dessus et au-dessous de la valeur k attendue ; ces valeurs deviennent l’intervalle de confiance. Les enveloppes de confiance ont tendance à suivre (présenter une forme et un emplacement identiques) la ligne bleue des valeurs K attendues pour un K non pondéré.

Interprétation des résultats de la fonction K

Interprétation des résultats pondérés de la fonction K

La fonction K évalue toujours la distribution spatiale des entités par rapport au caractère CSR (Complete Spatial Randomness, caractère aléatoire spatial complet), même lorsqu’un champ de pondération (Weight Field) est fourni. Vous pouvez considérer la pondération comme une représentation du nombre d’entités coïncidentes à chaque emplacement d’entité. Par exemple, une entité avec une pondération de 3 peut être interprétée comme 3 entités coïncidentes. Il existe toutefois une différence : une entité ne peut pas être sa propre voisine. Par conséquent, vous recevez un résultat différent pour un jeu de données avec 3 points coïncidents individuels avec une pondération de 1 (tous comptés en tant que voisins entre eux) que pour un jeu de données avec un seul point avec une pondération de 3 (une entité n’est pas comptée en tant que voisine d’elle-même). Les résultats de la fonction K pondérée sont toujours plus agrégés que les résultats sans champ de pondération. Il est utile d’exécuter la fonction K sur les points sans pondération pour obtenir une ligne de base indiquant l’intensité d’agrégation associée aux seuls emplacements d’entités. Vous pouvez ensuite comparer la ligne de base aux résultats pondérés pour obtenir une idée de l’intensité d’agrégation ou de dispersion supplémentaire ajoutée par la prise en compte des pondérations. La fonction K pondérée affiche l’agrégation (dispersion) en plus (en moins) de celle obtenue à partir du modèle non pondéré. En fait, au lieu du caractère CSR, vous pouvez utiliser des résultats de la fonction K non pondérée pour représenter le modèle attendu (avec sa propre enveloppe de confiance). Il existe deux hypothèses nulles possibles dans ce cas :

  1. Le modèle des entités pondérées n’est pas considérablement plus agrégé (dispersé) que le modèle sous-jacent de ces entités. Vous rejetez l'hypothèse nulle si les résultats pondérés observés tombent à l'extérieur de l'enveloppe de confiance des résultats non pondérés.
  2. Le modèle de points pondérés est plus agrégé (dispersé) que dans une situation aléatoire. Vous rejetez l'hypothèse nulle si les résultats non pondérés observés tombent dans l'enveloppe de confiance pour les résultats de la fonction K pondérée.

Lorsqu'un champ de pondération est spécifié, seules les valeurs de pondération sont redistribuées aléatoirement pour calculer des enveloppes de confiance ; les emplacements des points restent fixes. Essentiellement, lorsqu’un champ de pondération (Weight Field) est spécifié, les emplacements restent fixes et l’outil évalue l’agrégation des valeurs d’entité dans l’espace. Etant donné que les résultats sont fortement structurés par les emplacements fixes des entités, pour les analyses de fonction K pondérée l'enveloppe de confiance a tendance à suivre/refléter la ligne rouge des valeurs K observées.

Ressources supplémentaires

Bailey, T. C. et A. C. Gatrell. Interactive Spatial Data Analysis. Longman Scientific & Technical, Harlow, U.K. 395 pp. 1995.

Boots, B. et A. Getis. Point Pattern Analysis. Sage University Paper Series on Quantitative Applications in the Social Sciences, series no. 07–001. Sage Publications. 1988.

Getis, A. Interactive Modeling Using Second-Order Analysis. Environment and Planning A, 16: 173–183. 1984.

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.