Fonctionnement de l'outil High/Low Clustering (Getis-Ord General G)

L’outil Agrégation élevée/faible (Getis-Ord General G) mesure la concentration de valeurs élevées ou faibles pour une zone d’étude donnée.

Calculs

Formules mathématiques de la statistique General G

Consulter d’autres calculs de la statistique General G

Vous pouvez remarquer que la seule différence entre le numérateur et le dénominateur est la pondération (wij). L’outil Agrégation élevée/faible fonctionne uniquement avec des valeurs positives. Par conséquent, si vos pondérations sont binaires (0/1) ou sont toujours inférieures à 1, la plage de l’indice General G est comprise entre 0 et 1. Une structure de pondération binaire est recommandée pour cette statistique. Sélectionnez Fixed distance band (Canal de distance constante), Contiguity edges only (Tronçons de contiguïté uniquement), Contiguity edges corners (Angles des tronçons de contiguïté), K nearest neighbors (K voisins les plus proches), ou un fichier .swm avec Delaunay triangulation (Triangulation de Delaunay) comme valeur du paramètre Conceptualization of Spatial Relationships (Conceptualisation de relations spatiales). Sélectionnez None (Aucune) comme valeur du paramètre Standardization (Standardisation ).

Interprétation

La statistique Agrégation élevée/faible (Getis-Ord General G) est une statistique inférentielle, ce qui signifie que les résultats de l’analyse sont interprétés par rapport à l’hypothèse nulle. L’hypothèse nulle de cette statistique stipule qu’il n’y a aucune agrégation spatiale de valeurs d’entité. Lorsque la valeur p renvoyée par cet outil est faible et statistiquement significative, l’hypothèse nulle peut être rejetée (voir la rubrique Qu’est-ce qu’un score z ? Qu’est-ce qu’une valeur p ?). En cas de rejet de l’hypothèse nulle, le signe du score z devient important. Si la valeur du score z est positive, l’indice General G observé est plus grand que l’indice General G attendu, indiquant par là que les valeurs élevées de l’attribut sont agrégées dans la zone d’étude. Si la valeur de score z est négative, l'indice General G observé est plus petit que l'indice attendu, indiquant ainsi que les valeurs faibles sont agrégées dans la zone d'étude.

L’outil Agrégation élevée/faible (Getis-Ord General G) est particulièrement indiqué lorsque vous êtes en présence d’une distribution de valeurs relativement homogène et que vous recherchez des pics spatiaux inattendus de valeurs élevées. Malheureusement, lorsque les valeurs élevées et faibles s’agrègent les unes comme les autres, elles ont tendance à se neutraliser. Si vous souhaitez mesurer l’agrégation spatiale en présence de valeurs élevées et faibles agrégées, utilisez l’outil Autocorrélation spatiale.

L’hypothèse nulle dans le cas des outils Agrégation élevée/faible (Getis-Ord General G) et Autocorrélation spatiale (Global Moran’s I) est une structure spatiale totalement aléatoire (CSR, Complete spatial randomness) ; les valeurs sont distribuées aléatoirement dans les entités du jeu de données, reflétant ainsi des processus spatiaux aléatoires à l’œuvre. Toutefois, l’interprétation des scores z de l’outil Agrégation élevée/faible diffère de l’interprétation des scores z de l’outil Autocorrélation spatiale (Global Moran’s I), comme indiqué dans le tableau suivant :

RésultatAgrégation faible-élevéeAutocorrélation spatiale

La valeur p n’est pas statistiquement significative.

Vous ne pouvez pas rejeter l’hypothèse nulle. Il est tout à fait possible que la distribution spatiale des valeurs attributaires des entités résulte de processus spatiaux aléatoires. Autrement dit, le modèle spatial observé des valeurs pourrait bien être l’un des innombrables scénarios possibles d’une structure totalement aléatoire.

La valeur p est statistiquement significative, et le score z est positif.

Vous pouvez rejeter l’hypothèse nulle. La distribution spatiale des valeurs élevées dans le jeu de données présente une agrégation spatiale plus importante que si les processus spatiaux sous-jacents étaient réellement aléatoires.

Vous pouvez rejeter l’hypothèse nulle. La distribution spatiale de valeurs élevées et/ou de valeurs faibles dans le jeu de données fait l'objet d'une agrégation spatiale plus importante que si les processus spatiaux sous-jacents étaient aléatoires.

La valeur p est statistiquement significative, et le score z est négatif.

Vous pouvez rejeter l’hypothèse nulle. La distribution spatiale des valeurs faibles dans le jeu de données présente une agrégation spatiale plus importante que si les processus spatiaux sous-jacents étaient réellement aléatoires.

Vous pouvez rejeter l’hypothèse nulle. La distribution spatiale des valeurs élevées et des valeurs faibles dans le jeu de données présente une dispersion spatiale plus importante que si les processus spatiaux sous-jacents étaient réellement aléatoires. Un modèle spatial dispersé reflète souvent un processus de type concurrentiel : une entité présentant une valeur élevée repousse d'autres entités associées à des valeurs élevées ; de la même façon, une entité associée à une valeur faible repousse d'autres entités associées à des valeurs faibles.

Sortie

L’outil Agrégation élevée/faible (Getis-Ord General G) renvoie quatre valeurs : General G observé, General G attendu, score z et valeur p. Les valeurs sont écrites sous forme de messages au bas de la fenêtre Géotraitement au cours de l'exécution de l'outil et transmises sous la forme de valeurs en sortie dérivées pour une utilisation éventuelle dans des modèles ou des scripts. Vous pouvez accéder aux messages en passant le curseur de la souris sur la barre d’avancement, en cliquant sur le bouton de menu contextuel ou en développant la section de messages dans la fenêtre Geoprocessing (Géotraitement). Vous pouvez également consulter les messages de l’exécution précédente d’un outil via l’historique de géotraitement. Vous pouvez également utiliser cet outil pour créer un fichier de rapport HTML présentant un récapitulatif graphique des résultats. Le chemin d'accès au rapport est inclus avec les messages qui récapitulent les paramètres d'exécution de l'outil. Cliquez sur ce chemin d’accès pour ouvrir le fichier de rapport.

Forum aux questions

Q : Les résultats de l’outil Analyse de points chauds (Getis-Ord Gi*) révèlent des points chauds statistiquement significatifs. Pourquoi les résultats de l’outil Agrégation élevée/faible (Getis-Ord General G) ne sont-ils pas également statistiquement significatifs ?

R : Les outils de statistiques globales, tels que l’outil Agrégation élevée/faible (Getis-Ord General G), évaluent le modèle et la tendance de vos données dans leur ensemble. Ils donnent les meilleurs résultats lorsque le modèle spatial est cohérent dans toute la zone d’étude. Les outils de statistiques locales (tels que l’outil Analyse de points chauds) évaluent chaque entité par rapport aux entités voisines et comparent la situation locale à la situation globale. Prenons un exemple. Lorsque vous calculez la moyenne d’un ensemble de valeurs, vous calculez également une statistique globale. Si toutes les valeurs sont proches de 20, la moyenne se situe également autour de 20, et ce résultat représente et synthétise bien le jeu de données dans son ensemble. En revanche, si une moitié des valeurs est proche de 1 et si l’autre moitié est proche de 100, la moyenne se situe aux alentours de 50. Il se peut qu’aucune des valeurs de données ne soit proche de 50, si bien que la valeur moyenne n’est ni représentative ni récapitulative du jeu de données dans son ensemble. Toutefois, si vous créez un histogramme des valeurs des données, vous pourrez constater la distribution bimodale. De la même façon, les statistiques spatiales globales, notamment avec l’outil Agrégation élevée/faible, donnent les meilleurs résultats lorsque les processus spatiaux qui sont mesurés sont cohérents dans la zone d’étude. Les résultats constituent alors une bonne représentation et une bonne synthèse du modèle spatial global. Pour plus d'informations, reportez-vous à l'article de Getis et Ord (1992) cité ci-dessous et à l'analyse du syndrome de mort subite du nourrisson qu'ils présentent.

Q : Pourquoi les résultats de l’outil Agrégation élevée/faible (Getis-Ord General G) sont-ils différents des résultats de l’outil Spatial Autocorrélation spatiale (Global Moran’s I) ?

R : Reportez-vous au tableau ci-dessus. Ces outils mesurent des modèles spatiaux différents.

Q : Est-il possible de comparer les scores z ou les valeurs p de cet outil aux résultats de l’analyse d’une zone d’étude différente ?

R : Les résultats ne sont pas comparables à moins que la zone d’étude et que les paramètres utilisés pour l’analyse soient constants (identiques pour toutes les analyses à comparer). Si toutefois la zone d’étude comprend un ensemble fixe de polygones, et que les paramètres d’analyse sont constants, vous pouvez comparer les scores z d’un attribut particulier sur une période donnée. Par exemple, vous souhaitez analyser les tendances à l’agrégation en matière d’achat de médicaments sans ordonnance, au niveau des secteurs, pour un comté particulier. Dans ce cas, vous pouvez exécuter l’outil Agrégation élevée/faible (Getis-Ord General G) pour chaque période et créer un diagramme linéaire des résultats. S'il se trouve que les scores z sont statistiquement significatifs et croissants, vous pouvez en conclure que l'intensité d'agrégation spatiale pour les valeurs élevées d'achat de médicaments augmente.

Q : La taille des entités a-t-elle une incidence sur l’analyse ?

R : La taille des entités peut conditionner les résultats. Par exemple, si les grands polygones ont tendance à avoir des valeurs faibles, et les polygones plus petits à avoir des valeurs élevées, même si la concentration de valeurs faibles et élevées est homogène, l’indice General G observé peut être plus élevé que l’indice General G attendu, dans la mesure où il y a plus de paires de petits polygones sur la distance spécifiée.

Applications possibles

  • Rechercher des pics inattendus du nombre de visites au service des urgences, qui peuvent indiquer l’apparition d’un problème sanitaire local ou régional.
  • Comparer le modèle spatial de différents types de vente au détail dans une ville pour déterminer quels types de commerce s’agrègent à la concurrence pour tirer avantage de la comparaison des offres (concessions automobiles, par exemple) et quels types repoussent la concurrence (centres de remise en forme, par exemple).
  • Synthétiser le niveau d’agrégation des phénomènes spatiaux pour examiner les variations à différentes périodes ou à différents emplacements. Par exemple, on sait que les villes et leur population s’agrègent. À l’aide de l’outil Agrégation élevée/faible (Getis-Ord General G), vous pouvez comparer le niveau d’agrégation de la population d’une ville dans le temps (analyse de croissance et de densité urbaine).

Ressources supplémentaires

Getis, Arthur, and J. K. Ord. "The Analysis of Spatial Association by Use of Distance Statistics." Geographical Analysis 24, no. 3. 1992.

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.