Fonctionnement des associations spatiales entre les zones

L’outil Association spatiale entre les zones permet de mesurer le degré d’association spatiale entre deux régionalisations de même surface, lorsque chaque régionalisation est composée d’un ensemble de catégories, appelées zones. L’association entre les ensembles de zones est déterminée par la superposition de surface entre les zones de chaque régionalisation, et l’association est plus importante lorsque la surface des zones des deux régionalisations correspondent étroitement de façon spatiale. De la même manière, l’association spatiale est moins importante lorsque les zones de chaque régionalisation ont une superposition importante avec de nombreuses zones de l’autre régionalisation. La sortie principale est une association globale de l’association spatiale, d’un seul numéro compris entre 0 (pas de correspondance) et 1 (alignement spatial parfait des zones), mais l’association peut également être calculée et visualisée pour des zones spécifiques de la régionalisation ou pour des combinaisons particulières de zones issues des régionalisations utilisant des sorties facultatives. Chaque ensemble de zones peut être fourni en tant qu’entité surfacique ou que raster, et un champ catégoriel est utilisé pour indiquer la zone de chaque cellule d’entité ou raster.

Illustration de l’association spatiale entre des zones

Des exemples d’association élevée et faible entre les zones bleues et oranges sont illustrés.

Applications possibles

Cet outil peut être utilisé dans les exemples d’applications suivants :

  • Un gestionnaire de forêts peut planifier la lutte contre les nuisibles en comparant une carte du type de forêt à une carte des risques de maladies liées aux insectes nuisibles (faible, moyen et élevé) correspondant à un type de forêt. Cela permet au gestionnaire de forêts de déterminer quels types de forêts présentent le plus ou le moins de risque en matière de maladie liée aux insectes.
  • Un écologiste a créé une carte d’aptitude de l’habitat classé pour le loup gris en intégrant des variables telles que la pente, l’occupation du sol et la distance par rapport à un point d’eau. L’écologiste cherche à déterminer dans quelle mesure la carte d’aptitude finale correspond à chacune des variables utilisées pour la créer. L’écologiste peut exécuter cet outil plusieurs fois afin de calculer une mesure numérique de l’association entre la carte d’aptitude et chaque variable. Une correspondance élevée avec une seule variable et une correspondance faible avec toutes les autres variables peut indiquer qu’une seule variable a une influence disproportionnée sur l’aptitude finale.

Mesures de l’association

La statistique utilisée pour mesurer l’association spatiale entre les zones est appelée Mesure V et détermine la quantité d’informations qui peuvent être obtenues concernant l’un des ensembles de zones en observant les valeurs des autres ensembles de zones. Par exemple, si vous connaissez le type de forêt d’un emplacement, comment pourriez-vous être certain du type de sol de ce même emplacement ? De la même manière, si vous connaissez le type de sol d’un emplacement, dans quelle mesure pouvez-vous prévoir avec certitude le type de forêt ? Pour comprendre pourquoi ces deux questions sont différentes, supposez qu’un type de sol particulier apparaisse uniquement dans un type de forêt particulier, mais que ce type de forêt est composé de plusieurs types de sols. Si vous savez à quel endroit se trouve ce type de sol, vous pouvez être certain du type de forêt de l’emplacement, car le type de sol caractérise un seul type de forêt. Toutefois, même si vous connaissez un emplacement avec ce type de forêt, vous ne pouvez pas être certain de son type de sol, car ce type de forêt présente de nombreux types de sols. Plus le type de forêt est divisé en différents types de sols, plus il est difficile de prévoir le type de sol de l’emplacement. Dans le pire des cas, si la surface de la forêt est divisée en parts égales entre chaque type de sol, vous n’auriez aucune raison de privilégier un type de sol sur un autre. Par conséquent, pour mesurer l’association du type de forêt et du type de sol, vous devez regarder la diversité des types de sols dans des types de forêts fixes et la diversité des types de forêts dans des types de sols fixes.

Pour plus clarté, les zones en entrée correspondent au premier ensemble de zones, et les zones de superposition au second ensemble de zones. La Mesure V est calculée en mesurant la diversité des zones de superposition à l’intérieur des zones en entrée, et la diversité des zones en entrée à l’intérieur des zones de superposition, puis en calculant la moyenne harmonique de ces deux valeurs. Les trois mesures globales de l’association sont les suivantes :

  • Global Measure of Association (Mesure globale de l’association) — La mesure V, une mesure de l’association globale entre les zones en entrée et de superposition. Les plages de valeurs sont comprises entre 0 (aucune association) et 1 (correspondance parfaite). La valeur ne dépend pas du fait de savoir laquelle des deux régionalisations est spécifiée en tant que zone en entrée ou que zone de superposition (cette valeur de change pas même si les zones en entrée et de superposition sont inversées). La statistique est déterminée en calculant la moyenne harmonique des deux mesures d’association globale suivantes.
  • Global Correspondence of Overlay Zones within Input Zones (Correspondance globale des zones de superposition à l’intérieur des zones en entrée) — Mesure de la cohérence des catégories de la superposition à l’intérieur de chacune des zones en entrée, comprise entre 0 et 1. La valeur 1 indique que chaque zone en entrée renferme une seule zone de superposition (correspondance parfaite des zones). Les valeurs proches de 0 indiquent que les zones en entrée sont uniformément divisées en plusieurs catégories des zones de superposition (faible correspondance avec une seule zone de superposition). Cette mesure est appelée une exhaustivité dans le document dont il est fait mention à la section Ressources supplémentaires.
  • Global Correspondence of Input Zones within Overlay Zones (Correspondance globale des zones en entrée dans les zones de superposition) : mesure de la cohérence des catégories de la superposition dans chacune des zones en entrée. Cette valeur est analogue à l’autre valeur de correspondance globale, mais elle mesure la variabilité des zones en entrée dans les zones de superposition. Ces deux mesures échangent leurs valeurs en cas d’inversion des zones en entrée et des zones de superposition. Cette mesure est appelée une homogénéité dans le document dont il est fait mention à la section Ressources supplémentaires.

Ces trois mesures d’association globale s’affichent dans les messages de géotraitement et sont renvoyées comme des sorties dérivées. Ces sorties dérivées peuvent être référencées comme des variables dans les scripts Python ou utilisées comme des entrées avec d’autres outils de ModelBuilder. Les formules correspondant à chacune des mesures peuvent être consultées dans la référence de la section Ressources supplémentaires.

Examiner la correspondance de zone spatialement

Les deux mesures de correspondance globale utilisées pour calculer la Mesure V peuvent faire l’objet d’une division spatiale dans chaque intersection des zones en entrée et des zones de superposition. Chacune de ces intersections mesure la correspondance d’une combinaison particulière de zone en entrée et de zone de superposition, telle que la correspondance entre un sol pour maïs (type de culture) et un sol bien drainé (classe de drainage du sol). Ces combinaisons spécifiques peuvent être créées à l’aide du paramètre Output Features (Entités en sortie) ou Output Raster (Raster en sortie), selon que les zones ont été spécifiées en tant que polygones ou que rasters. A l’inverse de l’association globale et des mesures de correspondance, de plus petites valeurs de mesures de correspondance locales indiquent une plus grande correspondance des combinaisons de zone. La valeur minimale 0 indique une correspondance parfaite. Les mesures locales n’ont pas de limite supérieure, mais elles sont rarement supérieures à 2.

Si l’entité ou le raster en sortie est ajouté(e) à une carte, elle/il apparaît dans un schéma en couleur présentant simultanément la correspondance d’une zone en entrée spécifique à l’intérieur d’une zone de superposition spécifique et la correspondance de la zone en entrée à l’intérieur de la zone de superposition. Les nuances de bleu plus claires indiquent une plus grande correspondance de la zone de superposition à l’intérieur de la zone en entrée, les nuances de rose plus claires indiquant une plus grande correspondance de la zone en entrée à l’intérieur de la zone de superposition. Les surfaces qui s’affichent dans la nuance de gris la plus claire indiquent la plus grande correspondance dans les deux directions, et la nuance de violet la plus claire indique le plus faible niveau de correspondance dans les deux directions.

Schéma de couleur bivarié

Remarque :

Pour la création du schéma de couleur bivarié, au moins trois valeurs uniques sont nécessaires pour la correspondance des zones de superposition dans les zones en entrée et la correspondance des zones en entrée dans les zones de superposition. Dans ce cas, il est recommandé d’afficher les intersections agrégées par zone.

Par exemple, l’image ci-dessous montre les intersections des régions de température et de zones climatiques. Les niveaux de correspondance globale les plus élevés se trouvent dans les régions les plus au sud et les plus au nord du pays, indiquées par les surfaces d’intersection gris clair. Les niveaux de correspondance les plus faibles se trouvent dans les régions centrales et occidentales.

Intersections des zones climatiques et de température

Les intersections sont également accompagnées de deux diagrammes permettant de visualiser la correspondance des combinaisons de zones particulières. Le premier diagramme est Récapitulatif des zones de superposition à l’intérieur de zones en entrée, un diagramme à barres côte à côte divisé en chaque catégorie de zones en entrée. Chacun des diagrammes à barres côte à côte présente la surface d’intersection des zones de superposition avec la zone en entrée.

Par exemple, dans l’image ci-dessous, les zones en entrée sont le type de forêt, et les zones de superposition sont la catégorie d’insectes et de risques de maladies. Pour chaque type de forêt, un diagramme à barres est présenté pour la surface de l’intersection à l’intérieur de chacune des catégories d’insectes et de risques de maladies. Le diagramme à barres à l’extrême gauche présente le type de forêt California Mixed Conifer (Conifère mixte de Californie) présentant une intersection nette avec la catégorie No Risk (Aucun risque). Toutefois, environ un tiers de la surface est soit At Risk (A risque) soit Insects/Disease Present (Présence d’insectes/de maladie). Pour le type de forêt Lodgepole Pine (Pin tordu), environ un tiers de la surface seulement ne présente aucun risque, mais un faible pourcentage de la forêt a déjà des insectes/maladies. Pour le type de forêt Pinyon Juniper Woodland (Forêts pinyon-genévrier) à l’extrême gauche, une petite fraction seulement présente un risque ou a des insectes ou des maladies. Les trois barres sont plus courtes pour les forêts pinyon-genévrier que pour le conifère mixte de Californie et le pin tordu, car ce type de forêt présente une surface globalement plus petite à l’intérieur du domaine d’étude.

Diagramme récapitulant les zones de superposition à l’intérieur des zones en entrée

Le deuxième diagramme est Summary of Input Zones within Overlay Zones (Récapitulatif des zones en entrée à l’intérieur des zones de superposition). Il s’apparente au premier diagramme, sauf qu’il présente les intersections de surface de la zone en entrée à l’intérieur des zones de superposition.

Agréger les intersections par zone

Le nombre maximal d’intersections entre les zones en entrée et les zones de superposition est égal au nombre de catégories des zones en entrée multiplié par le nombre de catégories des zones de superposition. Avec autant de combinaisons potentielles et un schéma de couleur bivarié, même avec les diagrammes à barres, il peut être difficile de distinguer quelles zones en entrée spécifiques correspondent à quelles zones de superposition spécifiques. S’il y a trop de combinaisons pour évaluer chacune d’elles individuellement, il est utile d’agréger les mesures de correspondance par zone pour chacune des zones en entrée et des zones de superposition. Cela permet d’identifier les zones en entrée et les zones de superposition qui correspondent à une certaine zone de l’autre régionalisation, mais cela ne vous dira pas exactement à quelle zone elle correspond. Les entités en sortie ou le raster en sortie et les diagrammes peuvent alors être utilisés pour identifier la ou les combinaison(s) exacte(s) de la correspondance. Ces agrégations peuvent être créées à l’aide des paramètres Correspondence of Overlay Zones within Input Zones (Correspondance des zones de superposition à l’intérieur des zones en entrée) et Correspondence of Input Zones within Overlay Zones (Correspondance des zones en entrée à l’intérieur des zones de superposition) si les zones en entrée et les zones de superposition sont des polygones. S’il s’agit d’un raster, les agrégations sont enregistrées en tant que champs du raster en sortie. Une fois ajoutées à une carte, les surfaces affichées dans des couleurs plus claires correspondent à des surfaces de correspondance plus élevée.

Intersections agrégées

Ressources supplémentaires

Pour plus d’informations et plus de détails mathématiques, consultez la référence suivante :

  • Nowosad, J., Stepinski, T. F. (2018). « Spatial association between regionalizations using the information-theoretical V-measure. » International Journal of Geographical Information Science. https://doi.org/10.1080/13658816.2018.1511794