De nombreux outils de la boîte à outils Statistiques spatiales requièrent la définition d’un voisinage (ou la conceptualisation des relations spatiales) qui définit les entités considérées comme voisines et attribue une pondération au sein de chaque paire de voisins. Les voisins et les pondérations définissent ensemble une matrice de pondérations spatiales (SWM) qui représente les relations spatiales au sein de toutes les paires d’entités. Pour N entités, la matrice de pondérations spatiales comporte N lignes et N colonnes (matrice carrée), où les lignes représentent la première entité de la paire, les colonnes représentent la seconde entité de la paire et la valeur correspondante dans la matrice représente la pondération (ou relation) au sein de la paire. Par exemple, dans le cas d’un voisinage avec contiguïté polygonale, tout polygone connecté avec un autre polygone a la valeur 1 dans la cellule correspondante et la valeur 0 s’il n’est pas connecté.
Toute matrice symétrique carrée peut être décomposée en N composantes indépendantes (non corrélées) basées sur les vecteurs propres et les valeurs propres. Chaque composante représente un facteur indépendant de la matrice d’origine (de manière similaire à l’analyse en composantes principales qui refactorise les variables en composantes non corrélées). Ces composantes renferment toutes les informations de la matrice d’origine, mais sont elles sont refactorisées et séparées pour pouvoir être examinées individuellement, ce qui révèle souvent des structures centrales masquées dans la matrice initiale. Lorsque la matrice est une matrice de pondérations spatiales, ces vecteurs propres sont appelés vecteurs propres de Moran (également appelés composantes spatiales). Ils représentent les modèles spatiaux des entités et de la matrice de pondérations spatiales.
Chaque vecteur propre de Moran attribue une valeur numérique à chaque entité et, puisqu’ils sont généralement cartographiés et symbolisés pour permettre la visualisation des modèles spatiaux, ils sont souvent appelés cartes de vecteurs propres de Moran (MEM). Les premières cartes de vecteurs propres de Moran (dotées des valeurs propres les plus élevées et des modèles spatiaux les plus forts) correspondent généralement aux modèles spatiaux globaux et généraux, comme la tendance du nord vers le sud ou de l’est vers l’ouest, et les cartes de vecteurs propres de Moran suivantes (qui comportent des valeurs propres moins élevées et des modèles plus faibles) représentent généralement des modèles spatiaux plus localisés. Par exemple, l’image suivante représente différentes cartes de vecteurs propres de Moran pour une tessellation hexagonale avec une contiguïté polygonale qui définit la matrice de pondérations spatiales. La première ligne affiche les quatre premières cartes de vecteurs propres de Moran qui représentent les modèles spatiaux plus généraux, tandis que la dernière ligne affiche quatre cartes de vecteurs propres de Moran suivantes dont les modèles sont davantage localisés.
Il est important de noter que la création de cartes de vecteurs propres de Moran n’utilise que la matrice de pondérations spatiales et les localisations des entités, mais n’utilise aucun champ ou aucune variable des entités, de sorte que les modèles spatiaux peuvent ne correspondre à aucune variable présente aux localisations. Ils représentent plutôt des modèles spatiaux potentiels qui peuvent être combinés pour représenter divers modèles spatiaux de variables spatiales. Par exemple, si un champ des entités comporte une tendance générale de l’ouest vers l’est, mais qu’il contient également de petits agrégats de valeurs faibles et élevées, le modèle spatial de la variable peut être représenté par la combinaison de deux cartes de vecteurs propres de Moran : une pour la tendance de l’ouest vers l’est et l’autre pour les agrégats. Les variables spatiales plus complexes peuvent nécessiter de nombreuses cartes de vecteurs propres de Moran différentes pour représenter correctement leur configuration spatiale.
Les cartes de vecteurs propres de Moran sont également étroitement liées à la statistique I de Moran qui mesure le degré d’agrégation spatiale (autocorrélation) d’une variable spatiale. La première carte de vecteurs propres de Moran est l’ensemble des valeurs des entités qui aboutit à la valeur la plus élevée possible de l’indice de Moran (autocorrélation spatiale la plus élevée possible). La deuxième carte de vecteurs propres de Moran est l’ensemble des valeurs qui aboutit à la valeur la plus élevée possible de l’indice de Moran, compte tenu du fait que les valeurs ne doivent pas être corrélées avec les valeurs de la première carte de vecteurs propres de Moran. La troisième carte de vecteurs propres de Moran est l’ensemble des valeurs qui aboutit à la valeur la plus élevée possible de l’indice de Moran, compte tenu du fait qu’elle ne doit être corrélée avec aucune des deux premières cartes de vecteurs propres de Moran, etc. Pour N entités, il est possible de créer jusqu’à N cartes de vecteurs propres de Moran, bien que moins de 25 % des cartes de vecteurs propres de Moran représentent généralement les modèles spatiaux utiles.
La valeur de l’indice de Moran de la première carte de vecteurs propres de Moran représente la valeur la plus élevée possible de n’importe quel champ des entités. En d’autres termes, même si une seule valeur changeait au niveau d’une seule entité, la valeur de l’indice de Moran diminuerait et la variable serait moins agrégée. Cela vous permet de contextualiser les valeurs de l’indice de Moran des données réelles. Une idée fausse très répandue est que la valeur la plus élevée possible de l’indice de Moran est égale à 1 pour n’importe quel jeu de données et n’importe quelle matrice de pondérations spatiales, mais la valeur la plus élevée possible de l’indice de Moran est souvent significativement inférieure à 1 (par exemple, 0,6) en fonction des entités et de la matrice de pondérations spatiales. Il est également possible que la valeur la plus élevée possible de l’indice de Moran soit supérieure à 1, mais cela n’est pas fréquent. Par exemple, si, pour un champ de données, la valeur de l’indice de Moran est égale à 0,65, cela peut ne pas sembler très élevé si vous supposez que la valeur la plus élevée possible est égale à 1, mais si la valeur de l’indice de Moran de la première carte de vecteurs propres de Moran est égale à 0,7, cela signifie que le champ correspond presque à l’autocorrélation spatiale la plus élevée possible de la matrice de pondérations spatiales. Cela vous aide également à choisir une matrice de pondérations spatiales appropriée pour l’analyse, car les valeurs élevées possibles de l’indice de Moran de certaines matrices de pondérations spatiales sont beaucoup plus élevées que dans d’autres.
Utilisations des cartes de vecteurs propres de Moran dans l’analyse spatiale
Les utilisations des cartes de vecteurs propres de Moran sont très variées dans le cadre de l’analyse spatiale, et les outils du jeu d’outils Utilitaires des composantes spatiales (vecteurs propres de Moran) créent et utilisent les cartes de vecteurs propres de Moran de différentes manières :
Décomposer la structure spatiale (vecteurs propres de Moran) : crée l’ensemble des cartes de vecteurs propres de Moran possédant la valeur la plus élevée possible de l’indice de Moran pour la classe d’entités en entrée et la matrice de pondérations spatiales. L’entrée est une classe d’entités et la matrice de pondérations spatiales est définie par les paramètres de voisinage. Vous pouvez également préciser le mode de création des cartes de vecteurs propres de Moran en spécifiant une valeur de seuil relative de l’indice de Moran, ainsi qu’un nombre maximal de cartes de vecteurs propres de Moran. La sortie est une classe d’entités. Elle comporte les mêmes entités que l’entrée et inclut les cartes de vecteurs propres de Moran sous forme de champs. Les cartes de vecteurs propres de Moran créées par l’outil peuvent être cartographiées pour permettre la visualisation des différents modèles spatiaux de la matrice de pondérations spatiales ainsi que l’évaluation de la valeur maximale de l’indice de Moran de n’importe quel champ des entités de la matrice.
Comparer les conceptualisations de voisinage : suggère un voisinage et une structure de pondération qui représente le plus exactement les modèles spatiaux d’un ou de plusieurs champs d’une classe d’entités. L’entrée est une classe d’entités et un ou plusieurs champs. La sortie est un fichier SWM qui peut être utilisé dans d’autres outils de la boîte à outils Statistiques spatiales qui permet aux fichiers SWM personnalisés de définir des voisins et des pondérations, comme les outils Association spatiale bivariée (statistique L de Lee), Analyse de point chaud (Getis-Ord Gi*) et Analyse des agrégats et des points aberrants (indice local de Moran [Anselin]). L’outil détermine la matrice de pondérations spatiales suggérée en identifiant la matrice de pondérations spatiales qui crée les cartes de vecteurs propres de Moran qui ressemblent le plus étroitement aux modèles spatiaux des champs en entrée.
Créer des variables explicatives des composantes spatiales : crée et sélectionne un ensemble de cartes de vecteurs propres de Moran qui représentent ou expliquent le mieux les modèles spatiaux de plusieurs champs d’une classe d’entités en entrée. Ceci est utile lorsque vous souhaitez créer un modèle (par exemple, un modèle de régression des moindres carrés ordinaires) et que vous souhaitez tenir compte des modèles spatiaux des variables. Vous pouvez indiquer la classe d’entités et toutes les variables (explicatives et dépendantes) dans l’outil, qui crée les cartes de vecteurs propres de Moran utiles pour la représentation des modèles spatiaux des champs en entrée. L’inclusion de ces cartes de vecteurs propres de Moran en tant que variables explicatives (en plus des variables explicatives d’origine) dans le modèle de prévision améliore généralement le modèle, en fournissant de meilleures estimations des coefficients des variables explicatives initiales et en améliorant l’exactitude des prévisions grâce à la prise en compte des modèles spatiaux des variables.
Filtrer l’autocorrélation spatiale à partir d’un champ : crée et sélectionne un ensemble de cartes de vecteurs propres de Moran qui suppriment le mieux l’autocorrélation depuis un champ en entrée et génèrent une version spatialement filtrée du champ en entrée. Le champ en entrée est constitué des composantes spatiales (les cartes de vecteurs propres de Moran) et d’une composante non spatiale (la version spatialement filtrée du champ en entrée). Le champ filtré conserve les propriétés statistiques principales du champ tout en excluant les effets spatiaux, comme les tendances et les agrégats. Le champ filtré peut ensuite être utilisé dans des processus de corrélation ou d’autres analyses, dans lesquelles l’effet de l’espace est indésirable et ajoute du bruit au signal sous-jacent du champ. Vous pouvez, par exemple, estimer la corrélation entre la pollution et les taux d’asthme tout en excluant les effets spatiaux associés aux deux variables afin d’isoler la corrélation ou la relation directe entre ces dernières. Lorsque le champ en entrée est un champ résiduel d’un modèle de prévision, les cartes de vecteurs propres de Moran sélectionnées peuvent être utilisées comme variables explicatives du modèle de prévision (en plus des variables explicatives d’origine) pour supprimer l’autocorrélation spatiale du terme résiduel du modèle. Ceci est utile, car l’une des hypothèses de nombreux modèles de prévision est que les résidus ne sont pas spatialement autocorrélés.
Informations supplémentaires
Les cartes de vecteurs propres de Moran sont créées ou sélectionnées uniquement si elles présentent une autocorrélation spatiale positive, ce qui signifie que les modèles représentent des agrégats spatiaux plutôt que des modèles dispersés.
Le nombre de cartes de vecteurs propres de Moran créées est égal à 25 pour cent du nombre d’entités en entrée et peut aller jusqu’à un maximum de 100. Les outils Créer des variables explicatives des composantes spatiales et Filtrer l’autocorrélation spatiale à partir d’un champ effectuent leur sélection à partir de ces cartes de vecteurs propres de Moran pour créer respectivement des variables explicatives ou filtrer l’autocorrélation, de la manière la plus efficace.
À l’exception de l’outil Décomposer la structure spatiale (vecteurs propres de Moran) (qui utilise un seul voisinage spécifié et une structure de pondération), les outils testent 28 matrices de mondérations spatiales différentes et utilisent celle qui crée les cartes de vecteurs propres de Moran les plus efficaces en fonction de l’objectif de l’outil. Les matrices de pondérations spatiales suivantes sont testées :
- Cinq bandes de distance, chacune avec des noyaux bicarrés, gaussiens et non pondérés (15 au total). La bande de distance la plus courte est la distance qui génère au moins un voisin pour chaque entité. La bande de distance la plus longue représente 20 % de l’étendue diagonale des entités en entrée. Les trois autres bandes de distance sont créées par incrémentation régulière entre les bandes de distance la plus courte et la plus longue. Pour les entités surfaciques, la distance séparant les centroïdes permet de déterminer les distances et les voisins.
- Quatre nombres différents de voisins (8, 16, 32 et 64), chacun avec des noyaux bicarrés, gaussiens et non pondérés (12 au total). Les bandes passantes sont adaptatives et égales à la distance par rapport au (K+1)e voisin, pour K voisins. Si le nombre d’entités en entrée est inférieur à K, de nombreux voisins sont ignorés. Par exemple, s’il existe 50 entités en entrée, les trois matrices de pondérations spatiales qui utilisent les 64 voisins les plus proches sont ignorées. Pour les entités surfaciques, la distance séparant les centroïdes permet de déterminer les distances et les voisins.
- Pour les entités ponctuelles, la matrice de pondérations spatiales finale est un voisinage de type triangulation de Delaunay. Pour les entités surfaciques, la matrice de pondérations spatiales finale est un voisinage de type contiguïté (tronçons et angles).
Pour en savoir plus sur chaque voisinage et la pondération de noyau, consultez les rubriques Fonctionnement des résumés statistiques de voisinage et Modélisation de relations spatiales. Vous pouvez également indiquer un fichier .swm personnalisé dans le paramètre Fichier de matrice de pondérations spatiales en entrée. S’il est fourni, le fichier .swm est utilisé pour créer et sélectionner les cartes de vecteurs propres de Moran et les 28 matrices de pondérations spatiales ci-dessus ne sont pas testées.
Avant le calcul des cartes de vecteurs propres de Moran, chaque matrice de pondérations spatiales est ajustée de telle sorte que la somme de chaque ligne et colonne soit égale à 0 (c’est ce qu’on appelle le double centrage). Lorsque la matrice de pondérations spatiales n’est pas symétrique, par exemple en cas de voisinage défini par un certain nombre de voisins, elle est ajoutée à sa transposée de sorte à devenir symétrique avant le double centrage.
Bibliographie
Les ressources suivantes ont été utilisées pour implémenter les outils :
Bauman, David, Thomas Drouet, Stéphane Dray, and Jason Vleminckx. 2018. "Disentangling good from bad practices in the selection of spatial or phylogenetic eigenvectors." Ecography 41.10: 1638-1649. https://doi.org/10.1111/ecog.03380.
Bauman, David, Thomas Drouet, Marie-Josée Fortin, and Stéphane Dray. 2018. "Optimizing the choice of a spatial weighting matrix in eigenvector-based methods." Ecology 99, no. 10: 2159-2166. https://doi.org/10.1002/ecy.2469.
Blanchet, F. Guillaume, Pierre Legendre, and Daniel Borcard. 2008. "Forward selection of explanatory variables." Ecology 89, no. 9: 2623-2632. https://doi.org/10.1890/07-0986.1.
Dray, Stéphane, David Bauman, Guillaume Blanchet, Daniel Borcard, Sylvie Clappe, Guillaume Guenard, Thibaut Jombart, Guillaume Larocque, Pierre Legendre, Naima Madi, and Helene H. Wagner. 2022. "adespatial: Multivariate Multiscale Spatial Analysis." R package version 0.3-16. https://CRAN.R-project.org/package=adespatial.
Griffith, Daniel A. 2003. "Spatial Autocorrelation and Spatial Filtering." Advances in Spatial Science. Springer. ISBN 978-3-540-24806-4. https://doi.org/10.1007/978-3-540-24806-4.
Griffith, Daniel A., and Pedro R. Peres-Neto. 2006. "Spatial modeling in ecology: the flexibility of eigenfunction spatial analyses." Ecology 87, no. 10: 2603-2613. https://doi.org/10.1890/0012-9658(2006)87[2603:SMIETF]2.0.CO;2.
Rubriques connexes
Vous avez un commentaire à formuler concernant cette rubrique ?