Les épidémiologistes, les analystes de la criminalité, les démographes, les services d'urgence, les analystes des transports, les archéologues, les biologistes, les analystes de commerce de détail et de nombreux autres professionnels SIG ont des besoins croissants d'outils d'analyse spatiale avancés. La boîte à outils Spatial Statistics répond à ce besoin.
Les outils de statistiques spatiales permettent de
- récapituler les principales caractéristiques d'une distribution,
- identifier des agrégats spatiaux (hot spots/cold spots) statistiquement significatifs et des points aberrants spatiaux,
- évaluer les tendances générales d'agrégation ou de dispersion,
- diviser des entités en groupes similaires,
- identifier des entités possédant des caractéristiques similaires
- modéliser des relations spatiales.
Récapitulatif des caractéristiques clés
Questions | Outils | Exemples |
---|---|---|
Où se trouve le centre ? | Où se situe le centre de population et comment évolue-t-il dans le temps ? | |
Quelle entité est la plus accessible ? | Où placer le nouveau centre d'assistance ? | |
Quelle est la direction ou l'orientation dominante ? | Quelle est la principale direction du vent en hiver ? Quelle est l'orientation des lignes de faille dans cette région ? | |
Les entités sont-elles dispersées, compactes ou intégrées ? | Distance standard ou Distribution directionnelle (Ellipse d'écart type) | Quel gang occupe le territoire le plus étendu ? Quelle souche de maladie est la plus répandue ? En se basant sur l'observation des animaux, dans quelle mesure les espèces sont-elles intégrées ? |
Existe-t-il des tendances de direction ? | Quelle est l'orientation de la décharge ? Où les déchets sont-ils concentrés ? |
Identifier des agrégats statistiquement significatifs
Questions | Outils | Exemples |
---|---|---|
Où se trouvent les hot spots ? Où se trouvent les cold spots ? Quelle est l'intensité de l'agrégation ? | Analyse de hot spots (Getis-Ord Gi*) | Où se trouvent les frontières les plus nettes entre la richesse et la pauvreté ? Où la diversité biologique et la qualité de l'habitat sont-elles les plus élevées ? |
Où se trouvent les points aberrants d'emplacement ? | Analyse de grappes et de valeurs aberrantes (Anselin Local Moran's I) | Où se trouvent les modèles de dépense anormaux à Los Angeles ? |
Comment les ressources peuvent-elles être déployées le plus efficacement ? | Où les taux anormalement élevés de diabète sont-ils localisés ? Où les incendies de cuisine représentent-ils une part plus importante que prévue de tous les incendies domestiques ? Les crimes commis en journée présentent-ils le même modèle spatial que ceux commis la nuit ? | |
Quels sites sont les plus éloignés du problème ? | Où placer les sites d'évacuation ? | |
Quelles entités se ressemblent-elles le plus ? A quoi ressemble le tissu spatial des données ? | Spatially Constrained Multivariate Clustering (Agrégation multivariée spatialement contrainte) | Quels crimes dans la base de données sont les plus similaires à celui qui vient d'être commis ? Existe-t-il des régimes spatiaux distincts de résultats d'examens ? Quelles sont les régions associées à des résultats d'examens élevés et quelles sont celles dont les résultats sont faibles ? En se basant sur des facteurs d'espace, de temps, et sur des symptômes, quelles éruptions d'une maladie appartiennent probablement à la même épidémie ? |
Quelles entités sont plus semblables ou plus dissemblables ? | Quels sites présentent des caractéristiques similaires à celles de mes points de ventes les plus fréquentés ? Où se situent les salaires de mes employés par rapport aux salaires de postes équivalents dans des villes équivalentes à la mienne ? Quels crimes dans la base de données se rapprochent le plus d'un crime donné ? |
Évaluer les modèles spatiaux globaux
Questions | Outils | Exemples |
---|---|---|
Les caractéristiques spatiales sont-elles différentes ? | Quels types de crimes présentent la plus forte concentration spatiale ? Quelles espèces de plantes sont les plus dispersées sur la zone d'étude ? | |
Le modèle spatial change-t-il au fil du temps ? | Les riches et les pauvres sont-ils de plus en plus séparés spatialement ? Un pic inattendu est-il survenu dans les achats pharmaceutiques ? Au fil du temps, la maladie reste-t-elle géographiquement fixe ou se propage-t-elle au voisinage ? Les mesures de confinement sont-elles efficaces ? | |
Les processus spatiaux sont-ils semblables ? | Analyse de grappe spatiale multi-distances (fonction K de Ripley) | Le modèle spatial de la maladie reflète-t-il le modèle spatial de la population exposée ? Le modèle spatial du cambriolage commercial s'écarte-t-il du modèle spatial des établissements commerciaux ? |
Les données sont-elles corrélées spatialement ? | Les valeurs résiduelles de régression présentent-elles des auto-corrélations spatiales statistiquement significatives ? | |
A quelles distances l'agrégation spatiale est-elle la plus prononcée ? | Quelle distance constitue la meilleure échelle pour mon analyse ? |
Modéliser les relations
Questions | Outils | Exemples |
---|---|---|
Existe-t-il une corrélation ? La relation est-elle forte ? Quelles variables sont les prédicteurs les plus constants ? Les relations sont-elles cohérentes sur l'ensemble de la zone d'étude ? | Moindres carrés ordinaires, Régression exploratoire et Régression pondérée géographiquement | Quelle est la relation entre niveau de diplôme et revenu ? La relation est-elle uniforme sur l'ensemble de la zone d'étude ? Existe-t-il une relation positive entre vandalisme et cambriolage résidentiel ? Quelles combinaisons de variables explicatives candidates permettront d'obtenir des modèles de régression correctement spécifiés ? Les incidences de la maladie augmentent-elles avec la proximité par rapport aux entités d'eau ? |
Quels facteurs peuvent contribuer à des résultats donnés ? Dans quelle autre zone une réponse semblable peut-elle se produire ? | Ordinary Least Squares (OLS) (Moindres carrés ordinaires) , Exploratory Regression (Régression exploratoire), Geographically Weighted Regression (GWR) (Régression pondérée géographiquement) et Forest-based Classification and Regression (Classification et régression basées sur une forêt) | Quelles sont les variables clés qui expliquent la fréquence élevée d'incendies de forêt ? Quelles caractéristiques démographiques contribuent aux taux élevés de fréquentation des transports en commun ? Quels environnements doivent être protégés pour favoriser la réintroduction d'une espèce en danger ? |
Dans quelles zones les mesures d'évacuation seront-elles plus efficaces ? | Ordinary Least Squares (OLS) (Moindres carrés ordinaires) Geographically Weighted Regression (GWR) (Régression pondérée géographiquement) et Forest-based Classification and Regression (Classification et régression basées sur une forêt) | Dans quelles zones les enfants ont-ils de meilleurs résultats scolaires ? Quelles caractéristiques semblent être associées ? Où chacune des caractéristiques est-elle la plus importante ? Quels facteurs sont associés à une proportion plus importante que prévue des accidents de la route ? Quels facteurs sont les plus forts prédicteurs pour chaque emplacement présentant un taux élevé d'accidents ? |
Comment le modèle peut-il changer ? Que peut-on faire pour se préparer ? | Où se trouvent les hot spots des appels des services d'urgence ? Quelles variables prévoient efficacement les volumes d'appel ? Sur la base des projections à venir, quelle est la demande attendue en termes de ressources pour les services d'urgence ? | |
Pourquoi ce site est-il un point chaud ? Pourquoi ce site est-il un point froid ? | Pourquoi le nombre de cas de cancer est-il si élevé dans certaines zones ? Pourquoi les taux d'alphabétisation sont-ils si bas dans certaines régions ? Existent-ils des régions aux États-Unis où les gens meurent jeunes en nombre ? Pourquoi ? |
Les SIG offrent de nombreuses méthodes différentes d'analyse des données spatiales. Parfois l'analyse visuelle suffit : une carte est créée et révèle toutes les informations nécessaires pour prendre une décision. Il peut toutefois, dans certains cas, s'avérer difficile de tirer des conclusions à partir d'une seule carte. Les cartographes font des choix à la création d'une carte, quelles entités inclure ou exclure, la façon dont les entités sont symbolisées, les seuils de classification sélectionnées déterminant si une entité s'affiche en rouge vif ou en rose moins intense, l'intitulé des titres, etc. Tous ces éléments cartographiques permettent de communiquer le contexte et l'étendue du problème analysé, mais ils peuvent également modifier les caractéristiques de ce que nous voyons et, par conséquent, notre interprétation. Les statistiques spatiales peuvent contribuer à réduire la subjectivité afin d'accéder de manière plus directe à des modèles, tendances, processus ou relations spatiales. Si vos questions analytiques sont particulièrement difficiles ou si les décisions prises à la suite de votre analyse sont d'une importance capitale, il est essentiel d'examiner vos données et le contexte de votre problème sous différents angles. La boîte à outils Spatial Statistics offre des outils puissants qui peuvent compléter et améliorer efficacement les méthodes statistiques visuelles, cartographiques et classiques (non spatiales) d'analyse des données spatiales.
Ressources supplémentaires
- Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. Esri Press, 2005.
- https://www.esriurl.com/spatialstats contient la liste à jour de toutes les ressources disponibles pour l’utilisation des outils Statistiques spatiales.
Rubriques connexes
Vous avez un commentaire à formuler concernant cette rubrique ?