Pratiques conseillées pour la sélection d’une valeur de canal de distance constante

Un canal de distance constante peut être considéré comme une fenêtre d’analyse mobile qui s’arrête momentanément au-dessus de chaque entité pour l’observer dans le contexte de ses voisins. Les instructions et pratiques conseillées suivantes vous permettent d’identifier un canal de distance approprié pour votre analyse :

  • Sélectionnez une distance en vous appuyant sur vos connaissances de l'étendue géographique des processus spatiaux favorisant l'agrégation pour les phénomènes que vous étudiez. Souvent vous l’ignorez mais, si tel n’est pas le cas, appuyez-vous sur ces connaissances pour sélectionner une valeur de distance. Supposons, par exemple, que vous sachiez que la distance moyenne domicile-travail est 15 kilomètres. Utiliser 15 kilomètres comme canal distance constitue une bonne stratégie pour l'analyse des données des trajets vers et depuis le lieu de travail.
  • Utilisez un canal de distance suffisamment grand pour garantir que toutes les entités aient au moins un voisin, faute de quoi les résultats ne seront pas valides.
  • Si les données en entrée sont biaisées (à savoir, qu’elles ne créent pas de courbe lorsque les valeurs sont tracées sous la forme d’un histogramme), assurez-vous que votre canal de distance n’est ni trop petit (la plupart des entités ont seulement un ou deux voisins) ni trop grand (plusieurs entités comprennent toutes les autres entités comme voisins), car cela nuirait à la fiabilité des scores Z résultants.
  • Les scores z sont fiables (même avec des données biaisées) tant que le canal de distance est suffisamment grand pour garantir plusieurs voisins (environ huit) pour chaque entité. Même si aucune des entités n'a toutes les autres entités comme voisins, vous risquez de rencontrer des problèmes de performances, voire de mémoire insuffisante si vous créez un canal de distance dans lequel les entités ont des milliers de voisins.
  • En vous assurant que toutes les entités ont au moins un voisin, vous risquez d'obtenir des entités associées à des milliers de voisins, ce qui n'est pas souhaitable. Cela peut se produire si certaines de vos entités sont des points spatiaux aberrants. Pour résoudre ce problème, recherchez une valeur de canal de distance appropriée pour tous les points sauf les points spatiaux aberrants et utilisez l'outil Générer la matrice de pondérations spatiales pour créer un fichier de matrice de pondérations spatiales à l’aide de cette distance. Toutefois, lorsque vous exécutez l’outil Generate Spatial Weights Matrix (Générer la matrice de pondérations spatiales), spécifiez une valeur minimale pour le paramètre Number of Neighbors (Nombre de voisins). Supposons, par exemple, que vous évaluiez l’accès à une alimentation saine dans le comté de Los Angeles à l’aide des données des secteurs de recensement. Vous savez que plus de 90 pour cent de la population vit dans un rayon de 3 miles des commerces. En analysant les secteurs de recensement, vous risquez de constater que la distance entre les secteurs (basée sur les centroïdes de ces derniers) dans le centre-ville est d'environ 1 000 mètres en moyenne, alors que dans les zones périphériques, cette distance est supérieure à 18 000 mètres. Pour que chacune des entités ait au moins un voisin, votre canal de distance doit dépasser 18 000 mètres. Cette échelle d’analyse (distance) ne convient pas pour les questions que vous posez. La solution consiste à créer un fichier de matrice de pondérations spatiales pour la classe d’entités des secteurs de recensement à l’aide de l’outil Generate Spatial Weights Matrix (Générer la matrice de pondérations spatiales). Spécifiez pour le paramètre Distance Band or Threshold Distance (Canal distance ou distance seuil) une valeur pertinente pour tous les points sauf les points spatiaux aberrants (par exemple, 4 800 mètres, soit environ trois miles) et un nombre minimum de voisins pour le paramètre Number of Neighbors (Nombre de voisins) (par exemple, 2). Cela appliquera une distance de voisinage fixe de 4 800 mètres à toutes les entités sauf à celles qui n’ont pas au moins 2 voisins en utilisant cette distance. Pour les entités aberrantes (et seulement elles), la distance est augmentée juste assez pour garantir que chacune d’elles a au moins deux voisins.
  • Utilisez un canal distance qui reflète l'auto-corrélation spatiale maximale. Dès lors que vous remarquez une agrégation spatiale dans le paysage, vous voyez la preuve de l'existence de processus spatiaux sous-jacents. Le canal de distance qui présente l’agrégation maximale, mesurée par l’outil Autocorrélation spatiale incrémentielle, est la distance à laquelle ces processus spatiaux sont les plus actifs ou prononcés. Exécutez l’outil Autocorrélation spatiale incrémentielle et notez où le score z obtenu semble atteindre un pic. Utilisez la distance associée à la valeur pic pour l'analyse.
    Remarque :

    Saisissez les valeurs de distance en utilisant les unités spécifiées par la référence spatiale de la couche ou l’environnement de géotraitement du Système de coordonnées en sortie.

    • Chaque pic représente une distance à laquelle les processus qui favorisent l'agrégation spatiale sont les plus prononcés. Les pics multiples sont courants. En général, les pics associés aux plus grandes distances reflètent des tendances générales (une tendance générale d’est en ouest, par exemple, où l’ouest est un point chaud géant et l’est, un point froid géant). Vous vous intéresserez normalement le plus aux pics associés aux plus petites distances ; il s’agit souvent du premier.
    • Un petit pic signifie souvent que plusieurs processus spatiaux différents sont en cours à diverses échelles spatiales. Vous pouvez rechercher d’autres critères pour déterminer la distance constante à utiliser pour l’analyse (peut-être la distance la plus efficace pour la solution).
    • Si le score z ne présente jamais de pics (en d’autres termes, qu’il ne cesse d’augmenter) et si vous utilisez des données agrégées (par exemple, des comtés), cela signifie généralement que le schéma d’agrégation est trop grossier ; les processus spatiaux dignes d’intérêt fonctionnent à une échelle plus petit que celle des unités d’agrégation. Si vous pouvez passer à une échelle d’analyse plus réduite (de comtés à des secteurs, par exemple), cela pourrait aider à trouver un pic de distance. Si vous travaillez sur des données ponctuelles et si les scores z ne présentent jamais de pics, c'est qu'il existe de nombreux processus spatiaux différents fonctionnant à diverses échelles spatiales et vous devrez probablement trouver des critères différents pour déterminer la distance constante à utiliser dans votre analyse. En outre, lorsque vous exécutez l’outil Incremental Spatial Autocorrelation, vérifiez que la valeur Beginning Distance (Distance de départ) n’est pas trop élevée.
    • Si vous ne spécifiez pas de distance de départ, l’outil Incremental Spatial Autocorrelation (Autocorrélation spatiale incrémentielle) utilise la distance permettant d’assurer que toutes les entités ont au moins un voisin. Si vos données incluent des points spatiaux aberrants, cette distance risque cependant d’être trop élevée pour votre analyse et peut être la raison de l’absence de pic prononcé dans le fichier Output Report File (Fichier de rapport en sortie). Pour remédier à ce problème, exécutez l'outil Auto-corrélation spatiale incrémentielle sur un jeu de sélection excluant temporairement tous les points spatiaux aberrants. Si, lorsque les points aberrants sont exclus, vous trouvez un pic, utilisez la stratégie détaillée ci-dessus avec ce pic de distance appliqué à toutes vos entités (points aberrants spatiaux inclus) et exigez que chaque entité ait au moins un ou deux voisins. Si vous ne savez pas si certaines de vos entités sont des points aberrants spatiaux, essayez de procéder comme suit :
      • Pour les données surfaciques, affichez les surfaces de polygone à l'aide d'un schéma de rendu Standard Deviation (Écart type) et considérez les polygones dont les surfaces sont supérieures à trois écarts types comme des points spatiaux aberrants. Vous pouvez utiliser l'outil Calculer un champ pour créer un champ avec des surfaces de polygones si vous n'en n'avez pas déjà un.
      • Pour les données ponctuelles, utilisez l'outil Proche pour calculer la distance du voisin le plus proche pour chaque entité. Pour cela, définissez les paramètres Input Features (Entités en entrée) et Near Features (Entités de proximité) de l’outil À proximité sur votre jeu de données ponctuel. Une fois que vous disposez d'un champ avec des distances de voisin le plus proche, représentez ces valeurs à l'aide d'un schéma de rendu Standard Deviation (Écart type) et considérez les distances supérieures à trois écarts type comme des points spatiaux aberrants.
    Graphique illustrant l'autocorrélation spatiale incrémentielle
    Identifiez une distance à laquelle les processus qui favorisent l'agrégation sont les plus prononcés.
  • Essayez de ne pas vous focaliser sur l'idée qu'il existe un seul canal de distance correct. La réalité n'est jamais aussi simple. Il existe très probablement des processus spatiaux multiples ou en interaction qui favorisent l’agrégation observée. Plutôt que de penser que vous avez besoin d'un canal de distance, envisagez les outils d'analyse de modèles comme des méthodes efficaces d'exploration des relations spatiales à diverses échelles spatiales. Sachez que si vous modifiez l'échelle de l’analyse (en modifiant la valeur de canal de distance), vous pouvez poser une question différente. Supposons que vous examiniez des données relatives aux revenus. Si vous avez des canaux de distance réduits, vous pouvez examiner des modèles de revenus de quartier, des distances d'échelle moyennes peuvent refléter les modèles de revenus au sein d'une communauté ou d'une ville, et les canaux de distance plus importants mettent en avant des modèles de revenus régionaux.