Résumé
Calcule un index du voisin le plus proche en fonction de la distance moyenne de chaque entité par rapport à son entité avoisinante la plus proche.
Pour en savoir plus sur le fonctionnement de l'outil Distances moyennes du plus proche voisin
Illustration
Utilisation
L'outil Distances moyennes du plus proche voisin renvoie cinq valeurs : distance moyenne observée, distance moyenne attendue, indice de voisin le plus proche, score z et valeur p. Les valeurs sont écrites sous forme de messages au bas de la fenêtre Géotraitement au cours de l'exécution de l'outil et transmises sous la forme de valeurs en sortie dérivées pour une utilisation éventuelle dans des modèles ou des scripts. Vous pouvez accéder aux messages en pointant sur la barre de progression, en cliquant sur le bouton contextuel ou en développant la section des messages dans la fenêtre Géotraitement. Vous pouvez également accéder aux messages d'un outil précédemment exécuté via l'historique du géotraitement. Cet outil peut également créer un fichier de rapport HTML contenant un récapitulatif graphique des résultats. Le chemin d'accès au rapport est inclus avec les messages qui récapitulent les paramètres d'exécution de l'outil. Cliquez sur ce chemin d'accès pour ouvrir le fichier de rapport.
Les résultats de score z et de valeur p sont des mesures de signification statistique qui indiquent si l'on peut rejeter l'hypothèse nulle. Notez, toutefois, que la signification sur le plan statistique de cette méthode est fortement impactée par la taille de la zone d'étude (voir ci-après). Pour la statistique Distances moyennes du plus proche voisin, l'hypothèse nulle suppose que les entités sont distribuées aléatoirement.
L'indice de voisin le plus proche est exprimé en tant que rapport de la distance moyenne observée à la distance moyenne attendue. La distance attendue est la distance moyenne entre voisins dans une distribution aléatoire hypothétique. Si l'indice est inférieur à 1, le modèle présente un phénomène d'agrégation ; si l'indice est supérieur à 1, la tendance est à la dispersion ou à la concurrence.
La méthode Distances moyennes du plus proche voisin est très sensible à la valeur Surface (d'infimes variations de la valeur du paramètre Surface peuvent provoquer des variations importantes dans les résultats du score z et de la valeur p). Par conséquent, l'outil Distances moyennes du plus proche voisin est plus efficace pour comparer des entités différentes dans une zone d'étude fixe. L'image suivante illustre la façon dont des distributions identiques d'entités peuvent être dispersées ou agrégées selon la zone d'étude spécifiée.
Si une valeur du paramètre Surface n'est pas spécifiée, c'est la superficie du rectangle d'encadrement minimum des entités en entrée qui est utilisée. Contrairement à l'étendue, un rectangle d'encadrement minimum ne s'aligne pas nécessairement sur les axes x et y.
Lorsque la Classe d'entités en entrée n'est pas projetée (c'est-à-dire, lorsque les coordonnées sont exprimées en degrés, minutes et secondes) ou lorsque le système de coordonnées en sortie est un Système de coordonnées géographiques, les distances sont calculées à l'aide des mesures à la corde. Les mesures de distance à la corde permettent de calculer rapidement et de fournir une bonne estimation de distance géodésiques réelles, du moins pour les points situés à environ trente degrés les uns des autres. Les distances de corde reposent sur un sphéroïde aplati. Si l'on prend deux points sur la surface de la Terre, la distance de corde qui les sépare est la longueur d'une ligne qui traverse la Terre en trois dimensions pour relier ces deux points. Les distances à la corde sont exprimées en mètres.
Attention :
Veillez à projeter les données si votre zone d'étude s'étend au-delà de 30 degrés. Les distances à la corde ne constituent pas une bonne estimation des distance géodésiques au-delà de 30 degrés.
Lorsque vous utilisez des distances à la corde dans l'analyse, le paramètre Surface, s'il est spécifié, doit être exprimé en mètres.
Dans certains cas, des rectangles d'encadrement minimum non valides (superficie nulle) sont générés pour des entités en entrée. Pour y remédier, une petite valeur dérivée de la tolérance x,y de l'entité en entrée permet de créer le rectangle d'encadrement minimum. Par exemple, si toutes les entités sont coïncidentes (toutes ont exactement les mêmes coordonnées x et y), le système utilise, dans les calculs, la superficie d'un petit polygone carré autour de l'emplacement unique. Autre exemple : si toutes les entités sont parfaitement alignées (par exemple, 3 points sur une ligne droite), le système utilise la superficie d'un polygone rectangle qui laisse un petit espace autour des entités encadrées. Quoi qu'il en soit, il vaut toujours mieux fournir une valeur de Surface avec l'outil Distances moyennes du plus proche voisin.
Bien que cet outil fonctionne avec des données surfaciques ou linéaires, il est plus adapté aux données d'événement, d'incident ou autres données d'entité ponctuelle fixe. Pour les entités linéaires et surfaciques, les calculs utilisent le centroïde géométrique vrai pour chaque entité. Pour les multi-points, les polylignes, ou les polygones comprenant plusieurs parties, le centroïde est calculé à l'aide du centre moyen pondéré de toutes les parties d'entité. La pondération pour les entités ponctuelles est de 1 ; pour les entités linéaires, elle correspond à la longueur et pour les entités surfaciques, à la superficie.
-
Les couches peuvent permettre de définir la classe d'entités en entrée. Lorsque vous utilisez une couche avec une sélection, seules les entités sélectionnées sont comprises dans l'analyse.
Attention :
Lorsque vous utilisez des shapefiles, n'oubliez pas qu'ils ne peuvent pas stocker de valeurs Null. Il se peut que des outils ou autres procédures qui créent des fichiers de formes à partir d'entrées autres que des fichiers de formes stockent ou interprètent des valeurs Null comme étant égales à zéro. Dans certains cas, les valeurs Null sont stockées sous forme de valeurs négatives très élevées dans les fichiers de formes. Cela peut aboutir à des résultats inattendus. Reportez-vous à la rubrique Remarques concernant le géotraitement pour la sortie de fichiers de formes pour plus d'informations.
Syntaxe
arcpy.stats.AverageNearestNeighbor(Input_Feature_Class, Distance_Method, {Generate_Report}, {Area})
Paramètre | Explication | Type de données |
Input_Feature_Class | Classe d'entités, généralement une classe d'entités ponctuelles, pour laquelle les distances moyennes du plus proche voisin sont calculées. | Feature Layer |
Distance_Method | Spécifie le mode de calcul des distances de chaque entité avec les entités voisines.
| String |
Generate_Report (Facultatif) | Spécifie si l'outil créera un récapitulatif graphique des résultats.
| Boolean |
Area (Facultatif) | Valeur numérique qui représente la taille de la zone d'étude. La valeur par défaut correspond à la superficie du rectangle d'encadrement minimum qui englobe toutes les entités (ou toutes les entités sélectionnées). Les unités doivent correspondre à celles du système de coordonnées en sortie. | Double |
Exemple de code
Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil AverageNearestNeighbor.
import arcpy
arcpy.env.workspace = r"C:\data"
arcpy.AverageNearestNeighbor_stats("burglaries.shp", "EUCLIDEAN_DISTANCE", "NO_REPORT", "#")
Le script Python autonome ci-dessous illustre l'utilisation de l'outil AverageNearestNeighbor.
# Analyze crime data to determine if spatial patterns are statistically significant
# Import system modules
import arcpy
# Local variables...
workspace = "C:/data"
crime_data = "burglaries.shp"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.env.workspace = workspace
# Obtain Nearest Neighbor Ratio and z-score
# Process: Average Nearest Neighbor...
nn_output = arcpy.AverageNearestNeighbor_stats(crime_data, "EUCLIDEAN_DISTANCE", "NO_REPORT", "#")
# Create list of Average Nearest Neighbor output values by splitting the result object
print("The nearest neighbor index is: " + nn_output[0])
print("The z-score of the nearest neighbor index is: " + nn_output[1])
print("The p-value of the nearest neighbor index is: " + nn_output[2])
print("The expected mean distance is: " + nn_output[3])
print("The observed mean distance is: " + nn_output[4])
print("The path of the HTML report: " + nn_output[5])
except arcpy.ExecuteError:
# If an error occurred when running the tool, print out the error message.
print(arcpy.GetMessages())
Environnements
- Système de coordonnées en sortie
La géométrie de l'entité est projetée au système de coordonnées en sortie avant l'analyse. Tous les calculs mathématiques sont basés sur la référence spatiale du système de coordonnées en sortie. Lorsque le système de coordonnées en sortie est exprimé en degrés, minutes et secondes, les distances géodésiques sont estimées à l'aide de distances à la corde.
Informations de licence
- Basic: Oui
- Standard: Oui
- Advanced: Oui
Rubriques connexes
- Présentation générale du jeu d'outils Analyse de modèles
- Modélisation de relations spatiales
- Qu'est-ce qu'un score z ? Qu'est-ce qu'une valeur p ?
- Rechercher un outil de géotraitement
- Analyse de grappe spatiale multi-distances (fonction K de Ripley)
- Autocorrélation spatiale (Global Moran's I)
- Fonctionnement de l'outil Average Nearest Neighbor
Vous avez un commentaire à formuler concernant cette rubrique ?