L'outil Distances moyennes du plus proche voisin renvoie cinq valeurs : distance moyenne observée, distance moyenne attendue, indice de voisin le plus proche, score z et valeur p. Les valeurs sont écrites sous forme de messages au bas de la fenêtre Géotraitement au cours de l'exécution de l'outil et transmises sous la forme de valeurs en sortie dérivées pour une utilisation éventuelle dans des modèles ou des scripts. Vous pouvez accéder aux messages en pointant sur la barre de progression, en cliquant sur le bouton contextuel ou en développant la section des messages dans la fenêtre Géotraitement. Vous pouvez également accéder aux messages d'un outil précédemment exécuté via l'historique du géotraitement. Cet outil peut également créer un fichier de rapport HTML contenant un récapitulatif graphique des résultats. Le chemin d'accès au rapport est inclus avec les messages qui récapitulent les paramètres d'exécution de l'outil. Cliquez sur ce chemin d'accès pour ouvrir le fichier de rapport.
Les résultats de score z et de valeur p sont des mesures de signification statistique qui indiquent si l'on peut rejeter l'hypothèse nulle. Notez, toutefois, que la signification sur le plan statistique de cette méthode est fortement impactée par la taille de la zone d'étude (voir ci-après). Pour la statistique Distances moyennes du plus proche voisin, l'hypothèse nulle suppose que les entités sont distribuées aléatoirement.
L'indice de voisin le plus proche est exprimé en tant que rapport de la distance moyenne observée à la distance moyenne attendue. La distance attendue est la distance moyenne entre voisins dans une distribution aléatoire hypothétique. Si l'indice est inférieur à 1, le modèle présente un phénomène d'agrégation ; si l'indice est supérieur à 1, la tendance est à la dispersion ou à la concurrence.
La méthode Distances moyennes du plus proche voisin est très sensible à la valeur Surface (d'infimes variations de la valeur du paramètre Surface peuvent provoquer des variations importantes dans les résultats du score z et de la valeur p). Par conséquent, l'outil Distances moyennes du plus proche voisin est plus efficace pour comparer des entités différentes dans une zone d'étude fixe. L'image suivante illustre la façon dont des distributions identiques d'entités peuvent être dispersées ou agrégées selon la zone d'étude spécifiée.
Si une valeur du paramètre Surface n'est pas spécifiée, c'est la superficie du rectangle d'encadrement minimum des entités en entrée qui est utilisée. Contrairement à l'étendue, un rectangle d'encadrement minimum ne s'aligne pas nécessairement sur les axes x et y.
Lorsque la Classe d'entités en entrée n'est pas projetée (c'est-à-dire, lorsque les coordonnées sont exprimées en degrés, minutes et secondes) ou lorsque le système de coordonnées en sortie est un Système de coordonnées géographiques, les distances sont calculées à l'aide des mesures à la corde. Les mesures de distance à la corde permettent de calculer rapidement et de fournir une bonne estimation de distance géodésiques réelles, du moins pour les points situés à environ trente degrés les uns des autres. Les distances de corde reposent sur un sphéroïde aplati. Si l'on prend deux points sur la surface de la Terre, la distance de corde qui les sépare est la longueur d'une ligne qui traverse la Terre en trois dimensions pour relier ces deux points. Les distances à la corde sont exprimées en mètres.
Attention :
Veillez à projeter les données si votre zone d'étude s'étend au-delà de 30 degrés. Les distances à la corde ne constituent pas une bonne estimation des distance géodésiques au-delà de 30 degrés.
Lorsque vous utilisez des distances à la corde dans l'analyse, le paramètre Surface, s'il est spécifié, doit être exprimé en mètres.
Dans certains cas, des rectangles d'encadrement minimum non valides (superficie nulle) sont générés pour des entités en entrée. Pour y remédier, une petite valeur dérivée de la tolérance x,y de l'entité en entrée permet de créer le rectangle d'encadrement minimum. Par exemple, si toutes les entités sont coïncidentes (toutes ont exactement les mêmes coordonnées x et y), le système utilise, dans les calculs, la superficie d'un petit polygone carré autour de l'emplacement unique. Autre exemple : si toutes les entités sont parfaitement alignées (par exemple, 3 points sur une ligne droite), le système utilise la superficie d'un polygone rectangle qui laisse un petit espace autour des entités encadrées. Quoi qu'il en soit, il vaut toujours mieux fournir une valeur de Surface avec l'outil Distances moyennes du plus proche voisin.
Bien que cet outil fonctionne avec des données surfaciques ou linéaires, il est plus adapté aux données d'événement, d'incident ou autres données d'entité ponctuelle fixe. Pour les entités linéaires et surfaciques, les calculs utilisent le centroïde géométrique vrai pour chaque entité. Pour les multi-points, les polylignes, ou les polygones comprenant plusieurs parties, le centroïde est calculé à l'aide du centre moyen pondéré de toutes les parties d'entité. La pondération pour les entités ponctuelles est de 1 ; pour les entités linéaires, elle correspond à la longueur et pour les entités surfaciques, à la superficie.
Les couches peuvent permettre de définir la classe d'entités en entrée. Lorsque vous utilisez une couche avec une sélection, seules les entités sélectionnées sont comprises dans l'analyse.
Attention :
Lorsque vous utilisez des shapefiles, n'oubliez pas qu'ils ne peuvent pas stocker de valeurs Null. Il se peut que des outils ou autres procédures qui créent des fichiers de formes à partir d'entrées autres que des fichiers de formes stockent ou interprètent des valeurs Null comme étant égales à zéro. Dans certains cas, les valeurs Null sont stockées sous forme de valeurs négatives très élevées dans les fichiers de formes. Cela peut aboutir à des résultats inattendus. Reportez-vous à la rubrique Remarques concernant le géotraitement pour la sortie de fichiers de formes pour plus d'informations.
Paramètres
Étiquette
Explication
Type de données
Classe d'entités en entrée
Classe d'entités, généralement une classe d'entités ponctuelles, pour laquelle les distances moyennes du plus proche voisin sont calculées.
Feature Layer
Méthode de calcul de distance
Spécifie le mode de calcul des distances de chaque entité avec les entités voisines.
Euclidien—Distance en ligne droite entre deux points (distance à vol d'oiseau).
Manhattan—Distance entre deux points mesurée le long des axes à angle droit (bloc de bâtiments) ; calculée en totalisant la différence (absolue) entre les coordonnées x et y.
String
Générer le rapport
(Facultatif)
Spécifie si l'outil créera un récapitulatif graphique des résultats.
Cochée - Un récapitulatif graphique est créé au format HTML.
Non cochée - Aucun récapitulatif graphique n'est créé. Il s’agit de l’option par défaut.
Boolean
Superficie
(Facultatif)
Valeur numérique qui représente la taille de la zone d'étude. La valeur par défaut correspond à la superficie du rectangle d'encadrement minimum qui englobe toutes les entités (ou toutes les entités sélectionnées). Les unités doivent correspondre à celles du système de coordonnées en sortie.
Classe d'entités, généralement une classe d'entités ponctuelles, pour laquelle les distances moyennes du plus proche voisin sont calculées.
Feature Layer
Distance_Method
Spécifie le mode de calcul des distances de chaque entité avec les entités voisines.
EUCLIDEAN_DISTANCE—Distance en ligne droite entre deux points (distance à vol d'oiseau).
MANHATTAN_DISTANCE—Distance entre deux points mesurée le long des axes à angle droit (bloc de bâtiments) ; calculée en totalisant la différence (absolue) entre les coordonnées x et y.
String
Generate_Report
(Facultatif)
Spécifie si l'outil créera un récapitulatif graphique des résultats.
NO_REPORT—Aucun récapitulatif graphique n'est créé. Il s’agit de l’option par défaut.
GENERATE_REPORT—Un récapitulatif graphique est créé au format HTML.
Boolean
Area
(Facultatif)
Valeur numérique qui représente la taille de la zone d'étude. La valeur par défaut correspond à la superficie du rectangle d'encadrement minimum qui englobe toutes les entités (ou toutes les entités sélectionnées). Les unités doivent correspondre à celles du système de coordonnées en sortie.
Exemple 2 de la fonction AverageNearestNeighbor (script autonome)
Le script Python autonome ci-dessous illustre l'utilisation de l'outil AverageNearestNeighbor.
# Analyze crime data to determine if spatial patterns are statistically significant
# Import system modules
import arcpy
# Local variables...
workspace = "C:/data"
crime_data = "burglaries.shp"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.env.workspace = workspace
# Obtain Nearest Neighbor Ratio and z-score
# Process: Average Nearest Neighbor...
nn_output = arcpy.AverageNearestNeighbor_stats(crime_data, "EUCLIDEAN_DISTANCE", "NO_REPORT", "#")
# Create list of Average Nearest Neighbor output values by splitting the result object
print("The nearest neighbor index is: " + nn_output[0])
print("The z-score of the nearest neighbor index is: " + nn_output[1])
print("The p-value of the nearest neighbor index is: " + nn_output[2])
print("The expected mean distance is: " + nn_output[3])
print("The observed mean distance is: " + nn_output[4])
print("The path of the HTML report: " + nn_output[5])
except arcpy.ExecuteError:
# If an error occurred when running the tool, print out the error message.
print(arcpy.GetMessages())
La géométrie de l'entité est projetée au système de coordonnées en sortie avant l'analyse. Tous les calculs mathématiques sont basés sur la référence spatiale du système de coordonnées en sortie. Lorsque le système de coordonnées en sortie est exprimé en degrés, minutes et secondes, les distances géodésiques sont estimées à l'aide de distances à la corde.