Résumés statistiques de voisinage (Statistiques spatiales)

Résumé

Calcule les résumés statistiques d’un ou plusieurs champs numériques en utilisant les voisinages locaux autour de chaque entité. Parmi les statistiques locales se trouvent la moyenne, la médiane, l’écart type, l’écart interquartile, l’asymétrie, le déséquilibre quantile ; toutes les géographies peuvent être pondérées géographiquement en utilisant des noyaux pour accorder plus d’influence aux voisins situés plus près de l’entité focale. Il est possible d’utiliser plusieurs types de voisinage, notamment le canal de distance, le nombre de voisins, la contiguïté surfacique, la triangulation de Delaunay, et les fichiers de matrice de pondérations spatiales (.swm). Les résumés statistiques sont également calculés pour les distances par rapport aux voisins de chaque entité.

Pour en savoir plus sur le fonctionnement de l'outil Résumés statistiques de voisinage

Illustration

La valeur moyenne est calculée en utilisant les voisins.
La moyenne autour de l’entité focale est calculée à l’aide des voisins.

Utilisation

  • En plus des champs d'analyse fournis, des statistiques basées sur les distances par rapport aux voisins sont calculées pour chaque entité. Cela vous permet de calculer, par exemple, la moyenne et l'écart type des distances par rapport à chaque voisin pour voir si les voisins sont généralement proches ou éloignés de l’entité focale. L’entité focale ne sera pas utilisée dans les calculs des statistiques de distance par rapport aux voisins puisque cette distance est toujours zéro. En outre, ces statistiques ne seront pas pondérées géographiquement puisque le fait de pondérer les valeurs de distance en fonction de ces mêmes distances n’est pas significatif.

  • Lorsque l’option Delaunay triangulation (Triangulation de Delaunay) est sélectionnée pour le paramètre Neighborhood Type (Type de voisinage), la classe d'entités en sortie est appelée une carte de Voronoï.

  • Si les entités en entrée sont des polygones, toutes les distances entre les polygones sont définies en fonction des distances entre les centroïdes de polygones.

  • Les statistiques locales ne peuvent être pondérées géographiquement que si le paramètre Neighborhood Type (Type de voisinage) est défini sur Number of Neighbors (Nombre de voisins) ou Distance Band (Canal de distance) car les voisinages basés sur la contigüité surfacique ou la triangulation de Delaunay ne doivent pas être pondérés par la distance de centroïde à centroïde. Si le paramètre Neighborhood Type (Type de voisinage) est défini sur Get spatial weights from file (Extraire les pondérations spatiales à partir du fichier), les pondérations définies dans le fichier de pondérations spatiales sont automatiquement utilisées pour la pondération géographique.

  • Si l’environnement du système de coordonnées en sortie est défini sur un système de coordonnées géographiques utilisant des coordonnées de latitude et de longitude, toutes les distances sont calculées en utilisant la distance de corde. Dans le cas contraire, toutes les distances sont calculées en utilisant la distance en ligne droite (euclidienne).

  • Si vous choisissez d’ignorer les valeurs nulles en utilisant le paramètre Ignore Null Values in Calculations (Ignorer les valeurs nulles dans les calculs), les voisins ayant des valeurs nulles dans le champ d'analyse seront écartés après la recherche de voisins. Ceci peut réduire le nombre de voisins attendu, et si plusieurs champs d’analyse sont fournis, certains peuvent utiliser un nombre de voisins différents des autres. Ceci est particulièrement évident lorsque l’option Number of Neighbors (Nombre de voisins) est spécifiée pour le paramètre Neighborhood Type (Type de voisinage).

Syntaxe

arcpy.stats.NeighborhoodSummaryStatistics(in_features, output_features, {analysis_fields}, {local_summary_statistic}, {include_focal_feature}, {ignore_nulls}, {neighborhood_type}, {distance_band}, {number_of_neighbors}, {weights_matrix_file}, {local_weighting_scheme}, {kernel_bandwidth})
ParamètreExplicationType de données
in_features

Entités ponctuelles ou surfaciques qui serviront à calculer les statistiques locales.

Feature Layer
output_features

Classe d’entités en sortie contenant les statistiques locales en tant que champs. Chaque statistique de chaque champ d'analyse sera stockée sous forme de champ individuel.

Feature Class
analysis_fields
[analysis_fields,...]
(Facultatif)

Un ou plusieurs champs pour lesquels les statistiques locales seront calculées. Si aucun champ d'analyse n’est fourni, seules les statistiques locales basées sur les distances par rapport aux voisins seront calculées.

Field
local_summary_statistic
(Facultatif)

Spécifie le résumé statistique local qui sera calculé pour chaque champ d’analyse.

  • ALLToutes les statistiques locales seront calculées. Il s’agit de l’option par défaut.
  • MEANLa moyenne locale sera calculée.
  • MEDIAN La médiane locale sera calculée.
  • STD_DEVL’écart type local sera calculé.
  • IQR L’écart interquartile local sera calculé.
  • SKEWNESS L’asymétrie locale sera calculée.
  • QUANTILE_IMBALANCE Le déséquilibre quantile local sera calculé.
String
include_focal_feature
(Facultatif)

Spécifie si l’entité focale sera prise en compte lors du calcul des statistiques locales pour chaque entité.

  • INCLUDE_FOCALL’entité focale et tous ses voisins seront pris en compte lors du calcul des statistiques locales. Il s’agit de l’option par défaut.
  • EXCLUDE_FOCALL’entité focale ne sera pas prise en compte lors du calcul des statistiques locales. Seuls les voisins de l’entité seront pris en compte.
Boolean
ignore_nulls
(Facultatif)

Spécifie si les valeurs nulles des champs d’analyse seront prises en compte ou ignorées dans le calcul.

  • IGNORE_NULLSLes valeurs nulles seront ignorées dans les calculs locaux.
  • INCLUDE_NULLSLes valeurs nulles sont prises en compte dans les calculs locaux.
Boolean
neighborhood_type
(Facultatif)

Spécifie comment les voisins seront sélectionnés pour chaque entité en entrée. Pour calculer les statistiques locales, les entités voisines doivent être identifiées pour chaque entité en entrée, et ces voisins sont utilisés pour calculer les statistiques locales pour chaque entité. Pour les entités ponctuelles, la Delaunay triangulation (Triangulation de Delaunay) est la valeur par défaut. Pour les entités surfaciques, la valeur par défaut est Contiguity edges corners (Angles des tronçons de contiguïté).

  • DISTANCE_BANDLes entités qui se trouvent à une distance critique donnée de chaque entité seront incluses comme voisines.
  • NUMBER_OF_NEIGHBORS Les entités les plus proches seront incluses en tant que voisines.
  • CONTIGUITY_EDGES_ONLY Les entités surfaciques qui partagent un segment seront incluses en tant que voisines.
  • CONTIGUITY_EDGES_CORNERS Les entités surfaciques qui partagent un segment ou un angle seront incluses en tant que voisines. Il s'agit de la valeur par défaut pour les entités surfaciques.
  • DELAUNAY_TRIANGULATIONLes entités dont la triangulation de Delaunay partage un segment seront incluses en tant que voisines. Il s’agit de la valeur par défaut pour les entités ponctuelles.
  • GET_SPATIAL_WEIGHTS_FROM_FILE Les voisins et pondérations sont définis par un fichier de pondérations spatiales spécifié.
String
distance_band
(Facultatif)

Toutes les entités se trouvant dans cette distance seront incluses comme voisines. Si aucune valeur n’est fournie, une valeur sera estimée pendant l’exécution et incluse sous forme de message de géotraitement. Si la distance spécifiée génère plus de 1 000 voisins, seules les 1 000 entités les plus proches seront incluses en tant que voisines.

Linear Unit
number_of_neighbors
(Facultatif)

Le nombre de voisins qui seront inclus pour chaque calcul local. Le nombre n’inclut pas l’entité focale. Si l’entité focale est comprise dans le calcul, un voisin supplémentaire sera utilisé. La valeur par défaut est 8.

Long
weights_matrix_file
(Facultatif)

Chemin d’accès et nom du fichier de matrice de pondérations spatiales définissant les relations spatiales, et potentiellement les relations temporelles, entre des entités.

File
local_weighting_scheme
(Facultatif)

Spécifie la structure de pondération à appliquer aux voisins lors du calcul des statistiques locales.

  • UNWEIGHTEDLes voisins ne seront pas pondérés. Il s’agit de l’option par défaut.
  • BISQUARELes voisins seront pondérés à l’aide d’une structure de noyau bicarré.
  • GAUSSIANLes voisins seront pondérés à l’aide d’une structure de noyau Gaussien.
String
kernel_bandwidth
(Facultatif)

La bande passante des structures de pondération locales bicarrées ou Gaussienne. Si aucune valeur n’est fournie, une valeur sera estimée pendant l’exécution et incluse sous forme de message de géotraitement.

Linear Unit

Exemple de code

Exemple 1 d'utilisation de l'outil NeighborhoodSummaryStatistics (fenêtre Python)

Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil NeighborhoodSummaryStatistics.

import arcpy
arcpy.env.workspace = r"c:\data\project_data.gdb"
arcpy.stats.NeighborhoodSummaryStatistics("USCounties", 
      "USCounties_NeighborhoodSummaryStatistics", "POP2018;POP2019", 
      "ALL", "INCLUDE_FOCAL", "IGNORE_NULLS", "NUMBER_OF_NEIGHBORS", None, 
      8, None, "UNWEIGHTED")
Exemple 2 d'utilisation de l'outil NeighborhoodSummaryStatistics (script autonome)

Le script autonome suivant illustre l'utilisation de l'outil NeighborhoodSummaryStatistics.

# Calculate a focal mean for the population and income of US cities.  
import arcpy 
# Set the current workspace
arcpy.env.workspace = r"c:\data\project_data.gdb" 
# Calculate the local mean of POP2020 and MedIncome2020 fields
# using 8 nearest neighbors.
arcpy.stats.NeighborhoodSummaryStatistics("USCities", "USCities_Mean", 
      "POP2020;MedIncome2020", "MEAN", "EXCLUDE_FOCAL", "IGNORE_NULLS", 
      "NUMBER_OF_NEIGHBORS", None, 8, None, "GAUSSIAN", "50 Miles")

Informations de licence

  • Basic: Oui
  • Standard: Oui
  • Advanced: Oui

Rubriques connexes