Rechercher les points chauds (GeoAnalytics)

Résumé

Dans un ensemble d'entités, cet outil identifie les points chauds et les points froids statistiquement significatifs à l'aide de la statistique Getis-Ord Gi*.

Pour en savoir plus sur le fonctionnement de l'analyse de points chauds (Getis-Ord Gi*)

Illustration

Rechercher les points chauds

Utilisation

  • Cet outil identifie les agrégats spatiaux statistiquement significatifs de nombreuses entités (points chauds) et de peu d'entités (points froids). Il permet de créer une nouvelle classe d’entités en sortie avec un score z, une valeur p et un groupe de niveau de confiance (Gi_Bin) pour chaque entité de la classe d’entités en entrée.

  • Pendant l’analyse, les points en entrée (incidents) sont agrégés dans des groupes d’une taille spécifiée, puis ils sont analysés pour déterminer les points chauds. Les groupes agrégés doivent contenir diverses valeurs (le nombre de points figurant dans un groupe doit être très variable).

  • Les scores z et les valeurs p sont des mesures de signification statistique qui indiquent si l’on peut ou non rejeter l’hypothèse nulle en utilisant des groupes agrégés. En d’autres termes, ces mesures indiquent en effet si l’agrégation spatiale observée des valeurs élevées ou faibles est plus prononcée qu’elle ne devrait l’être dans le cadre d’une répartition aléatoire de ces valeurs. Les champs des scores z et des valeurs p ne reflètent aucune sorte de correction False Discovery Rate (FDR).

  • Un score z élevé et une valeur p faible pour une entité indiquent la présence certaine d'incidents de points. Un score z négatif faible et une valeur p faible indiquent l'absence de points d'incidents. Plus le score z est élevé (ou faible), plus l'intensité de l'agrégation est importante. Un score z proche de zéro indique qu'il n'y a aucune agrégation apparente.

  • Le score z repose sur le calcul de l'hypothèse nulle aléatoire. Pour plus d'informations sur les scores z, reportez-vous à la rubrique Qu'est-ce qu'un score z ? Qu'est-ce qu'une valeur p ?

  • L’outil Rechercher les points chauds nécessite de projeter la couche en entrée ou que le système de coordonnées en sortie soit un système de coordonnées projetées.

  • Lorsque des entités en entrée sont analysées à l'aide d'intervalles de temps, chaque intervalle de temps est analysé indépendamment des entités en dehors de cet intervalle de temps.

  • Le paramètre Time Step Reference (Référence de l’intervalle temporel) peut être une valeur de date et d’heure ou simplement une valeur de date, mais pas uniquement une valeur d’heure.

  • Cet outil de géotraitement est mis en œuvre par ArcGIS GeoAnalytics Server. L’analyse est réalisée sur le GeoAnalytics Server et les résultats sont stockés dans votre contenu dans ArcGIS Enterprise.

  • Lors de l’exécution des outils GeoAnalytics Server, l’analyse est réalisée sur GeoAnalytics Server. Pour des performances optimales, GeoAnalytics Server doit pouvoir accéder aux données via les couches d’entités hébergées sur votre portail ArcGIS Enterprise ou les partages de fichiers Big Data. Les données qui ne sont pas locales pour GeoAnalytics Server sont transférées sur GeoAnalytics Server avant le début de l’analyse. Autrement dit, l’exécution d’un outil prend plus de temps et, dans certains cas, le transfert des données entre ArcGIS Pro et GeoAnalytics Server peut échouer. Le seuil d’échec dépend aussi bien des débits du réseau que de la taille et de la complexité des données. Il est par conséquent recommandé de toujours partager les données ou créer un partage de fichiers Big Data.

    Pour en savoir plus sur le partage des données dans votre portail.

    Pour en savoir pus sur la création d'un partage de fichiers Big Data via ArcGIS Server Manager

  • Vous pouvez effectuer une analyse semblable en utilisant :

Syntaxe

arcpy.geoanalytics.FindHotSpots(point_layer, output_name, {bin_size}, {neighborhood_size}, {time_step_interval}, {time_step_alignment}, {time_step_reference}, {data_store})
ParamètreExplicationType de données
point_layer

Classe d'entité ponctuelle pour laquelle une analyse des points chauds est effectuée.

Feature Set
output_name

Le nom de la couche en sortie avec les résultats des scores z et des valeurs p.

String
bin_size
(Facultatif)

Intervalle de distance qui représente la taille du groupe et les unités dans lesquelles la point_layer sera agrégée. L'intervalle de distance doit être une unité linéaire.

Linear Unit
neighborhood_size
(Facultatif)

Étendue spatiale du voisinage d’analyse. Cette valeur désigne les entités qui sont analysées ensemble en vue d’évaluer l’agrégation locale.

Linear Unit
time_step_interval
(Facultatif)

L’intervalle qui sera utilisé pour le pas de temps. Ce paramètre est uniquement utilisé si la temporalité est activée pour point_layer.

Time Unit
time_step_alignment
(Facultatif)

Spécifie la manière dont les pas de temps seront alignés. Ce paramètre n’est disponible que si les points en entrée sont temporels et représentent un instant dans le temps.

  • END_TIMELes pas de temps s’alignent sur le dernier événement temporel et s’agrègent dans le passé.
  • START_TIMELes pas de temps s’alignent sur le premier événement temporel et s’agrègent dans le futur. Il s’agit de l’option par défaut.
  • REFERENCE_TIMELes pas de temps s’alignent sur une date ou une heure spécifiée. Si la valeur d’horodatage de tous les points des entités en entrée est supérieure à la référence temporelleque vous avez spécifiée (ou si elle correspond exactement à l’heure de début des entités en entrée), l’intervalle temporel commence par cette référence temporelle et procède à une agrégation dans le futur (comme avec l’alignement Start time (Heure de début)). Si la valeur d’horodatage de tous les points des entités en entrée est inférieure à la référence temporelle spécifiée (ou si elle correspond exactement à l’heure de fin des entités en entrée), l’intervalle temporel termine par cette référence temporelle et procède à une agrégation dans le passé (comme avec l’alignement End time (Heure de fin)). Si la référence temporelle spécifiée se trouve au milieu de l’étendue temporelle de vos données, un intervalle temporel est créé qui se termine par la référence temporelle que vous indiquez (comme avec l’alignement End time (Heure de fin)). Des intervalles supplémentaires seront créés avant et après la référence temporelle jusqu’à ce que l’étendue temporelle complète des données soit couverte.
String
time_step_reference
(Facultatif)

L’heure qui sera utilisée pour aligner les pas de temps et les intervalles temporels. Ce paramètre est uniquement utilisé si la temporalité est activée pour point_layer.

Date
data_store
(Facultatif)

Indique le ArcGIS Data Store dans laquelle la sortie est enregistrée. La valeur par défaut est SPATIOTEMPORAL_DATA_STORE. Tous les résultats stockés dans un répertoire de données Big Data spatio-temporelles seront stockés en WGS84. Les résultats stockés dans un répertoire de données relationnelles conservent leur système de coordonnées.

  • SPATIOTEMPORAL_DATA_STORELa sortie sera stockée dans un stockage de Big Data spatio-temporelles. Il s’agit de l’option par défaut.
  • RELATIONAL_DATA_STORELa sortie sera stockée dans un data store relationnel.
String

Sortie dérivée

NomExplicationType de données
output

Points chauds statistiquement significatifs.

Jeu d'entités

Exemple de code

FindHotSpots (fenêtre Python)

Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil FindHotSpots.

#-------------------------------------------------------------------------------
# Name: FindHotSpots.py
# Description: Find Hots Spots of 311 calls for bins of 500 meters looking at neighbors withing 1 kilometers. Complete the analysis for each month. 
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
inFeatures = "https://sampleserver6.arcgisonline.com/arcgis/rest/services/SF311/FeatureServer/0"
bins = "500 Meters"
neighborhood = "1 Kilometers"
timeStep = "1 Months"
outFS = "HotSpotsOF311Data"
dataStore = "SPATIOTEMPORAL_DATA_STORE"
# Execute Find Hot Spots
arcpy.geoanalytics.FindHotSpots(inFeatures, outFS, bins, neighborhood, timeStep, 
                                None, None, dataStore)

Environnements

Système de coordonnées en sortie

Système de coordonnées qui sera utilisé pour l'analyse. L’analyse sera réalisée dans le système de coordonnées en entrée, à moins que ce paramètre en spécifie un autre. Pour les Outils GeoAnalytics, les résultats finaux seront stockés dans le stockage des données spatio-temporelles dans WGS84.

Informations de licence

  • Basic: Requiert ArcGIS GeoAnalytics Server
  • Standard: Requiert ArcGIS GeoAnalytics Server
  • Advanced: Requiert ArcGIS GeoAnalytics Server

Rubriques connexes