Analyse de points chauds émergents (Exploration des modèles spatio-temporels)

Résumé

Identifie les tendances d’agrégation des densités de points (totaux) ou des valeurs dans un cube spatio-temporel créé à l’aide de l’outil Créer un cube spatio-temporel en agrégeant des points, Créer un cube spatio-temporel à partir d’emplacements définis ou Créer un cube spatio-temporel à partir d’une couche raster multidimensionnelle. Les catégories sont notamment les points chauds et froids nouveaux, consécutifs, d'intensification, persistants, diminuants, sporadiques, oscillants et historiques.

Pour en savoir plus sur le fonctionnement de l'outil Analyse de points chauds émergents

Illustration

Tendances des points chauds

Utilisation

  • Cet outil peut uniquement accepter les fichiers netCDF créés par l’outil Créer un cube spatio-temporel en agrégeant des points, Créer un cube spatio-temporel à partir d’emplacements définis ou Créer un cube spatio-temporel à partir d’une couche raster multidimensionnelle.

  • Chaque groupe dans le cube spatio-temporel présente une valeur LOCATION_ID, time_step_ID et COUNT, ainsi que les champs de récapitulation (Summary Fields) ou les variables qui ont été agrégés lors de la création du cube. Les groupes associés au même emplacement physique partagent le même ID d'emplacement et constituent ensemble une série chronologique. Les groupes associés au même intervalle temporel partagent le même ID d'intervalle temporel et constituent ensemble une tranche de temps. La valeur numérique de chaque groupe représente le nombre d'incidents ou d'enregistrements présents à l'emplacement associé de l'intervalle temporel associé.

    Chaque groupe est associé à un ID d'emplacement, un ID d'intervalle temporel et un nombre

  • Cet outil analyse une variable dans le Cube spatio-temporel en entrée netCDF à l'aide d'une implémentation spatio-temporelle de la statistique Getis-Ord Gi*.

  • Les entités en sortie seront ajoutées à la fenêtre Contenu avec le rendu qui récapitule les résultats de l'analyse spatio-temporelle pour tous les emplacements analysés. Si vous spécifiez un Masque d'analyse de polygone, les emplacements analysés seront ceux qui figurent dans le masque d'analyse. Sinon, les emplacements analysés seront ceux qui présentent au moins un point pour au moins un intervalle temporel.

    Emplacements des cubes avec et sans données.

  • Outre l'option Classe d’entités en sortie, un récapitulatif d'analyse est généré sous forme de messages apparaissant en bas de la fenêtre Géotraitement pendant l'exécution de l'outil. Vous pouvez accéder aux messages en passant le curseur de la souris sur la barre de progression, en cliquant sur le bouton de menu contextuel Ouvrir dans une nouvelle fenêtre ou en développant la section du détail des messages dans la fenêtre Geoprocessing (Géotraitement). Vous pouvez également consulter les messages provenant d'un outil déjà exécuté via l’historique de géotraitement.

  • L'outil Analyse de points chauds émergents peut détecter huit tendances de points chauds ou froids spécifiques : nouveau, consécutif, d'intensification, persistant, diminuant, sporadique, oscillant et historique. Reportez-vous à la section En savoir plus sur le fonctionnement de l'outil Analyse de points chauds émergents pour consulter des définitions de catégorie en sortie et obtenir des informations supplémentaires sur les algorithmes que cet outil utilise.

  • Pour obtenir une mesure de l'intensité de l'agrégation des entités, cet outil utilise une implémentation spatio-temporelle de la statistique Getis-Ord Gi* qui tient compte de la valeur correspondant à chaque groupe dans le contexte des valeurs des groupes voisins.

  • Pour déterminer quels groupes sont inclus dans chaque voisinage d'analyse, l'outil trouve d'abord les groupes voisins inclus dans la conceptualisation de relations spatiales. Ensuite, pour chacun de ces groupes, il inclut les groupes se trouvant aux mêmes endroits séparés par N phases précédentes, N représentant la valeur d'intervalle temporel de voisinage que vous spécifiez.

  • Le choix du paramètre Conceptualisation de relations spatiales doit refléter les relations inhérentes entre les entités que vous analysez. Plus la modélisation de l'interaction des entités dans l'espace est réaliste, plus les résultats sont précis. Des recommandations sont présentées dans la section Sélection d'une conceptualisation de relations spatiales : meilleures pratiques.

  • La conceptualisation de relations spatiales est Distance fixe. Un groupe est considéré comme un voisin lorsque son centroïde se trouve dans la distance de voisinage et que son intervalle temporel est compris dans l'intervalle temporel de voisinage spécifié. Si vous n'indiquez pas de valeur pour Distance du voisinage, une valeur est calculée pour vous en fonction de la distribution spatiale de vos données ponctuelles. Si vous n'indiquez aucune valeur pour l'option Intervalle temporel de voisinage, l'outil utilise une valeur par défaut, à savoir 1 intervalle temporel.

  • Le paramètre Nombre de voisins peut remplacer la distance de voisinage pour l'option Distance fixe ou étendre la recherche de voisinage pour Tronçons de contiguïté uniquement et Angles des tronçons de contiguïté options. Dans ce cas, Nombre de voisins est utilisé comme nombre minimum. Par exemple, si vous spécifiez Distance fixe avec une distance de voisinage de 10 miles et 3 pour le paramètre Nombre de voisins, tous les groupes reçoivent un minimum de 3 voisins spatiaux même si la distance de voisinage doit augmenter pour les trouver. La distance augmente uniquement pour les groupes où le nombre de voisins minimum n'est pas satisfait. De même, avec les options de contiguïté, pour les groupes dont le nombre de voisins contigus est inférieur à celui-ci, des voisins supplémentaires sont choisis en fonction de la proximité avec le centroïde.

  • La valeur de l'option Intervalle temporel de voisinage représente le nombre d'intervalles temporels à inclure dans le voisinage d'analyse. Si l'intervalle temporel de votre cube équivaut à trois mois, par exemple, et que vous indiquez 2 comme valeur pour Intervalle temporel de voisinage, le nombre total de groupes compris dans la distance de voisinage, ainsi que tous les groupes associés pour les deux intervalles temporels précédents (représentant une période de neuf mois) seront inclus dans le voisinage d'analyse.

  • La couche d'entités Masque d'analyse de polygone peut inclure un ou plusieurs polygones qui définissent la zone d'étude de l'analyse. Ces polygones doivent indiquer l'endroit où les entités ponctuelles risquent d'être présentes et exclure les surfaces où les points ne risquent pas d'apparaître. Si vous analysez des tendances de cambriolage dans des résidences, par exemple, vous pouvez utiliser le masque d'analyse de polygone pour exclure un lac étendu, des parcs régionaux ou d'autres endroits ne comprenant aucune résidence.

  • Le masque d'analyse de polygone est intersecté avec l'étendue du cube spatio-temporel en entrée et n'étendra pas les dimensions du cube.

  • Si le masque d'analyse de polygone que vous utilisez pour définir votre zone d'étude couvre une zone qui s'étend au-delà de l'étendue des entités en entrée qui ont servi lors de la création initiale du cube, vous pouvez recréer votre cube en utilisant ce masque d'analyse de polygone en tant que paramètre d'environnement d'étendue en sortie. Cette opération permet de s'assurer que toute la zone couverte par le masque d'analyse de polygone est comprise lors de l'exécution de l'outil Analyse de points chauds émergents. L'utilisation du masque d'analyse de polygone comme paramètre d'environnement d'étendue en sortie au cours de la création du cube permet de s'assurer que l'étendue du cube concorde avec l'étendue du masque d'analyse de polygone.

  • L'exécution de l'outil Analyse de points chauds émergents permet d'ajouter certains résultats d'analyse dans le cube spatio-temporel en entrée netCDF. Trois types d'analyses sont exécutés :

    • Chaque groupe est analysé par rapport aux groupes voisins pour mesurer l'intensité de l'agrégation des valeurs élevées et faibles. Le résultat de cette analyse est un score z, une valeur p et une catégorie de classification pour chaque groupe du cube spatio-temporel.
    • La série chronologique de ces scores z aux emplacements analysés est ensuite évaluée à l'aide de la statistique de Mann-Kendall. Le résultat de cette analyse est un score z de tendance d'agrégation, une valeur p et une catégorie de classification pour chaque emplacement.
    • Pour terminer, la série chronologique des valeurs aux emplacements analysés est évaluée à l'aide de la statistique de Mann-Kendall. Le résultat de cette analyse est un score z de tendance, une valeur p et une catégorie de classification pour chaque emplacement.

    Vous trouverez ci-dessous un récapitulatif des variables ajoutées au Cube spatio-temporel en entrée :

    Nom de variableDescriptionCotation

    EMERGING_{ANALYSIS_VARIABLE}_HS_PVALUE

    Valeur p de la statistique Getis-Ord Gi* qui mesure l’importance d’un point de vue statistique de l’agrégation de valeurs élevées (point chaud) et faibles (point froid).

    Tridimensionnel : une valeur de p pour chaque groupe du cube spatio-temporel.

    EMERGING_{ANALYSIS_VARIABLE}_HS_ZSCORE

    Score z de la statistique Getis-Ord Gi* qui mesure l’intensité de l’agrégation de valeurs élevées (point chaud) et faibles (point froid).

    Tridimensionnel : un score z pour chaque groupe du cube spatio-temporel.

    EMERGING_{ANALYSIS_VARIABLE}_HS_BIN

    Catégorie de résultats permettant de classer chaque groupe en tant que valeur de point chaud ou froid statistiquement significatif. Ce groupe est basé sur une correction FDR.

    • -3 : point froid, niveau de confiance de 99 pour cent
    • -2 : point froid, niveau de confiance de 95 pour cent
    • -1 : point froid, niveau de confiance de 90 pour cent
    • 0 : point chaud ou froid statistiquement non significatif
    • 1 : point chaud, niveau de confiance de 90 pour cent
    • 2 : point chaud, niveau de confiance de 95 pour cent
    • 3 : point chaud, niveau de confiance de 99 pour cent

    Tridimensionnel : une catégorie de classification pour chaque groupe du cube spatio-temporel. Ce groupe est basé sur une correction FDR.

    {ANALYSIS_VARIABLE}_TREND_PVALUE

    Valeur p de Mann-Kendall mesure la signification statistique de la tendance de valeurs à un emplacement donné.

    Bidimensionnel : une valeur de p pour chaque emplacement analysé.

    {ANALYSIS_VARIABLE}_TREND_ZSCORE

    Le score z qui mesure la tendance de Mann-Kendall, vers le haut ou vers le bas, associée aux valeurs à un emplacement donné. Un score z positif indique une tendance vers le haut et un score z négatif indique une tendance vers le bas.

    Bidimensionnel : un score z pour chaque emplacement analysé.

    {ANALYSIS_VARIABLE}_TREND_BIN

    Catégorie de résultats permettant de classer chaque emplacement qui présente une tendance statistiquement significative vers le haut ou vers le bas pour les valeurs.

    • -3 : tendance vers le bas, niveau de confiance de 99 pour cent
    • -2 : tendance vers le bas, niveau de confiance de 95 pour cent
    • -1 : tendance vers le bas, niveau de confiance de 90 pour cent
    • 0 : aucune tendance significative
    • 1 : tendance vers le haut, niveau de confiance de 90 pour cent
    • 2 : tendance vers le haut, niveau de confiance de 95 pour cent
    • 3 : tendance vers le haut, niveau de confiance de 99 pour cent

    Bidimensionnel : une catégorie de classification pour chaque emplacement analysé.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_PVALUE

    Valeur p de Mann-Kendall qui mesure la signification statistique de la tendance dans les scores z de points chauds/froids à un emplacement donné.

    Bidimensionnel : une valeur de p pour chaque emplacement analysé.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_ZSCORE

    Le score z qui mesure la tendance de Mann-Kendall, vers le haut ou vers le bas, associée à la tendance des scores z de points chauds/froids à un emplacement donné. Un score z positif indique une tendance vers le haut et un score z négatif indique une tendance vers le bas.

    Bidimensionnel : un score z pour chaque emplacement analysé.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_BIN

    Catégorie de résultats permettant de classer chaque emplacement qui présente une tendance statistiquement significative vers le haut ou vers le bas pour les scores z des points chauds/froids.

    • -3 : tendance vers le bas, niveau de confiance de 99 pour cent
    • -2 : tendance vers le bas, niveau de confiance de 95 pour cent
    • -1 : tendance vers le bas, niveau de confiance de 90 pour cent
    • 0 : aucune tendance significative
    • 1 : tendance vers le haut, niveau de confiance de 90 pour cent
    • 2 : tendance vers le haut, niveau de confiance de 95 pour cent
    • 3 : tendance vers le haut, niveau de confiance de 99 pour cent

    Bidimensionnel : une catégorie de classification pour chaque emplacement analysé.

    EMERGING_{ANALYSIS_VARIABLE}_CATEGORY

    Une des 17 catégories, 1 à 8, 0 et -1 à -8.

    • 1, nouveau point chaud
    • 2, point chaud consécutif
    • 3, intensification de point chaud
    • 4, point chaud persistant
    • 5, point chaud diminuant
    • 6, point chaud sporadique
    • 7, point chaud oscillant
    • 8, point chaud historique
    • 0, aucun modèle détecté
    • -1, nouveau point froid
    • -2, point froid consécutif
    • -3, intensification de point froid
    • -4, point froid persistant
    • -5, point froid diminuant
    • -6, point froid sporadique
    • -7, point froid oscillant
    • -8, point froid historique

    Bidimensionnel : une catégorie pour chaque emplacement analysé.

Syntaxe

arcpy.stpm.EmergingHotSpotAnalysis(in_cube, analysis_variable, output_features, {neighborhood_distance}, {neighborhood_time_step}, {polygon_mask}, {conceptualization_of_spatial_relationships}, {number_of_neighbors}, {define_global_window})
ParamètreExplicationType de données
in_cube

Cube netCDF à analyser. Le fichier doit être doté de l’extension .nc et doit avoir été créé avec l’outil Créer un cube spatio-temporel en agrégeant des points ou Créer un cube spatio-temporel à partir d’emplacements définis.

File
analysis_variable

Variable numérique dans le fichier netCDF que vous voulez analyser.

String
output_features

Résultats de la classe d'entités en sortie. Cette classe d'entités sera une représentation cartographique en deux dimensions des tendances des points chauds et froids dans vos données. Elle présentera, par exemple, les points chauds nouveaux ou d'intensification.

Feature Class
neighborhood_distance
(Facultatif)

Etendue spatiale du voisinage d'analyse. Cette valeur désigne les entités qui sont analysées ensemble en vue d'évaluer l'agrégation spatio-temporelle locale.

Linear Unit
neighborhood_time_step
(Facultatif)

Nombre d'intervalles temporels à inclure dans le voisinage d'analyse. Cette valeur désigne les entités qui sont analysées ensemble en vue d'évaluer l'agrégation spatio-temporelle locale.

Long
polygon_mask
(Facultatif)

Couche d'entités surfaciques dont un ou plusieurs polygones définissent la zone d'étude d'analyse. Un masque d'analyse surfacique permet, par exemple, d'exclure un lac de grande envergure de l'analyse. Les groupes définis dans le in_cube qui se situent en dehors du masque ne sont pas inclus dans l'analyse.

Ce paramètre est uniquement disponible pour les cubes de quadrillage.

Feature Layer
conceptualization_of_spatial_relationships
(Facultatif)

Indique comment les relations spatiales sont définies parmi les groupes.

  • FIXED_DISTANCEChaque groupe est analysé par rapport aux groupes voisins. Les groupes voisins situés en deçà de la distance critique spécifiée (neighborhood_distance) reçoivent une pondération de 1 et exercent une influence sur les calculs du groupe cible. Les groupes voisins situés au-delà de la distance critique reçoivent une pondération de zéro et n'exercent aucune influence sur les calculs du groupe cible.
  • K_NEAREST_NEIGHBORSLes k groupes les plus proches sont inclus dans l'analyse ; k est un paramètre numérique spécifié.
  • CONTIGUITY_EDGES_ONLYSeules les groupes voisins qui partagent un tronçon influencent les calculs du groupe surfacique cible.
  • CONTIGUITY_EDGES_CORNERSLes groupes voisins qui partagent un tronçon ou un nœud influencent les calculs du groupe surfacique cible..
String
number_of_neighbors
(Facultatif)

Un entier spécifiant le nombre minimum ou exact de voisins à inclure dans les calculs du groupe cible. Pour K_NEAREST_NEIGHBORS, chaque groupe aura exactement ce nombre spécifié de voisins. Pour FIXED_DISTANCE_BAND, chaque groupe aura au moins ce nombre de voisins (la distance seuil sera temporairement étendue pour garantir ce nombre de voisins, le cas échéant). Si une des conceptualisations de contiguïté est sélectionnée, ce nombre minimum de voisins est attribué à chaque groupe. Pour les groupes dont le nombre de voisins contigus est inférieur à celui spécifié, les voisins supplémentaires reposeront sur la proximité avec le centroïde des entités.

Long
define_global_window
(Facultatif)

La statistique compare une statistique locale, calculée d’après les voisins de chaque groupe, à une valeur globale. Ce paramètre permet de contrôler les groupes à utiliser pour calculer la valeur globale.

  • ENTIRE_CUBEChaque voisinage est analysé en le comparant au cube entier. Il s’agit de l’option par défaut.
  • NEIGHBORHOOD_TIME_STEPChaque voisinage est analysé en le comparant aux groupes contenus dans l’intervalle temporel de voisinage (option Neighborhood Time Step) spécifié.
  • INDIVIDUAL_TIME_STEPChaque voisinage est analysé par comparaison avec les groupes du même intervalle temporel.
String

Exemple de code

Exemple 1 d'utilisation de l'outil EmergingHotSpotAnalysis (fenêtre Python)

Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil EmergingHotSpotAnalysis.

import arcpy
arcpy.env.workspace = r"C:\STPM"
arcpy.EmergingHotSpotAnalysis_stpm("Homicides.nc", "COUNT", "EHS_Homicides.shp", "5 Miles", 2, "#", "FIXED_DISTANCE", "3")
Exemple 2 d'utilisation de l'outil EmergingHotSpotAnalysis (script autonome)

Le script Python autonome ci-dessous illustre l'utilisation de l'outil EmergingHotSpotAnalysis.

# Create Space Time Cube of homicide incidents in a metropolitan area
# Import system modules
import arcpy
# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True
# Local variables...
workspace = r"C:\STPM"
try:
    # Set the current workspace (to avoid having to specify the full path to the feature 
    # classes each time)
    arcpy.env.workspace = workspace
    # Create Space Time Cube of homicide incident data with 3 months and 3 miles settings
    # Process: Create Space Time Cube 
    cube = arcpy.CreateSpaceTimeCube_stpm("Homicides.shp", "Homicides.nc", "MyDate", "#", 
                                          "3 Months", "End time", "#", "3 Miles", "Property MEDIAN SPACETIME; Age STD ZEROS",
																																										"HEXAGON_GRID")
    # Create a polygon that defines where incidents are possible  
    # Process: Minimum Bounding Geometry of homicide incident data
    arcpy.MinimumBoundingGeometry_management("Homicides.shp", "bounding.shp", "CONVEX_HULL",
                                             "ALL", "#", "NO_MBG_FIELDS")
    # Emerging Hot Spot Analysis of homicide incident cube using 5 Miles neighborhood 
    # distance and 2 neighborhood time step to detect hot spots
    # Process: Emerging Hot Spot Analysis 
    cube = arcpy.EmergingHotSpotAnalysis_stpm("Homicides.nc", "COUNT", "EHS_Homicides.shp", 
                                              "5 Miles", 2, "bounding.shp", "FIXED_DISTANCE", "3")
except arcpy.ExecuteError:
    # If any error occurred when running the tool, print the messages
    print(arcpy.GetMessages())

Informations de licence

  • Basic: Oui
  • Standard: Oui
  • Advanced: Oui

Rubriques connexes