Analyse de points chauds émergents (Exploration des modèles spatio-temporels)

Synthèse

Identifie les tendances d’agrégation des densités de points (totaux) ou des valeurs dans un cube spatio-temporel créé à l’aide de l’outil Créer un cube spatio-temporel en agrégeant des points, Créer un cube spatio-temporel à partir d’emplacements définis ou Créer un cube spatio-temporel à partir d’une couche raster multidimensionnelle. Les catégories sont notamment les points chauds et froids nouveaux, consécutifs, d'intensification, persistants, diminuants, sporadiques, oscillants et historiques.

Pour en savoir plus sur le fonctionnement de l’outil Analyse de points chauds émergents

Illustration

Illustration de l’outil Analyse de points chauds émergents

Utilisation

  • Cet outil accepte les fichiers netCDF créés à l’aide de divers outils figurant dans la boîte à outils Exploration des modèles spatio-temporels.

    En savoir plus sur la création d’un cube spatio-temporel

  • Chaque groupe dans le cube spatio-temporel présente une valeur LOCATION_ID, time_step_IDet COUNT, ainsi que les champs de récapitulation ou les variables qui ont été agrégés lors de la création du cube. Les groupes associés à la même localisation physique partagent le même ID de localisation et constituent ensemble une série chronologique. Les groupes associés au même intervalle temporel partagent le même ID d’intervalle temporel et constituent ensemble une tranche temporelle. La valeur de nombre de chaque groupe représente le nombre d’incidents ou d’enregistrements présents à la localisation associée dans l’intervalle temporel associé.

    Chaque groupe est associé à un ID de localisation, un ID d’intervalle temporel et un nombre.

  • Cet outil analyse une variable dans le Cube spatio-temporel en entrée netCDF à l'aide d'une implémentation spatio-temporelle de la statistique Getis-Ord Gi*.

  • Les entités en sortie seront ajoutées à la fenêtre Contenu avec un rendu qui résume les résultats de l’analyse spatio-temporelle pour toutes les localisations analysées. Si vous spécifiez un Masque d’analyse surfacique, les localisations analysées seront celles qui figurent dans le masque d’analyse. Sinon, les localisations analysées seront celles qui présentent au moins un point pour au moins un intervalle temporel.

    Emplacements des cubes avec et sans données.

  • Outre l’option Classe d’entités en sortie, un résumé de l’analyse est généré sous forme de messages apparaissant en bas de la fenêtre Géotraitement pendant l’exécution de l’outil. Vous pouvez accéder aux messages en passant le curseur de la souris sur la barre de progression, en cliquant sur le bouton de menu contextuel Ouvrir dans une nouvelle fenêtre ou en développant la section du détail des messages dans la fenêtre Geoprocessing (Géotraitement). Vous pouvez également consulter les messages provenant d'un outil déjà exécuté via l’historique de géotraitement.

  • L'outil Analyse de points chauds émergents peut détecter huit tendances de points chauds ou froids spécifiques : nouveau, consécutif, d'intensification, persistant, diminuant, sporadique, oscillant et historique. Reportez-vous à la section En savoir plus sur le fonctionnement de l'outil Analyse de points chauds émergents pour consulter des définitions de catégorie en sortie et obtenir des informations supplémentaires sur les algorithmes que cet outil utilise.

  • Pour obtenir une mesure de l'intensité de l'agrégation des entités, cet outil utilise une implémentation spatio-temporelle de la statistique Getis-Ord Gi* qui tient compte de la valeur correspondant à chaque groupe dans le contexte des valeurs des groupes voisins.

  • Pour déterminer les groupes à inclure dans chaque voisinage d’analyse, l’outil identifie d’abord les groupes voisins inclus dans la conceptualisation des relations spatiales. Ensuite, pour chacun de ces groupes, il inclut les groupes se trouvant aux mêmes endroits séparés par N phases précédentes, N représentant la valeur d’intervalle temporel de voisinage que vous spécifiez.

  • Le choix du paramètre Conceptualisation des relations spatiales doit refléter les relations inhérentes entre les entités que vous analysez. Plus la modélisation des interactions entre les entités dans l’espace est réaliste, plus les résultats sont précis. Des recommandations sont présentées dans la section Sélection d’une conceptualisation des relations spatiales : bonnes pratiques.

  • La conceptualisation des relations spatiales par défaut est Distance fixe. Un groupe est considéré comme un voisin lorsque son centroïde se trouve dans la distance de voisinage et que son intervalle temporel est compris dans l’intervalle temporel de voisinage spécifié. Si vous n’indiquez pas de valeur pour le paramètre Distance de voisinage, une valeur est calculée pour vous en fonction de la distribution spatiale de vos données ponctuelles. Si vous n’indiquez pas de valeur pour le paramètre Intervalle temporel de voisinage, l’outil utilise une valeur par défaut, à savoir 1 intervalle temporel.

  • Le paramètre Nombre de voisins peut remplacer la distance de voisinage pour l’option Distance fixe ou étendre la recherche de voisinage pour les options Segments de contiguïté uniquement et Angles des segments de contiguïté. Dans ce cas, Nombre de voisins est utilisé comme nombre minimum. Par exemple, si vous choisissez Distance fixe avec une distance de voisinage de 10 miles et 3 pour le paramètre Nombre de voisins, tous les groupes reçoivent un minimum de 3 voisins spatiaux même si la distance de voisinage doit augmenter pour les trouver. La distance augmente uniquement pour les groupes où le nombre de voisins minimal n’est pas satisfait. De même, avec les options de contiguïté, pour les groupes dont le nombre de voisins contigus est inférieur au nombre spécifié, des voisins supplémentaires sont choisis en fonction de la proximité avec le centroïde.

  • La valeur du paramètre Intervalle temporel de voisinage représente le nombre d’intervalles temporels à inclure dans le voisinage d’analyse. Si l'intervalle temporel de votre cube équivaut à trois mois, par exemple, et que vous indiquez 2 comme valeur pour Intervalle temporel de voisinage, le nombre total de groupes compris dans la distance de voisinage, ainsi que tous les groupes associés pour les deux intervalles temporels précédents (représentant une période de neuf mois) seront inclus dans le voisinage d'analyse.

  • La couche d’entités Masque d’analyse surfacique peut inclure un ou plusieurs polygones qui définissent la zone d’étude de l’analyse. Ces polygones doivent indiquer l’endroit où les entités ponctuelles risquent d’être présentes et exclure les zones où les points ne risquent pas d’apparaître. Si vous analysez les tendances en matière de cambriolage dans les résidences, par exemple, vous pouvez utiliser le masque d’analyse surfacique pour exclure un lac étendu, des parcs régionaux ou d’autres endroits ne comprenant aucune habitation.

  • Le masque d’analyse surfacique est intersecté avec l’étendue du cube spatio-temporel en entrée et n’étend pas les dimensions du cube.

  • Si le masque d'analyse de polygone que vous utilisez pour définir votre zone d'étude couvre une zone qui s'étend au-delà de l'étendue des entités en entrée qui ont servi lors de la création initiale du cube, vous pouvez recréer votre cube en utilisant ce masque d'analyse de polygone en tant que paramètre d'environnement d'étendue en sortie. Cette opération permet de s'assurer que toute la zone couverte par le masque d'analyse de polygone est comprise lors de l'exécution de l'outil Analyse de points chauds émergents. L'utilisation du masque d'analyse de polygone comme paramètre d'environnement d'étendue en sortie au cours de la création du cube permet de s'assurer que l'étendue du cube concorde avec l'étendue du masque d'analyse de polygone.

  • L’exécution de l’outil Analyse de points chauds émergents permet d’ajouter certains résultats d’analyse dans le cube spatio-temporel en entrée netCDF. Trois types d'analyses sont exécutés :

    • Chaque groupe est analysé par rapport aux groupes voisins pour mesurer l'intensité de l'agrégation des valeurs élevées et faibles. Le résultat de cette analyse est un score z, une valeur p et une catégorie de classification pour chaque bin du cube spatio-temporel.
    • La série chronologique de ces scores z aux emplacements analysés est ensuite évaluée à l'aide de la statistique de Mann-Kendall. Le résultat de cette analyse est un score z de tendance d'agrégation, une valeur p et une catégorie de classification pour chaque emplacement.
    • Pour terminer, la série chronologique des valeurs aux emplacements analysés est évaluée à l'aide de la statistique de Mann-Kendall. Le résultat de cette analyse est un score z de tendance, une valeur p et une catégorie de classification pour chaque emplacement.

    Vous trouverez ci-dessous un récapitulatif des variables ajoutées au Cube spatio-temporel en entrée :

    Nom de variableDescriptionDimension

    EMERGING_{ANALYSIS_VARIABLE}_HS_PVALUE

    Valeur p de la statistique Getis-Ord Gi* qui mesure l’importance d’un point de vue statistique de l’agrégation de valeurs élevées (point chaud) et faibles (point froid).

    Tridimensionnel : une valeur de p pour chaque groupe du cube spatio-temporel.

    EMERGING_{ANALYSIS_VARIABLE}_HS_ZSCORE

    Le score z de la statistique Getis-Ord Gi* qui mesure l’intensité de l’agrégation de valeurs élevées (point chaud) et faibles (point froid).

    Tridimensionnel : un score z pour chaque groupe du cube spatio-temporel.

    EMERGING_{ANALYSIS_VARIABLE}_HS_BIN

    Catégorie de résultats permettant de classer chaque bin en tant que valeur de point chaud ou froid statistiquement significatif. Ce groupe est basé sur une correction FDR.

    • -3 : point froid, niveau de confiance de 99 pour cent
    • -2 : point froid, niveau de confiance de 95 pour cent
    • -1 : point froid, niveau de confiance de 90 pour cent
    • 0 : point chaud ou froid statistiquement non significatif
    • 1 : point chaud, niveau de confiance de 90 pour cent
    • 2 : point chaud, niveau de confiance de 95 pour cent
    • 3 : point chaud, niveau de confiance de 99 pour cent

    Tridimensionnel : une catégorie de classification pour chaque groupe du cube spatio-temporel. Ce groupe est basé sur une correction FDR.

    {ANALYSIS_VARIABLE}_TREND_PVALUE

    La valeur p de Mann-Kendall qui mesure la signification statistique de la tendance de valeurs à un emplacement donné.

    Bidimensionnel : une valeur de p pour chaque emplacement analysé.

    {ANALYSIS_VARIABLE}_TREND_ZSCORE

    Le score z qui mesure la tendance de Mann-Kendall, vers le haut ou vers le bas, associée aux valeurs à un emplacement donné. Un score z positif indique une tendance vers le haut et un score z négatif indique une tendance vers le bas.

    Bidimensionnel : un score z pour chaque emplacement analysé.

    {ANALYSIS_VARIABLE}_TREND_BIN

    Catégorie de résultats permettant de classer chaque emplacement qui présente une tendance statistiquement significative vers le haut ou vers le bas pour les valeurs.

    • -3 : tendance vers le bas, niveau de confiance de 99 pour cent
    • -2 : tendance vers le bas, niveau de confiance de 95 pour cent
    • -1 : tendance vers le bas, niveau de confiance de 90 pour cent
    • 0 : aucune tendance significative
    • 1 : tendance vers le haut, niveau de confiance de 90 pour cent
    • 2 : tendance vers le haut, niveau de confiance de 95 pour cent
    • 3 : tendance vers le haut, niveau de confiance de 99 pour cent

    Bidimensionnel : une catégorie de classification pour chaque emplacement analysé.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_PVALUE

    La valeur p de Mann-Kendall qui mesure la signification statistique de la tendance dans les scores z de points chauds/froids à un emplacement donné.

    Bidimensionnel : une valeur de p pour chaque emplacement analysé.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_ZSCORE

    Le score z qui mesure la tendance de Mann-Kendall, vers le haut ou vers le bas, associée à la tendance des scores z de points chauds/froids à un emplacement donné. Un score z positif indique une tendance vers le haut et un score z négatif indique une tendance vers le bas.

    Bidimensionnel : un score z pour chaque emplacement analysé.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_BIN

    Catégorie de résultats permettant de classer chaque emplacement qui présente une tendance statistiquement significative vers le haut ou vers le bas pour les scores z des points chauds/froids.

    • -3 : tendance vers le bas, niveau de confiance de 99 pour cent
    • -2 : tendance vers le bas, niveau de confiance de 95 pour cent
    • -1 : tendance vers le bas, niveau de confiance de 90 pour cent
    • 0 : aucune tendance significative
    • 1 : tendance vers le haut, niveau de confiance de 90 pour cent
    • 2 : tendance vers le haut, niveau de confiance de 95 pour cent
    • 3 : tendance vers le haut, niveau de confiance de 99 pour cent

    Bidimensionnel : une catégorie de classification pour chaque emplacement analysé.

    EMERGING_{ANALYSIS_VARIABLE}_CATEGORY

    Une des 17 catégories, 1 à 8, 0 et -1 à -8.

    • 1, nouveau point chaud
    • 2, point chaud consécutif
    • 3, intensification de point chaud
    • 4, point chaud persistant
    • 5, point chaud diminuant
    • 6, point chaud sporadique
    • 7, point chaud oscillant
    • 8, point chaud historique
    • 0, aucun modèle détecté
    • -1, nouveau point froid
    • -2, point froid consécutif
    • -3, intensification de point froid
    • -4, point froid persistant
    • -5, point froid diminuant
    • -6, point froid sporadique
    • -7, point froid oscillant
    • -8, point froid historique

    Bidimensionnel : une catégorie pour chaque emplacement analysé.

Paramètres

ÉtiquetteExplicationType de données
Cube spatio-temporel en entrée

Le cube spatio-temporel contenant la variable à analyser. Les cubes spatio-temporels ont une extension de fichier .nc et sont créés à l’aide de divers outils dans la boîte à outils Exploration des modèles spatio-temporels.

File
Variable d’analyse

Variable numérique dans le fichier netCDF que vous voulez analyser.

String
Entités en sortie

Résultats de la classe d’entités en sortie. Cette classe d'entités sera une représentation cartographique en deux dimensions des tendances des points chauds et froids dans vos données. Elle présentera, par exemple, les points chauds nouveaux ou d'intensification.

Feature Class
Distance de voisinage
(Facultatif)

Étendue spatiale du voisinage d’analyse. Cette valeur désigne les entités qui sont analysées ensemble en vue d’évaluer l’agrégation spatio-temporelle locale.

Linear Unit
Intervalle temporel de voisinage
(Facultatif)

Nombre d’intervalles temporels à inclure dans le voisinage d’analyse. Cette valeur désigne les entités qui sont analysées ensemble en vue d’évaluer l’agrégation spatio-temporelle locale.

Long
Masque d’analyse surfacique
(Facultatif)

Couche d’entités surfaciques dont un ou plusieurs polygones définissent la zone d’étude de l’analyse. Un masque d’analyse surfacique permet, par exemple, d’exclure un lac de grande envergure de l’analyse. Les groupes définis dans le cube spatio-temporel en entrée qui se situent en dehors du masque ne sont pas inclus dans l’analyse.

Ce paramètre est uniquement disponible pour les cubes de grille.

Feature Layer
Conceptualisation des relations spatiales
(Facultatif)

Indique comment les relations spatiales entre les entités sont définies.

  • Distance fixeChaque groupe est analysé par rapport aux groupes voisins. Les groupes voisins situés dans la distance critique spécifiée (Distance de voisinage) reçoivent une pondération de 1 et exercent une influence sur les calculs du groupe cible. Les groupes voisins situés au-delà de la distance critique reçoivent une pondération de zéro et n’exercent aucune influence sur les calculs du groupe cible.
  • K voisins les plus prochesLes k groupes les plus proches sont inclus dans l’analyse, k étant un paramètre numérique spécifié.
  • Segments de contiguïté uniquementSeuls les groupes voisins qui partagent un segment influencent les calculs du groupe surfacique cible.
  • Angles des segments de contiguïtéLes groupes voisins qui partagent un segment ou un nœud influencent les calculs du groupe surfacique cible.
String
Nombre de voisins spatiaux
(Facultatif)

Entier spécifiant le nombre minimal ou exact de voisins à inclure dans les calculs du groupe cible. Pour K voisins les plus proches, chaque groupe aura exactement ce nombre spécifié de voisins. Pour Distance fixe, chaque groupe aura au moins ce nombre de voisins (la distance seuil sera temporairement étendue pour garantir ce nombre de voisins, le cas échéant). Si l’une des conceptualisations de contiguïté est sélectionnée, ce nombre minimal de voisins est attribué à chaque groupe. Pour les groupes dont le nombre de voisins contigus est inférieur à celui spécifié, les voisins supplémentaires reposeront sur la proximité avec le centroïde des entités.

Long
Définir la fenêtre globale
(Facultatif)

La statistique compare une statistique locale, calculée d’après les voisins de chaque groupe, à une valeur globale. Ce paramètre permet de contrôler les groupes à utiliser pour calculer la valeur globale.

  • Cube entierChaque voisinage est analysé en le comparant au cube entier. Il s’agit de l’option par défaut.
  • Intervalle temporel de voisinageChaque voisinage est analysé en le comparant aux groupes contenus dans l’intervalle temporel de voisinage (option Neighborhood Time Step) spécifié.
  • Intervalle temporel individuelChaque voisinage est analysé par comparaison avec les groupes du même intervalle temporel.
String

arcpy.stpm.EmergingHotSpotAnalysis(in_cube, analysis_variable, output_features, {neighborhood_distance}, {neighborhood_time_step}, {polygon_mask}, {conceptualization_of_spatial_relationships}, {number_of_neighbors}, {define_global_window})
NomExplicationType de données
in_cube

Le cube spatio-temporel contenant la variable à analyser. Les cubes spatio-temporels ont une extension de fichier .nc et sont créés à l’aide de divers outils dans la boîte à outils Exploration des modèles spatio-temporels.

File
analysis_variable

Variable numérique dans le fichier netCDF que vous voulez analyser.

String
output_features

Résultats de la classe d’entités en sortie. Cette classe d'entités sera une représentation cartographique en deux dimensions des tendances des points chauds et froids dans vos données. Elle présentera, par exemple, les points chauds nouveaux ou d'intensification.

Feature Class
neighborhood_distance
(Facultatif)

Étendue spatiale du voisinage d’analyse. Cette valeur désigne les entités qui sont analysées ensemble en vue d’évaluer l’agrégation spatio-temporelle locale.

Linear Unit
neighborhood_time_step
(Facultatif)

Nombre d’intervalles temporels à inclure dans le voisinage d’analyse. Cette valeur désigne les entités qui sont analysées ensemble en vue d’évaluer l’agrégation spatio-temporelle locale.

Long
polygon_mask
(Facultatif)

Couche d’entités surfaciques dont un ou plusieurs polygones définissent la zone d’étude de l’analyse. Un masque d’analyse surfacique permet, par exemple, d’exclure un lac de grande envergure de l’analyse. Les groupes définis dans le in_cube qui se situent en dehors du masque ne sont pas inclus dans l’analyse.

Ce paramètre est uniquement disponible pour les cubes de grille.

Feature Layer
conceptualization_of_spatial_relationships
(Facultatif)

Indique comment les relations spatiales entre les groupes sont définies.

  • FIXED_DISTANCEChaque groupe est analysé par rapport aux groupes voisins. Les groupes voisins situés dans la distance critique spécifiée (neighborhood_distance) reçoivent une pondération de 1 et exercent une influence sur les calculs du groupe cible. Les groupes voisins situés au-delà de la distance critique reçoivent une pondération de zéro et n’exercent aucune influence sur les calculs du groupe cible.
  • K_NEAREST_NEIGHBORSLes k groupes les plus proches sont inclus dans l’analyse, k étant un paramètre numérique spécifié.
  • CONTIGUITY_EDGES_ONLYSeuls les groupes voisins qui partagent un segment influencent les calculs du groupe surfacique cible.
  • CONTIGUITY_EDGES_CORNERSLes groupes voisins qui partagent un segment ou un nœud influencent les calculs du groupe surfacique cible.
String
number_of_neighbors
(Facultatif)

Entier spécifiant le nombre minimal ou exact de voisins à inclure dans les calculs du groupe cible. Pour K_NEAREST_NEIGHBORS, chaque groupe aura exactement ce nombre spécifié de voisins. Pour FIXED_DISTANCE_BAND, chaque groupe aura au moins ce nombre de voisins (la distance seuil sera temporairement étendue pour garantir ce nombre de voisins, le cas échéant). Si l’une des conceptualisations de contiguïté est sélectionnée, ce nombre minimal de voisins est attribué à chaque groupe. Pour les groupes dont le nombre de voisins contigus est inférieur à celui spécifié, les voisins supplémentaires reposeront sur la proximité avec le centroïde des entités.

Long
define_global_window
(Facultatif)

La statistique compare une statistique locale, calculée d’après les voisins de chaque groupe, à une valeur globale. Ce paramètre permet de contrôler les groupes à utiliser pour calculer la valeur globale.

  • ENTIRE_CUBEChaque voisinage est analysé en le comparant au cube entier. Il s’agit de l’option par défaut.
  • NEIGHBORHOOD_TIME_STEPChaque voisinage est analysé en le comparant aux groupes contenus dans l’intervalle temporel de voisinage (option Neighborhood Time Step) spécifié.
  • INDIVIDUAL_TIME_STEPChaque voisinage est analysé par comparaison avec les groupes du même intervalle temporel.
String

Exemple de code

Exemple 1 d'utilisation de l'outil EmergingHotSpotAnalysis (fenêtre Python)

Le script suivant pour la fenêtre Python illustre l’utilisation de la fonction EmergingHotSpotAnalysis.

import arcpy
arcpy.env.workspace = r"C:\STPM"
arcpy.stpm.EmergingHotSpotAnalysis("Homicides.nc", "COUNT", "EHS_Homicides.shp", "5 Miles", 2, "#", "FIXED_DISTANCE", "3")
Exemple 2 d'utilisation de l'outil EmergingHotSpotAnalysis (script autonome)

Le script Python autonome ci-dessous illustre l’utilisation de la fonction EmergingHotSpotAnalysis.

# Create Space Time Cube of homicide incidents in a metropolitan area

# Import system modules
import arcpy

# Set overwriteOutput property to overwrite existing output, by default
arcpy.env.overwriteOutput = True

# Local variables...
workspace = r"C:\STPM"

try:
    # Set the current workspace (to avoid having to specify the full path to the feature 
    # classes each time)
    arcpy.env.workspace = workspace

    # Create Space Time Cube of homicide incident data with 3 months and 3 miles settings
    # Process: Create Space Time Cube 
    cube = arcpy.stpm.CreateSpaceTimeCube("Homicides.shp", "Homicides.nc", "MyDate", "#", 
                                          "3 Months", "End time", "#", "3 Miles", "Property MEDIAN SPACETIME; Age STD ZEROS",
																																										"HEXAGON_GRID")

    # Create a polygon that defines where incidents are possible  
    # Process: Minimum Bounding Geometry of homicide incident data
    arcpy.management.MinimumBoundingGeometry("Homicides.shp", "bounding.shp", "CONVEX_HULL",
                                             "ALL", "#", "NO_MBG_FIELDS")

    # Emerging Hot Spot Analysis of homicide incident cube using 5 Miles neighborhood 
    # distance and 2 neighborhood time step to detect hot spots
    # Process: Emerging Hot Spot Analysis 
    cube = arcpy.stpm.EmergingHotSpotAnalysis("Homicides.nc", "COUNT", "EHS_Homicides.shp", 
                                              "5 Miles", 2, "bounding.shp", "FIXED_DISTANCE", "3")

except arcpy.ExecuteError:
    # If any error occurred when running the tool, print the messages
    print(arcpy.GetMessages())

Informations de licence

  • Basic: Oui
  • Standard: Oui
  • Advanced: Oui

Rubriques connexes