Détection de points spatiaux aberrants (Statistiques spatiales)

Résumé

Identifie les points aberrants spatiaux dans les entités ponctuelles en calculant le facteur LOF de chaque entité. Les points aberrants spatiaux sont des entités dans des emplacements anormalement isolés et le facteur LOF est une mesure qui décrit l’isolement d’un emplacement par rapport à ses voisins locaux. Une valeur LOF plus élevée indique un isolement plus important. L’outil peut également servir à produire une surface de prévision raster permettant d’estimer si de nouvelles entités seront classées comme points aberrants en tant compte de la distribution spatiale des données.

Pour en savoir plus sur le fonctionnement de l’outil Détection de points spatiaux aberrants

Illustration

Illustration de l’outil Détection de points spatiaux aberrants

Utilisation

  • Cet outil identifie les points fournis dans le paramètre Input Features (Entités en entrée) comme des points spatiaux aberrants ou des points spatiaux corrects.

  • L’outil réalise un calcul de facteur aberrant local pour estimer le degré d’aberrance d’une entité ponctuelle par rapport à la distribution spatiale des entités dans son voisinage.

  • L’outil utilise un voisinage local autour de chaque entité, spécifié dans le paramètre Number of Neighbors (Nombre de voisins).

  • Le paramètre Percent of Locations Considered Outliers (Pourcentage des localisations considérées comme points aberrants) permet d’établir un seuil pour le facteur aberrant local afin de désigner chaque entité ponctuelle comme point aberrant ou comme correcte.

    Remarque :

    De petites différences de valeurs pour le paramètre Percent of Locations Considered Outliers (Pourcentage des localisations considérées comme points aberrants) peut générer le même nombre d’entités en sortie désignées comme points aberrants. Cela peut être le cas lorsque des similitudes dans la distribution spatiale donnent la même valeur de facteur aberrant local pour plusieurs entités.

  • Les entités en sortie incluent deux diagrammes. Le premier est un diagramme à barres qui illustre le nombre de points aberrants et de points corrects. Le second est un histogramme qui illustre la distribution des valeurs de facteur aberrant local pour toutes les entités ponctuelles, ainsi que le seuil de facteur aberrant local utilisé pour déterminer si une entité est un point aberrant ou est correcte.

  • Si les entités en entrée ont le même attribut géométrique Shape.Z, l’outil respecte la nature 3D de vos données en détectant les points spatiaux aberrants dans l’espace 3D. Lorsqu’elles sont ajoutées à une vue de scène, les entités en sortie s’affichent en 3D pour visualiser les points spatiaux aberrants 3D. Si l’unité (par exemple, les mètres) de Shape.Z n’est pas définie dans un système de coordonnées verticales, on suppose qu’elle est identique à celle de Shape.X et Shape.Y.

  • Le paramètre Output Prediction Raster est une sortie facultative contenant le résultat de facteur aberrant local en tant que surface continue sur toute la zone d’étude pour servir à déterminer si les observations futures sont des points aberrants sans avoir à recalculer la valeur de facteur aberrant local du nouveau point. Pour créer le raster en sortie, les entités en entrée sont utilisées comme données d’entraînement, et les valeurs de facteur aberrant local sont calculées au centre de chaque cellule raster en fonction de la distribution spatiale des données d’entraînement. Cette sortie peut uniquement être créée pour les entités en entrée 2D.

    Remarque :

    Les valeurs de facteur aberrant local des points ne correspondront pas aux valeurs de facteur aberrant local des cellules raster sous chaque point, même si les points coïncident avec un centre de cellule du raster. En effet, l’entité ne s’utilise pas comme voisin, alors que la cellule raster utilise l’entité comme voisin, de sorte que chaque calcul utilise différents voisins et produit une valeur de facteur aberrant local différente.

  • Pour plus d’informations sur le facteur de point aberrant local, consultez les références suivantes :

    • Breunig, M. M., Kriegel, H. P., Ng, R. T., Sander, J. (2000). « LOF: identifying density-based local outliers. » Proceedings of the 2000 ACM SIGMOD international conference on Management of data. (p. 93-104).

Paramètres

ÉtiquetteExplicationType de données
Entités en entrée

Les entités ponctuelles utilisées pour construire le modèle de détection des points spatiaux aberrants. Chaque point est classé comme point aberrant ou point correct sur son facteur aberrant local.

Feature Layer
Entités en sortie

La classe d’entités en sortie contenant le facteur aberrant local pour chaque entité en entrée ainsi qu’un indicateur informant si le point est un point spatial aberrant ou non.

Feature Class
Nombre de voisins
(Facultatif)

Le nombre de voisins à inclure lors du calcul du facteur aberrant local. Les entités les plus proches du point en entrée sont utilisées comme voisins. La valeur par défaut est 20.

Long
Pourcentage des localisations considérées comme points aberrants
(Facultatif)

Le pourcentage des localisations à identifier comme points spatiaux aberrants en définissant le seuil du facteur aberrant local. Si aucune valeur n’est spécifiée, une valeur est estimée au moment de l’exécution et s’affiche dans un message de géotraitement.

Double
Raster de prévision en sortie
(Facultatif)

Le raster en sortie contenant les facteurs aberrants locaux à chaque cellule, qui est calculé sur la distribution spatiale des entités en entrée.

Raster Dataset

arcpy.stats.SpatialOutlierDetection(in_features, output_features, {n_neighbors}, {percent_outlier}, {output_raster})
NomExplicationType de données
in_features

Les entités ponctuelles utilisées pour construire le modèle de détection des points spatiaux aberrants. Chaque point est classé comme point aberrant ou point correct sur son facteur aberrant local.

Feature Layer
output_features

La classe d’entités en sortie contenant le facteur aberrant local pour chaque entité en entrée ainsi qu’un indicateur informant si le point est un point spatial aberrant ou non.

Feature Class
n_neighbors
(Facultatif)

Le nombre de voisins à inclure lors du calcul du facteur aberrant local. Les entités les plus proches du point en entrée sont utilisées comme voisins. La valeur par défaut est 20.

Long
percent_outlier
(Facultatif)

Le pourcentage des localisations à identifier comme points spatiaux aberrants en définissant le seuil du facteur aberrant local. Si aucune valeur n’est spécifiée, une valeur est estimée au moment de l’exécution et s’affiche dans un message de géotraitement.

Double
output_raster
(Facultatif)

Le raster en sortie contenant les facteurs aberrants locaux à chaque cellule, qui est calculé sur la distribution spatiale des entités en entrée.

Raster Dataset

Exemple de code

Exemple 1 d’utilisation de l’outil SpatialOutlierDetection (fenêtre Python)

Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil SpatialOutlierDetection.

arcpy.stats.SpatialOutlierDetection("Transaction_Locations", 
            "Transactions_SpatialOutliers", 20, 5, 
            "Transactions_OutliersPredictionSurface")
Exemple 2 d’utilisation de l’outil SpatialOutlierDetection (script autonome)

Le script Python autonome ci-dessous illustre l'utilisation de l'outil SpatialOutlierDetection.

# Import system modules.
import arcpy
try:
    # Set the workspace and input features.
    arcpy.env.workspace = 'C:\\SpatialOutlierDetection\\MyData.gdb'
    inputFeatures = "PM25_AirQualityStations"
    # Set the name of the output features
    outputFeatures = "AirQualityStations_SpatialOutliers"
    # Set the number of neighbors
    numberNeighbors = 8
    # Set the percentage of locations considered outliers
    pcntLocationsAsOutliers = 10
    # Set the output prediction raster
    outputPredictionRaster = airQualityStations_OutPredictionRaster
    # Run the Spatial Outlier Detection tool
    arcpy.stats.SpatialOutlierDetection(inputFeatures, outputFeatures, 
            numberNeighbors, pcntLocationsAsOutliers, outputPredictionRaster)
except arcpy.ExecuteError:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())

Environnements

Taille de cellule

Cet environnement affecte uniquement le raster en sortie.

Masque

Cet environnement affecte uniquement le raster en sortie.

Raster de capture

Cet environnement affecte uniquement le raster en sortie.

Étendue

Cet environnement affecte uniquement le raster en sortie.

Rubriques connexes