Erkennung räumlicher Ausreißer (Spatial Statistics)

Zusammenfassung

Erkennt räumliche Ausreißer in Punkt-Features durch Berechnen des lokalen Ausreißer-Faktors (Local Outlier Factor, LOF) für die einzelnen Features. Räumliche Ausreißer sind Features an anormal isolierten Positionen, und der LOF ist ein Maß, mit dem beschrieben wird, wie isoliert eine Position von ihren lokalen Nachbarn ist. Ein höherer LOF-Wert zeigt eine höhere Isolation an. Darüber hinaus kann mit dem Werkzeug eine vorhergesagte Raster-Oberfläche erstellt werden, mit der geschätzt werden kann, ob neue Features vor dem Hintergrund der räumlichen Verteilung der Daten als Ausreißer klassifiziert werden.

Weitere Informationen zur Funktionsweise der Erkennung räumlicher Ausreißer

Abbildung

Darstellung des Werkzeugs "Erkennung räumlicher Ausreißer"

Verwendung

  • Mit diesem Werkzeug werden im Parameter Eingabe-Features angegebene Punkte als räumliche Ausreißer oder räumliche Inlier erkannt.

  • Mit dem Werkzeug wird eine LOF-Berechnung durchgeführt, um den Grad abzuschätzen, zu dem ein Punkt-Feature basierend auf der räumlichen Verteilung von Features in seinem unmittelbaren Umkreis ein Ausreißer ist.

  • Für das Werkzeug wird eine lokale Nachbarschaft um die einzelnen im Parameter Anzahl der Nachbarn angegebenen Features verwendet.

  • Der Parameter Prozentsatz an Positionen, die als Ausreißer gelten wird verwendet, um einen Schwellenwert für den LOF festzulegen, ab dem ein Punkt-Feature als Ausreißer oder Inlier gilt.

    Hinweis:

    Geringe Unterschiede in den Werten für den Parameter Prozentsatz der Positionen, die als Ausreißer gelten können dazu führen, dass die gleiche Anzahl von Ausgabe-Features als Ausreißer gelten. Das kann vorkommen, wenn Ähnlichkeiten in der räumlichen Verteilung für Features dazu führen, dass mehrere Features denselben LOF-Wert aufweisen.

  • Die Ausgabe-Features beinhalten zwei Diagramme. Das eine ist ein Balkendiagramm, mit dem die Anzahl der Ausreißer und der Inlier dargestellt wird. Das zweite ist ein Histogramm, mit dem die Verteilung von LOF-Werten für alle Punkt-Features und der LOF-Schwellenwert dargestellt werden, mit dem bestimmt wird, ob ein Feature als Ausreißer oder Inlier gilt.

  • Wenn die Eingabe-Features das Geometrieattribut "Shape.Z" aufweisen, wird vom Werkzeug die 3D-Eigenschaft der Daten berücksichtigt, indem räumliche Ausreißer im 3D-Raum erkannt werden. Beim Hinzufügen zu einer Szenenansicht werden die Ausgabe-Features zur Visualisierung der räumlichen Ausreißer in 3D dargestellt. Wenn die Einheit (z. B. Meter) von "Shape.Z" in einem vertikalen Koordinatensystem nicht definiert ist, wird davon ausgegangen, dass sie mit "Shape.X" und "Shape.Y" identisch ist.

  • Der Parameter Ausgabe-Vorhersage-Raster ist eine optionale Ausgabe, die das LOF-Ergebnis als kontinuierliche Oberfläche im Untersuchungsgebiet enthält, mit der festgelegt werden kann, ob zukünftige Beobachtungen Ausreißer sind, ohne den LOF-Wert des neuen Punktes neu berechnen zu müssen. Zum Erstellen des Ausgabe-Rasters werden die Eingabe-Features als Trainingsdaten verwendet und die LOF-Werte werden am Mittelpunkt der einzelnen Rasterzellen basierend auf der räumlichen Verteilung der Trainingsdaten berechnet. Diese Ausgabe kann nur für 2D-Eingabe-Features erstellt werden.

    Hinweis:

    Die LOF-Werte der Punkte stimmen nicht mit den LOF-Werten der Rasterzellen unter den einzelnen Punkten überein, auch dann nicht, wenn die Punkte mit einem Zellenmittelpunkt des Rasters lagegleich sind. Das liegt daran, dass das Feature sich nicht selbst als Nachbar verwendet, die Rasterzelle jedoch das Feature als Nachbar verwendet, sodass bei jeder Berechnung unterschiedliche Nachbarn verwendet werden und sich somit unterschiedliche LOF-Werte ergeben.

  • Weitere Informationen zum lokalen Ausreißer-Faktor finden Sie in den folgenden Quellen:

    • Breunig, M. M., Kriegel, H. P., Ng, R. T., Sander, J. (2000). "LOF: identifying density-based local outliers." Proceedings of the 2000 ACM SIGMOD international conference on Management of data. (S. 93-104).

Parameter

BeschriftungErläuterungDatentyp
Eingabe-Features

Die Punkt-Features, die zum Erstellen des Modells zur Erkennung räumlicher Ausreißer verwendet werden. Die einzelnen Punkte werden je nach ihrem lokalen Ausreißer-Faktor als Ausreißer oder Inlier klassifiziert.

Feature Layer
Ausgabe-Features

Die Ausgabe-Feature-Class, die den lokalen Ausreißer-Faktor für die einzelnen Eingabe-Features sowie einen Indikator dafür enthält, ob es sich beim jeweiligen Punkt um einen räumlicher Ausreißer handelt.

Feature Class
Anzahl der Nachbarn
(optional)

Die Anzahl der Nachbarn, die beim Berechnen des lokalen Ausreißer-Faktors einbezogen werden sollen. Die dem Eingabepunkt nächstgelegenen Features werden als Nachbarn verwendet. Die Standardeinstellung ist 20.

Long
Prozentsatz der Positionen, die als Ausreißer gelten
(optional)

Der Prozentsatz der Positionen, die durch Festlegen des Schwellenwertes für den lokalen Ausreißer-Faktor als räumliche Ausreißer erkannt werden. Wenn kein Wert angegeben wird, wird ein Wert zur Laufzeit geschätzt und als Geoverarbeitungsmeldung angezeigt.

Double
Ausgabe-Vorhersage-Raster
(optional)

Das Ausgabe-Raster, das die lokalen Ausreißer-Faktoren der einzelnen Zellen enthält, die basierend auf der räumlichen Verteilung der Eingabe-Features berechnet werden.

Raster Dataset

arcpy.stats.SpatialOutlierDetection(in_features, output_features, {n_neighbors}, {percent_outlier}, {output_raster})
NameErläuterungDatentyp
in_features

Die Punkt-Features, die zum Erstellen des Modells zur Erkennung räumlicher Ausreißer verwendet werden. Die einzelnen Punkte werden je nach ihrem lokalen Ausreißer-Faktor als Ausreißer oder Inlier klassifiziert.

Feature Layer
output_features

Die Ausgabe-Feature-Class, die den lokalen Ausreißer-Faktor für die einzelnen Eingabe-Features sowie einen Indikator dafür enthält, ob es sich beim jeweiligen Punkt um einen räumlicher Ausreißer handelt.

Feature Class
n_neighbors
(optional)

Die Anzahl der Nachbarn, die beim Berechnen des lokalen Ausreißer-Faktors einbezogen werden sollen. Die dem Eingabepunkt nächstgelegenen Features werden als Nachbarn verwendet. Die Standardeinstellung ist 20.

Long
percent_outlier
(optional)

Der Prozentsatz der Positionen, die durch Festlegen des Schwellenwertes für den lokalen Ausreißer-Faktor als räumliche Ausreißer erkannt werden. Wenn kein Wert angegeben wird, wird ein Wert zur Laufzeit geschätzt und als Geoverarbeitungsmeldung angezeigt.

Double
output_raster
(optional)

Das Ausgabe-Raster, das die lokalen Ausreißer-Faktoren der einzelnen Zellen enthält, die basierend auf der räumlichen Verteilung der Eingabe-Features berechnet werden.

Raster Dataset

Codebeispiel

SpatialOutlierDetection – Beispiel 1 (Python-Fenster)

Das folgende Skript veranschaulicht die Verwendung des Werkzeugs SpatialOutlierDetection im Python-Fenster.

arcpy.stats.SpatialOutlierDetection("Transaction_Locations", 
            "Transactions_SpatialOutliers", 20, 5, 
            "Transactions_OutliersPredictionSurface")
SpatialOutlierDetection – Beispiel 2 (eigenständiges Skript)

Das folgende eigenständige Python-Skript veranschaulicht, wie Sie das Werkzeug SpatialOutlierDetection verwenden.

# Import system modules.
import arcpy
try:
    # Set the workspace and input features.
    arcpy.env.workspace = 'C:\\SpatialOutlierDetection\\MyData.gdb'
    inputFeatures = "PM25_AirQualityStations"
    # Set the name of the output features
    outputFeatures = "AirQualityStations_SpatialOutliers"
    # Set the number of neighbors
    numberNeighbors = 8
    # Set the percentage of locations considered outliers
    pcntLocationsAsOutliers = 10
    # Set the output prediction raster
    outputPredictionRaster = airQualityStations_OutPredictionRaster
    # Run the Spatial Outlier Detection tool
    arcpy.stats.SpatialOutlierDetection(inputFeatures, outputFeatures, 
            numberNeighbors, pcntLocationsAsOutliers, outputPredictionRaster)
except arcpy.ExecuteError:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())

Umgebungen

Sonderfälle

Zellengröße

Diese Umgebung wirkt sich nur auf das Ausgabe-Raster aus.

Maske

Diese Umgebung wirkt sich nur auf das Ausgabe-Raster aus.

Fang-Raster

Diese Umgebung wirkt sich nur auf das Ausgabe-Raster aus.

Ausdehnung

Diese Umgebung wirkt sich nur auf das Ausgabe-Raster aus.

Lizenzinformationen

  • Basic: Begrenzt
  • Standard: Begrenzt
  • Advanced: Begrenzt

Verwandte Themen