Detección de valores atípicos espaciales (Estadística espacial)

Resumen

Identifica valores atípicos espaciales en entidades de punto calculando el factor de valor atípico local (LOF) de cada entidad. Los valores atípicos son entidades situadas en ubicaciones anormalmente aisladas y el LOF es una medición que describe cómo de aislada está una ubicación de sus vecinos locales. Un LOF más alto corresponde a una aislamiento mayor. La herramienta también se puede utilizar para producir una superficie de predicción ráster que se puede utilizar para estimar si las nuevas entidades se clasificarán como valores atípicos dada la distribución espacial de los datos.

Más información sobre cómo funciona Detección de valores atípicos espaciales

Ilustración

Ilustración de la herramienta Detección de valores atípicos espaciales

Uso

  • Esta herramienta identifica los puntos suministrados en el parámetro Entidades de entrada como valores atípicos (outliers) espaciales o como inliers espaciales.

  • La herramienta realiza un cálculo de LOF para estimar el grado en el que una entidad de punto es un valor atípico según la distribución espacial de las entidades cercanas.

  • La herramienta utiliza una vecindad local alrededor de cada entidad, especificada en el parámetro Cantidad de vecinos.

  • El parámetro Porcentaje de ubicaciones consideradas valores atípicos se utiliza para establecer un umbral para que el LOF designe cada entidad de punto como un valor atípico (outlier) o un inlier.

    Nota:

    Las pequeñas diferencias en los valores del parámetro Porcentaje de ubicaciones consideradas valores atípicos pueden dar como resultado el mismo recuento de entidades de salida designadas como valores atípicos. Esto puede ocurrir cuando las similitudes en la distribución espacial de las entidades dan como resultado el mismo valor de LOF para varias entidades.

  • Las entidades de salida incluyen dos gráficos. El primero es un gráfico de barras que muestra los recuentos de valores atípicos e inliers. El segundo es un histograma que muestra la distribución de los valores de LOF para todas las entidades de punto y el umbral de LOF utilizado para determinar si una entidad es un valor atípico o un inlier.

  • Si las entidades de entrada tienen el atributo de geometría Shape.Z, la herramienta respetará la naturaleza 3D de los datos detectando valores atípicos espaciales en el espacio 3D. Cuando se agregan a una vista de escena, las entidades de salida se muestran en 3D para visualizar los valores atípicos espaciales 3D. Si la unidad (por ejemplo, metros) de Shape.Z no está definida en un sistema de coordenadas verticales, se presupone que la unidad es la misma que en Shape.X y Shape.Y.

  • El parámetro Ráster de predicción de salida es una salida opcional que contiene el resultado de LOF como una superficie continua en el área de estudio que se puede utilizar para determinar si las observaciones futuras son valores atípicos sin necesidad de recalcular el valor de LOF del nuevo punto. Para crear el ráster de salida, las entidades de entrada se utilizan como datos de entrenamiento y los valores de LOF se calculan en el centro de cada celda ráster en función de la distribución espacial de los datos de entrenamiento. Esta salida solo se puede crear para entidades de entrada 2D.

    Nota:

    Los valores de LOF de los puntos no coincidirán con los valores de LOF de las celdas ráster bajo cada punto, aunque los puntos coincidan con un centro de celda del ráster. Esto se debe a que la entidad no se utiliza a sí misma como vecino, pero la celda ráster sí utiliza la entidad como vecino, de modo que cada cálculo utiliza distintos vecinos y produce un valor de LOF diferente.

  • Para obtener más información sobre el factor de valor atípico local, consulte las siguientes referencias:

    • Breunig, M. M., Kriegel, H. P., Ng, R. T., Sander, J. (2000). "LOF: identifying density-based local outliers." Proceedings of the 2000 ACM SIGMOD international conference on Management of data. (pp. 93-104).

Parámetros

EtiquetaExplicaciónTipo de datos
Entidades de entrada

Las entidades de punto utilizadas para crear el modelo de detección de valores atípicos espaciales. Cada punto se clasificará como un valor atípico (outlier) o un inlier en función de su factor de valor atípico local.

Feature Layer
Entidades de salida

La clase de entidad de salida que contiene el factor de valor atípico local para cada entidad de entrada, así como un indicador de si el punto es un valor atípico espacial.

Feature Class
Cantidad de vecinos
(Opcional)

El número de vecinos que se incluirán al calcular el factor de valor atípico local. Las entidades más cercanas al punto de entrada se utilizan como vecinos. El valor predeterminado es 20.

Long
Porcentaje de ubicaciones consideradas valores atípicos
(Opcional)

El porcentaje de ubicaciones que se identificarán como valores atípicos espaciales mediante la definición del umbral del factor de valor atípico local. Si no se especifica ningún valor, se estima un valor en el tiempo de ejecución y se muestra como un mensaje de geoprocesamiento.

Double
Ráster de predicción de salida
(Opcional)

El ráster de salida que contiene los factores de valores atípicos locales en cada celda, que se calcula según la distribución espacial de las entidades de entrada.

Raster Dataset

arcpy.stats.SpatialOutlierDetection(in_features, output_features, {n_neighbors}, {percent_outlier}, {output_raster})
NombreExplicaciónTipo de datos
in_features

Las entidades de punto utilizadas para crear el modelo de detección de valores atípicos espaciales. Cada punto se clasificará como un valor atípico (outlier) o un inlier en función de su factor de valor atípico local.

Feature Layer
output_features

La clase de entidad de salida que contiene el factor de valor atípico local para cada entidad de entrada, así como un indicador de si el punto es un valor atípico espacial.

Feature Class
n_neighbors
(Opcional)

El número de vecinos que se incluirán al calcular el factor de valor atípico local. Las entidades más cercanas al punto de entrada se utilizan como vecinos. El valor predeterminado es 20.

Long
percent_outlier
(Opcional)

El porcentaje de ubicaciones que se identificarán como valores atípicos espaciales mediante la definición del umbral del factor de valor atípico local. Si no se especifica ningún valor, se estima un valor en el tiempo de ejecución y se muestra como un mensaje de geoprocesamiento.

Double
output_raster
(Opcional)

El ráster de salida que contiene los factores de valores atípicos locales en cada celda, que se calcula según la distribución espacial de las entidades de entrada.

Raster Dataset

Muestra de código

Ejemplo 1 de SpatialOutlierDetection (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la herramienta SpatialOutlierDetection.

arcpy.stats.SpatialOutlierDetection("Transaction_Locations", 
            "Transactions_SpatialOutliers", 20, 5, 
            "Transactions_OutliersPredictionSurface")
Ejemplo 2 de SpatialOutlierDetection (script independiente)

El siguiente script de Phython independiente muestra cómo utilizar la herramienta SpatialOutlierDetection.

# Import system modules.
import arcpy
try:
    # Set the workspace and input features.
    arcpy.env.workspace = 'C:\\SpatialOutlierDetection\\MyData.gdb'
    inputFeatures = "PM25_AirQualityStations"
    # Set the name of the output features
    outputFeatures = "AirQualityStations_SpatialOutliers"
    # Set the number of neighbors
    numberNeighbors = 8
    # Set the percentage of locations considered outliers
    pcntLocationsAsOutliers = 10
    # Set the output prediction raster
    outputPredictionRaster = airQualityStations_OutPredictionRaster
    # Run the Spatial Outlier Detection tool
    arcpy.stats.SpatialOutlierDetection(inputFeatures, outputFeatures, 
            numberNeighbors, pcntLocationsAsOutliers, outputPredictionRaster)
except arcpy.ExecuteError:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())

Entornos

Casos especiales

Tamaño de celda

Este entorno solo afecta al ráster de salida.

Máscara

Este entorno solo afecta al ráster de salida.

Alinear ráster

Este entorno solo afecta al ráster de salida.

Extensión

Este entorno solo afecta al ráster de salida.

Información de licenciamiento

  • Basic: Limitado
  • Standard: Limitado
  • Advanced: Limitado

Temas relacionados