Buscar ubicaciones similares (Geoanálisis)

Resumen

Identifica las entidades candidatas que son más similares o menos similares a una o varias entidades de entrada en función de los atributos de entidades.

Heredado:

La extensión de ArcGIS GeoAnalytics Server quedará obsoleta en ArcGIS Enterprise. La versión final de GeoAnalytics Server se incluyó con ArcGIS Enterprise 11.3. Esta herramienta de geoprocesamiento está disponible a través de ArcGIS Enterprise 11.3 y versiones anteriores.

Ilustración

Ilustración de la herramienta Buscar ubicaciones similares

Uso

  • Se pueden utilizar entidades de tabla, puntos, línea o área.

  • Se necesita una capa (candidata) de búsqueda de entrada. Las entidades de la capa de búsqueda se clasificarán por similitud con las ubicaciones de entrada (referencia).

  • Si hay más de una entidad en la capa de entrada, la coincidencia se basa en la media de los valores de la capa de entrada. Por ejemplo, si hay dos entidades de Capa de entrada y uno de los atributos de Campos de análisis es una variable de población, la herramienta buscará las Capas de búsqueda con poblaciones similares al promedio de los valores de población. Por ejemplo, si los valores de población son 100 y 102, la herramienta buscará candidatos con poblaciones próximas a 101.

    Nota:

    Si hay más de una Capa de entrada, seleccione atributos de Campos de análisis con valores similares. Si, por ejemplo, si el valor de población de una de las entradas es 100 y la otra entrada es 100.000, la herramienta buscará coincidencias con poblaciones próximas al promedio de ambos valores: 50.050. Tenga en cuenta que este valor promedio está lejos del valor de población de las distintas Capas de entrada.

  • Utilice el parámetro Más o menos similar para buscar las entidades que sean más similares o menos similares a las entidades de Capa de entrada mediante las opciones Más similar o Menos similar, respectivamente. En algunos casos, quizá le convenga ver ambas. Por ejemplo, si el valor del parámetro Número de resultados es 3 y el del parámetro Más o menos similar es Ambos, la herramienta buscará las tres entidades candidatas más similares y las tres menos similares.

  • Cualquier coincidencia de soluciones dada en las Entidades de salida será una solución que sea la más similar o una solución que sea la menos similar a la Capa de entrada de destino; una única solución no puede ser las dos cosas (y las coincidencias de soluciones no se duplicarán en las Entidades de salida). Por lo tanto, si el valor del parámetro Más o menos similar es Ambos, el número máximo de coincidencias resultantes posibles (Número de resultados) será la mitad del número de la Capa de búsqueda.

  • Se devolverá un máximo de 10.000 entidades de capa de búsqueda.
  • El parámetro Método de coincidencia ofrece las siguientes opciones de valor:

    • Valores de atributos: los candidatos más similares tendrán la suma más pequeña de las diferencias cuadradas de todos los atributos de Campos de análisis. Todos los valores se estandarizan antes de calcular las diferencias.
    • Perfiles de atributos: se mide la similitud de coseno. La similitud de coseno busca las mismas relaciones entre los valores de atributo estandarizados, en lugar de intentar hacer coincidir magnitudes. Por ejemplo, supongamos que hay tres Campos de análisis llamados A1, A2 y A3. A2 es dos veces mayor que A1, y A3 es casi igual que A2. Si el valor del parámetro Método de coincidencia es Perfiles de atributos, la herramienta buscará candidatos con las mismas relaciones de atributos: A2 es el doble de grande que A1 y A3 casi igual a A2. Como este método busca relaciones entre atributos, debe especificar un mínimo de dos atributos de Campos de análisis. Podría utilizar el método de similitud de coseno (la opción Perfiles de atributos) para buscar lugares similares a Los Ángeles, pero a una escala diferente; por ejemplo, el perfil de población comparado con el número de coches con el número de residentes menores de 20 años. El índice de similitud de coseno fluctúa entre 1,0 (similitud perfecta) y -1,0 (disimilitud perfecta). El índice de similitud de coseno se escribe en el campo Entidades de salida simindex (Similitud de coseno).

  • El parámetro Campos de análisis debe ser numérico y estar presente, con el mismo nombre de campo y tipo de campo, tanto en los datasets de Capa de entrada como en los de Capa de búsqueda. Si la herramienta no encuentra los campos correspondientes para la Capa de búsqueda, aparece una advertencia que indica que los atributos que faltan se han eliminado del análisis.

  • Todos los atributos utilizados para coincidencias se escriben en la salida. El parámetro Campos para incorporar permite especificar los campos que se van a agregar a la tabla de salida. Por defecto, se agregan todos los campos. Use el parámetro Campos para incorporar para seleccionar los campos de la Capa de búsqueda que desea agregar.

  • Todas las coincidencias de la Capa de entrada y de soluciones se escriben en las entidades de salida junto con los parámetros Campos de análisis y Campos para incorporar. Además, en las entidades de salida se incluyen los siguientes campos:

    Nombre de campoDescripciónNotes

    location_type

    Una cadena de caracteres que indica si las entidades son una capa de referencia (entrada) o una capa candidata (búsqueda).

    simrank

    Si selecciona Más similar o Ambos como valor del parámetro Más o menos similar, todas las coincidencias de la solución se clasifican de más similar a menos similar. La coincidencia de solución más similar tendrá un valor de clasificación de 1.

    Este campo solo se incluye en las Entidades de salida si selecciona Más similar o Ambos como valor del parámetro Más o menos similar.

    dissimrank

    Si selecciona Menos similar o Ambos como valor del parámetro Más o menos similar, todas las coincidencias de la solución se clasifican de más a menos similar. La solución que sea menos similar tiene un valor de clasificación de 1.

    Este campo solo se incluye en las Entidades de salida si selecciona Menos similar o Ambos como valor del parámetro Más o menos similar.

    simindex

    Este campo cuantifica cuán similar es cada coincidencia de solución a la entidad de destino. Si especifica Valores de atributos como valor del parámetro Método de coincidencia, este valor representa la suma de las diferencias de los valores al cuadrado.

    Para obtener más información sobre cómo se calcula este índice, consulte Cómo funciona Búsqueda de similitud.

    Este campo solo se incluye en las Entidades de salida cuando se selecciona Valores de atributos como valor del parámetro Método de coincidencia.

    cosimindex

    Este campo cuantifica cuán similar es cada coincidencia de solución a la entidad de destino. Si especifica Perfiles de atributos como valor del parámetro Método de coincidencia, este valor representa la similitud de coseno.

    Para obtener más información sobre cómo se calcula este índice, consulte Cómo funciona Búsqueda de similitud.

    Este campo solo se incluye en las Entidades de salida cuando se selecciona Perfiles de atributos como valor del parámetro Método de coincidencia.

    labelrank

    Este campo es exclusivo para visualización. La herramienta utiliza este campo para una representación predeterminada de los resultados del análisis.

    reference_id

    Un valor de Id. único para entidades de referencia. A las entidades de búsqueda se les asigna un valor nulo.

    Este campo está disponible en ArcGIS Enterprise 10.6.1 o versiones posteriores.

    search_id

    Un valor de Id. único para entidades de búsqueda. A las entidades de referencia se les asigna un valor nulo.

    Este campo está disponible en ArcGIS Enterprise 10.6.1 o versiones posteriores.

  • La salida se agrega automáticamente a la tabla de contenido con la representación en pantalla predeterminada aplicada al campo labelrank.

  • Es posible mejorar el rendimiento de la herramienta Buscar ubicaciones similares realizando una o varias de las siguientes sugerencias:

    • Defina el entorno de extensión para analizar únicamente datos de interés.
    • Seleccione solo unas pocas entidades para la capa de referencia.
    • Utilice datos locales en los que se ejecute el análisis.

  • Esta herramienta de geoprocesamiento se basa en ArcGIS GeoAnalytics Server. El análisis se completa en GeoAnalytics Server y los resultados se almacenan en su contenido en ArcGIS Enterprise.

  • Al ejecutar herramientas de GeoAnalytics Server, el análisis se completa en GeoAnalytics Server. Para obtener un rendimiento óptimo, haga que los datos estén disponibles para GeoAnalytics Server mediante capas de entidades alojadas en su portal de ArcGIS Enterprise o mediante recursos compartidos de archivos de big data. Los datos que no son locales para GeoAnalytics Server se moverán a GeoAnalytics Server antes de que comience el análisis. Significa que ejecutar una herramienta tardará más tiempo y, en algunos casos, mover los datos de ArcGIS Pro a GeoAnalytics Server podría fallar. El umbral de error depende de la velocidad de su red, así como del tamaño y complejidad de los datos. Se recomienda que siempre comparta sus datos o que cree un recurso compartido de archivos de big data.

    Más información acerca del uso compartido de datos en el portal

    Más información sobre cómo crear un archivo compartido de Big Data mediante Server Manager

  • Es posible realizar análisis similares con la herramienta Búsqueda de similitud de la caja de herramientas Estadísticas espaciales de ArcGIS Pro.

Parámetros

EtiquetaExplicaciónTipo de datos
Capa de entrada

La capa de referencia (o una selección de una capa) que contiene las entidades que se concordarán. La herramienta busca otras entidades similares a estas entidades. Si se especifica más de una entidad, la coincidencia estará basada en los promedios de los atributos.

Record Set
Buscar en capas

La capa candidata (o una selección de una capa) que contiene las entidades coincidentes candidatas. La herramienta busca entre estas candidatas las entidades más similares (o menos similares) al parámetro Capa de entrada.

Record Set
Nombre de salida

El nombre de la clase de entidad de salida. La clase de entidad de salida contiene un registro de cada uno de los parámetros de Capa de entrada y de todas las entidades coincidentes con la solución encontrada.

String
Campos de análisis

Una lista de los atributos numéricos que representan los criterios de coincidencia.

String
Más o menos similar

Especifica si las entidades que se deben encontrar son las más similares o las menos similares al parámetro Capa de entrada.

  • Más similarBusca las entidades que son más similares.
  • Menos similarBusca las entidades que son menos similares.
  • AmbasBusca las entidades que son más similares y las entidades que son menos similares.
String
Método de coincidencia

Especifica si las coincidencias se basarán en relaciones de valores o de cosenos.

  • Valores de atributosLa similitud o disimilitud se basará en la suma de las diferencias de valores de atributos estandarizados al cuadrado para todos los atributos de Campos de análisis.
  • Perfiles de atributosLa similitud o disimilitud se calculará como función de similitud de cosenos para todos los atributos de Campos de análisis.
String
Número de resultados

El número de coincidencias de solución que se debe buscar. Si se introduce cero o un número mayor que el número total de entidades de Capa de búsqueda, se devolverá la clasificación de todas las entidades candidatas, con un máximo de 10.000.

Long
Campos para incorporar
(Opcional)

Una lista opcional de atributos para incluir con la salida. Por ejemplo, puede incluir un identificador de nombre, un campo categórico o un campo de fecha. Estos campos no se utilizan para determinar la similitud, sino que solamente se incluyen en los atributos de parámetros de salida como referencia. Por defecto, se agregan todos los campos.

Field
Data store
(Opcional)

Especifica el ArcGIS Data Store donde se almacenará la salida. Todos los resultados almacenados en un big data store espaciotemporal se almacenarán en WGS84. Los resultados almacenados en un data store relacional mantendrán su sistema de coordenadas.

  • Big data store espaciotemporalLa salida se almacenará en un big data store espaciotemporal. Esta es la opción predeterminada.
  • Data store relacionalLa salida se almacenará en un data store relacional.
String

Salida derivada

EtiquetaExplicaciónTipo de datos
Clase de entidad de salida

Las entidades de la entrada y todas las entidades encontradas coincidentes con la solución.

Record Set

arcpy.geoanalytics.FindSimilarLocations(input_layer, search_layer, output_name, analysis_fields, most_or_least_similar, match_method, number_of_results, {append_fields}, {data_store})
NombreExplicaciónTipo de datos
input_layer

La capa de referencia (o una selección de una capa) que contiene las entidades que se concordarán. La herramienta busca otras entidades similares a estas entidades. Si se especifica más de una entidad, la coincidencia estará basada en los promedios de los atributos.

Record Set
search_layer

La capa candidata (o una selección de una capa) que contiene las entidades coincidentes candidatas. La herramienta busca entre estas candidatas las entidades más similares (o menos similares) al parámetro input_layer.

Record Set
output_name

El nombre del servicio de entidades de salida. El servicio de entidades de salida contiene un registro de cada uno de los parámetros input_layer y de todas las entidades coincidentes con la solución encontrada.

String
analysis_fields
[analysis_fields,...]

Una lista de los atributos numéricos que representan los criterios de coincidencia.

String
most_or_least_similar

Especifica si las entidades que se deben encontrar son las más similares o las menos similares al parámetro input_layer.

  • MOST_SIMILARBusca las entidades que son más similares.
  • LEAST_SIMILARBusca las entidades que son menos similares.
  • BOTHBusca las entidades que son más similares y las entidades que son menos similares.
String
match_method

Especifica si las coincidencias se basarán en relaciones de valores o de cosenos.

  • ATTRIBUTE_VALUESLa similitud o disimilitud se basará en la suma de las diferencias de valores de atributos estandarizados al cuadrado para todos los atributos de analysis_fields.
  • ATTRIBUTE_PROFILESLa similitud o disimilitud se calculará como función de similitud de cosenos para todos los atributos de analysis_fields.
String
number_of_results

El número de coincidencias de solución que se debe buscar. Si se introduce cero o un número mayor que el número total de entidades de search_layer, se devolverá la clasificación de todas las entidades candidatas, con un máximo de 10.000.

Long
append_fields
[append_fields,...]
(Opcional)

Una lista opcional de atributos para incluir con la salida. Por ejemplo, puede incluir un identificador de nombre, un campo categórico o un campo de fecha. Estos campos no se utilizan para determinar la similitud, sino que solamente se incluyen en los atributos de parámetros de salida como referencia. Por defecto, se agregan todos los campos.

Field
data_store
(Opcional)

Especifica el ArcGIS Data Store donde se almacenará la salida. Todos los resultados almacenados en un big data store espaciotemporal se almacenarán en WGS84. Los resultados almacenados en un data store relacional mantendrán su sistema de coordenadas.

  • SPATIOTEMPORAL_DATA_STORELa salida se almacenará en un big data store espaciotemporal. Esta es la opción predeterminada.
  • RELATIONAL_DATA_STORELa salida se almacenará en un data store relacional.
String

Salida derivada

NombreExplicaciónTipo de datos
output

Las entidades de la entrada y todas las entidades encontradas coincidentes con la solución.

Record Set

Muestra de código

FindSimilarLocations (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la herramienta FindSimilarLocations.

#-------------------------------------------------------------------------------
# Name: FindSimilarLocations.py
# Description: Find Similar stores to a top performing store
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
referenceStore = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Stores/BigDataCatalogServer/TopPerformer"
candidateStores = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Stores/BigDataCatalogServer/AllStores"
analysisFields = [ "SickDays", "TotalCustomers", "AvgPurchaseAmount"]
outputName = "BestStores_10"
dataStore = "SPATIOTEMPORAL_DATA_STORE"
# Execute Find Similar Locations
arcpy.geoanalytics.FindSimilarLocations(referenceStore, candidateStores, 
                                        outputName, analysisFields, 
                                        "MOST_SIMILAR", "ATTRIBUTE_VALUES", 10, 
                                        None, dataStore)

Entornos

Casos especiales

Sistema de coordenadas de salida

El sistema de coordenadas que se usará para el análisis. El análisis se completará en el sistema de coordenadas de entrada salvo que este parámetro especifique otra opción. En GeoAnalytics Tools, los resultados finales se almacenarán en el data store espaciotemporal en WGS84.

Información de licenciamiento

  • Basic: Requiere ArcGIS GeoAnalytics Server
  • Standard: Requiere ArcGIS GeoAnalytics Server
  • Advanced: Requiere ArcGIS GeoAnalytics Server

Temas relacionados