Resumen
Identifica las entidades candidatas que son más similares o menos similares a una o varias entidades de entrada en función de los atributos de entidades.
Ilustración
Uso
Se pueden utilizar entidades de tabla, puntos, línea o área.
Se necesita una capa (candidata) de búsqueda de entrada. Las entidades de la capa de búsqueda se clasificarán por similitud con las ubicaciones de entrada (referencia).
Si hay más de una entidad en la capa de entrada, la coincidencia se basa en la media de los valores de la capa de entrada. Por ejemplo, si hay dos entidades de Capa de entrada y uno de los atributos de Campos de análisis es una variable de población, la herramienta buscará las Capas de búsqueda con poblaciones similares al promedio de los valores de población. Por ejemplo, si los valores de población son 100 y 102, la herramienta buscará candidatos con poblaciones próximas a 101.
Nota:
Si hay más de una Capa de entrada, seleccione atributos de Campos de análisis con valores similares. Si, por ejemplo, si el valor de población de una de las entradas es 100 y la otra entrada es 100.000, la herramienta buscará coincidencias con poblaciones próximas al promedio de ambos valores: 50.050. Tenga en cuenta que este valor promedio está lejos del valor de población de las distintas Capas de entrada.
Utilice el parámetro Más o menos similar para buscar las entidades que sean más similares o menos similares a las entidades de Capa de entrada mediante las opciones Más similar o Menos similar, respectivamente. En algunos casos, quizá le convenga ver ambas. Por ejemplo, si el valor del parámetro Número de resultados es 3 y el del parámetro Más o menos similar es Ambos, la herramienta buscará las tres entidades candidatas más similares y las tres menos similares.
Cualquier coincidencia de soluciones dada en las Entidades de salida será una solución que sea la más similar o una solución que sea la menos similar a la Capa de entrada de destino; una única solución no puede ser las dos cosas (y las coincidencias de soluciones no se duplicarán en las Entidades de salida). Por lo tanto, si el valor del parámetro Más o menos similar es Ambos, el número máximo de coincidencias resultantes posibles (Número de resultados) será la mitad del número de la Capa de búsqueda.
- Se devolverá un máximo de 10.000 entidades de capa de búsqueda.
El parámetro Método de coincidencia ofrece las siguientes opciones de valor:
- Valores de atributos: los candidatos más similares tendrán la suma más pequeña de las diferencias cuadradas de todos los atributos de Campos de análisis. Todos los valores se estandarizan antes de calcular las diferencias.
- Perfiles de atributos: se mide la similitud de coseno. La similitud de coseno busca las mismas relaciones entre los valores de atributo estandarizados, en lugar de intentar hacer coincidir magnitudes. Por ejemplo, supongamos que hay tres Campos de análisis llamados A1, A2 y A3. A2 es dos veces mayor que A1, y A3 es casi igual que A2. Si el valor del parámetro Método de coincidencia es Perfiles de atributos, la herramienta buscará candidatos con las mismas relaciones de atributos: A2 es el doble de grande que A1 y A3 casi igual a A2. Como este método busca relaciones entre atributos, debe especificar un mínimo de dos atributos de Campos de análisis. Podría utilizar el método de similitud de coseno (la opción Perfiles de atributos) para buscar lugares similares a Los Ángeles, pero a una escala diferente; por ejemplo, el perfil de población comparado con el número de coches con el número de residentes menores de 20 años. El índice de similitud de coseno fluctúa entre 1,0 (similitud perfecta) y -1,0 (disimilitud perfecta). El índice de similitud de coseno se escribe en el campo Entidades de salida simindex (Similitud de coseno).
El parámetro Campos de análisis debe ser numérico y estar presente, con el mismo nombre de campo y tipo de campo, tanto en los datasets de Capa de entrada como en los de Capa de búsqueda. Si la herramienta no encuentra los campos correspondientes para la Capa de búsqueda, aparece una advertencia que indica que los atributos que faltan se han eliminado del análisis.
Todos los atributos utilizados para coincidencias se escriben en la salida. El parámetro Campos para incorporar permite especificar los campos que se van a agregar a la tabla de salida. Por defecto, se agregan todos los campos. Use el parámetro Campos para incorporar para seleccionar los campos de la Capa de búsqueda que desea agregar.
Todas las coincidencias de la Capa de entrada y de soluciones se escriben en las entidades de salida junto con los parámetros Campos de análisis y Campos para incorporar. Además, en las entidades de salida se incluyen los siguientes campos:
Nombre de campo Descripción Notes location_type
Una cadena de caracteres que indica si las entidades son una capa de referencia (entrada) o una capa candidata (búsqueda).
simrank
Si selecciona Más similar o Ambos como valor del parámetro Más o menos similar, todas las coincidencias de la solución se clasifican de más similar a menos similar. La coincidencia de solución más similar tendrá un valor de clasificación de 1.
Este campo solo se incluye en las Entidades de salida si selecciona Más similar o Ambos como valor del parámetro Más o menos similar.
dissimrank
Si selecciona Menos similar o Ambos como valor del parámetro Más o menos similar, todas las coincidencias de la solución se clasifican de más a menos similar. La solución que sea menos similar tiene un valor de clasificación de 1.
Este campo solo se incluye en las Entidades de salida si selecciona Menos similar o Ambos como valor del parámetro Más o menos similar.
simindex
Este campo cuantifica cuán similar es cada coincidencia de solución a la entidad de destino. Si especifica Valores de atributos como valor del parámetro Método de coincidencia, este valor representa la suma de las diferencias de los valores al cuadrado.
Para obtener más información sobre cómo se calcula este índice, consulte Cómo funciona Búsqueda de similitud.
Este campo solo se incluye en las Entidades de salida cuando se selecciona Valores de atributos como valor del parámetro Método de coincidencia.
cosimindex
Este campo cuantifica cuán similar es cada coincidencia de solución a la entidad de destino. Si especifica Perfiles de atributos como valor del parámetro Método de coincidencia, este valor representa la similitud de coseno.
Para obtener más información sobre cómo se calcula este índice, consulte Cómo funciona Búsqueda de similitud.
Este campo solo se incluye en las Entidades de salida cuando se selecciona Perfiles de atributos como valor del parámetro Método de coincidencia.
labelrank
Este campo es exclusivo para visualización. La herramienta utiliza este campo para una representación predeterminada de los resultados del análisis.
reference_id
Un valor de Id. único para entidades de referencia. A las entidades de búsqueda se les asigna un valor nulo.
Este campo está disponible en ArcGIS Enterprise 10.6.1 o versiones posteriores.
search_id
Un valor de Id. único para entidades de búsqueda. A las entidades de referencia se les asigna un valor nulo.
Este campo está disponible en ArcGIS Enterprise 10.6.1 o versiones posteriores.
La salida se agrega automáticamente a la tabla de contenido con la representación en pantalla predeterminada aplicada al campo labelrank.
Es posible mejorar el rendimiento de la herramienta Buscar ubicaciones similares realizando una o varias de las siguientes sugerencias:
- Defina el entorno de extensión para analizar únicamente datos de interés.
- Seleccione solo unas pocas entidades para la capa de referencia.
- Utilice datos locales en los que se ejecute el análisis.
Esta herramienta de geoprocesamiento se basa en ArcGIS GeoAnalytics Server. El análisis se completa en su GeoAnalytics Server y los resultados se almacenan en su contenido en ArcGIS Enterprise.
Al ejecutar Herramientas de GeoAnalytics Server, el análisis se completa en GeoAnalytics Server. Para obtener un rendimiento óptimo, haga que los datos estén disponibles para GeoAnalytics Server mediante capas de entidades alojadas en su portal de ArcGIS Enterprise o mediante recursos compartidos de archivos de big data. Los datos que no son locales para su GeoAnalytics Server se moverán a GeoAnalytics Server antes de que comience el análisis. Significa que ejecutar una herramienta tardará más tiempo y, en algunos casos, mover los datos de ArcGIS Pro a GeoAnalytics Server podría fallar. El umbral de error depende de la velocidad de su red, así como del tamaño y complejidad de los datos. Por lo tanto, se recomienda que siempre comparta sus datos o que cree un recurso compartido de archivos de big data.
Más información acerca del uso compartido de datos en el portal
Más información sobre cómo crear un archivo compartido de Big Data mediante Server Manager
Es posible realizar análisis similares con la herramienta Búsqueda de similitud de la caja de herramientas Estadísticas espaciales de ArcGIS Pro.
Sintaxis
FindSimilarLocations(input_layer, search_layer, output_name, analysis_fields, most_or_least_similar, match_method, number_of_results, {append_fields}, {data_store})
Parámetro | Explicación | Tipo de datos |
input_layer | La capa de referencia (o una selección de una capa) que contiene las entidades que se concordarán. La herramienta busca otras entidades similares a estas entidades. Si se especifica más de una entidad, la coincidencia estará basada en los promedios de los atributos. | Record Set |
search_layer | La capa candidata (o una selección de una capa) que contiene las entidades coincidentes candidatas. La herramienta busca entre estas candidatas las entidades más similares (o menos similares) al parámetro input_layer. | Record Set |
output_name | El nombre del servicio de entidades de salida. El servicio de entidades de salida contiene un registro de cada uno de los parámetros input_layer y de todas las entidades coincidentes con la solución encontrada. | String |
analysis_fields [analysis_fields,...] | Una lista de los atributos numéricos que representan los criterios de coincidencia. | String |
most_or_least_similar | Especifica si las entidades que se deben encontrar son las más similares o las menos similares al parámetro input_layer.
| String |
match_method | Especifica si las coincidencias se basarán en relaciones de valores o de cosenos.
| String |
number_of_results | El número de coincidencias de solución que se debe buscar. Si se introduce cero o un número mayor que el número total de entidades de search_layer, se devolverá la clasificación de todas las entidades candidatas, con un máximo de 10.000. | Long |
append_fields [append_fields,...] (Opcional) | Una lista opcional de atributos para incluir con la salida. Por ejemplo, puede incluir un identificador de nombre, un campo categórico o un campo de fecha. Estos campos no se utilizan para determinar la similitud, sino que solamente se incluyen en los atributos de parámetros de salida como referencia. Por defecto, se agregan todos los campos. | Field |
data_store (Opcional) | Especifica el ArcGIS Data Store en el que se guardará la salida. La predeterminada es SPATIOTEMPORAL_DATA_STORE. Todos los resultados almacenados en el SPATIOTEMPORAL_DATA_STORE se almacenarán en WGS84. Los resultados almacenados en un RELATIONAL_DATA_STORE mantendrán su sistema de coordenadas.
| String |
Salida derivada
Nombre | Explicación | Tipo de datos |
output | Las entidades de la entrada y todas las entidades encontradas coincidentes con la solución. | Conjunto de registros |
Muestra de código
El siguiente script de la ventana de Python muestra cómo utilizar la herramienta FindSimilarLocations.
#-------------------------------------------------------------------------------
# Name: FindSimilarLocations.py
# Description: Find Similar stores to a top performing store
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
referenceStore = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Stores/BigDataCatalogServer/TopPerformer"
candidateStores = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Stores/BigDataCatalogServer/AllStores"
analysisFields = [ "SickDays", "TotalCustomers", "AvgPurchaseAmount"]
outputName = "BestStores_10"
dataStore = "SPATIOTEMPORAL_DATA_STORE"
# Execute Find Similar Locations
arcpy.geoanalytics.FindSimilarLocations(referenceStore, candidateStores,
outputName, analysisFields,
"MOST_SIMILAR", "ATTRIBUTE_VALUES", 10,
None, dataStore)
Entornos
- Sistema de coordenadas de salida
El sistema de coordenadas que se usará para el análisis. El análisis se completará en el sistema de coordenadas de entrada salvo que este parámetro especifique otra opción. Para las GeoAnalytics Tools, los resultados finales se almacenarán en el data store espaciotemporal en WGS84.
Información de licenciamiento
- Basic: Requiere ArcGIS GeoAnalytics Server
- Standard: Requiere ArcGIS GeoAnalytics Server
- Advanced: Requiere ArcGIS GeoAnalytics Server