Resumen
Identifica las entidades candidatas que son más similares o menos similares a una o varias entidades de entrada en función de los atributos de entidades.
Ilustración
Uso
Se pueden utilizar entidades de tabla, puntos, línea o área.
Se necesita una capa (candidata) de búsqueda de entrada. Las entidades de la capa de búsqueda se clasificarán por similitud con las ubicaciones de entrada (referencia).
Si hay más de una entidad en la capa de entrada, la coincidencia se basa en la media de los valores de la capa de entrada. Por ejemplo, si hay dos entidades de Capa de entrada y uno de los atributos de Campos de análisis es una variable de población, la herramienta buscará las Capas de búsqueda con poblaciones similares al promedio de los valores de población. Por ejemplo, si los valores de población son 100 y 102, la herramienta buscará candidatos con poblaciones próximas a 101.
Nota:
Si hay más de una Capa de entrada, seleccione atributos de Campos de análisis con valores similares. Si, por ejemplo, si el valor de población de una de las entradas es 100 y la otra entrada es 100.000, la herramienta buscará coincidencias con poblaciones próximas al promedio de ambos valores: 50.050. Tenga en cuenta que este valor promedio está lejos del valor de población de las distintas Capas de entrada.
Utilice el parámetro Más o menos similar para buscar las entidades que sean más similares o menos similares a las entidades de Capa de entrada mediante las opciones Más similar o Menos similar, respectivamente. En algunos casos, quizá le convenga ver ambas. Por ejemplo, si el valor del parámetro Número de resultados es 3 y el del parámetro Más o menos similar es Ambos, la herramienta buscará las tres entidades candidatas más similares y las tres menos similares.
Cualquier coincidencia de soluciones dada en las Entidades de salida será una solución que sea la más similar o una solución que sea la menos similar a la Capa de entrada de destino; una única solución no puede ser las dos cosas (y las coincidencias de soluciones no se duplicarán en las Entidades de salida). Por lo tanto, si el valor del parámetro Más o menos similar es Ambos, el número máximo de coincidencias resultantes posibles (Número de resultados) será la mitad del número de la Capa de búsqueda.
- Se devolverá un máximo de 10.000 entidades de capa de búsqueda.
El parámetro Método de coincidencia ofrece las siguientes opciones de valor:
- Valores de atributos: los candidatos más similares tendrán la suma más pequeña de las diferencias cuadradas de todos los atributos de Campos de análisis. Todos los valores se estandarizan antes de calcular las diferencias.
- Perfiles de atributos: se mide la similitud de coseno. La similitud de coseno busca las mismas relaciones entre los valores de atributo estandarizados, en lugar de intentar hacer coincidir magnitudes. Por ejemplo, supongamos que hay tres Campos de análisis llamados A1, A2 y A3. A2 es dos veces mayor que A1, y A3 es casi igual que A2. Si el valor del parámetro Método de coincidencia es Perfiles de atributos, la herramienta buscará candidatos con las mismas relaciones de atributos: A2 es el doble de grande que A1 y A3 casi igual a A2. Como este método busca relaciones entre atributos, debe especificar un mínimo de dos atributos de Campos de análisis. Podría utilizar el método de similitud de coseno (la opción Perfiles de atributos) para buscar lugares similares a Los Ángeles, pero a una escala diferente; por ejemplo, el perfil de población comparado con el número de coches con el número de residentes menores de 20 años. El índice de similitud de coseno fluctúa entre 1,0 (similitud perfecta) y -1,0 (disimilitud perfecta). El índice de similitud de coseno se escribe en el campo Entidades de salida simindex (Similitud de coseno).
El parámetro Campos de análisis debe ser numérico y estar presente, con el mismo nombre de campo y tipo de campo, tanto en los datasets de Capa de entrada como en los de Capa de búsqueda. Si la herramienta no encuentra los campos correspondientes para la Capa de búsqueda, aparece una advertencia que indica que los atributos que faltan se han eliminado del análisis.
Todos los atributos utilizados para coincidencias se escriben en la salida. El parámetro Campos para incorporar permite especificar los campos que se van a agregar a la tabla de salida. Por defecto, se agregan todos los campos. Use el parámetro Campos para incorporar para seleccionar los campos de la Capa de búsqueda que desea agregar.
Todas las coincidencias de la Capa de entrada y de soluciones se escriben en las entidades de salida junto con los parámetros Campos de análisis y Campos para incorporar. Además, en las entidades de salida se incluyen los siguientes campos:
Nombre de campo Descripción Notes location_type
Una cadena de caracteres que indica si las entidades son una capa de referencia (entrada) o una capa candidata (búsqueda).
simrank
Si selecciona Más similar o Ambos como valor del parámetro Más o menos similar, todas las coincidencias de la solución se clasifican de más similar a menos similar. La coincidencia de solución más similar tendrá un valor de clasificación de 1.
Este campo solo se incluye en las Entidades de salida si selecciona Más similar o Ambos como valor del parámetro Más o menos similar.
dissimrank
Si selecciona Menos similar o Ambos como valor del parámetro Más o menos similar, todas las coincidencias de la solución se clasifican de más a menos similar. La solución que sea menos similar tiene un valor de clasificación de 1.
Este campo solo se incluye en las Entidades de salida si selecciona Menos similar o Ambos como valor del parámetro Más o menos similar.
simindex
Este campo cuantifica cuán similar es cada coincidencia de solución a la entidad de destino. Si especifica Valores de atributos como valor del parámetro Método de coincidencia, este valor representa la suma de las diferencias de los valores al cuadrado.
Para obtener más información sobre cómo se calcula este índice, consulte Cómo funciona Búsqueda de similitud.
Este campo solo se incluye en las Entidades de salida cuando se selecciona Valores de atributos como valor del parámetro Método de coincidencia.
cosimindex
Este campo cuantifica cuán similar es cada coincidencia de solución a la entidad de destino. Si especifica Perfiles de atributos como valor del parámetro Método de coincidencia, este valor representa la similitud de coseno.
Para obtener más información sobre cómo se calcula este índice, consulte Cómo funciona Búsqueda de similitud.
Este campo solo se incluye en las Entidades de salida cuando se selecciona Perfiles de atributos como valor del parámetro Método de coincidencia.
labelrank
Este campo es exclusivo para visualización. La herramienta utiliza este campo para una representación predeterminada de los resultados del análisis.
reference_id
Un valor de Id. único para entidades de referencia. A las entidades de búsqueda se les asigna un valor nulo.
search_id
Un valor de Id. único para entidades de búsqueda. A las entidades de referencia se les asigna un valor nulo.
La salida se agrega automáticamente a la tabla de contenido con la representación en pantalla predeterminada aplicada al campo labelrank.
Es posible mejorar el rendimiento de la herramienta Buscar ubicaciones similares realizando una o varias de las siguientes sugerencias:
- Defina el entorno de extensión para analizar únicamente datos de interés.
- Seleccione solo unas pocas entidades para la capa de referencia.
- Utilice datos locales en los que se ejecute el análisis.
Esta herramienta de geoprocesamiento se basa en Spark. El análisis se completa en su equipo de escritorio utilizando varios núcleos en paralelo. Consulte Consideraciones acerca de las herramientas de GeoAnalytics Desktop para obtener más información acerca de la ejecución de análisis.
Al ejecutar herramientas de GeoAnalytics Desktop, el análisis se completa en su equipo de escritorio. Para un rendimiento óptimo, los datos deben estar disponibles en su escritorio. Si utiliza una capa de entidades alojada, se recomienda utilizar ArcGIS GeoAnalytics Server. Si sus datos no están almacenados localmente, se tardará más tiempo en ejecutar una herramienta. Para utilizar ArcGIS GeoAnalytics Server con el fin de realizar un análisis, consulte GeoAnalytics Tools.
Es posible realizar análisis similares con la herramienta Búsqueda de similitud de la caja de herramientas Estadísticas espaciales de ArcGIS Pro.
Sintaxis
arcpy.gapro.FindSimilarLocations(input_layer, search_layer, output, analysis_fields, most_or_least_similar, match_method, number_of_results, {append_fields})
Parámetro | Explicación | Tipo de datos |
input_layer | La capa de referencia (o una selección de una capa) que contiene las entidades que se concordarán. La herramienta busca otras entidades similares a estas entidades. Si se especifica más de una entidad, la coincidencia estará basada en los promedios de los atributos. | Table View |
search_layer | La capa candidata (o una selección de una capa) que contiene las entidades coincidentes candidatas. La herramienta busca entre estas candidatas las entidades más similares (o menos similares) al parámetro input_layer. | Table View |
output | El dataset de salida contiene un registro de cada uno de los parámetros de input_layer y de todas las entidades coincidentes con la solución encontrada. | Feature Class; Table |
analysis_fields [analysis_fields,...] | Una lista de los atributos numéricos que representan los criterios de coincidencia. | String |
most_or_least_similar | Especifica si las entidades que se deben encontrar son las más similares o las menos similares al parámetro input_layer.
| String |
match_method | Especifica si las coincidencias se basarán en relaciones de valores o de cosenos.
| String |
number_of_results | El número de coincidencias de solución que se debe buscar. Si se introduce cero o un número mayor que el número total de entidades de search_layer, se devolverá la clasificación de todas las entidades candidatas, con un máximo de 10.000. | Long |
append_fields [append_fields,...] (Opcional) | Una lista opcional de atributos para incluir con la salida. Por ejemplo, puede incluir un identificador de nombre, un campo categórico o un campo de fecha. Estos campos no se utilizan para determinar la similitud, sino que solamente se incluyen en los atributos de parámetros de salida como referencia. Por defecto, se agregan todos los campos. | Field |
Muestra de código
El siguiente script de la ventana de Python muestra cómo utilizar la herramienta FindSimilarLocations.
#-------------------------------------------------------------------------------
# Name: FindSimilarLocations.py
# Description: Find Similar stores to a top performing store
# Import system modules
import arcpy
arcpy.env.workspace = "C:/data/SalesData.gdb"
# Set local variables
referenceStore = "TopPerformer"
candidateStores = "AllStores"
analysisFields = [ "SickDays", "TotalCustomers", "AvgPurchaseAmount"]
outputName = "BestStores_10"
# Execute Find Similar Locations
arcpy.gapro.FindSimilarLocations(referenceStore, candidateStores,
outputName, analysisFields,
"MOST_SIMILAR", "ATTRIBUTE_VALUES", 10)
Entornos
Información de licenciamiento
- Basic: No
- Standard: No
- Advanced: Sí