Rechercher des localisations similaires (GeoAnalytics)—ArcGIS Pro

Synthèse

Identifie les entités candidates les plus semblables (ou dissemblables) à une ou plusieurs entités en entrée en fonction d’attributs d’entités.

Héritage :

L’extension ArcGIS GeoAnalytics Server devient obsolète dans ArcGIS Enterprise. La dernière version de GeoAnalytics Server a été incluse avec ArcGIS Enterprise 11.3. Cet outil de géotraitement est accessible via ArcGIS Enterprise 11.3 et versions antérieures.

Illustration

Utilisation

Des entités tabulaires, ponctuelles, linéaires ou surfaciques peuvent être utilisées.
Une couche de recherche (candidate) en entrée est requise. Les entités contenues dans la couche de recherche sont classées selon leur similarité avec les emplacements (de référence) en entrée.
Si une ou plusieurs entités se trouvent dans la valeur du paramètre Couche en entrée, l’appariement est effectué en calculant la moyenne des valeurs du paramètre Couche en entrée. Par exemple, s’il existe deux entités Couche en entrée et que l’un des attributs du paramètre Champs d’analyse contient une variable liée à la population, l’outil va rechercher les valeurs de paramètre Couche de recherche dont la population s’approche le plus des valeurs de population moyennes. Si les valeurs de population sont de 100 et 102, par exemple, l’outil recherche des candidats dont la population avoisine 101.
Remarque :
S’il existe plus d’une valeur de paramètre Couche en entrée, choisissez les attributs Champs d’analyse dont les valeurs sont les plus proches. Si, par exemple, la valeur de population de l’une des entrées est de 100 et que l’autre entrée est de 100 000, l’outil recherche des correspondances dont la population avoisine la moyenne de ces deux valeurs, à savoir 50 050. Vous remarquerez que cette moyenne ne correspond à la valeur de population d’aucune valeur Couche en entrée.
Utilisez le paramètre Most Or Least Similar (Les plus ou les moins similaires) pour rechercher les entités qui sont les plus similaires ou les moins similaires aux entités Input Layer (Couche en entrée) en utilisant respectivement l’option Most similar (Le plus similaire) ou Least similar (Le moins similaire). Dans certains cas, vous pouvez avoir besoin de consulter les deux paramètres. Si la valeur du paramètre Number of Results (Nombre de résultats) est égale à 3 et que la valeur du paramètre Most Or Least Similar (Les plus ou les moins similaires) est définie sur Both (Les deux), par exemple, l’outil renvoie les trois entités candidates les plus similaires et les trois entités candidates les moins similaires.
Les solutions proposées dans le paramètre Entités en sortie sont soit la solution la plus similaire, soit la moins similaire à la valeur Couche en entrée cible. Une seule solution ne peut pas être les deux à la fois (et les solutions ne sont pas dupliquées dans Entités en sortie). En conséquence, lorsque la valeur du paramètre Les plus ou les moins similaires est Les deux, le nombre maximal de résultats possibles (la valeur du paramètre Nombre de résultats) correspond à la moitié du nombre de la valeur Couche de recherche.
Un maximum de 10 000 entités de la couche de recherche peuvent être renvoyées.
Le paramètre Match Method (Méthode d’appariement) comporte les options de valeurs suivantes :
- Attribute values (Valeurs attributaires) : les candidats les plus similaires auront la plus petite somme des différences au carré pour tous les attributs Analysis Fields (Champs d’analyse). Toutes les valeurs sont standardisées avant le calcul des différences.
- Attribute profiles (Profils attributaires) : la similarité cosinusoïdale est mesurée. La similarité cosinusoïdale recherche les relations identiques parmi les valeurs attributaires normalisées au lieu de se préoccuper de l’appariement des amplitudes des attributs. Supposons par exemple qu’il existe trois valeurs Champs d’analyse nommées A1, A2 et A3. A2 est deux fois plus grand qu’A1 et A3 est presque identique à A2. Si la valeur du paramètre Méthode d’appariement est Profils attributaires, l’outil recherche des candidats avec les mêmes relations attributaires : A2 est deux fois plus grand qu’A1 et A3 est presque identique à A2. Comme cette méthode recherche des relations entre les attributs, vous devez spécifier un minimum de deux attributs Champs d’analyse. Vous pouvez utiliser la méthode de similarité cosinusoïdale (c’est-à-dire l’option Attribute profiles (Profils attributaires)) pour trouver des sites similaires à Los Angeles, mais à une échelle différente. Par exemple, vous pouvez vous intéresser au profil de la population par rapport au nombre de voitures et au nombre d’habitants de moins de 20 ans. L’index de similarité cosinusoïdale s’étend de 1,0 (similarité parfaite) à -1,0 (dissemblance parfaite). L’index de similarité cosinusoïdale est indiqué dans le champ simindex (Similarité cosinusoïdale) de l’option Output Features (Entités en sortie).
Le paramètre Champs d’analyse doit être numérique et présenter les mêmes nom et type de champ dans les valeurs de paramètre Couche en entrée et Couche de recherche. Si l’outil ne trouve aucun champ correspondant pour la valeur Couche de recherche, un avertissement indique que les attributs manquants ont été ignorés dans l’analyse.
Tous les attributs utilisés pour l’appariement sont inscrits dans la sortie. Le paramètre Append Fields (Ajouter des champs) vous permet d’indiquer les champs à ajouter à la table en sortie. Par défaut, aucun champ n’est ajouté. Utilisez le paramètre Ajouter des champs pour sélectionner des champs dans la valeur Couche de recherche que vous souhaitez ajouter.

Le paramètre Couche en entrée et les solutions correspondantes sont inscrits dans les entités en sortie ainsi que dans les valeurs de paramètre Champs d’analyse et Ajouter des champs. De plus, les champs suivants sont inclus dans les entités en sortie :


Nom du champ	Description	Remarques
location_type	Chaîne indiquant si les entités sont une couche de référence (entrée) ou une couche candidate (recherche).
simrank	Lorsque vous spécifiez Le plus similaire ou Les deux comme valeur du paramètre Les plus ou les moins similaires, toutes les solutions correspondantes sont classées des plus similaires aux moins similaires. La valeur de classement de la solution la plus similaire est de 1.	Ce champ est inclus uniquement dans la valeur Entités en sortie lorsque vous spécifiez Le plus similaire ou Les deux comme valeur du paramètre Les plus ou les moins similaires.
dissimrank	Lorsque vous spécifiez Le moins similaire ou Les deux comme valeur du paramètre Les plus ou les moins similaires, toutes les solutions correspondantes sont classées des moins similaires aux plus similaires. La valeur de classement de la solution la moins similaire est de 1.	Ce champ est inclus uniquement dans la valeur Entités en sortie lorsque vous spécifiez Le moins similaire ou Les deux comme valeur du paramètre Les plus ou les moins similaires.
simindex	Ce champ quantifie la similarité de chaque solution par rapport à l’entité cible. Lorsque vous spécifiez Attribute values (Valeurs attributaires) comme valeur du paramètre Match Method (Méthode d’appariement), cette valeur représente la somme des différences des valeurs au carré. Pour en savoir plus sur le calcul de cet index, reportez-vous à la rubrique Fonctionnement de Recherche de similarités.	Ce champ est inclus uniquement dans la valeur Entités en sortie lorsque vous spécifiez Valeurs attributaires comme valeur du paramètre Méthode d’appariement.
cosimindex	Ce champ quantifie la similarité de chaque solution par rapport à l’entité cible. Lorsque vous spécifiez Attribute profiles (Profils attributaires) comme valeur du paramètre Match Method (Méthode d’appariement), cette valeur représente la similarité cosinusoïdale. Pour en savoir plus sur le calcul de cet index, reportez-vous à la rubrique Fonctionnement de Recherche de similarités.	Ce champ est inclus uniquement dans la valeur Entités en sortie lorsque vous spécifiez Profils attributaires comme valeur du paramètre Méthode d’appariement.
labelrank	Ce champ est fourni uniquement à des fins d’affichage. L’outil utilise ce champ pour fournir le rendu par défaut des résultats d’analyse.
reference_id	Valeur d’ID unique des entités de référence. Les entités de recherche ont une valeur nulle.	Ce champ est disponible dans la version ArcGIS Enterprise 10.6.1 ou ultérieure.
search_id	Valeur d’ID unique des entités de recherche. Les entités de référence ont une valeur nulle.	Ce champ est disponible dans la version ArcGIS Enterprise 10.6.1 ou ultérieure.

La classe d’entités en sortie est ajoutée automatiquement à la table des matières, le rendu par défaut étant appliqué au champ labelrank.
Vous pouvez améliorer les performances de l’outil Rechercher des emplacements similaires en suivant un ou plusieurs des conseils ci-après :
- Définissez l’environnement de l’étendue de manière à analyser uniquement des données d’intérêt.
- Sélectionnez seulement quelques entités dans la couche de référence.
- Utilisez les données locales de l’environnement de l’analyse.
Cet outil de géotraitement est mis en œuvre par ArcGIS GeoAnalytics Server. L’analyse est réalisée sur GeoAnalytics Server et les résultats sont stockés dans votre contenu dans ArcGIS Enterprise.
Lors de l’exécution des outils GeoAnalytics Server, l’analyse est réalisée sur GeoAnalytics Server. Pour des performances optimales, GeoAnalytics Server doit pouvoir accéder aux données via les couches d’entités hébergées sur votre portail ArcGIS Enterprise ou les partages de fichiers Big Data. Les données qui ne sont pas locales pour GeoAnalytics Server sont transférées sur GeoAnalytics Server avant le début de l’analyse. Autrement dit, l’exécution d’un outil prend plus de temps et, dans certains cas, le transfert des données depuis ArcGIS Pro vers GeoAnalytics Server peut échouer. Le seuil d’échec dépend aussi bien des débits du réseau que de la taille et de la complexité des données. Il est recommandé de toujours partager les données ou de créer un partage de fichiers Big Data.
Pour en savoir plus sur le partage des données dans votre portail.
En savoir pus sur la création d’un partage de fichiers Big Data via ArcGIS Server Manager
Une analyse semblable peut également être réalisée à l’aide de l’outil Recherche de similarités de la boîte à outils Statistiques spatiales dans ArcGIS Pro.

Paramètres

Étiquette	Explication	Type de données
Couche en entrée	Couche de référence (ou une sélection sur une couche) contenant les entités à apparier. L’outil recherche d’autres entités similaires à ces entités. Lorsque plusieurs entités sont fournies, l’appariement repose sur la moyenne des attributs.	Record Set
Couche de recherche	Couche candidate (ou une sélection sur une couche) contenant les entités correspondant aux entités candidates. L’outil recherche les entités les plus similaires (ou dissemblables) à la valeur du paramètre Couche en entrée parmi ces candidats.	Record Set
Nom en sortie	Nom de la classe d’entités en sortie. La classe d’entités en sortie contient un enregistrement pour chacune des valeurs du paramètre Couche en entrée et pour toutes les solutions trouvées.	String
Champs d’analyse	Une liste d’attributs numériques représentant les critères d’appariement.	String
Les plus ou les moins similaires	Indique si les entités à rechercher sont les plus similaires ou les moins similaires à la valeur du paramètre Couche en entrée. Le plus similaire—Les entités les plus similaires sont recherchées. Le moins similaire—Les entités les moins similaires sont recherchées. Les deux—Les entités qui sont les plus similaires et les entités qui sont les moins similaires sont toutes recherchées.	String
Méthode d’appariement	Indique si les appariements de similarité et de dissemblance doivent reposer sur des valeurs ou des relations cosinusoïdales. Valeurs attributaires—La similarité et la dissemblance reposent sur la somme des différences des valeurs attributaires standardisées au carré de tous les attributs Analysis Fields (Champs d’analyse). Profils attributaires—La similarité et la dissemblance sont calculées comme une fonction de la similarité cosinusoïdale de tous les attributs Analysis Fields (Champs d’analyse).	String
Nombre de résultats	Nombre de solutions correspondantes qui seront trouvées. Pour classer toutes les entités candidates, et 10 000 au maximum, entrez zéro ou un nombre supérieur au nombre total d’entités de type Search Layer (Couche de recherche).	Long
Ajouter des champs (Facultatif)	Une liste facultative d’attributs à inclure avec la sortie. Vous pouvez inclure un identifiant de nom, un champ de catégorie ou un champ de date, par exemple. Ces champs ne sont pas utilisés pour déterminer la similarité. Ils sont inclus uniquement dans les attributs du paramètre en sortie à titre de référence. Par défaut, aucun champ n’est ajouté.	Field
Data store (Facultatif)	Indique le ArcGIS Data Store où la sortie sera stockée. Tous les résultats stockés dans un répertoire de données Big Data spatio-temporelles seront stockés en WGS84. Les résultats stockés dans un répertoire de données relationnelles conservent leur système de coordonnées. Stockage de Big Data spatio-temporelles—La sortie sera stockée dans un stockage de Big Data spatio-temporelles. Il s’agit de l’option par défaut. Stockage des données relationnelles—La sortie sera stockée dans un data store relationnel.	String

Sortie obtenue

Étiquette	Explication	Type de données
Classe d’entités en sortie	Entités de l’entrée et pour toutes les solutions trouvées.	Record Set

arcpy.geoanalytics.FindSimilarLocations(input_layer, search_layer, output_name, analysis_fields, most_or_least_similar, match_method, number_of_results, {append_fields}, {data_store})

Nom	Explication	Type de données
input_layer	Couche de référence (ou une sélection sur une couche) contenant les entités à apparier. L’outil recherche d’autres entités similaires à ces entités. Lorsque plusieurs entités sont fournies, l’appariement repose sur la moyenne des attributs.	Record Set
search_layer	Couche candidate (ou une sélection sur une couche) contenant les entités correspondant aux entités candidates. L’outil recherche les entités les plus similaires (ou dissemblables) à la valeur du paramètre input_layer parmi ces candidats.	Record Set
output_name	Nom du service d’entités en sortie. Le service d’entités en sortie contient un enregistrement pour chacune des valeurs de paramètre input_layer et pour toutes les solutions trouvées.	String
analysis_fields [analysis_fields,...]	Une liste d’attributs numériques représentant les critères d’appariement.	String
most_or_least_similar	Indique si les entités à rechercher sont les plus similaires ou les moins similaires à la valeur du paramètre input_layer. MOST_SIMILAR—Les entités les plus similaires sont recherchées. LEAST_SIMILAR—Les entités les moins similaires sont recherchées. BOTH—Les entités qui sont les plus similaires et les entités qui sont les moins similaires sont toutes recherchées.	String
match_method	Indique si les appariements de similarité et de dissemblance doivent reposer sur des valeurs ou des relations cosinusoïdales. ATTRIBUTE_VALUES—La similarité et la dissemblance reposent sur la somme des différences des valeurs attributaires standardisées au carré de tous les attributs analysis_fields. ATTRIBUTE_PROFILES—La similarité et la dissemblance sont calculées comme une fonction de similarité cosinusoïdale de tous les attributs analysis_fields.	String
number_of_results	Nombre de solutions correspondantes qui seront trouvées. Pour classer toutes les entités candidates, et 10 000 au maximum, entrez zéro ou un nombre supérieur au nombre total d’entités de type search_layer.	Long
append_fields [append_fields,...] (Facultatif)	Une liste facultative d’attributs à inclure avec la sortie. Vous pouvez inclure un identifiant de nom, un champ de catégorie ou un champ de date, par exemple. Ces champs ne sont pas utilisés pour déterminer la similarité. Ils sont inclus uniquement dans les attributs du paramètre en sortie à titre de référence. Par défaut, aucun champ n’est ajouté.	Field
data_store (Facultatif)	Indique le ArcGIS Data Store où la sortie sera stockée. Tous les résultats stockés dans un répertoire de données Big Data spatio-temporelles seront stockés en WGS84. Les résultats stockés dans un répertoire de données relationnelles conservent leur système de coordonnées. SPATIOTEMPORAL_DATA_STORE—La sortie sera stockée dans un stockage de Big Data spatio-temporelles. Il s’agit de l’option par défaut. RELATIONAL_DATA_STORE—La sortie sera stockée dans un data store relationnel.	String

Sortie obtenue

Nom	Explication	Type de données
output	Entités de l’entrée et pour toutes les solutions trouvées.	Record Set

Exemple de code

FindSimilarLocations (fenêtre Python)

Le script ci-dessous pour la fenêtre Python illustre l’utilisation de la fonction FindSimilarLocations.

# Name: FindSimilarLocations.py
# Description: Find Similar stores to a top performing store
#
# Requirements: ArcGIS GeoAnalytics Server

# Import system modules
import arcpy
function
# Set local variables
referenceStore = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Stores/BigDataCatalogServer/TopPerformer"
candidateStores = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Stores/BigDataCatalogServer/AllStores"
analysisFields = [ "SickDays", "TotalCustomers", "AvgPurchaseAmount"]
outputName = "BestStores_10"
dataStore = "SPATIOTEMPORAL_DATA_STORE"

# Run Find Similar Locations
arcpy.geoanalytics.FindSimilarLocations(referenceStore, candidateStores, 
                                        outputName, analysisFields, 
                                        "MOST_SIMILAR", "ATTRIBUTE_VALUES", 10, 
                                        None, dataStore)

Environnements

Système de coordonnées en sortie, Étendue, Espace de travail courant

Cas particuliers

Système de coordonnées en sortie: Système de coordonnées qui sera utilisé pour l'analyse. L’analyse sera réalisée dans le système de coordonnées en entrée, à moins que ce paramètre en spécifie un autre. Pour GeoAnalytics Tools, les résultats finaux sont stockés dans le stockage des données spatio-temporelles dans WGS84.

Informations de licence

Basic: Nécessite ArcGIS GeoAnalytics Server
Standard: Nécessite ArcGIS GeoAnalytics Server
Advanced: Nécessite ArcGIS GeoAnalytics Server

Rubriques connexes

Vous avez un commentaire à formuler concernant cette rubrique ?

Synthèse

Héritage :

Illustration

Utilisation

Remarque :

Paramètres

Sortie obtenue

Sortie obtenue

Exemple de code

Environnements

Cas particuliers

Informations de licence

Rubriques connexes

Dans cette rubrique