Résumé
Identifie les entités candidates les plus semblables (ou dissemblables) à une ou plusieurs entités en entrée en fonction d’attributs d’entités.
Illustration
Utilisation
Des entités tabulaires, ponctuelles, linéaires ou surfaciques peuvent être utilisées.
Une couche de recherche (candidate) en entrée est requise. Les entités contenues dans la couche de recherche sont classées selon leur similarité avec les emplacements (de référence) en entrée.
Si une ou plusieurs entités se trouvent dans la couche en entrée, l'appariement est effectué en calculant la moyenne des valeurs de la couche en entrée. Par exemple, s’il existe deux entités Input Layer (Couche en entrée) et que l’un des attributs Analysis Fields (Champs d’analyse) contient une variable liée à la population, l’outil va rechercher les couches de recherche (Search Layers) dont la population s’approche le plus des valeurs de population moyennes. Si les valeurs de population sont de 100 et 102, par exemple, l’outil recherche des candidats dont la population avoisine 101.
Remarque :
S’il existe plus d’une couche en entrée (Input Layer), choisissez les attributs Analysis Fields (Champs d’analyse) dont les valeurs sont les plus proches. Si, par exemple, la valeur de population de l’une des entrées est de 100 et que l’autre entrée est de 100 000, l’outil recherche des correspondances dont la population avoisine la moyenne de ces deux valeurs, à savoir 50 050. Vous remarquerez que cette moyenne ne correspond à la valeur de population d’aucune couche en entrée (Input Layer).
Utilisez le paramètre Most Or Least Similar (Les plus ou les moins similaires) pour rechercher les entités qui sont les plus similaires ou les moins similaires aux entités Input Layer (Couche en entrée) en utilisant respectivement l’option Most similar (Le plus similaire) ou Least similar (Le moins similaire). Dans certains cas, vous pouvez avoir besoin de consulter les deux paramètres. Si la valeur du paramètre Number of Results (Nombre de résultats) est égale à 3 et que la valeur du paramètre Most Or Least Similar (Les plus ou les moins similaires) est définie sur Both (Les deux), par exemple, l’outil renvoie les trois entités candidates les plus similaires et les trois entités candidates les moins similaires.
Les solutions données dans Output Features (Entités en sortie) sont soit la solution la plus similaire, soit la moins similaire à Input Layer (Couche en entrée) cibles. Une seule solution ne peut pas être les deux à la fois (et les solutions ne sont pas dupliquées dans Output Features (Entités en sortie)). En conséquence, lorsque la valeur du paramètre Most Or Least Similar (Les plus ou les moins similaires) est Both (Les deux), le nombre maximal de résultats possibles (Number of Results (Nombre de résultats)) correspond à la moitié du nombre de la valeur Search Layer (Couche de recherche).
- Un maximum de 10 000 entités de la couche de recherche peuvent être renvoyées.
Le paramètre Match Method (Méthode d’appariement) comporte les options de valeurs suivantes :
- Attribute values (Valeurs attributaires) : les candidats les plus similaires auront la plus petite somme des différences au carré pour tous les attributs Analysis Fields (Champs d’analyse). Toutes les valeurs sont normalisées avant le calcul des différences.
- Attribute profiles (Profils attributaires) : la similarité cosinusoïdale est mesurée. La similarité cosinusoïdale recherche les relations identiques parmi les valeurs attributaires normalisées au lieu de se préoccuper de l’appariement des amplitudes des attributs. Supposons par exemple qu’il existe trois Analysis Fields (Champs d’analyse) nommés A1, A2 et A3. A2 est deux fois plus grand qu'A1 et A3 est presque identique à A2. Si la valeur du paramètre Match Method (Méthode d’appariement) est Attribute profiles (Profils attributaires), l’outil va rechercher les candidats présentant les mêmes relations attributaires : A2 deux fois plus grand qu’A1 et A3 presque égal à A2. Comme cette méthode recherche des relations entre les attributs, vous devez spécifier un minimum de deux attributs Analysis Fields (Champs d’analyse). Vous pouvez utiliser la méthode de similarité cosinusoïdale (c’est-à-dire l’option Attribute profiles (Profils attributaires)) pour trouver des sites similaires à Los Angeles, mais à une échelle différente. Par exemple, vous pouvez vous intéresser au profil de la population par rapport au nombre de voitures et au nombre d’habitants de moins de 20 ans. L'index de similarité cosinusoïdale s'étend de 1,0 (similarité parfaite) à -1,0 (dissemblance parfaite). L'index de similarité cosinusoïdale est indiqué dans le champ simindex (similarité cosinusoïdale) des Output Features (Entités en sortie).
Le paramètre Analysis Fields (Champs d’analyse) doit être numérique et présenter les mêmes nom et type de champ dans les jeux de données Input Layer (Couche en entrée) et Search Layer (Couche de recherche). Si l’outil ne trouve aucun champ correspondant pour Search Layer (Couche de recherche), un avertissement indique que les attributs manquants ont été ignorés dans l’analyse.
Tous les attributs utilisés pour l'appariement sont inscrits dans la sortie. Le paramètre Append Fields (Ajouter des champs) vous permet d’indiquer les champs à ajouter à la table en sortie. Par défaut, tous les champs sont ajoutés. Utilisez le paramètre Append Fields (Ajouter des champs) pour sélectionner des champs dans la couche de recherche (Search Layer) que vous souhaitez ajouter.
Le paramètre Input Layer (Couche en entrée) et les solutions correspondantes sont inscrits dans les entités en sortie ainsi que dans les paramètres Analysis Fields (Champs d’analyse) et Append Fields (Ajouter des champs). De plus, les champs suivants sont inclus dans les entités en sortie :
Nom du champ Description Remarques location_type
Chaîne indiquant si les entités sont une couche de référence (entrée) ou une couche candidate (recherche).
simrank
Lorsque vous sélectionnez Most Similar (Le plus similaire) ou Both (Les deux) comme valeur du paramètre Most Or Least Similar (Les plus ou les moins similaires), toutes les solutions sont classées des plus similaires aux moins similaires. La valeur de classement de la solution la plus similaire est de 1.
Ce champ est inclus uniquement dans les entités en sortie lorsque vous sélectionnez Most Similar (Le plus similaire) ou Both (Les deux) comme valeur du paramètre Most Or Least Similar (Les plus ou les moins similaires).
dissimrank
Lorsque vous sélectionnez Least Similar (Le moins similaire) ou Both (Les deux) comme valeur du paramètre Most Or Least Similar (Les plus ou les moins similaires), toutes les solutions sont classées des moins similaires aux plus similaires. La valeur de classement de la solution la moins similaire est de 1.
Ce champ est inclus uniquement dans les entités en sortie (Output Features) lorsque vous sélectionnez Least Similar (Le moins similaire) ou Both (Les deux) comme valeur du paramètre Most Or Least Similar (Les plus ou les moins similaires).
simindex
Ce champ quantifie la similarité de chaque solution par rapport à l'entité cible. Lorsque vous spécifiez Attribute values (Valeurs attributaires) comme valeur du paramètre Match Method (Méthode d’appariement), cette valeur représente la somme des différences des valeurs au carré.
Pour en savoir plus sur le calcul de cet index, reportez-vous à la rubrique Fonctionnement de Recherche de similarités.
Ce champ est inclus uniquement dans les entités en sortie (Output Features) lorsque vous sélectionnez Attribute values (Valeurs attributaires) comme valeur du paramètre Match Method (Méthode d’appariement).
cosimindex
Ce champ quantifie la similarité de chaque solution par rapport à l'entité cible. Lorsque vous spécifiez Attribute profiles (Profils attributaires) comme valeur du paramètre Match Method (Méthode d’appariement), cette valeur représente la similarité cosinusoïdale.
Pour en savoir plus sur le calcul de cet index, reportez-vous à la rubrique Fonctionnement de Recherche de similarités.
Ce champ est inclus uniquement dans les entités en sortie (Output Features) lorsque vous sélectionnez Attribute profiles (Profils attributaires) comme valeur du paramètre Match Method (Méthode d’appariement).
labelrank
Ce champ est fourni uniquement à des fins d’affichage. L'outil utilise ce champ pour fournir le rendu par défaut des résultats d'analyse.
reference_id
Valeur d’ID unique pour les entités de référence. Les entités de recherche reçoivent une valeur nulle.
Ce champ est disponible dans la version ArcGIS Enterprise 10.6.1 ou ultérieure.
search_id
Valeur d’ID unique des entités de recherche. Les entités de référence reçoivent une valeur nulle.
Ce champ est disponible dans la version ArcGIS Enterprise 10.6.1 ou ultérieure.
La classe d’entités en sortie est ajoutée automatiquement à la table des matières, le rendu par défaut étant appliqué au champ labelrank.
Vous pouvez améliorer les performances de l’outil Rechercher des emplacements similaires en suivant les conseils ci-après :
- Définissez l’environnement de l’étendue de manière à analyser uniquement des données d’intérêt.
- Sélectionnez seulement quelques entités dans la couche de référence.
- Utilisez les données locales de l’environnement de l’analyse.
Cet outil de géotraitement est mis en œuvre par ArcGIS GeoAnalytics Server. L’analyse est réalisée sur le GeoAnalytics Server et les résultats sont stockés dans votre contenu dans ArcGIS Enterprise.
Lors de l’exécution des outils GeoAnalytics Server, l’analyse est réalisée sur GeoAnalytics Server. Pour des performances optimales, GeoAnalytics Server doit pouvoir accéder aux données via les couches d’entités hébergées sur votre portail ArcGIS Enterprise ou les partages de fichiers Big Data. Les données qui ne sont pas locales pour GeoAnalytics Server sont transférées sur GeoAnalytics Server avant le début de l’analyse. Autrement dit, l’exécution d’un outil prend plus de temps et, dans certains cas, le transfert des données entre ArcGIS Pro et GeoAnalytics Server peut échouer. Le seuil d’échec dépend aussi bien des débits du réseau que de la taille et de la complexité des données. Il est par conséquent recommandé de toujours partager les données ou créer un partage de fichiers Big Data.
Pour en savoir plus sur le partage des données dans votre portail.
Pour en savoir pus sur la création d'un partage de fichiers Big Data via ArcGIS Server Manager
Une analyse semblable peut également être réalisée à l’aide de l’outil Similarity Search (Recherche de similarités) de la boîte d’outils Statistiques spatiales dans ArcGIS Pro.
Syntaxe
arcpy.geoanalytics.FindSimilarLocations(input_layer, search_layer, output_name, analysis_fields, most_or_least_similar, match_method, number_of_results, {append_fields}, {data_store})
Paramètre | Explication | Type de données |
input_layer | Couche de référence (ou une sélection sur une couche) contenant les entités à apparier. L’outil recherche d’autres entités similaires à ces entités. Lorsque plusieurs entités sont fournies, l'appariement repose sur la moyenne des attributs. | Record Set |
search_layer | Couche candidate (ou une sélection sur une couche) contenant les entités correspondant aux entités candidates. L’outil recherche les entités les plus similaires (ou dissemblables) au paramètre input_layer parmi ces candidats. | Record Set |
output_name | Nom du service d’entités en sortie. Le service d’entités en sortie contient un enregistrement pour chacun des paramètres input_layer et pour toutes les solutions trouvées. | String |
analysis_fields [analysis_fields,...] | Une liste d'attributs numériques représentant les critères d'appariement. | String |
most_or_least_similar | Indique si les entités à rechercher sont les plus similaires ou les moins similaires au paramètre input_layer.
| String |
match_method | Indique si les appariements doivent reposer sur des valeurs ou des relations cosinusoïdales.
| String |
number_of_results | Nombre de solutions à trouver. Pour classer toutes les entités candidates, et 10 000 au maximum, entrez zéro ou un nombre supérieur au nombre total d’entités de type search_layer. | Long |
append_fields [append_fields,...] (Facultatif) | Une liste facultative d’attributs à inclure avec la sortie. Vous pouvez inclure un identifiant de nom, un champ de catégorie ou un champ de date, par exemple. Ces champs ne sont pas utilisés pour déterminer la similarité. Ils sont inclus uniquement dans les attributs du paramètre en sortie à titre de référence. Par défaut, tous les champs sont ajoutés. | Field |
data_store (Facultatif) | Indique le ArcGIS Data Store dans laquelle la sortie est enregistrée. La valeur par défaut est SPATIOTEMPORAL_DATA_STORE. Tous les résultats stockés dans un répertoire de données Big Data spatio-temporelles seront stockés en WGS84. Les résultats stockés dans un répertoire de données relationnelles conservent leur système de coordonnées.
| String |
Sortie dérivée
Nom | Explication | Type de données |
output | Entités de l’entrée et pour toutes les solutions trouvées. | Jeu d'enregistrements |
Exemple de code
Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil FindSimilarLocations.
#-------------------------------------------------------------------------------
# Name: FindSimilarLocations.py
# Description: Find Similar stores to a top performing store
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
referenceStore = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Stores/BigDataCatalogServer/TopPerformer"
candidateStores = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Stores/BigDataCatalogServer/AllStores"
analysisFields = [ "SickDays", "TotalCustomers", "AvgPurchaseAmount"]
outputName = "BestStores_10"
dataStore = "SPATIOTEMPORAL_DATA_STORE"
# Execute Find Similar Locations
arcpy.geoanalytics.FindSimilarLocations(referenceStore, candidateStores,
outputName, analysisFields,
"MOST_SIMILAR", "ATTRIBUTE_VALUES", 10,
None, dataStore)
Environnements
- Système de coordonnées en sortie
Système de coordonnées qui sera utilisé pour l'analyse. L’analyse sera réalisée dans le système de coordonnées en entrée, à moins que ce paramètre en spécifie un autre. Pour les Outils GeoAnalytics, les résultats finaux seront stockés dans le stockage des données spatio-temporelles dans WGS84.
Informations de licence
- Basic: Requiert ArcGIS GeoAnalytics Server
- Standard: Requiert ArcGIS GeoAnalytics Server
- Advanced: Requiert ArcGIS GeoAnalytics Server
Rubriques connexes
Vous avez un commentaire à formuler concernant cette rubrique ?