Réduire les entités en double dans les données

La mise en forme des données de référence peut contenir des entités en double représentant le même emplacement, mais avec des attributs différents, de manière à créer un emplacement prenant en charge d’autres noms. C’est ce qui est illustré par les données ci-après, où 12725 Yosemite Blvd, Waterford et 12725 CA-132, Waterford présentent la même géométrie, mais des valeurs de champ FullStreetName différentes.

Table attributaire PointAddress présentant des entités en double pour le même emplacement avec des noms différents

La méthode préconisée pour créer un localisateur prenant en charge les autres noms des entités consiste à ajouter les autres valeurs à une table et à utiliser un rôle de table des autres noms qui correspond au rôle de localisateur principal. Toutefois, s'il existe des entités en double dans les données de référence, cela risque de créer d’autres valeurs et les géométries en double seront exclues si le localisateur est créé avec l’outil Créer un localisateur. Pour supprimer les géométries en double, les données de référence principales doivent comporter un champ dont l’ID connecte les entités dupliquées avec un même emplacement. Ce champ d’ID doit être apparié à un champ d’ID d’entité du rôle de localisateur, par exemple POINT_ADDRESS_ID. Ainsi, la taille du localisateur est réduite et les candidats multiples superflus sont supprimés des résultats du géocodage.

Table attributaire PointAddress avec un champ POINT_ADDRESS_ID pour relier les entités en double pour le même emplacement

L’outil Créer un localisateur utilise les valeurs mappées au champ d’identifiant de l’entité pour ignorer toutes les géométries en double, à l’exception de la première géométrie détectée qui est stockée dans le localisateur. Les autres valeurs attributaires sont créées en fonction des ID appariés des entités en double.

Champ POINT_ADDRESS_ID attribué au champ de rôle de localisateur Feature ID (Identifiant de l’entité) dans l’outil Créer un localisateur

Remarque :

Si les données de référence n’incluent pas le champ d’ID, il est possible de l’ajouter à l’aide de l’outil Rechercher les doublons. Le champ Shape permet de rechercher les doublons dans les données de référence principales, partant du principe qu’ils ont la même géométrie. Il peut y avoir des doublons dans les données de référence lorsque deux adresses ou points d’intérêt (POI) distincts partagent le même emplacement, ce qui peut s’avérer problématique. Cette procédure ne fonctionne pas dans tous les cas. Si le champ Shape est utilisé avec l’outil Rechercher les doublons, la table en sortie contient les ID identiques des entités en double. Elle peut ensuite être jointe aux données de référence principales et utilisée pour créer le localisateur en affectant le nouveau champ d'ID au rôle de localisateur Feature ID ( ID d'entité) dans l'outil Créer un localisateur.

Si la classe d’entités ponctuelles à utiliser comme données de référence principales compte 13 millions d’entités, dont 10 millions d’entités uniques, l’appariement du champ d’identifiant de l’entité va activer les fonctions de l’outil Créer un localisateur pour supprimer les géométries en double. Vous obtenez un localisateur dont la taille est réduite de 253 Mo à 200 Mo.