Réduire les entités en double dans les données

La mise en forme des données de référence peut contenir des entités en double représentant le même emplacement, mais avec des attributs différents, de manière à créer un emplacement prenant en charge d’autres noms. C’est ce qui est illustré par les données ci-après, où 12725 Yosemite Blvd, Waterford et 12725 CA-132, Waterford possèdent la même géométrie mais des valeurs différentes dans le champ FullStreetName.

Table attributaire PointAddress présentant des entités en double pour le même emplacement avec des noms différents

Pour créer un localisateur prenant en charge d’autres noms pour les entités, la méthode recommandée consiste à ajouter les autres valeurs à une table et à utiliser un rôle de table des autres noms qui corresponde au rôle de localisateur principal. Toutefois, si les données de référence contiennent déjà des entités en double, cela risque de créer d’autres valeurs et les géométries en double seront exclues si le localisateur est créé avec l’outil Créer un localisateur. Pour supprimer les géométries en double, les données de référence principales doivent comporter un champ dont l’ID connecte les entités dupliquées avec un même emplacement. Ce champ d’ID doit être apparié à un champ d’ID principal du rôle de localisateur, par exemple POINT_ADDRESS_ID. Cette opération permet de diminuer la taille du localisateur et de supprimer les candidats multiples en surplus dans les résultats de géocodage.

Table attributaire PointAddress avec champ POINT_ADDRESS_ID permettant de lier les entités en double d’un même emplacement

L’outil Créer un localisateur utilise les valeurs appariées au champ ID principal pour ignorer toutes les géométries en double, sauf la première occurrence de géométrie rencontrée, qui est stockée dans le localisateur. Les autres valeurs attributaires sont créées d’après les ID correspondants des entités en double.

Remarque :

Si les données de référence n’incluent pas le champ ID, il peut être ajouté à l’aide de l’outil Rechercher les doublons. Le champ Shape est utilisé pour rechercher les doublons dans les données de référence principales, en supposant qu’ils ont la même géométrie. Il peut arriver qu’il y ait des doublons dans les données de référence lorsque deux adresses ou points d’intérêt (POI) distincts partagent le même emplacement, ce qui peut s’avérer problématique. Cette procédure ne fonctionnera donc pas dans tous les cas. Si le champ Shape est utilisé avec l’outil Rechercher les doublons, les entités en double auront des ID identiques dans la table en sortie. Cette table peut ensuite être jointe aux données de référence principales et utilisée pour créer le localisateur.

Si la classe d’entités ponctuelles à utiliser comme données de référence principales compte 13 millions d’entités, dont 10 millions d’entités uniques, l’appariement du champ d’ID principal active la fonctionnalité dans l’outil Créer un localisateur pour supprimer les géométries en double. Vous obtenez un localisateur dont la taille est réduite de 253 Mo à 200 Mo.

Champs ID principaux pour chaque rôle

RôleID principal

Adresse de point

ID de jointure d'adresse

Parcelle

ID de jointure de parcelle

Adresse

ID de jointure de rue

PI

ID de jointure de lieu

Symbole ponctuel de distance

ID de jointure de rue

Plage de distance

ID de jointure de rue

Code postal

ID de jointure de code postal

Extension postale

ID de jointure d'extension postale

Localité postale

Une combinaison de l’ID de jointure du code postal et de tous les ID de jointure des zones administratives appariées est utilisée en tant qu’ID principal dans l’outil Créer un localisateur. En conséquence, tous ces ID devraient être appariés.

Zone

ID de jointure de zone

Bloquer

ID de jointure d'îlot

Secteur

ID de jointure de secteur

Quartier

ID de jointure de quartier

Arrondissement

ID de jointure d'arrondissement

City

ID de jointure de ville

Métropole

ID de jointure de zone métropolitaine

Département

ID de jointure de département

Région

ID de jointure de région

Territoire

ID de jointure de territoire

Pays

ID de jointure de pays