Disponible avec une licence LocateXT.
L’extension ArcGIS LocateXT permet d’utiliser la fenêtre Extract Locations (Extraire les emplacements) pour rechercher des emplacements spatiaux dans des données non structurées et générer des entités ponctuelles représentant ces emplacements.
Les données non structurées désignent tout texte ou document incluant, sans que cela soit limitatif, des pages web, des rapports, des messages électroniques, du contenu issu des réseaux sociaux, etc. Les documents Microsoft Office (Word, PowerPoint et Excel), les fichiers PDF Adobe, les fichiers texte, entres autres, peuvent tous être traités. La fenêtre Extract Locations (Extraire les emplacements) est en mesure de traiter de nombreux dossiers et fichiers en une seule opération ou encore d’analyser l’intégralité du disque. Vous pouvez également faire glisser du texte depuis un message électronique ou une page web et le déposer dans la fenêtre pour l’analyser.
Chaque point dans la classe d’entités en sortie possède un contenu dans la table attributaire qui indique le fichier dans lequel se trouve l’emplacement spatial. Le texte entourant l’emplacement spatial est extrait du document d’origine et stocké dans les attributs afin de délivrer le contexte de l’emplacement. Il est également possible d’extraire les dates et les mots-clés associés à l’emplacement. La fenêtre Extract Locations (Extraire les emplacements) ne reconnaît pas automatiquement le texte désignant une adresse en tant qu’emplacement spatial et, par conséquence, ne peut pas utiliser un localisateur pour produire un point représentant cet emplacement.
Les fonctionnalités fournies dans la fenêtre Extract Locations (Extraire les emplacements) sont également disponibles via les outils de géotraitement Extract Locations From Document (Extraire les emplacements du document) et Extract Locations From Text (Extraire les emplacements du texte).
Exemple de texte libre
Si vous consultez des articles sur les tremblements de terre en Alaska et que vous souhaitez visualiser sur une carte chaque emplacement mentionné dans un article, vous pouvez copier et coller l’exemple de texte en entrée ci-dessous directement dans la fenêtre.
Texte en entrée
L’Alaska connaît en moyenne 100 tremblements de terre chaque jour. La tectonique de la région est dominée par l’interaction des plaques pacifique et nord-américaine. Cette interaction est responsable de trois des plus importants tremblements de terre jamais enregistrés au cours de l’histoire. Le plus puissant, d’une magnitude de 9,2 sur l’échelle de Richter, s’est produit dans la baie du Prince-William (60,91°N, 147,34°O) le 28 mars 1964. Le deuxième tremblement de terre le plus fort survenu en Alaska, d’une magnitude de 8,7, a eu lieu le 4 février 1965, à proximité des îles Rat (51,25°N, 178,72°E). Le troisième, d’une magnitude de 8,6, s’est produit le 9 mars 1957 près des îles Andreanof (51,50°N, 175,63°O).
Entités en sortie
Une fois que les emplacements des trois tremblements de terre ont été extraits du texte en entrée, la classe d’entités en sortie apparaît dans la fenêtre Contents (Contenu) et les points sont visibles dans la carte active.
Par défaut, toute date relativement récente trouvée dans le texte en entrée est également extraite et enregistrée dans la table attributaire de la classe d’entités en sortie. Les dates dans le texte en entrée ci-dessus ne sont toutefois pas comprises dans la plage de dates par défaut.
Remarque :
Certains formats de coordonnées spatiales internationaux et certains formats de date internationaux ne sont pas reconnus par défaut lorsqu’ils se trouvent dans le texte en entrée. Ceci est le cas par exemple lorsque des coordonnées spatiales utilisent des abréviations d’adresses traduites dans d’autres langues que l’anglais, et quand les dates ne sont pas fournies au format ISO mais rédigées dans une langue autre que l’anglais. Les paramètres peuvent être personnalisés afin de reconnaître correctement les coordonnées et les dates dans d’autres langues, à la place ou en plus de l’anglais.
Exemple de texte semi-structuré
Outre la reconnaissance des coordonnées spatiales, vous pouvez définir des emplacements personnalisés pour associer un lieu à des coordonnées spatiales. Si, par exemple le mot Portland est trouvé dans un document, un point représentant un emplacement dans la ville peut être associé à ce mot. De même, si le code d’un aéroport est trouvé, un point représentant l’emplacement de l’aéroport en question peut être associé à ce code.
Certains documents possèdent une structure plus ou moins développée. Si vous détenez un dossier rempli de formulaires de voyage, il est possible d’en extraire des informations et de stocker celles-ci dans les attributs personnalisés au sein de la table attributaire de la classe d’entités en sortie. Par exemple, avec un document contenant le texte en entrée mentionné ci-dessous, vous pouvez définir les attributs personnalisés pour extraire le texte selon les étiquettes Name: (Nom :), Address: (Adresse :) et Purpose of travel: (But du voyage :). Par la suite, les attributs sont traités au moyen d’autres outils disponibles dans ArcGIS Pro.
Texte en entrée
Name: Doe, Jane (Nom : Doe, Jane)
Address: 380 New York St, Redlands, CA, 92373 (Adresse : 380 New York St, Redlands, CA, 92373, États-Unis)
Date : 2019-03-14
Destination : PDX
Purpose of travel: Meet with the team at the Esri R&D Center at 309 SW 6th Ave #600, Portland, OR, 97204. (But du voyage : Rendez-vous avec l’équipe Esri R&D Center au 309 SW 6th Ave #600, Portland, OR, 97204, États-Unis)
Entités en sortie
Une fois que les emplacements personnalisés dans Portland ont été extraits du texte en entrée, la classe d’entités en sortie apparaît dans la fenêtre Contents (Contenu) et les points sont visibles dans la dans la carte active. Cliquez sur les entités pour explorer les informations extraites du document. Dans cet exemple, les dates sont extraites et stockées dans la table attributaire. Les attributs personnalisés sont également utilisés pour extraire le texte depuis la fin d’une étiquette jusqu’à la fin de la ligne et pour stocker ce contenu dans les champs désignant le nom et l’adresse du voyageur ainsi que la raison de son voyage. Tout autre attribut personnalisé permet de localiser un mot-clé figurant dans le document et de le stocker dans un autre champ.
Le contenu du champ d’adresse dans la table attributaire de la classe d’entités en sortie peut être géocodé à l’aide d’autres outils ; il n’est pas géocodé de façon automatique. De la même manière, l’adresse stockée dans le texte libre décrivant le but du voyage n’est pas automatiquement identifiée comme une adresse et géocodée.
Remarque :
Si vous possédez des données textuelles structurées (un fichier de texte dont les valeurs sont séparées par des virgules, par exemple) dans lesquelles les coordonnées x et y sont stockées dans des colonnes séparées de la table, utilisez l’outil Table XY vers points pour créer des entités ponctuelles représentant ces emplacements.
Rubriques connexes
Vous avez un commentaire à formuler concernant cette rubrique ?