Disponible con licencia de LocateXT.
La extensión ArcGIS LocateXT permite usar el panel Extraer ubicaciones para buscar datos no estructurados para ubicaciones espaciales y generar entidades de puntos que representan dichas ubicaciones.
Los datos no estructurados son cualquier texto o documento, incluyendo, entre otros, el contenido de páginas web, informes, correos electrónicos y redes sociales. Pueden procesarse los documentos de Microsoft Office (Word, PowerPoint y Excel), los documentos PDF de Adobe, los archivos de texto, etc. El panel Extraer ubicaciones puede procesar muchas carpetas y archivos a la vez, o escanear un disco completo. También puede arrastrar el texto de un correo electrónico o una página web al panel para analizarlo.
Cada punto en la clase de entidad de salida tiene contenido en la tabla de atributos que indica el archivo en el que se encontró la ubicación espacial. El texto alrededor de la ubicación espacial se extrae del documento original y se almacena en atributos para proporcionar un contexto a la ubicación. También se pueden extraer fechas y palabras clave asociadas con la ubicación. El panel Extraer ubicaciones no reconoce automáticamente el texto que representa una dirección como una ubicación espacial y, por lo tanto, no puede usar un localizador para producir el punto que represente esa ubicación.
Las capacidades proporcionas en el panel Extraer ubicaciones también están disponibles usando las herramientas de geoprocesamiento Extraer ubicaciones de un documento y Extraer ubicaciones de un texto.
Ejemplo de texto de formato libre
Si está revisando artículos de noticias sobre terremotos en Alaska y desea ver cada ubicación mencionada en un artículo en un mapa, el texto de entrada de muestra que figura a continuación se puede copiar y pegar directamente en el panel.
Texto de entrada
El promedio en Alaska es de 100 terremotos al día. La tectónica de la región está dominada por la interacción de las placas del Pacífico y de América del Norte. Esta interacción ha explicado tres de los terremotos más grandes registrados en la historia. El más grande, que midió 9,2 en la escala de Richter, ocurrió en Prince William Sound (60,91°N 147,34°O) el 28 de marzo de 1964. El segundo terremoto más grande de Alaska, que midió 8,7, ocurrió el 4 de febrero de 1965 cerca de las Islas Rata (51,25°N, 178,72°E). El tercero, que midió 8,6, ocurrió el 9 de marzo de 1957 cerca de las Islas Andreanof (51,50°N 175,63°O).
Entidades de salida
Una vez extraídas del texto de entrada las ubicaciones de los tres terremotos, la clase de entidad de salida aparece en el panel Contenido y los puntos son visibles en el mapa activo.
De forma predeterminada, las fechas encontradas en el texto de entrada y que se encuentren dentro de un periodo de tiempo relativamente reciente también se extraen y registran en la tabla de atributos de la clase de entidad de salida. Sin embargo, las fechas del texto de entrada anterior se encuentran dentro del rango de fechas predeterminado.
Nota:
Algunos formatos de coordenadas espaciales internaciones y formatos de fechas internacionales no se reconocen por defecto cuando se producen en el texto de entrada. Por ejemplo, sucede si una coordenada espacial utiliza abreviaturas de dirección traducidas a idiomas distintos del inglés, o si no se proporcionan fechas en formato ISO y se escriben en idiomas distintos del inglés. Estos ajustes se pueden personalizar para reconocer correctamente coordenadas y fechas en otros idiomas, ya sean distintos del inglés o además de este.
Ejemplo de texto semiestructurado
Además de reconocer las coordenadas espaciales, se pueden definir ubicaciones personalizadas que asocian un lugar con una coordenada espacial. Por ejemplo, si la palabra Portland se encuentra en cualquier parte de un documento, un punto que representa una ubicación en la ciudad puede asociarse con esa palabra. De manera similar, si se encuentra un código de aeropuerto, un punto que representa la ubicación del aeropuerto puede asociarse con ese código.
Algunos documentos tienen una cierta cantidad de estructura. Si dispone de una carpeta llena de formularios de viaje, se puede extraer de ellos la información y almacenarla en atributos personalizados en la tabla de atributos de la clase de entidad de salida. Por ejemplo, con un documento que contenga el texto de entrada que figura a continuación, se pueden definir atributos personalizados que extraigan texto siguiendo las etiquetas Nombre:, Dirección: y Finalidad del viaje:. Más tarde, los atributos se pueden procesar utilizando otras herramientas disponibles en ArcGIS Pro.
Texto de entrada
Nombre: Doe, Jane
Dirección: 380 New York St, Redlands, CA, 92373
Fecha: 2019-03-14
Destino: PDX
Finalidad del viaje: reunirse con el equipo en el Centro de I+D de Esri en 309 SW 6th Ave #600, Portland, OR, 97204.
Entidades de salida
Una vez extraídas del texto de entrada las ubicaciones personalizadas de Portland, la clase de entidad de salida aparece en el panel Contenido y los puntos son visibles en el mapa activo. Haga clic en las entidades para explorar la información extraída del documento. Para este ejemplo, las fechas se extraen y almacenan en la tabla de atributos. Los atributos personalizados también se usan para extraer texto desde el final de una etiqueta hasta el final de la línea y almacenar ese contenido en campos que representan el nombre y la dirección de la persona que viaja y el motivo del viaje. Para localizar las palabras clave que existen en el documento y almacenarlas en otro campo se utiliza un atributo personalizado adicional.
El contenido del campo Dirección de la tabla de atributos de la clase de entidad de salida puede geocodificarse utilizando otras herramientas (no se geocodifica automáticamente). De manera similar, la dirección almacenada en el texto de formato libre que describe la finalidad del viaje no se identifica automáticamente como dirección y se geocodifica.
Nota:
Si tiene datos de texto estructurados, como un archivo de texto delimitado por comas, donde las coordenadas x e y se almacenan en columnas separadas de la tabla, use la herramienta De tabla XY a punto para crear entidades de puntos que representen estas ubicaciones.