Puede configurar, visualizar y utilizar las conexiones de big data (BDC) en el análisis.
Usar una BDC
Una vez que haya estructurado sus datos, puede hacer lo siguiente:
- Configurar una BDC
- Visualizar un dataset de BDC
- Usar datasets de la BDC en el análisis
Configurar una BDC
Para empezar a trabajar, necesita crear una BDC. Hay dos formas de crear una BDC:
- A través del cuadro de diálogo Nueva conexión de big data. Para acceder al cuadro de diálogo, en la cinta Insertar, haga clic en Conexiones y seleccione Nueva conexión de big data. El cuadro de diálogo ofrece una experiencia interactiva para crear una BDC y configurar las propiedades de cada dataset.
- Use la herramienta de geoprocesamiento Crear conexión de big data.
Al descubrir datasets en su BDC, podrían surgir uno de los dos problemas siguientes:
- Faltan los datasets que esperaba. En este caso, verifique que la ruta que especificó como una carpeta de origen que contiene subcarpetas es correcta y corresponde a un tipo de datos admitido.
- Uno o varios datasets no se registran. Si los datasets no se registran, observará una o varias de las siguientes consecuencias:
Problema Solución Ejemplo El dataset no presenta el formato esperado.
Abra el archivo para comprobar si tiene el aspecto esperado. Si los datos no están estructurados correctamente, actualícelos e inténtelo de nuevo.
Un archivo .csv contiene unas pocas líneas y un resumen de los datos, pero solo líneas vacías a partir de ese punto.
Los esquemas de los datasets de una carpeta no coinciden.
Todos los archivos de una carpeta de dataset deben tener el mismo esquema. Abra los archivos para comparar los esquemas. Resuelva cualquier discrepancia en los esquemas e intente registrar de nuevo el dataset.
Tiene un archivo .csv con 10 campos y otro con 8.
Los tipos de archivo de un dataset de una carpeta no coinciden.
Todos los archivos de una carpeta de dataset deben tener la misma extensión (tipo de archivo). Compruebe los tipos de archivo de la ubicación de la fuente de datos y elimine o reubique cualquier archivo mal ubicado.
Un dataset de shapefile está en la misma carpeta que un archivo PARQUET.
Tiene un formato de campo no reconocido.
Aunque es una situación improbable, puede ocurrir si el ORC y PARQUET utilizan un formato inesperado. Asegúrese de utilizar formatos de campo válidos.
Tiene un archivo PARQUET con un formato de campo desconocido.
Si crea una BDC utilizando un archivo delimitado y no ve filas de encabezado, es posible que tenga una fila de encabezado no válida. Asegúrese de que todos los campos tengan un encabezado y de que ninguno esté vacío. Si está utilizando el cuadro de diálogo para crear el recurso compartido de archivos de big data, puede actualizar los encabezados de los campos en el panel Campos. También puede actualizar los nombres de campos mediante la herramienta Actualizar propiedades del dataset de conexión de big data.
Al crear una BDC, se descubre el esquema, la geometría y el tiempo de cada uno de sus datasets. A menudo, hay cambios que puede hacer en la forma en que los datasets representan estos valores. Para verificar que cada dataset representa correctamente la geometría, el tiempo y los campos, utilice la herramienta de geoprocesamiento Describir dataset. Por ejemplo, al revisar sus datasets, quizá desee hacer uno o varios de los siguientes cambios en uno o varios datasets de su BDC:
- Cambie los nombres de los campos de los datasets delimitados.
- Modifique qué campos son visibles para el análisis.
- Cambie los campos utilizados para representar la geometría o el tiempo.
- Agregue un filtro a un dataset.
- Agregue un alias a un dataset.
- Elimine los datasets de la BDC que no le interese analizar.
- Refresque la BDC para incluir un dataset recién agregado (una nueva subcarpeta dentro de la carpeta de origen).
Para realizar estos cambios opcionales, puede utilizar el cuadro de diálogo Nueva conexión de big datao cualquier combinación de las siguientes herramientas:
- Copiar dataset a partir de la conexión de big data: copia un dataset de una BDC en una clase de entidad.
- Duplicar dataset desde conexión de big data: crea una vista de un dataset de BDC existente.
- Refrescar conexión de big data: comprueba si hay datasets nuevos y los agrega a la BDC.
- Quitar dataset desde conexión de big data: elimina un dataset de la BDC.
- Actualizar propiedades de dataset de conexión de big data: modifica las propiedades de un dataset de BDC individual.
- Vista previa de dataset desde conexión de big data: muestra una vista previa de las diez primeras entidades del dataset para verificar que se han registrado correctamente.
- Describir dataset: verifica que el dataset tiene el aspecto esperado.
Visualizar un dataset de BDC
Los datasets de BDC basados en shapefiles y delimitados se pueden visualizar en un mapa.
Nota:
Los datasets de BDC que utilizan archivos fuente PARQUET y ORC no se pueden visualizar.Para agregar su dataset al mapa, ubique el elemento de BDC en el panel Catálogo, haga clic para expandir los datasets y agregue el dataset al mapa.
Los datasets de BDC ofrecen una experiencia simplificada en el mapa y tienen las siguientes limitaciones:
- Al visualizar datasets de BDC, las propiedades de tiempo en las propiedades del dataset de BDC no se establecen automáticamente en la nueva capa. Para visualizar el dataset con tiempo, establezca las propiedades de tiempo de la capa después de agregar el dataset al mapa.
- Al dibujar archivos delimitados, se acercará a la extensión completa de la referencia espacial del dataset de BDC.
- Si agrega nuevos registros a un dataset de BDC existente, por ejemplo, al agregar nuevas filas a un archivo CSV en una BDC existente, los nuevos registros no se dibujarán hasta que se reinicie ArcGIS Pro.
- Si agrega nuevos archivos a un dataset de BDC existente, por ejemplo, al agregar un nuevo archivo CSV a un dataset de BDC existente, los nuevos registros no se dibujarán hasta que se reinicie ArcGIS Pro.
Usar datasets de la BDC en el análisis
Al utilizar datasets de BDC como entrada para las herramientas de GeoAnalytics Desktop, el análisis se optimiza para leer los datos y ejecutarse en paralelo entre los núcleos de su equipo. Para el resto de herramientas de geoprocesamiento, la lectura y el procesamiento del dataset de BDC no están optimizados para ejecutarse en paralelo, sino que son secuenciales y de subproceso único.
Los datasets de BDC basados en archivos delimitados o shapefiles se pueden utilizar en la mayoría de las herramientas de geoprocesamiento.
Nota:
Los datasets de BDC que utilizan archivos fuente PARQUET y ORC solo se pueden utilizar en las herramientas de GeoAnalytics Desktop.No se puede aplicar una selección a un dataset de BDC cuando se utiliza como entrada para una herramienta de GeoAnalytics Desktop.
Para utilizar un dataset de BDC en una herramienta de geoprocesamiento, agregue un dataset de BDC a un mapa y seleccione el nombre de la capa en la lista de opciones de parámetros, o utilice el botón Examinar para examinar un espacio de trabajo de BDC y seleccione el dataset de entrada. Las siguientes herramientas no admiten los archivos de BDC de entrada:
- Herramientas basadas en servicios, entre ellas, GeoAnalytics Server, el análisis de entidades estándar y las herramientas de análisis de ArcGIS Online
- Herramientas que modifican el dataset de entrada, como Calcular campo y Cercano