El cuadro de diálogo Nueva conexión de big data es una experiencia única y guiada que permite conectarse a los datasets y definir de forma flexible propiedades como la hora y la geometría. El cuadro de diálogo Nueva conexión de big data simplifica y agiliza la preparación de los datos al eliminar los flujos de trabajo que consumen mucho tiempo, como el cálculo de la geometría, la aplicación de formato a los campos o la combinación de datasets. El cuadro de diálogo de conexión de big data permite hacer lo siguiente:
- Conectar con los datos y crear una conexión de big data.
- Editar el dataset de la conexión de big data.
- Obtener una vista previa de los datasets.
Para acceder al cuadro de diálogo de Nueva conexión de big data, en la pestaña Insertar, en el grupo Proyecto, haga clic en la flecha desplegable de Conexiones y haga clic en Nueva conexión de big data .
La creación de una conexión de big data consta de tres pasos:
- Conectar con la conexión de big data.
- Configurar los datasets de la conexión de big data.
- Revisar la conexión de big data.
Conectarse
La conexión a una conexión de big data requiere un nombre para la conexión, y una ruta a una carpeta de datasets. Una vez que haya rellenado el nombre de la conexión de big data y la carpeta de origen, haga clic en Crear conexión para establecer una conexión con la carpeta de origen. Esto devuelve los datasets correctos e incorrectos. Revise los datasets para asegurarse de que tienen el aspecto esperado y resuelva cualquier problema. Si los datasets tienen el aspecto esperado, haga clic en Siguiente.
Más información sobre por qué un dataset de conexión de big data fue incorrecto
Configurar
Al configurar su conexión de big data, puede realizar las siguientes operaciones en cualquier dataset:
- Duplicar: duplicar la referencia a un dataset, para que sea posible registrarlo de varias maneras.
- Eliminar: eliminar la referencia al dataset.
- Editar propiedades: modificar la hora, la geometría, los campos, la configuración de los archivos y los filtros de un dataset.
- Previsualizar: visualizar una vista previa del dataset registrado.
Para acceder a estas opciones, seleccione un dataset, haga clic en uno de los botones o haga clic con el botón derecho del ratón y elija una de las opciones. La edición y la visualización de la vista previa se describen con más detalle a continuación.
Cuando se crea una conexión de big data, es importante asegurarse de que está correctamente referenciada. Para asegurarse de que funciona como se espera, utilice la opción de vista previa para ver una muestra de los datos y observe las propiedades configuradas para asegurarse de que coinciden con sus expectativas.
Editar propiedades
La edición de las propiedades permite modificar la representación de una conexión de big data. Puede modificar cinco propiedades diferentes en función del tipo de datos de origen:
- Campos: modificar los nombres y tipos de campo para los archivos delimitados.
- Hora: definir cómo se representan la fecha y la hora especificando los campos de fecha y hora, los formatos y la zona horaria.
- Geometría: definir cómo se representa la geometría especificando el tipo de geometría, los campos utilizados para representar la geometría y la referencia espacial.
- Archivo: definir el formato de archivo para los archivos delimitados.
- Filtrar: aplicar un filtro para utilizar un subconjunto del dataset.
Previsualización
La vista previa muestra los primeros 10 registros de un dataset. Previsualice un dataset después de descubrirlo o de haber editado las propiedades. Verifique que los campos y valores tienen el aspecto esperado.
Nota:
La vista previa no muestra el registro de la geometría. Para verificar que la geometría y la hora tienen el aspecto esperado, utilice la herramienta Describir dataset en su conexión de big data.
Revisión
Revise la ubicación de salida de su conexión de big data, la carpeta de origen a la que se ha conectado y los datasets que se han descubierto. Vuelva al panel Configurar para realizar cambios.
Finalizar
Después de configurar su conexión de big data, haga clic en el botón Finalizar para concluir. El archivo de la conexión de big data (.bdc) se crea en la carpeta de inicio del proyecto.