Resumen
Actualiza una conexión de big data (BDC) existente y registra cualquier dataset nuevo que se haya agregado a la ubicación de origen.
Uso
Esta herramienta requiere un BDC. Para crear un BDC, utilice la herramienta Crear conexión de big data.
Esta herramienta sirve para agregar uno o varios datasets nuevos a una conexión de big data existente. La herramienta también registrará los datasets que se hayan eliminado con la herramienta Quitar dataset desde conexión de big data. A continuación, se muestran ejemplos de cuándo utilizar esta herramienta:
- Ha copiado una carpeta de datos en una carpeta de origen de BDC existente y quiere que se represente como un dataset en BDC.
- Ha utilizado la herramienta Quitar dataset desde conexión de big data y quiere agregar de nuevo a BDC los datasets que ha eliminado.
Esta herramienta no actualiza las propiedades de dataset existente que se han editado con la herramienta Actualizar propiedades de dataset de conexión de big data. Todas las propiedades modificadas se mantendrán. En los escenarios siguientes se incluyen los flujos de trabajo recomendados:
- Ha modificado el esquema de un dataset de origen existente: utilice la herramienta Actualizar propiedades de dataset de conexión de big data para modificar los campos. También puede utilizar la herramienta Quitar dataset desde conexión de big data para eliminar el dataset y la herramienta Refrescar conexión de big data si no existen modificaciones en el dataset de BDC que desee mantener.
- Ha agregado archivos nuevos a un dataset existente: no se requieren pasos adicionales. Al ejecutar una herramienta de geoprocesamiento para analizar los datos de BDC, todos los archivos del dataset de BDC se incluirán para análisis.
- Ha eliminado un dataset existente: utilice la herramienta Quitar dataset desde conexión de big data para eliminar el dataset de BDC.
Los mensajes de la herramienta incluirán la siguiente información sobre los datasets detectados y su estado:
- Omitido: todos los datasets existentes se omiten durante la actualización y permanecen como están.
- Correcto: se han descubierto y agregado datasets nuevos a BDC.
- Con fallos: datasets que no se agregaron correctamente a BDC.
Al descubrir datasets en su BDC, podrían surgir uno de los dos problemas siguientes:
- Faltan los datasets que esperaba. En este caso, verifique que la ruta que especificó es una carpeta de origen que contiene subcarpetas, es correcta y corresponde a un tipo de datos admitido.
- Uno o varios datasets no se registran. Si los datasets no se registran, observará una o varias de las siguientes consecuencias:
Problema Solución Ejemplo El dataset no presenta el formato esperado.
Abra el archivo para comprobar si tiene el aspecto esperado. Si los datos no están estructurados correctamente, actualícelos e inténtelo de nuevo.
Un archivo .csv contiene unas pocas líneas y un resumen de los datos, pero solo líneas vacías a partir de ese punto.
Los esquemas de los datasets de una carpeta no coinciden.
Todos los archivos de una carpeta de dataset deben tener el mismo esquema. Abra los archivos para comparar los esquemas. Resuelva cualquier discrepancia en los esquemas e intente registrar de nuevo el dataset.
Tiene un archivo .csv con 10 campos y otro con 8.
Los tipos de archivo de un dataset de una carpeta no coinciden.
Todos los archivos de una carpeta de dataset deben tener la misma extensión (tipo de archivo). Compruebe los tipos de archivo de la ubicación de la fuente de datos y elimine o reubique cualquier archivo mal ubicado.
Un dataset de shapefile está en la misma carpeta que un archivo PARQUET.
Tiene un formato de campo no reconocido.
Aunque es una situación improbable, puede ocurrir si el ORC y PARQUET utilizan un formato inesperado. Asegúrese de utilizar formatos de campo válidos.
Tiene un archivo PARQUET con un formato de campo desconocido.
Más información sobre por qué los datasets no se han podido agregar a un archivo BDC
Una vez que actualice un BDC, utilice la herramienta Describir dataset para verificar que el dataset actualizado tiene el aspecto esperado.
La herramienta Refrescar conexión de big data identifica los datasets nuevos. Las siguientes herramientas también se pueden utilizar para modificar un BDC:
- Copiar dataset desde conexión de big data: permite copiar un dataset de BDC en una clase de entidad.
- Duplicar dataset desde conexión de big data: permite crear una vista de un dataset de BDC existente.
- Quitar dataset desde conexión de big data: permite eliminar un dataset de BDC.
- Actualizar propiedades de dataset de conexión de big data: permite modificar las propiedades de un dataset de BDC individual.
- Previsualizar dataset desde conexión de big data: permite mostrar una vista previa de las diez primeras entidades del dataset para verificar que se han registrado correctamente.
- Describir dataset: permite verificar que el dataset tiene el aspecto previsto.
Esta herramienta de geoprocesamiento se basa en Spark. Consulte Conexiones de big data para obtener más información sobre las conexiones de big data y cómo usarlas.
Sintaxis
RefreshBDC(bdc_file, {visible_geometry}, {visible_time})
Parámetro | Explicación | Tipo de datos |
bdc_file | Archivo BDC que se va a actualizar. | File |
visible_geometry (Opcional) | Especifica si los campos utilizados para identificar la geometría se incluirán (visible) como campos de análisis cuando el archivo BDC se utilice en otras herramientas de geoprocesamiento. Cuando los campos de geometría no están visibles, la geometría sigue aplicándose al dataset. La configuración de visibilidad de la geometría se puede modificar en el BDC.
| Boolean |
visible_time (Opcional) | Especifica si los campos utilizados para indicar el tiempo se incluirán (visible) como campos de análisis cuando el archivo BDC se utilice en otras herramientas de geoprocesamiento. Cuando los campos de tiempo no están visibles, el tiempo sigue aplicándose al dataset. La configuración de visibilidad del tiempo se puede modificar en el BDC.
| Boolean |
Salida derivada
Nombre | Explicación | Tipo de datos |
updated_bdc | Archivo .bdc de entrada con datasets actualizados. | Archivo |
Muestra de código
En el siguiente script de Python se muestra cómo utilizar la función RefreshBDC.
# Name: RefreshBDC.py
# Description: Refreshes a big data connection to automatically discover datasets that
# have been added.
#
# Requirements: ArcGIS Pro Advanced License
# Import system modules
import arcpy
# Set local variables
bdcFile = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc"
# Execute Refresh Big Data Connection
arcpy.gapro.refreshBDC(bdcFile)
Entornos
Información de licenciamiento
- Basic: No
- Standard: No
- Advanced: Sí