Refrescar conexión de big data (GeoAnalytics Desktop)

Resumen

Actualiza una conexión de big data (BDC) existente y registra cualquier dataset nuevo que se haya agregado a la ubicación de origen.

Uso

  • Esta herramienta requiere un BDC. Para crear un BDC, utilice la herramienta Crear conexión de big data.

  • Esta herramienta sirve para agregar uno o varios datasets nuevos a una conexión de big data existente. La herramienta también registrará los datasets que se hayan eliminado con la herramienta Quitar dataset desde conexión de big data. A continuación, se muestran ejemplos de cuándo utilizar esta herramienta:

    • Ha copiado una carpeta de datos en una carpeta de origen de BDC existente y quiere que se represente como un dataset en BDC.
    • Ha utilizado la herramienta Quitar dataset desde conexión de big data y quiere agregar de nuevo a BDC los datasets que ha eliminado.

  • Esta herramienta no actualiza las propiedades de dataset existente que se han editado con la herramienta Actualizar propiedades de dataset de conexión de big data. Todas las propiedades modificadas se mantendrán. En los escenarios siguientes se incluyen los flujos de trabajo recomendados:

  • Los mensajes de la herramienta incluirán la siguiente información sobre los datasets detectados y su estado:

    • Omitido: todos los datasets existentes se omiten durante la actualización y permanecen como están.
    • Correcto: se han descubierto y agregado datasets nuevos a BDC.
    • Con fallos: datasets que no se agregaron correctamente a BDC.

    Al descubrir datasets en su BDC, podrían surgir uno de los dos problemas siguientes:

    • Faltan los datasets que esperaba. En este caso, verifique que la ruta que especificó es una carpeta de origen que contiene subcarpetas, es correcta y corresponde a un tipo de datos admitido.
    • Uno o varios datasets no se registran. Si los datasets no se registran, observará una o varias de las siguientes consecuencias:

      ProblemaSoluciónEjemplo

      El dataset no presenta el formato esperado.

      Abra el archivo para comprobar si tiene el aspecto esperado. Si los datos no están estructurados correctamente, actualícelos e inténtelo de nuevo.

      Un archivo .csv contiene unas pocas líneas y un resumen de los datos, pero solo líneas vacías a partir de ese punto.

      Los esquemas de los datasets de una carpeta no coinciden.

      Todos los archivos de una carpeta de dataset deben tener el mismo esquema. Abra los archivos para comparar los esquemas. Resuelva cualquier discrepancia en los esquemas e intente registrar de nuevo el dataset.

      Tiene un archivo .csv con 10 campos y otro con 8.

      Los tipos de archivo de un dataset de una carpeta no coinciden.

      Todos los archivos de una carpeta de dataset deben tener la misma extensión (tipo de archivo). Compruebe los tipos de archivo de la ubicación de la fuente de datos y elimine o reubique cualquier archivo mal ubicado.

      Un dataset de shapefile está en la misma carpeta que un archivo PARQUET.

      Tiene un formato de campo no reconocido.

      Aunque es una situación improbable, puede ocurrir si el ORC y PARQUET utilizan un formato inesperado. Asegúrese de utilizar formatos de campo válidos.

      Tiene un archivo PARQUET con un formato de campo desconocido.

    Más información sobre por qué los datasets no se han podido agregar a un archivo BDC

  • Una vez que actualice un BDC, utilice la herramienta Describir dataset para verificar que el dataset actualizado tiene el aspecto esperado.

  • La herramienta Refrescar conexión de big data identifica los datasets nuevos. Las siguientes herramientas también se pueden utilizar para modificar un BDC:

  • Esta herramienta de geoprocesamiento se basa en Spark. Consulte Conexiones de big data para obtener más información sobre las conexiones de big data y cómo usarlas.

Sintaxis

RefreshBDC(bdc_file, {visible_geometry}, {visible_time})
ParámetroExplicaciónTipo de datos
bdc_file

Archivo BDC que se va a actualizar.

File
visible_geometry
(Opcional)

Especifica si los campos utilizados para identificar la geometría se incluirán (visible) como campos de análisis cuando el archivo BDC se utilice en otras herramientas de geoprocesamiento. Cuando los campos de geometría no están visibles, la geometría sigue aplicándose al dataset. La configuración de visibilidad de la geometría se puede modificar en el BDC.

  • GEOMETRY_VISIBLELos campos de geometría se incluirán como campos de análisis. Esta es la opción predeterminada.
  • GEOMETRY_NOT_VISIBLELos campos de geometría no se incluirán como campos de análisis.
Boolean
visible_time
(Opcional)

Especifica si los campos utilizados para indicar el tiempo se incluirán (visible) como campos de análisis cuando el archivo BDC se utilice en otras herramientas de geoprocesamiento. Cuando los campos de tiempo no están visibles, el tiempo sigue aplicándose al dataset. La configuración de visibilidad del tiempo se puede modificar en el BDC.

  • TIME_VISIBLELos campos de tiempo se incluirán como campos de análisis. Esta es la opción predeterminada.
  • TIME_NOT_VISIBLELos campos de tiempo no se incluirán como campos de análisis.
Boolean

Salida derivada

NombreExplicaciónTipo de datos
updated_bdc

Archivo .bdc de entrada con datasets actualizados.

Archivo

Muestra de código

RefreshBDC (script independiente)

En el siguiente script de Python se muestra cómo utilizar la función RefreshBDC.

# Name: RefreshBDC.py
# Description: Refreshes a big data connection to automatically discover datasets that 
#              have been added.
#
# Requirements: ArcGIS Pro Advanced License
# Import system modules
import arcpy
# Set local variables
bdcFile = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc"
# Execute Refresh Big Data Connection
arcpy.gapro.refreshBDC(bdcFile)

Entornos

Esta herramienta no utiliza ningún entorno de geoprocesamiento.

Información de licenciamiento

  • Basic: No
  • Standard: No
  • Advanced: Sí

Temas relacionados