Actualizar propiedades de dataset de conexión de big data (GeoAnalytics Desktop)

Resumen

Actualiza las propiedades de un dataset de conexión de big data (BDC). Esta herramienta modifica la configuración de campo, geometría, tiempo y archivo de un dataset de BDC específico.

Uso

  • Esta herramienta requiere un BDC. Para crear una BDC, utilice el cuadro de diálogo Nueva conexión de big data o la herramienta Crear conexión de big data.

  • Utilice esta herramienta para modificar el tiempo, la geometría o el esquema de dataset de BDC para el uso en análisis o visualización en situaciones como la siguiente:

    • El dataset de CSV se ha registrado con todos los campos de tipo de cadena de caracteres y desea configurar los campos como numéricos para el uso en análisis.
    • El dataset de BDC tiene valores de atributo para dos ubicaciones separadas, como paradas de taxi donde se recoge y se deja a la gente, y desea cambiar la geometría que va a utilizar durante el análisis.
    • El flujo de trabajo requiere configurar el tiempo en la capa de entrada.
    • Desea compartir un dataset de BDC con un compañero que solo está interesado en un subconjunto de entidades, por lo que agrega una expresión de consulta de definición y oculta algunos campos que no se utilizan.

  • Puede modificar las siguientes propiedades:

    • Consulta de definición: expresión utilizada para limitar las entidades empleadas en el análisis.
    • Campos: nombre de campo, tipo de campo y visibilidad.
    • Geometría: cómo se representa la geometría. No son editables para shapefiles.
    • Tiempo: cómo se representa el tiempo.
    • Archivo: las propiedades de archivo utilizadas para leer el dataset.

  • Utilice el cuadro de diálogo Nueva conexión de big data para disfrutar de una experiencia simplificada para crear, editar y obtener una vista previa de una conexión de big data.

  • Especifique el dataset de BDC con las propiedades que quiera modificar utilizando el parámetro Dataset de conexión de big data. Puede ir al dataset o especificarlo mediante el uso de una ruta de acceso, como c:\<path>\MyBDC.bdc\<dataset_name>, por ejemplo, c:\MyBDCFolder\MyBDC.bdc\earthquakes_dataset.

  • Defina una expresión para limitar las entidades utilizadas en el análisis por medio del parámetro Expresión. El procedimiento para agregar un filtro a un dataset de BDC es similar a aplicar una consulta de definición a un dataset del mapa: se especifica una expresión SQL para filtrar las entidades de interés.

  • Puede actualizar el tipo de campo correspondiente a archivos delimitados. No se puede actualizar el tipo de campo de otras fuentes de datos (como archivos ORC, de parquet y shapefiles).

  • Puede modificar la geometría de archivos delimitados, ORC y de parquet. No puede modificar la geometría de un dataset con origen en un shapefile.

  • En la tabla siguiente se explica cómo especificar formatos de tiempo para los parámetros Hora inicial y Hora final al editar un dataset de BDC. Los ejemplos muestran cómo se representa la hora 9:45:02.05 PM del 2 de enero de 2016.

    Formatos de tiempo en conexiones de big data

    SímboloSignificadoEjemplo

    yy

    El año, representado por dos dígitos.

    16

    yyyy

    El año, representado por cuatro dígitos.

    2016

    MM

    El mes, representado numéricamente.

    01 o 1

    MMM

    El mes, representado con tres letras.

    Jan

    MMMM

    El mes, representado con el nombre completo.

    January

    dd

    El día.

    02 o 2

    HH

    La hora usando un día de 24 horas; valores entre 0 y 23.

    21

    hh

    La hora usando un día de 12 horas; valores entre 1 y 12.

    9

    mm

    Los minutos; valores entre 0 y 59.

    45

    ss

    Los segundos; valores entre 0 y 59.

    02

    SSS

    Los milisegundos; valores entre 0 y 999.

    50

    a

    Marcador AM/PM.

    PM

    epoch_millis

    El tiempo en milésimas de segundo desde epoch.

    1509581781000

    epoch_seconds

    El tiempo en segundos desde epoch.

    1509747601

    Z

    El desplazamiento de zona horaria expresado en horas.

    -0100 o -01:00

    ZZZ

    El desplazamiento de zona horaria expresado mediante Id.

    America/Los_Angeles

    ''

    Use comillas simples para agregar texto que no represente un valor descrito en esta tabla.

    'T'

    En la siguiente tabla se muestran ejemplos de distintos formatos de la misma fecha, 2 de enero de 2016 a las 9:45:02.05 PM:

    Ejemplos de formato de tiempo

    Fecha de entradaFormato de fecha

    01/02/2016 9:45:02PM

    MM/dd/aaaa hh:mm:ssa

    Ene02-16 21:45:02

    MMMdd-aa HH:mm:ss

    2 de enero 2016 9:45:02.050PM

    MMMM dd aaaa hh:mm:ss.SSSa

    01/02/2017T9:45:14:05-0000

    MM/dd/yyyy'T'HH:mm:ssZ

    You can specify the time zone using one of the following:
    • El nombre completo de la zona horaria: Pacific Standard Time
    • Desplazamiento de zona horaria expresado en horas: -0100 o -01:00
    • Abreviatura UTC o GMT
  • Puede modificar las siguientes propiedades de un archivo delimitado:

    • Delimitador de campo: delimitador de cada campo. Los delimitadores comunes son , y ;.
    • Terminador de registro: terminador de cada fila de datos. Los terminadores comunes son \n y \t.
    • Carácter de comillas: carácter usado para las comillas en el dataset de origen.
    • Tiene fila de encabezado: valor verdadero o falso que indica si el dataset de origen incluye encabezados. Si se incluye una fila de encabezado en el dataset, los encabezados se usarán para los nombres de campo.
    • Codificación: tipo de codificación utilizado por el dataset de origen. El valor predeterminado es UTF -8.

  • La herramienta Actualizar propiedades de dataset de conexión de big data actualiza las propiedades de un dataset individual. Para modificar un BDC, utilice las herramientas siguientes:

  • El archivo BDC también se puede modificar de forma manual. El archivo .bdc siempre debería modificarse manualmente en las situaciones siguientes:

    • Está utilizando uno o varios campos para representar la ubicación x-, y- o z-.
    • Desea actualizar la ruta de origen.

    Más información sobre la asignación de formato a archivos de conexiones de big data.

  • Esta herramienta de geoprocesamiento se basa en Spark. Consulte Conexiones de big data para obtener más información sobre las conexiones de big data y cómo usarlas.

Parámetros

EtiquetaExplicaciónTipo de datos
Dataset de conexión de big data

Dataset de BDC que se va a actualizar. Las opciones de edición variarán dependiendo de los datos de origen (shapefile, archivo delimitado, ORC o archivo de parquet).

Table View
Expresión
(Opcional)

Expresión utilizada para limitar las entidades que se usarán en el análisis.

SQL Expression
Propiedades del campo
(Opcional)

Especifica los nombres y propiedades de campo que se van a modificar.

Especifica si los campos estarán visibles u ocultos.

  • Activado: los campos estarán visibles y disponibles para el uso en las herramientas de geoprocesamiento. Esta es la opción predeterminada.
  • Desactivado: los campos estarán ocultos y no se pueden utilizar como entrada en las herramientas de geoprocesamiento.

  • CortoEl campo será de tipo corto.
  • LargoEl campo será de tipo largo
  • DobleEl campo será de tipo doble.
  • FlotanteEl campo será de tipo flotante.
  • CadenaEl campo será de tipo cadena de caracteres.
  • FechaEl campo será de tipo fecha.
  • BLOBEl campo será de tipo BLOB.
Value Table
Tipo de geometría
(Opcional)

Especifica el tipo de geometría que se utilizará para representar espacialmente el dataset. La geometría no se puede modificar para datasets con origen en shapefile.

  • PuntoEl tipo de geometría es punto.
  • PolilíneaEl tipo de geometría es polilínea.
  • PolígonoEl tipo de geometría es polígono.
  • NadaNingún tipo de geometría.
String
Referencia espacial
(Opcional)

Valor de WKID o cadena de caracteres de WKT que se utilizará para la referencia espacial del dataset. El valor predeterminado es WKID 4326 (WGS84). La geometría no se puede modificar para datos con origen en shapefile.

String
Tipo de formato de geometría
(Opcional)

Especifica cómo se formateará la geometría. La geometría no se puede modificar para datos con origen en shapefile.

  • XYZDos o más campos representarán x, y y, opcionalmente, z.
  • WKTLa geometría estará representada por un único campo en un campo de texto conocido.
  • WKBLa geometría estará representada por un único campo en un campo binario conocido.
  • GeoJSONLa geometría estará representada por un único campo en formato GeoJSON.
  • EsriJSONLa geometría estará representada por un único campo en formato EsriJSON.
String
Campo Geometría
(Opcional)

Campo único utilizado para representar la geometría. Este campo se utiliza cuando el formato de geometría es WKT, WKB, GeoJSON o EsriJSON.

String
Campo X
(Opcional)

Campo único utilizado para representar la ubicación x. Si tiene más de un campo que representa la ubicación x, modifique el archivo .bdc manualmente.

String
Campo Y
(Opcional)

Campo utilizado para representar la ubicación y. Si tiene más de un campo que representa la ubicación y, modifique el archivo .bdc manualmente.

String
Campo Z
(Opcional)

Campo utilizado para representar la ubicación z. Si tiene más de un campo que representa la ubicación z, modifique el archivo .bdc manualmente.

String
Tipo de hora
(Opcional)

Especifica el tipo de tiempo utilizado para representar temporalmente el dataset.

  • IntervaloEl tipo de tiempo representará una duración con hora inicial y final.
  • InstanteEl tipo de tiempo representará un instante en el tiempo.
  • NadaEl tiempo no está habilitado.
String
Zona horaria
(Opcional)

Zona horaria del dataset.

String
Hora de inicio
(Opcional)

Campos utilizados para definir la hora de inicio y el formato de tiempo.

Value Table
Hora de finalización
(Opcional)

Campos utilizados para definir la hora de finalización y el formato de tiempo.

Value Table
Extensión de archivo
(Opcional)

Extensión de archivo del dataset de origen. El valor del parámetro no se puede modificar.

String
Delimitador de campo
(Opcional)

Delimitador de campo utilizado en el dataset de origen.

String
Terminador de registro
(Opcional)

Terminador de registro utilizado en el dataset de origen.

String
Carácter de comillas
(Opcional)

Carácter de comillas utilizado en el dataset de origen.

String
Tiene fila de encabezado
(Opcional)

Especifica si el dataset de origen incluye una fila de encabezado.

  • Activado: el dataset de origen incluye una fila de encabezado.
  • Desactivado: el dataset de origen no incluye una fila de encabezado.

Boolean
Codificación
(Opcional)

Tipo de codificación utilizado por el dataset de origen. Es UTF-8 de manera predeterminada.

String

Salida derivada

EtiquetaExplicaciónTipo de datos
BDC actualizado

Archivo BDC actualizado con las propiedades editadas aplicadas al dataset especificado.

File

arcpy.gapro.UpdateBDCDatasetProperties(bdc_dataset, {expression}, {field_properties}, {geometry_type}, {spatial_reference}, {geometry_format_type}, {geometry_field}, {x_field}, {y_field}, {z_field}, {time_type}, {time_zone}, {start_time_format}, {end_time_format}, {file_extension}, {field_delimiter}, {record_terminator}, {quote_character}, {has_header_row}, {encoding})
NombreExplicaciónTipo de datos
bdc_dataset

Dataset de BDC que se va a actualizar. Las opciones de edición variarán dependiendo de los datos de origen (shapefile, archivo delimitado, ORC o archivo de parquet).

Table View
expression
(Opcional)

Expresión utilizada para limitar las entidades que se usarán en el análisis.

SQL Expression
field_properties
[field_properties,...]
(Opcional)

Especifica los nombres y propiedades de campo que se van a modificar.

  • SHORTEl campo será de tipo corto.
  • LONGEl campo será de tipo largo
  • DOUBLEEl campo será de tipo doble.
  • FLOATEl campo será de tipo flotante.
  • STRINGEl campo será de tipo cadena de caracteres.
  • DATEEl campo será de tipo fecha.
  • BLOBEl campo será de tipo BLOB.

Especifica si los campos estarán visibles u ocultos.

  • TRUELos campos estarán visibles y disponibles para el uso en las herramientas de geoprocesamiento. Esta es la opción predeterminada.
  • FALSELos campos estarán ocultos y no se pueden utilizar como entrada en las herramientas de geoprocesamiento.
Value Table
geometry_type
(Opcional)

Especifica el tipo de geometría que se utilizará para representar espacialmente el dataset. La geometría no se puede modificar para datasets con origen en shapefile.

  • POINTEl tipo de geometría es punto.
  • LINEEl tipo de geometría es polilínea.
  • POLYGONEl tipo de geometría es polígono.
  • NONENingún tipo de geometría.
String
spatial_reference
(Opcional)

Valor de WKID o cadena de caracteres de WKT que se utilizará para la referencia espacial del dataset. El valor predeterminado es WKID 4326 (WGS84). La geometría no se puede modificar para datos con origen en shapefile.

String
geometry_format_type
(Opcional)

Especifica cómo se formateará la geometría. La geometría no se puede modificar para datos con origen en shapefile.

  • XYZDos o más campos representarán x, y y, opcionalmente, z.
  • WKTLa geometría estará representada por un único campo en un campo de texto conocido.
  • WKBLa geometría estará representada por un único campo en un campo binario conocido.
  • GEOJSONLa geometría estará representada por un único campo en formato GeoJSON.
  • ESRIJSONLa geometría estará representada por un único campo en formato EsriJSON.
String
geometry_field
(Opcional)

Campo único utilizado para representar la geometría. Este campo se utiliza cuando el formato de geometría es WKT, WKB, GeoJSON o EsriJSON.

String
x_field
(Opcional)

Campo único utilizado para representar la ubicación x. Si tiene más de un campo que representa la ubicación x, modifique el archivo .bdc manualmente.

String
y_field
(Opcional)

Campo utilizado para representar la ubicación y. Si tiene más de un campo que representa la ubicación y, modifique el archivo .bdc manualmente.

String
z_field
(Opcional)

Campo utilizado para representar la ubicación z. Si tiene más de un campo que representa la ubicación z, modifique el archivo .bdc manualmente.

String
time_type
(Opcional)

Especifica el tipo de tiempo utilizado para representar temporalmente el dataset.

  • INTERVALEl tipo de tiempo representará una duración con hora inicial y final.
  • INSTANTEl tipo de tiempo representará un instante en el tiempo.
  • NONEEl tiempo no está habilitado.
String
time_zone
(Opcional)

Zona horaria del dataset.

String
start_time_format
[start_time_format,...]
(Opcional)

Campos utilizados para definir la hora de inicio y el formato de tiempo.

Value Table
end_time_format
[end_time_format,...]
(Opcional)

Campos utilizados para definir la hora de finalización y el formato de tiempo.

Value Table
file_extension
(Opcional)

Extensión de archivo del dataset de origen. El valor del parámetro no se puede modificar.

String
field_delimiter
(Opcional)

Delimitador de campo utilizado en el dataset de origen.

String
record_terminator
(Opcional)

Terminador de registro utilizado en el dataset de origen.

String
quote_character
(Opcional)

Carácter de comillas utilizado en el dataset de origen.

String
has_header_row
(Opcional)

Especifica si el dataset de origen incluye una fila de encabezado.

  • HAS_HEADEREl dataset de origen incluye una fila de encabezado.
  • NO_HEADEREl dataset de origen no incluye una fila de encabezado.
Boolean
encoding
(Opcional)

Tipo de codificación utilizado por el dataset de origen. Es UTF-8 de manera predeterminada.

String

Salida derivada

NombreExplicaciónTipo de datos
updated_bdc

Archivo BDC actualizado con las propiedades editadas aplicadas al dataset especificado.

File

Muestra de código

Ejemplo de UpdateBDCDatasetProperties (script independiente)

En el siguiente script de Python se muestra cómo utilizar la función UpdateBDCDatasetProperties.

# Name: UpdateBDCDatasetProperties.py
# Description: Add a filter and modify the schema, time, and geometry for a BDC dataset
# Requirements: ArcGIS Pro Advanced License

# Import system modules
import arcpy

# Set local variables
dataset = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc\myBigDataset"
filter = "COUNT > 500"
field_properties = "Field1 FLOAT true;Field2 STRING true;Field3 DOUBLE true"
geometry_type = "POINT"
sref = "4326"
geometry_format = "XYZ"
x_field = "Long"
y_field = "Lat"
z_field = ""
time_type = "INSTANT"
time_zone = "UTC"
time_formats = "Year yyyy"
file_extenstion = "csv"
file_delimitor = ","
file_terminator = r"\n"
file_quotechar = '"'
has_header_row = True
file_encoding = "UTF-8"


# Execute Update BDC Dataset Properties
arcpy.gapro.UpdateBDCDatasetProperties(dataset, filter, field_properties, geometry_type, sref, geometry_format, "",
x_field, y_field, z_field, time_type, time_zone, time_formats, None, file_extension, file_delimitor, file_terminator, 
file_quotechar, has_header_row, file_encoding)

Entornos

Esta herramienta no utiliza ningún entorno de geoprocesamiento.

Información de licenciamiento

  • Basic: No
  • Standard: No
  • Advanced: Sí

Temas relacionados