Resumen
Actualiza las propiedades de un dataset de conexión de big data (BDC). Esta herramienta modifica la configuración de campo, geometría, tiempo y archivo de un dataset de BDC específico.
Uso
Esta herramienta requiere un BDC. Para crear un BDC, utilice la herramienta Crear conexión de big data.
Utilice esta herramienta para modificar el tiempo, la geometría o el esquema de dataset de BDC para el uso en análisis o visualización en situaciones como la siguiente:
- El dataset de CSV se ha registrado con todos los campos de tipo de cadena de caracteres y desea configurar los campos como numéricos para el uso en análisis.
- El dataset de BDC tiene valores de atributo para dos ubicaciones separadas, como paradas de taxi donde se recoge y se deja a la gente, y desea cambiar la geometría que va a utilizar durante el análisis.
- El flujo de trabajo requiere configurar el tiempo en la capa de entrada.
- Desea compartir un dataset de BDC con un compañero que solo está interesado en un subconjunto de entidades, por lo que agrega una expresión de consulta de definición y oculta algunos campos que no se utilizan.
Puede modificar las siguiente propiedades:
- Consulta de definición: expresión utilizada para limitar las entidades empleadas en el análisis.
- Campos: nombre de campo, tipo de campo y visibilidad.
- Geometría: cómo se representa la geometría. No son editables para shapefiles.
- Tiempo: cómo se representa el tiempo.
- Archivo: propiedades de archivo utilizadas para leer el dataset.
Especifique el dataset de BDC con las propiedades que quiera modificar utilizando el parámetro Dataset de conexión de big data. Puede ir al dataset o especificarlo mediante el uso de una ruta de acceso, como c:\<path>\MyBDC.bdc\<dataset_name>, por ejemplo, c:\MyBDCFolder\MyBDC.bdc\earthquakes_dataset.
Defina una expresión para limitar las entidades utilizadas en el análisis por medio del parámetro Expresión. El procedimiento para agregar un filtro a un dataset de BDC es similar a aplicar una consulta de definición a un dataset del mapa: se especifica una expresión SQL para filtrar las entidades de interés.
Puede actualizar el tipo de campo correspondiente a archivos delimitados. No se puede actualizar el tipo de campo de otras fuentes de datos (como archivos ORC, de parquet y shapefiles).
Puede modificar la geometría de archivos delimitados, ORC y de parquet. No puede modificar la geometría de un dataset con origen en un shapefile.
En la tabla siguiente se explica cómo especificar formatos de tiempo para los parámetros Hora inicial y Hora final al editar un dataset de BDC. Los ejemplos muestran cómo se representa la hora 9:45:02.05 PM del 2 de enero de 2016.
Formatos de tiempo en conexiones de big data
Símbolo Significado Ejemplo yy
El año, representado por dos dígitos.
16
yyyy
El año, representado por cuatro dígitos.
2016
MM
El mes, representado numéricamente.
01 o 1
MMM
El mes, representado con tres letras.
Jan
MMMM
El mes, representado con el nombre completo.
January
dd
El día.
02 o 2
HH
La hora usando un día de 24 horas; valores entre 0 y 23.
21
hh
La hora usando un día de 12 horas; valores entre 1 y 12.
9
mm
Los minutos; valores entre 0 y 59.
45
ss
Los segundos; valores entre 0 y 59.
02
SSS
Los milisegundos; valores entre 0 y 999.
50
a
Marcador AM/PM.
PM
epoch_millis
El tiempo en milésimas de segundo desde epoch.
1509581781000
epoch_seconds
El tiempo en segundos desde epoch.
1509747601
Z
El desplazamiento de zona horaria expresado en horas.
-0100 o -01:00
ZZZ
El desplazamiento de zona horaria expresado mediante Id.
America/Los_Angeles
''
Use comillas simples para agregar texto que no represente un valor descrito en esta tabla.
'T'
En la siguiente tabla se muestran ejemplos de distintos formatos de la misma fecha, 2 de enero de 2016 a las 9:45:02.05 PM:
Ejemplos de formato de tiempo
Puede especificar la zona horaria de una de estas maneras:Fecha de entrada Formato de fecha 01/02/2016 9:45:02PM
MM/dd/aaaa hh:mm:ssa
Ene02-16 21:45:02
MMMdd-aa HH:mm:ss
2 de enero 2016 9:45:02.050PM
MMMM dd aaaa hh:mm:ss.SSSa
01/02/2017T9:45:14:05-0000
MM/dd/yyyy'T'HH:mm:ssZ
- Nombre completo de la zona horaria: Pacific Standard Time
- Desplazamiento de zona horaria expresado en horas: -0100 o -01:00
- Abreviatura UTC o GMT
Puede modificar las siguientes propiedades de un archivo delimitado:
- Delimitador de campo: delimitador de cada campo. Los delimitadores comunes son , y ;.
- Terminador de registro: terminador de cada fila de datos. Los terminadores comunes son \n y \t.
- Carácter de comillas: carácter usado para las comillas en el dataset de origen.
- Tiene fila de encabezado: valor verdadero o falso que indica si el dataset de origen incluye encabezados. Si se incluye una fila de encabezado en el dataset, los encabezados se usarán para los nombres de campo.
- Codificación: tipo de codificación utilizado por el dataset de origen. El valor predeterminado es UTF -8.
La herramienta Actualizar propiedades de dataset de conexión de big data actualiza las propiedades de un dataset individual. Para modificar un BDC, utilice las herramientas siguientes:
- Copiar dataset desde conexión de big data: permite copiar un dataset de BDC en una clase de entidad.
- Duplicar dataset desde conexión de big data: permite crear una vista de un dataset de BDC existente.
- Refrescar conexión de big data: permite comprobar si hay datasets nuevos y agregarlos a BDC.
- Quitar dataset desde conexión de big data: permite eliminar un dataset de BDC.
- Actualizar propiedades de dataset de conexión de big data: permite modificar las propiedades de un dataset de BDC individual.
- Previsualizar dataset desde conexión de big data: permite mostrar una vista previa de las diez primeras entidades del dataset para verificar que se han registrado correctamente.
- Describir dataset: permite confirmar que el dataset se muestra según lo previsto.
El archivo BDC también se puede modificar de forma manual. El archivo .bdc siempre debería modificarse manualmente en las situaciones siguientes:
- Está utilizando uno o varios campos para representar la ubicación x-, y- o z-.
- Desea actualizar la ruta de origen.
Más información sobre la asignación de formato a archivos de conexiones de big data.
Esta herramienta de geoprocesamiento se basa en Spark. Consulte Conexiones de big data para obtener más información sobre las conexiones de big data y cómo usarlas.
Sintaxis
UpdateBDCDatasetProperties(bdc_dataset, {expression}, {field_properties}, {geometry_type}, {spatial_reference}, {geometry_format_type}, {geometry_field}, {x_field}, {y_field}, {z_field}, {time_type}, {time_zone}, {start_time_format}, {end_time_format}, {file_extension}, {field_delimiter}, {record_terminator}, {quote_character}, {has_header_row}, {encoding})
Parámetro | Explicación | Tipo de datos |
bdc_dataset | Dataset de BDC que se va a actualizar. Las opciones de edición variarán dependiendo de los datos de origen (shapefile, archivo delimitado, ORC o archivo de parquet). | Table View |
expression (Opcional) | Expresión utilizada para limitar las entidades que se usarán en el análisis. | SQL Expression |
field_properties [field_properties,...] (Opcional) | Especifica los nombres y propiedades de campo que se van a modificar.
Especifica si los campos estarán visibles u ocultos.
| Value Table |
geometry_type (Opcional) | Especifica el tipo de geometría que se utilizará para representar espacialmente el dataset. La geometría no se puede modificar para datasets con origen en shapefile.
| String |
spatial_reference (Opcional) | Valor de WKID o cadena de caracteres de WKT que se utilizará para la referencia espacial del dataset. El valor predeterminado es WKID 4326 (WGS84). La geometría no se puede modificar para datos con origen en shapefile. | String |
geometry_format_type (Opcional) | Especifica cómo se formateará la geometría. La geometría no se puede modificar para datos con origen en shapefile.
| String |
geometry_field (Opcional) | Campo único utilizado para representar la geometría. Este campo se utiliza cuando el formato de geometría es WKT, WKB, GeoJSON o EsriJSON. | String |
x_field (Opcional) | Campo único utilizado para representar la ubicación x. Si tiene más de un campo que representa la ubicación x, modifique el archivo .bdc manualmente. | String |
y_field (Opcional) | Campo utilizado para representar la ubicación y. Si tiene más de un campo que representa la ubicación y, modifique el archivo .bdc manualmente. | String |
z_field (Opcional) | Campo utilizado para representar la ubicación z. Si tiene más de un campo que representa la ubicación z, modifique el archivo .bdc manualmente. | String |
time_type (Opcional) | Especifica el tipo de tiempo utilizado para representar temporalmente el dataset.
| String |
time_zone (Opcional) | Zona horaria del dataset. | String |
start_time_format [start_time_format,...] (Opcional) | Campos utilizados para definir la hora de inicio y el formato de tiempo. | Value Table |
end_time_format [end_time_format,...] (Opcional) | Campos utilizados para definir la hora de finalización y el formato de tiempo. | Value Table |
file_extension (Opcional) | Extensión de archivo del dataset de origen. El valor del parámetro no se puede modificar. | String |
field_delimiter (Opcional) | Delimitador de campo utilizado en el dataset de origen. | String |
record_terminator (Opcional) | Terminador de registro utilizado en el dataset de origen. | String |
quote_character (Opcional) | Carácter de comillas utilizado en el dataset de origen. | String |
has_header_row (Opcional) | Especifica si el dataset de origen incluye una fila de encabezado.
| Boolean |
encoding (Opcional) | Tipo de codificación utilizado por el dataset de origen. Es UTF-8 de manera predeterminada. | String |
Salida derivada
Nombre | Explicación | Tipo de datos |
updated_bdc | Archivo BDC actualizado con las propiedades editadas aplicadas al dataset especificado. | Archivo |
Muestra de código
En el siguiente script de Python se muestra cómo utilizar la función UpdateBDCDatasetProperties.
# Name: UpdateBDCDatasetProperties.py
# Description: Add a filter and modify the schema, time, and geometry for a BDC dataset
# Requirements: ArcGIS Pro Advanced License
# Import system modules
import arcpy
# Set local variables
dataset = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc\myBigDataset"
filter = "COUNT > 500"
field_properties = "Field1 FLOAT true;Field2 STRING true;Field3 DOUBLE true"
geometry_type = "POINT"
sref = "4326"
geometry_format = "XYZ"
x_field = "Long"
y_field = "Lat"
z_field = ""
time_type = "INSTANT"
time_zone = "UTC"
time_formats = "Year yyyy"
file_extenstion = "csv"
file_delimitor = ","
file_terminator = r"\n"
file_quotechar = '"'
has_header_row = True
file_encoding = "UTF-8"
# Execute Update BDC Dataset Properties
arcpy.gapro.UpdateBDCDatasetProperties(dataset, filter, field_properties, geometry_type, sref, geometry_format, "",
x_field, y_field, z_field, time_type, time_zone, time_formats, None, file_extension, file_delimitor, file_terminator,
file_quotechar, has_header_row, file_encoding)
Entornos
Información de licenciamiento
- Basic: No
- Standard: No
- Advanced: Sí