Mettre à jour les propriétés d’une connexion Big Data (GeoAnalytics Desktop)

Résumé

Met à jour les propriétés d’un jeu de données de connexion Big Data. Cet outil modifie les paramètres de champ, de géométrie, de temps et de fichier d’un jeu de données de connexion Big Data spécifié.

Utilisation

  • Cet outil requiert une connexion Big Data (BDC). Pour créer une connexion Big Data, utilisez l’outil Create Big Data Connection (Créer une connexion Big Data).

  • Utilisez cet outil pour modifier le schéma de jeu de données de connexion Big Data, les données géométriques ou les données temporelles à utiliser dans l'analyse ou la visualisation, dans des scénarios tels que le suivant :

    • Votre jeu de données de connexion Big Data a été inscrit avec tous les champs de type chaîne et vous souhaitez définir ces champs comme des champs numériques pour l’analyse.
    • Votre jeu de données de connexion Big Data contient des valeurs attributaires pour deux localisations distinctes, telles que les adresses de départ et d’arrivée des courses de taxi et vous souhaitez modifier la géométrie que vous utilisez pour l’analyse.
    • Votre processus requiert de définir le temps sur la couche en entrée.
    • Vous souhaitez partager un jeu de données de connexion Big Data avec un collègue qui n’est intéressé que par un sous-ensemble d’entités et ajoutez donc une expression de requête de définition et masquez certains champs inutilisés.

  • Vous pouvez modifier les propriétés suivantes :

    • Definition query (Ensemble de définition) : expression permettant de limiter les entités utilisées dans l'analyse.
    • Fields (Champs) : nom de champ, type de champ et visibilité.
    • Geometry (Géométrie) : mode de représentation de la géométrie. Ces champs ne sont pas modifiables pour les shapefiles.
    • Time (Temps) : mode de représentation du temps.
    • File (Fichier) : propriétés de fichier utilisées pour lire le jeu de données.

  • Spécifiez le jeu de données de connexion Big Data avec les propriétés à modifier, à l’aide du paramètre Big Data Connection Dataset (Jeu de données de connexion Big Data). Vous pouvez accéder au jeu de données ou le spécifier à l’aide d’un chemin d’accès tel que c:\<path>\MyBDC.bdc\<dataset_name> (par exemple, c:\MyBDCFolder\MyBDC.bdc\earthquakes_dataset).

  • Définissez une expression pour limiter les entités utilisées dans l’analyse, à l’aide du paramètre Expression (Expression). L’ajout d’un filtre à un jeu de données de connexion Big Data est similaire à l’application d’une requête de définition à un jeu de données de votre carte : spécifiez une expression SQL pour filtrer les entités qui vous intéressent.

  • Vous pouvez mettre à jour le type de champ pour les fichiers délimités. Vous ne pouvez pas mettre à jour le type de champ des autres sources de données (shapefiles, ORC ou fichiers Parquet).

  • Vous pouvez modifier la géométrie des fichiers délimités, des fichiers de forme (ORC) et des fichiers Parquet. Vous ne pouvez pas modifier la géométrie d’un jeu de données provenant d’un shapefile.

  • Le tableau ci-après explique comment spécifier les formats de date et heure des paramètres Start Time (Heure de début) et End Time (Heure de fin) lorsque vous mettez à jour un jeu de données de connexion Big Data. Les exemples expliquent comment représenter le 2 janvier 2016 à 21:45:02.05.

    Formats de date et heure des connexions Big Data

    SymboleSignificationExemple

    aa

    L'année, représentée par deux chiffres.

    16

    aaaa

    L'année, représentée par quatre chiffres.

    2016

    MM

    Le mois, représenté numériquement.

    01 ou 1

    MMM

    Le mois, représenté avec trois lettres.

    Jan

    MMMM

    Le mois, représenté avec l'orthographe complète.

    January

    dd

    Le jour.

    02 ou 2

    HH

    Heure, avec un jour de 24 heures et des valeurs comprises entre 0 et 23.

    21

    hh

    Heure avec un jour de 12 heures et des valeurs comprises entre 1 et 12.

    9

    mm

    Minute, avec des valeurs comprises entre 0 et 59.

    45

    ss

    Seconde, avec des valeurs comprises entre 0 et 59.

    02

    SSS

    Milliseconde, avec des valeurs comprises entre 0 et 999.

    50

    a

    Symbole ponctuel AM/PM.

    PM

    epoch_millis

    Le temps en millisecondes, d’epoch.

    1509581781000

    epoch_seconds

    Le temps en secondes, d’epoch.

    1509747601

    Z

    Le décalage du fuseau horaire exprimé en heures.

    -0100 ou -01:00

    ZZZ

    Le décalage du fuseau horaire exprimé à l’aide d’ID.

    America/Los_Angeles

    ''

    Utilisez les guillemets simples pour ajouter du texte qui ne représente pas une valeur décrite dans cette table.

    'T'

    Le tableau suivant fournit des exemples de différents formats de la même date : 2 janvier 2016 à 21:45:02.05 :

    Exemples de format temporel :

    Date en entréeFormat de date

    01/02/2016 9:45:02PM

    MM/jj/aaaa hh:mm:ssa

    Jan02-16 21:45:02

    MMMjj-aa HH:mm:ss

    2 janvier 2016 9:45:02.050PM

    MMMM jj aaaa hh:mm:ss.SSSa

    01/02/2017T9:45:14:05-0000

    MM/jj/aaaa'T'HH:mm:ssZ

    Vous pouvez spécifier le fuseau horaire à l’aide de l’un des éléments suivants :
    • Nom complet du fuseau horaire : Pacific Standard Time
    • Décalage horaire exprimé en heures : -0100 ou -01:00
    • Abréviation UTC ou GMT
  • Vous pouvez modifier les propriétés suivantes d’un fichier délimité :

    • Field Delimiter (Délimiteur de champ) : délimiteur de chaque champ. Les délimiteurs courants sont , et ;.
    • Record Terminator (Terminateur d'enregistrement) : terminateur de chaque ligne de données. Les terminateurs courants sont \n et \t.
    • Quote Character (Caractère de délimitation) : caractères utilisés comme délimiteurs dans le jeu de données source.
    • Has Header Row (Contient un en-tête de ligne) : valeur true ou false indiquant si le jeu de données source inclut des en-têtes. Si une ligne d'en-têtes est incluse dans le jeu de données, les en-têtes sont utilisés pour les noms de champs.
    • Encoding (Codage) : type de codage utilisé par le jeu de données source. La valeur par défaut est UTF-8.

  • L’outil Update Big Data Connection Dataset Properties (Mettre à jour les propriétés d’une connexion Big Data) met à jour les propriétés d’un jeu de données individuel. Utilisez les outils suivants pour modifier une connexion Big Data :

  • Vous pouvez éventuellement mettre à jour manuellement votre fichier BDC. Vous devez toujours modifier manuellement le fichier .bdc dans les cas suivants :

    • Un ou plusieurs de vos champs sont utilisés pour représenter l’emplacement x,y ou z.
    • Voulez souhaitez mettre à jour le chemin source.

    En savoir plus sur la mise en forme des fichiers de connexion Big Data.

  • Cet outil de géotraitement est mis en œuvre par Spark. Pour en savoir plus sur les connexions Big Data et leur utilisation, reportez-vous à la rubrique Connexions Big Data.

Syntaxe

UpdateBDCDatasetProperties(bdc_dataset, {expression}, {field_properties}, {geometry_type}, {spatial_reference}, {geometry_format_type}, {geometry_field}, {x_field}, {y_field}, {z_field}, {time_type}, {time_zone}, {start_time_format}, {end_time_format}, {file_extension}, {field_delimiter}, {record_terminator}, {quote_character}, {has_header_row}, {encoding})
ParamètreExplicationType de données
bdc_dataset

Jeu de données de connexion Big Data à mettre à jour. Les options de mise à jour dépendent des données source (shapefile, fichier délimité, ORC ou fichier Parquet).

Table View
expression
(Facultatif)

Une expression permet de limiter les entités à utiliser dans l'analyse.

SQL Expression
field_properties
[field_properties,...]
(Facultatif)

Indique les noms de champ et les propriétés à modifier.

  • SHORTLe champ est de type court.
  • LONGLe champ est de type long.
  • DOUBLELe champ est de type double.
  • FLOATLe champ est de type flottant.
  • STRINGLe champ est de type chaîne.
  • DATELe champ est de type date.
  • BLOBLe champ est de type BLOB.

Indique si les champs sont visibles ou masqués.

  • TRUELes champs sont visibles et peuvent être utilisés dans les outils de géotraitement. Il s’agit de l’option par défaut.
  • FALSELes champs sont masqués et ne peuvent pas être utilisés en entrée dans les outils de géotraitement.
Value Table
geometry_type
(Facultatif)

Spécifie le type de géométrie qui sera utilisé pour représenter spatialement le jeu de données. La géométrie ne peut pas être modifiée pour les jeux de données provenant de shapefile.

  • POINTLa géométrie est de type point.
  • LINELa géométrie est de type polyligne.
  • POLYGONLa géométrie est de type polygone.
  • NONEAucun type de géométrie.
String
spatial_reference
(Facultatif)

Valeur WKID ou chaîne WKT qui sera utilisée pour la référence spatiale du jeu de données. La valeur par défaut est WKID 4326 (WGS84). La référence spatiale ne peut pas être modifiée pour les jeux de données provenant de shapefile.

String
geometry_format_type
(Facultatif)

Spécifie le mode de mise en forme de la géométrie. La géométrie ne peut pas être modifiée pour les jeux de données provenant de shapefile.

  • XYZPlusieurs champs représentent x, y et éventuellement z.
  • WKTLa géométrie est représentée par un champ unique dans un champ de texte bien connu.
  • WKBLa géométrie est représentée par un champ unique dans un champ binaire bien connu.
  • GEOJSONLa géométrie est représentée par un champ unique au format GeoJSON.
  • ESRIJSONLa géométrie est représentée par un champ unique au format EsriJSON.
String
geometry_field
(Facultatif)

Champ unique utilisé pour représenter la géométrie. Ce champ est utilisé si le format de la géométrie est WKT, WKB, GeoJSON ou EsriJSON.

String
x_field
(Facultatif)

Champ utilisé pour représenter l’emplacement x. Si plusieurs de vos champs représentent l’emplacement x, modifiez le fichier .bdc manuellement.

String
y_field
(Facultatif)

Champ utilisé pour représenter l’emplacement y. Si plusieurs de vos champs représentent l’emplacement y, modifiez le fichier .bdc manuellement.

String
z_field
(Facultatif)

Champ utilisé pour représenter l’emplacement z. Si plusieurs de vos champs représentent l’emplacement z, modifiez le fichier .bdc manuellement.

String
time_type
(Facultatif)

Spécifie le type d’heure utilisé pour représenter temporairement le jeu de données.

  • INTERVALLe type d’heure représente une durée avec des heures de début et de fin.
  • INSTANTLe type d’heure représente un moment.
  • NONEL’heure n’est pas activée.
String
time_zone
(Facultatif)

Fuseau horaire du jeu de données.

String
start_time_format
[start_time_format,...]
(Facultatif)

Champs utilisés pour définir l’heure de début et la mise en forme de l’heure.

Value Table
end_time_format
[end_time_format,...]
(Facultatif)

Champs utilisés pour définir l’heure de fin et la mise en forme de l’heure.

Value Table
file_extension
(Facultatif)

Extension de fichier du jeu de données source. La valeur du paramètre ne peut pas être modifiée.

String
field_delimiter
(Facultatif)

Délimiteur de champ utilisé dans le jeu de données source.

String
record_terminator
(Facultatif)

Terminateur d'enregistrement utilisé dans le jeu de données source.

String
quote_character
(Facultatif)

Caractère de délimitation utilisé dans le jeu de données source.

String
has_header_row
(Facultatif)

Indique si le jeu de données source inclut un en-tête de ligne.

  • HAS_HEADERLe jeu de données source inclut un en-tête de ligne.
  • NO_HEADERLe jeu de données source n’inclut pas d’en-tête de ligne.
Boolean
encoding
(Facultatif)

Type de codage utilisé par le jeu de données source. Par défaut UTF-8 est utilisé.

String

Sortie dérivée

NomExplicationType de données
updated_bdc

Fichier BDC mis à jour avec les propriétés mises à jour appliquées au jeu de données spécifié.

Fichier

Exemple de code

Exemple d’utilisation de l’outil UpdateBDCDatasetProperties (script autonome)

Le script Python ci-dessous illustre l'utilisation de la fonction UpdateBDCDatasetProperties.

# Name: UpdateBDCDatasetProperties.py
# Description: Add a filter and modify the schema, time, and geometry for a BDC dataset
# Requirements: ArcGIS Pro Advanced License
# Import system modules
import arcpy
# Set local variables
dataset = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc\myBigDataset"
filter = "COUNT > 500"
field_properties = "Field1 FLOAT true;Field2 STRING true;Field3 DOUBLE true"
geometry_type = "POINT"
sref = "4326"
geometry_format = "XYZ"
x_field = "Long"
y_field = "Lat"
z_field = ""
time_type = "INSTANT"
time_zone = "UTC"
time_formats = "Year yyyy"
file_extenstion = "csv"
file_delimitor = ","
file_terminator = r"\n"
file_quotechar = '"'
has_header_row = True
file_encoding = "UTF-8"
# Execute Update BDC Dataset Properties
arcpy.gapro.UpdateBDCDatasetProperties(dataset, filter, field_properties, geometry_type, sref, geometry_format, "",
x_field, y_field, z_field, time_type, time_zone, time_formats, None, file_extension, file_delimitor, file_terminator, 
file_quotechar, has_header_row, file_encoding)

Environnements

Cet outil n'utilise pas d’environnement de géotraitement.

Informations de licence

  • Basic: Non
  • Standard: Non
  • Advanced: Oui

Rubriques connexes