Update Big Data Connection Dataset Properties (Mettre à jour les propriétés d’une connexion Big Data) (GeoAnalytics Desktop)

Synthèse

Met à jour les propriétés d’un jeu de données de connexion Big Data. Cet outil modifie les paramètres de champ, de géométrie, de temps et de fichier d’un jeu de données de connexion Big Data spécifié.

Utilisation

  • Cet outil requiert une connexion Big Data (BDC). Pour créer une connexion Big Data, utilisez la boîte de dialogue Nouvelle connexion Big Data ou l’outil Créer un connexion Big Data.

  • Utilisez cet outil pour modifier le schéma de jeu de données de connexion Big Data, les données géométriques ou les données temporelles à utiliser dans l'analyse ou la visualisation, dans des scénarios tels que le suivant :

    • Votre jeu de données de connexion Big Data a été inscrit avec tous les champs de type chaîne et vous souhaitez définir ces champs comme des champs numériques pour l’analyse.
    • Votre jeu de données de connexion Big Data contient des valeurs attributaires pour deux localisations distinctes, telles que les adresses de départ et d’arrivée des courses de taxi et vous souhaitez modifier la géométrie que vous utilisez pour l’analyse.
    • Votre processus requiert de définir le temps sur la couche en entrée.
    • Vous souhaitez partager un jeu de données de connexion Big Data avec un collègue qui n’est intéressé que par un sous-ensemble d’entités et ajoutez donc une expression de requête de définition et masquez certains champs inutilisés.

  • Vous pouvez modifier les propriétés suivantes :

    • Ensemble de définition : expression permettant de limiter les entités utilisées dans l’analyse.
    • Champs : nom de champ, type de champ et visibilité.
    • Géométrie : mode de représentation de la géométrie. Ces champs ne sont pas modifiables pour les shapefiles.
    • Temps : mode de représentation du temps.
    • Fichier : propriétés de fichier utilisées pour lire le jeu de données.

  • Utilisez la boîte de dialogue New Big Data Connection (Nouvelle connexion Big Data) pour créer, mettre à jour et prévisualiser une connexion Big Data de façon simplifiée.

  • Spécifiez le jeu de données de connexion Big Data avec les propriétés à modifier, à l’aide du paramètre Big Data Connection Dataset (Jeu de données de connexion Big Data). Vous pouvez accéder au jeu de données ou le spécifier à l’aide du chemin c:\<path>\MyBDC.bdc\<dataset_name>, par exemple, c:\MyBDCFolder\MyBDC.bdc\earthquakes_dataset.

  • Définissez une expression pour limiter les entités utilisées dans l’analyse à l’aide du paramètre Expression. L’ajout d’un filtre à un jeu de données BDC est semblable à l’application d’un ensemble de définition à un jeu de données sur une carte : spécifiez une expression SQL pour filtrer les entités d’intérêt.

  • Vous pouvez mettre à jour le type de champ pour les fichiers délimités. Vous ne pouvez pas mettre à jour le type de champ des autres sources de données (shapefiles, ORC ou fichiers Parquet).

  • Vous pouvez modifier la géométrie des fichiers délimités, des fichiers de forme (ORC) et des fichiers Parquet. Vous ne pouvez pas modifier la géométrie d’un jeu de données provenant d’un shapefile.

  • Le tableau ci-après explique comment spécifier les formats de date et heure des paramètres Start Time (Heure de début) et End Time (Heure de fin) lorsque vous mettez à jour un jeu de données de connexion Big Data. Les exemples expliquent comment représenter le 2 janvier 2016 à 21:45:02.05.

    Formats de date et heure des connexions Big Data

    SymboleSignificationExemple

    aa

    L'année, représentée par deux chiffres.

    16

    aaaa

    L'année, représentée par quatre chiffres.

    2016

    MM

    Le mois, représenté numériquement.

    01 ou 1

    MMM

    Le mois, représenté avec trois lettres.

    Jan

    MMMM

    Le mois, représenté avec l'orthographe complète.

    January

    jj

    Le jour.

    02 ou 2

    HH

    Heure, avec un jour de 24 heures et des valeurs comprises entre 0 et 23.

    21

    hh

    Heure avec un jour de 12 heures et des valeurs comprises entre 1 et 12.

    9

    mm

    Minute, avec des valeurs comprises entre 0 et 59.

    45

    ss

    Seconde, avec des valeurs comprises entre 0 et 59.

    02

    SSS

    Milliseconde, avec des valeurs comprises entre 0 et 999.

    50

    a

    Symbole ponctuel AM/PM.

    PM

    epoch_millis

    Le temps en millisecondes, d’epoch.

    1509581781000

    epoch_seconds

    Le temps en secondes, d’epoch.

    1509747601

    Z

    Le décalage du fuseau horaire exprimé en heures.

    -0100 ou -01:00

    ZZZ

    Le décalage du fuseau horaire exprimé à l’aide d’ID.

    America/Los_Angeles

    ''

    Utilisez les guillemets simples pour ajouter du texte qui ne représente pas une valeur décrite dans cette table.

    'T'

    Le tableau suivant fournit des exemples de différents formats de la même date : 2 janvier 2016 à 21:45:02.05 :

    Exemples de format temporel :

    Date en entréeFormat de date

    01/02/2016 9:45:02PM

    MM/jj/aaaa hh:mm:ssa

    Jan02-16 21:45:02

    MMMjj-aa HH:mm:ss

    2 janvier 2016 9:45:02.050PM

    MMMM jj aaaa hh:mm:ss.SSSa

    01/02/2017T9:45:14:05-0000

    MM/jj/aaaa'T'HH:mm:ssZ

    You can specify the time zone using one of the following:
    • Le nom complet du fuseau horaire, par exemple, Heure normale du Pacifique
    • Décalage horaire exprimé en heures : -0100 ou -01:00
    • Abréviation UTC ou GMT
  • Vous pouvez modifier les propriétés suivantes d’un fichier délimité :

    • Field Delimiter (Délimiteur de champ) : délimiteur de chaque champ. Les délimiteurs les plus courants sont la virgule (,) et le point-virgule (;).
    • Record Terminator (Terminateur d'enregistrement) : terminateur de chaque ligne de données. Les terminaisons les plus courantes sont \n et \t.
    • Quote Character (Caractère de délimitation) : caractères utilisés comme délimiteurs dans le jeu de données source.
    • Has Header Row (Contient un en-tête de ligne) : valeur true ou false indiquant si le jeu de données source inclut des en-têtes. Si une ligne d'en-têtes est incluse dans le jeu de données, les en-têtes sont utilisés pour les noms de champs.
    • Encoding (Codage) : type de codage utilisé par le jeu de données source. La valeur par défaut est UTF-8.

  • L’outil Update Big Data Connection Dataset Properties (Mettre à jour les propriétés d’une connexion Big Data) met à jour les propriétés d’un jeu de données individuel. Utilisez les outils suivants pour modifier une connexion Big Data :

  • Vous pouvez éventuellement mettre à jour manuellement votre fichier BDC. Vous devez toujours modifier manuellement le fichier .bdc dans les cas suivants :

    • Un ou plusieurs de vos champs sont utilisés pour représenter l’emplacement x,y ou z.
    • Voulez souhaitez mettre à jour le chemin source.

    En savoir plus sur la mise en forme des fichiers de connexion Big Data.

  • Cet outil de géotraitement est mis en œuvre par Spark. Pour en savoir plus sur les connexions Big Data et leur utilisation, reportez-vous à la rubrique Connexions Big Data.

Paramètres

ÉtiquetteExplicationType de données
Big Data Connection Dataset (Jeu de données de connexion Big Data)

Le jeu de données BDC à mettre à jour. Les options de mise à jour dépendent des données source (shapefile, fichier délimité, ORC ou fichier Parquet).

Table View
Expression
(Facultatif)

Une expression permettant de limiter les entités qui seront utilisées dans l’analyse.

SQL Expression
Propriétés du champ
(Facultatif)

Indique le nom des champs et les propriétés qui vont être modifiés.

Indique si les champs sont visibles ou masqués.

  • Cochée : les champs sont visibles et peuvent être utilisés dans les outils de géotraitement. Il s’agit de l’option par défaut.
  • Non sélectionnée : les champs sont masqués et ne peuvent pas être utilisés en entrée dans les outils de géotraitement.

  • CourtLe champ est de type court.
  • LongLe champ est de type long.
  • DoubleLe champ est de type double.
  • FlottantLe champ est de type flottant.
  • ChaîneLe champ est de type chaîne.
  • DateLe champ est de type date.
  • BLOBLe champ est de type BLOB.
Value Table
Type de géométrie
(Facultatif)

Spécifie le type de géométrie qui sera utilisé pour représenter spatialement le jeu de données. La géométrie ne peut pas être modifiée pour les jeux de données provenant de shapefile.

  • PointLe type de géométrie sera le point.
  • PolyligneLe type de géométrie sera la polyligne.
  • PolygoneLe type de géométrie sera le polygone.
  • AucunAucun type de géométrie n’est spécifié.
String
Référence spatiale
(Facultatif)

Valeur WKID ou chaîne WKT qui sera utilisée pour la référence spatiale du jeu de données. La valeur par défaut est WKID 4326 (WGS84). La référence spatiale ne peut pas être modifiée pour les jeux de données provenant de shapefile.

String
Geometry Format Type (Type de format de géométrie)
(Facultatif)

Spécifie le mode de mise en forme de la géométrie. La géométrie ne peut pas être modifiée pour les jeux de données provenant de shapefile.

  • XYZPlusieurs champs représentent x, y et éventuellement z.
  • WKTLa géométrie est représentée par un champ unique dans un champ de texte bien connu.
  • WKBLa géométrie est représentée par un champ unique dans un champ binaire bien connu.
  • GeoJSONLa géométrie est représentée par un champ unique au format GeoJSON.
  • EsriJSONLa géométrie est représentée par un champ unique au format EsriJSON.
  • EsriShapeLa géométrie est représentée par un champ unique au format EsriShape.
String
Champ Geometry (Géométrie)
(Facultatif)

Champ unique utilisé pour représenter la géométrie. Ce champ est utilisé lorsque le format de géométrie est WKT, WKB, GeoJSON, EsriJSON ou EsriShape.

String
Champ X
(Facultatif)

Champ utilisé pour représenter l’emplacement x. Si plusieurs champs représentent la localisation x, modifiez le fichier .bdc manuellement.

String
Champ Y
(Facultatif)

Champ utilisé pour représenter l’emplacement y. Si plusieurs champs représentent la localisation y, modifiez le fichier .bdc manuellement.

String
Champ Z
(Facultatif)

Champ utilisé pour représenter l’emplacement z. Si plusieurs champs représentent la localisation z, modifiez le fichier .bdc manuellement.

String
Type d’heure
(Facultatif)

Indique le type de temps utilisé pour représenter temporellement le jeu de données.

  • IntervalleLe type d’heure représente une durée avec des heures de début et de fin.
  • InstantLe type d’heure représente un moment.
  • AucunL’heure n’est pas activée.
String
Fuseau horaire
(Facultatif)

Fuseau horaire du jeu de données.

String
Heure de début
(Facultatif)

Champs utilisés pour définir l’heure de début et la mise en forme de l’heure.

Value Table
Heure de fin
(Facultatif)

Champs utilisés pour définir l’heure de fin et la mise en forme de l’heure.

Value Table
Extension du fichier
(Facultatif)

Extension de fichier du jeu de données source. La valeur du paramètre ne peut pas être modifiée.

String
Délimiteur de champ
(Facultatif)

Délimiteur de champ utilisé dans le jeu de données source.

String
Terminateur d'enregistrement
(Facultatif)

Terminateur d'enregistrement utilisé dans le jeu de données source.

String
Caractère de délimitation
(Facultatif)

Caractère de délimitation utilisé dans le jeu de données source.

String
Has Header Row (Contient un en-tête de ligne)
(Facultatif)

Indique si le jeu de données source inclut un en-tête de ligne.

  • Cochée : le jeu de données source inclut un en-tête de ligne.
  • Non sélectionnée : le jeu de données source n’inclut pas d’en-tête de ligne.

Boolean
Codage
(Facultatif)

Type de codage utilisé par le jeu de données source. UTF-8 est utilisé par défaut.

String

Sortie obtenue

ÉtiquetteExplicationType de données
Updated BDC (BDC mis à jour)

Fichier BDC mis à jour avec les propriétés mises à jour appliquées au jeu de données spécifié.

File

arcpy.gapro.UpdateBDCDatasetProperties(bdc_dataset, {expression}, {field_properties}, {geometry_type}, {spatial_reference}, {geometry_format_type}, {geometry_field}, {x_field}, {y_field}, {z_field}, {time_type}, {time_zone}, {start_time_format}, {end_time_format}, {file_extension}, {field_delimiter}, {record_terminator}, {quote_character}, {has_header_row}, {encoding})
NomExplicationType de données
bdc_dataset

Le jeu de données BDC à mettre à jour. Les options de mise à jour dépendent des données source (shapefile, fichier délimité, ORC ou fichier Parquet).

Table View
expression
(Facultatif)

Une expression permettant de limiter les entités qui seront utilisées dans l’analyse.

SQL Expression
field_properties
[field_properties,...]
(Facultatif)

Indique le nom des champs et les propriétés qui vont être modifiés.

  • SHORTLe champ est de type court.
  • LONGLe champ est de type long.
  • DOUBLELe champ est de type double.
  • FLOATLe champ est de type flottant.
  • STRINGLe champ est de type chaîne.
  • DATELe champ est de type date.
  • BLOBLe champ est de type BLOB.

Indique si les champs sont visibles ou masqués.

  • TRUELes champs sont visibles et peuvent être utilisés dans les outils de géotraitement. Il s’agit de l’option par défaut.
  • FALSELes champs sont masqués et ne peuvent pas être utilisés en entrée dans les outils de géotraitement.
Value Table
geometry_type
(Facultatif)

Spécifie le type de géométrie qui sera utilisé pour représenter spatialement le jeu de données. La géométrie ne peut pas être modifiée pour les jeux de données provenant de shapefile.

  • POINTLe type de géométrie sera le point.
  • LINELe type de géométrie sera la polyligne.
  • POLYGONLe type de géométrie sera le polygone.
  • NONEAucun type de géométrie n’est spécifié.
String
spatial_reference
(Facultatif)

Valeur WKID ou chaîne WKT qui sera utilisée pour la référence spatiale du jeu de données. La valeur par défaut est WKID 4326 (WGS84). La référence spatiale ne peut pas être modifiée pour les jeux de données provenant de shapefile.

String
geometry_format_type
(Facultatif)

Spécifie le mode de mise en forme de la géométrie. La géométrie ne peut pas être modifiée pour les jeux de données provenant de shapefile.

  • XYZPlusieurs champs représentent x, y et éventuellement z.
  • WKTLa géométrie est représentée par un champ unique dans un champ de texte bien connu.
  • WKBLa géométrie est représentée par un champ unique dans un champ binaire bien connu.
  • GEOJSONLa géométrie est représentée par un champ unique au format GeoJSON.
  • ESRIJSONLa géométrie est représentée par un champ unique au format EsriJSON.
  • ESRISHAPELa géométrie est représentée par un champ unique au format EsriShape.
String
geometry_field
(Facultatif)

Champ unique utilisé pour représenter la géométrie. Ce champ est utilisé lorsque le format de géométrie est WKT, WKB, GeoJSON, EsriJSON ou EsriShape.

String
x_field
(Facultatif)

Champ utilisé pour représenter l’emplacement x. Si plusieurs champs représentent la localisation x, modifiez le fichier .bdc manuellement.

String
y_field
(Facultatif)

Champ utilisé pour représenter l’emplacement y. Si plusieurs champs représentent la localisation y, modifiez le fichier .bdc manuellement.

String
z_field
(Facultatif)

Champ utilisé pour représenter l’emplacement z. Si plusieurs champs représentent la localisation z, modifiez le fichier .bdc manuellement.

String
time_type
(Facultatif)

Indique le type de temps utilisé pour représenter temporellement le jeu de données.

  • INTERVALLe type d’heure représente une durée avec des heures de début et de fin.
  • INSTANTLe type d’heure représente un moment.
  • NONEL’heure n’est pas activée.
String
time_zone
(Facultatif)

Fuseau horaire du jeu de données.

String
start_time_format
[start_time_format,...]
(Facultatif)

Champs utilisés pour définir l’heure de début et la mise en forme de l’heure.

Value Table
end_time_format
[end_time_format,...]
(Facultatif)

Champs utilisés pour définir l’heure de fin et la mise en forme de l’heure.

Value Table
file_extension
(Facultatif)

Extension de fichier du jeu de données source. La valeur du paramètre ne peut pas être modifiée.

String
field_delimiter
(Facultatif)

Délimiteur de champ utilisé dans le jeu de données source.

String
record_terminator
(Facultatif)

Terminateur d'enregistrement utilisé dans le jeu de données source.

String
quote_character
(Facultatif)

Caractère de délimitation utilisé dans le jeu de données source.

String
has_header_row
(Facultatif)

Indique si le jeu de données source inclut un en-tête de ligne.

  • HAS_HEADERLe jeu de données source inclut un en-tête de ligne.
  • NO_HEADERLe jeu de données source n’inclut pas d’en-tête de ligne.
Boolean
encoding
(Facultatif)

Type de codage utilisé par le jeu de données source. UTF-8 est utilisé par défaut.

String

Sortie obtenue

NomExplicationType de données
updated_bdc

Fichier BDC mis à jour avec les propriétés mises à jour appliquées au jeu de données spécifié.

File

Exemple de code

Exemple d’utilisation de l’outil UpdateBDCDatasetProperties (script autonome)

Le script Python ci-dessous montre comment utiliser la fonction UpdateBDCDatasetProperties.

# Name: UpdateBDCDatasetProperties.py
# Description: Add a filter and modify the schema, time, and geometry for a BDC dataset
# Requirements: ArcGIS Pro Advanced License

# Import system modules
import arcpy

# Set local variables
dataset = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc\myBigDataset"
filter = "COUNT > 500"
field_properties = "Field1 FLOAT true;Field2 STRING true;Field3 DOUBLE true"
geometry_type = "POINT"
sref = "4326"
geometry_format = "XYZ"
x_field = "Long"
y_field = "Lat"
z_field = ""
time_type = "INSTANT"
time_zone = "UTC"
time_formats = "Year yyyy"
file_extension = "csv"
file_delimiter = ","
file_terminator = r"\n"
file_quotechar = '"'
has_header_row = True
file_encoding = "UTF-8"


# Execute Update BDC Dataset Properties
arcpy.gapro.UpdateBDCDatasetProperties(dataset, filter, field_properties, geometry_type, sref, geometry_format, "",
x_field, y_field, z_field, time_type, time_zone, time_formats, None, file_extension, file_delimiter, file_terminator, 
file_quotechar, has_header_row, file_encoding)

Environnements

Cet outil n’utilise pas d’environnement de géotraitement.

Informations de licence

  • Basic: Non
  • Standard: Non
  • Advanced: Oui

Rubriques connexes