Résumé
Met à jour les propriétés d’un jeu de données de connexion Big Data. Cet outil modifie les paramètres de champ, de géométrie, de temps et de fichier d’un jeu de données de connexion Big Data spécifié.
Utilisation
Cet outil requiert une connexion Big Data (BDC). Pour créer une connexion Big Data, utilisez l’outil Create Big Data Connection (Créer une connexion Big Data).
Utilisez cet outil pour modifier le schéma de jeu de données de connexion Big Data, les données géométriques ou les données temporelles à utiliser dans l'analyse ou la visualisation, dans des scénarios tels que le suivant :
- Votre jeu de données de connexion Big Data a été inscrit avec tous les champs de type chaîne et vous souhaitez définir ces champs comme des champs numériques pour l’analyse.
- Votre jeu de données de connexion Big Data contient des valeurs attributaires pour deux localisations distinctes, telles que les adresses de départ et d’arrivée des courses de taxi et vous souhaitez modifier la géométrie que vous utilisez pour l’analyse.
- Votre processus requiert de définir le temps sur la couche en entrée.
- Vous souhaitez partager un jeu de données de connexion Big Data avec un collègue qui n’est intéressé que par un sous-ensemble d’entités et ajoutez donc une expression de requête de définition et masquez certains champs inutilisés.
Vous pouvez modifier les propriétés suivantes :
- Definition query (Ensemble de définition) : expression permettant de limiter les entités utilisées dans l'analyse.
- Fields (Champs) : nom de champ, type de champ et visibilité.
- Geometry (Géométrie) : mode de représentation de la géométrie. Ces champs ne sont pas modifiables pour les shapefiles.
- Time (Temps) : mode de représentation du temps.
- File (Fichier) : propriétés de fichier utilisées pour lire le jeu de données.
Spécifiez le jeu de données de connexion Big Data avec les propriétés à modifier, à l’aide du paramètre Big Data Connection Dataset (Jeu de données de connexion Big Data). Vous pouvez accéder au jeu de données ou le spécifier à l’aide d’un chemin d’accès tel que c:\<path>\MyBDC.bdc\<dataset_name> (par exemple, c:\MyBDCFolder\MyBDC.bdc\earthquakes_dataset).
Définissez une expression pour limiter les entités utilisées dans l’analyse, à l’aide du paramètre Expression (Expression). L’ajout d’un filtre à un jeu de données de connexion Big Data est similaire à l’application d’une requête de définition à un jeu de données de votre carte : spécifiez une expression SQL pour filtrer les entités qui vous intéressent.
Vous pouvez mettre à jour le type de champ pour les fichiers délimités. Vous ne pouvez pas mettre à jour le type de champ des autres sources de données (shapefiles, ORC ou fichiers Parquet).
Vous pouvez modifier la géométrie des fichiers délimités, des fichiers de forme (ORC) et des fichiers Parquet. Vous ne pouvez pas modifier la géométrie d’un jeu de données provenant d’un shapefile.
Le tableau ci-après explique comment spécifier les formats de date et heure des paramètres Start Time (Heure de début) et End Time (Heure de fin) lorsque vous mettez à jour un jeu de données de connexion Big Data. Les exemples expliquent comment représenter le 2 janvier 2016 à 21:45:02.05.
Formats de date et heure des connexions Big Data
Symbole Signification Exemple aa
L'année, représentée par deux chiffres.
16
aaaa
L'année, représentée par quatre chiffres.
2016
MM
Le mois, représenté numériquement.
01 ou 1
MMM
Le mois, représenté avec trois lettres.
Jan
MMMM
Le mois, représenté avec l'orthographe complète.
January
dd
Le jour.
02 ou 2
HH
Heure, avec un jour de 24 heures et des valeurs comprises entre 0 et 23.
21
hh
Heure avec un jour de 12 heures et des valeurs comprises entre 1 et 12.
9
mm
Minute, avec des valeurs comprises entre 0 et 59.
45
ss
Seconde, avec des valeurs comprises entre 0 et 59.
02
SSS
Milliseconde, avec des valeurs comprises entre 0 et 999.
50
a
Symbole ponctuel AM/PM.
PM
epoch_millis
Le temps en millisecondes, d’epoch.
1509581781000
epoch_seconds
Le temps en secondes, d’epoch.
1509747601
Z
Le décalage du fuseau horaire exprimé en heures.
-0100 ou -01:00
ZZZ
Le décalage du fuseau horaire exprimé à l’aide d’ID.
America/Los_Angeles
''
Utilisez les guillemets simples pour ajouter du texte qui ne représente pas une valeur décrite dans cette table.
'T'
Le tableau suivant fournit des exemples de différents formats de la même date : 2 janvier 2016 à 21:45:02.05 :
Exemples de format temporel :
Vous pouvez spécifier le fuseau horaire à l’aide de l’un des éléments suivants :Date en entrée Format de date 01/02/2016 9:45:02PM
MM/jj/aaaa hh:mm:ssa
Jan02-16 21:45:02
MMMjj-aa HH:mm:ss
2 janvier 2016 9:45:02.050PM
MMMM jj aaaa hh:mm:ss.SSSa
01/02/2017T9:45:14:05-0000
MM/jj/aaaa'T'HH:mm:ssZ
- Nom complet du fuseau horaire : Pacific Standard Time
- Décalage horaire exprimé en heures : -0100 ou -01:00
- Abréviation UTC ou GMT
Vous pouvez modifier les propriétés suivantes d’un fichier délimité :
- Field Delimiter (Délimiteur de champ) : délimiteur de chaque champ. Les délimiteurs courants sont , et ;.
- Record Terminator (Terminateur d'enregistrement) : terminateur de chaque ligne de données. Les terminateurs courants sont \n et \t.
- Quote Character (Caractère de délimitation) : caractères utilisés comme délimiteurs dans le jeu de données source.
- Has Header Row (Contient un en-tête de ligne) : valeur true ou false indiquant si le jeu de données source inclut des en-têtes. Si une ligne d'en-têtes est incluse dans le jeu de données, les en-têtes sont utilisés pour les noms de champs.
- Encoding (Codage) : type de codage utilisé par le jeu de données source. La valeur par défaut est UTF-8.
L’outil Update Big Data Connection Dataset Properties (Mettre à jour les propriétés d’une connexion Big Data) met à jour les propriétés d’un jeu de données individuel. Utilisez les outils suivants pour modifier une connexion Big Data :
- Copy Dataset From Big Data Connection (Copier un jeu de données à partir d’une connexion Big Data) : copie un jeu de données d’une connexion Big Data dans une classe d’entités.
- Duplicate Dataset From Big Data Connection (Dupliquer un jeu de données d’une connexion Big Data) : crée une vue d’un jeu de données de connexion Big Data existant.
- Refresh Big Data Connection (Actualiser la connexion Big Data) : recherche les nouveaux jeux de données et les ajoute à la connexion Big Data.
- Remove Dataset From Big Data Connection (Supprimer un jeu de données d’une connexion Big Data) : supprime un jeu de données de la connexion Big Data.
- Update Big Data Connection Dataset Properties (Mettre à jour les propriétés d’un jeu de données de connexion Big Data) : modifie les propriétés d’un jeu de données de connexion Big Data individuel.
- Preview Dataset From Big Data Connection (Aperçu d’un jeu de données à partir d’une connexion Big Data) : prévisualise les dix premières entités de votre jeu de données pour vérifier qu’elles sont correctement enregistrées.
- Describe Dataset (Décrire le jeu de données) : permet de confirmer que le jeu de données s’affiche comme prévu.
Vous pouvez éventuellement mettre à jour manuellement votre fichier BDC. Vous devez toujours modifier manuellement le fichier .bdc dans les cas suivants :
- Un ou plusieurs de vos champs sont utilisés pour représenter l’emplacement x,y ou z.
- Voulez souhaitez mettre à jour le chemin source.
En savoir plus sur la mise en forme des fichiers de connexion Big Data.
Cet outil de géotraitement est mis en œuvre par Spark. Pour en savoir plus sur les connexions Big Data et leur utilisation, reportez-vous à la rubrique Connexions Big Data.
Syntaxe
UpdateBDCDatasetProperties(bdc_dataset, {expression}, {field_properties}, {geometry_type}, {spatial_reference}, {geometry_format_type}, {geometry_field}, {x_field}, {y_field}, {z_field}, {time_type}, {time_zone}, {start_time_format}, {end_time_format}, {file_extension}, {field_delimiter}, {record_terminator}, {quote_character}, {has_header_row}, {encoding})
Paramètre | Explication | Type de données |
bdc_dataset | Jeu de données de connexion Big Data à mettre à jour. Les options de mise à jour dépendent des données source (shapefile, fichier délimité, ORC ou fichier Parquet). | Table View |
expression (Facultatif) | Une expression permet de limiter les entités à utiliser dans l'analyse. | SQL Expression |
field_properties [field_properties,...] (Facultatif) | Indique les noms de champ et les propriétés à modifier.
Indique si les champs sont visibles ou masqués.
| Value Table |
geometry_type (Facultatif) | Spécifie le type de géométrie qui sera utilisé pour représenter spatialement le jeu de données. La géométrie ne peut pas être modifiée pour les jeux de données provenant de shapefile.
| String |
spatial_reference (Facultatif) | Valeur WKID ou chaîne WKT qui sera utilisée pour la référence spatiale du jeu de données. La valeur par défaut est WKID 4326 (WGS84). La référence spatiale ne peut pas être modifiée pour les jeux de données provenant de shapefile. | String |
geometry_format_type (Facultatif) | Spécifie le mode de mise en forme de la géométrie. La géométrie ne peut pas être modifiée pour les jeux de données provenant de shapefile.
| String |
geometry_field (Facultatif) | Champ unique utilisé pour représenter la géométrie. Ce champ est utilisé si le format de la géométrie est WKT, WKB, GeoJSON ou EsriJSON. | String |
x_field (Facultatif) | Champ utilisé pour représenter l’emplacement x. Si plusieurs de vos champs représentent l’emplacement x, modifiez le fichier .bdc manuellement. | String |
y_field (Facultatif) | Champ utilisé pour représenter l’emplacement y. Si plusieurs de vos champs représentent l’emplacement y, modifiez le fichier .bdc manuellement. | String |
z_field (Facultatif) | Champ utilisé pour représenter l’emplacement z. Si plusieurs de vos champs représentent l’emplacement z, modifiez le fichier .bdc manuellement. | String |
time_type (Facultatif) | Spécifie le type d’heure utilisé pour représenter temporairement le jeu de données.
| String |
time_zone (Facultatif) | Fuseau horaire du jeu de données. | String |
start_time_format [start_time_format,...] (Facultatif) | Champs utilisés pour définir l’heure de début et la mise en forme de l’heure. | Value Table |
end_time_format [end_time_format,...] (Facultatif) | Champs utilisés pour définir l’heure de fin et la mise en forme de l’heure. | Value Table |
file_extension (Facultatif) | Extension de fichier du jeu de données source. La valeur du paramètre ne peut pas être modifiée. | String |
field_delimiter (Facultatif) | Délimiteur de champ utilisé dans le jeu de données source. | String |
record_terminator (Facultatif) | Terminateur d'enregistrement utilisé dans le jeu de données source. | String |
quote_character (Facultatif) | Caractère de délimitation utilisé dans le jeu de données source. | String |
has_header_row (Facultatif) | Indique si le jeu de données source inclut un en-tête de ligne.
| Boolean |
encoding (Facultatif) | Type de codage utilisé par le jeu de données source. Par défaut UTF-8 est utilisé. | String |
Sortie dérivée
Nom | Explication | Type de données |
updated_bdc | Fichier BDC mis à jour avec les propriétés mises à jour appliquées au jeu de données spécifié. | Fichier |
Exemple de code
Le script Python ci-dessous illustre l'utilisation de la fonction UpdateBDCDatasetProperties.
# Name: UpdateBDCDatasetProperties.py
# Description: Add a filter and modify the schema, time, and geometry for a BDC dataset
# Requirements: ArcGIS Pro Advanced License
# Import system modules
import arcpy
# Set local variables
dataset = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc\myBigDataset"
filter = "COUNT > 500"
field_properties = "Field1 FLOAT true;Field2 STRING true;Field3 DOUBLE true"
geometry_type = "POINT"
sref = "4326"
geometry_format = "XYZ"
x_field = "Long"
y_field = "Lat"
z_field = ""
time_type = "INSTANT"
time_zone = "UTC"
time_formats = "Year yyyy"
file_extenstion = "csv"
file_delimitor = ","
file_terminator = r"\n"
file_quotechar = '"'
has_header_row = True
file_encoding = "UTF-8"
# Execute Update BDC Dataset Properties
arcpy.gapro.UpdateBDCDatasetProperties(dataset, filter, field_properties, geometry_type, sref, geometry_format, "",
x_field, y_field, z_field, time_type, time_zone, time_formats, None, file_extension, file_delimitor, file_terminator,
file_quotechar, has_header_row, file_encoding)
Environnements
Informations de licence
- Basic: Non
- Standard: Non
- Advanced: Oui
Rubriques connexes
Vous avez un commentaire à formuler concernant cette rubrique ?