Résumé
Actualise une connexion Big Data (BDC) existante et inscrit les nouveaux jeux de données ajoutés à l’emplacement source.
Utilisation
Cet outil requiert une connexion Big Data (BDC). Pour créer une connexion Big Data, utilisez l’outil Create Big Data Connection (Créer une connexion Big Data).
Cet outil permet d’ajouter un ou plusieurs nouveaux jeux de données à une connexion Big Data existante. En outre, il réinscrit les jeux de données qui ont été supprimés à l’aide de l’outil Remove Dataset From Big Data Connection (Supprimer un jeu de données d’une connexion Big Data). Voici quelques exemples d’utilisation de cet outil :
- Vous avez copié un dossier de données dans votre dossier source BDC existant et souhaitez qu’il soit représenté comme jeu de données dans votre connexion Big Data.
- Vous avez utilisé l’outil Remove Dataset From Big Data Connection (Supprimer un jeu de données d’une connexion Big Data) et souhaitez rajouter les jeux de données supprimés à la connexion Big Data.
Cet outil n’actualise pas les propriétés de jeu de données existantes qui ont été mises à jour à l’aide de l’outil Update Big Data Connection Dataset Properties (Mettre à jour les propriétés d’une connexion Big Data). Toutes les propriétés modifiées sont conservées. Les scénarios suivants incluent les processus recommandés :
- Vous avez modifié la structure d’un jeu de données source existant : utilisez l’outil Update Big Data Connection Dataset Properties (Mettre à jour les propriétés d’une connexion Big Data) pour modifier les champs. Vous pouvez également utiliser l’outil Remove Dataset From Big Data Connection (Supprimer un jeu de données d’une connexion Big Data) pour supprimer le jeu de données et l’outil Refresh Big Data Connection (Actualiser une connexion Big Data) si le jeu de données de connexion Big Data que vous souhaitez conserver n’a fait l’objet d’aucune modification.
- Vous avez ajouté de nouveaux fichiers à un jeu de données existant : aucune étape supplémentaire n’est requise. Lorsque vous utilisez un outil de géotraitement pour analyser vos données BDC, tous les fichiers du jeu de données de connexion Big Data sont inclus pour l’analyse.
- Vous avez supprimé un jeu de données existant : utilisez l’outil Remove Dataset From Big Data Connection (Supprimer un jeu de données d’une connexion Big Data) pour supprimer le jeu de données de la connexion Big Data.
Les messages de l’outil incluent les informations suivantes sur les jeux de données découverts et leur statut :
- Skipped (Ignoré(s)) : tous les jeux de données existants sont ignorés lors de l’actualisation et restent tels quels.
- Succeeded (Réussite) : de nouveaux jeux de données ont été découverts et ajoutés à la connexion Big Data.
- Failed (Échec) : jeux de données non ajoutés à la connexion Big Data.
Vous pouvez rencontrer un de ces deux problèmes lorsque vous examinez les jeux de données de votre connexion Big Data :
- Les jeux de données attendus sont introuvables. Dans ce cas, vérifiez que le chemin d’accès spécifié au dossier source contenant les sous-dossiers est correct et que son type de données est pris en charge.
- Impossible d’inscrire un ou de plusieurs jeux de données. Si vous ne parvenez pas à inscrire des jeux de données, vous rencontrez peut-être les problèmes suivants :
Problème Solution Exemple Le jeu de données n’est pas dans le format attendu.
Ouvrez le fichier pour voir s’il possède l’aspect attendu. Si les données sont structurées de façon incorrecte, mettez le fichier à jour et réessayez.
Un fichier .csv comporte quelques lignes et un résumé des données, puis seulement des lignes vides.
Les structures des jeux de données dans un dossier ne concordent pas.
Tous les fichiers dans un dossier de jeux de données doivent avoir la même structure. Ouvrez les fichiers pour comparer les structures. Corrigez les structures non concordantes et réessayez d’inscrire le jeu de données.
Vous avez un fichier .csv avec 10 champs, et un autre avec 8.
Les types de fichiers d’un jeu de données dans un dossier ne concordent pas.
Tous les fichiers dans un dossier de jeux de données doivent avoir la même extension (type de fichier). Vérifiez les types de fichiers de la localisation de la source de données et supprimez ou relocalisez les fichiers incorrectement positionnés.
Un jeu de données de shapefile se trouve dans le même dossier qu’un fichier Parquet.
Vous avez un format de champ non reconnu.
Même si cette situation est peu probable, elle peut se produire si les fichiers ORC et Parquet utilisent un format inattendu. Vérifiez que vous utilisez des formats de champs valides.
Vous avez un fichier Parquet avec un format de champ inconnu.
En savoir plus sur les motifs des échecs d’ajout de jeux de données à un fichier BDC
Une fois que vous avez actualisé une connexion Big Data, utilisez l’outil Describe Dataset (Décrire le jeu de données) pour vérifier que le jeu de données mis à jour possède l’aspect attendu.
L'outil Refresh Big Data Connection (Actualiser une connexion Big Data) identifie les nouveaux jeux de données. Les outils suivants peuvent également être utilisés pour modifier une connexion Big Data :
- Copy Dataset From Big Data Connection (Copier un jeu de données à partir d’une connexion Big Data) : copie un jeu de données d’une connexion Big Data dans une classe d’entités.
- Duplicate Dataset From Big Data Connection (Dupliquer un jeu de données d’une connexion Big Data) : crée une vue d’un jeu de données de connexion Big Data existant.
- Remove Dataset From Big Data Connection (Supprimer un jeu de données d’une connexion Big Data) : supprime un jeu de données de la connexion Big Data.
- Update Big Data Connection Dataset Properties (Mettre à jour les propriétés d’un jeu de données de connexion Big Data) : modifie les propriétés d’un jeu de données de connexion Big Data individuel.
- Preview Dataset From Big Data Connection (Aperçu d’un jeu de données à partir d’une connexion Big Data) : prévisualise les dix premières entités de votre jeu de données pour vérifier qu’elles sont correctement enregistrées.
- Describe Dataset (Décrire le jeu de données) : permet de vérifier que le jeu de données possède l’aspect attendu.
Cet outil de géotraitement est mis en œuvre par Spark. Pour en savoir plus sur les connexions Big Data et leur utilisation, reportez-vous à la rubrique Connexions Big Data.
Syntaxe
RefreshBDC(bdc_file, {visible_geometry}, {visible_time})
Paramètre | Explication | Type de données |
bdc_file | Fichier BDC à actualiser. | File |
visible_geometry (Facultatif) | Indique si les champs utilisés pour identifier la géométrie sont inclus (visibles) comme champs de l’analyse si le fichier BDC est utilisé dans d’autres outils de géotraitement. Si les champs de géométrie ne sont pas visibles, la géométrie est tout de même appliquée au jeu de données. Le paramètre de visibilité de la géométrie peut être modifié dans la connexion Big Data.
| Boolean |
visible_time (Facultatif) | Indique si les champs utilisés pour indiquer le temps sont inclus (visibles) comme champs de l’analyse si le fichier BDC est utilisé dans d’autres outils de géotraitement. Si les champs temporels ne sont pas visibles, le temps est tout de même appliqué au jeu de données. Le paramètre de visibilité du temps peut être modifié dans la connexion Big Data.
| Boolean |
Sortie dérivée
Nom | Explication | Type de données |
updated_bdc | Fichier .bdc en entrée avec les jeux de données mis à jour. | Fichier |
Exemple de code
Le script Python ci-dessous illustre l'utilisation de la fonction RefreshBDC.
# Name: RefreshBDC.py
# Description: Refreshes a big data connection to automatically discover datasets that
# have been added.
#
# Requirements: ArcGIS Pro Advanced License
# Import system modules
import arcpy
# Set local variables
bdcFile = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc"
# Execute Refresh Big Data Connection
arcpy.gapro.refreshBDC(bdcFile)
Environnements
Informations de licence
- Basic: Non
- Standard: Non
- Advanced: Oui
Rubriques connexes
Vous avez un commentaire à formuler concernant cette rubrique ?