Refresh Big Data Connection (Actualiser une connexion Big Data) (GeoAnalytics Desktop)

Synthèse

Actualise une connexion Big Data (BDC) existante et inscrit les nouveaux jeux de données ajoutés à l’emplacement source.

Utilisation

  • Cet outil requiert une connexion Big Data (BDC). Pour créer une connexion Big Data, utilisez l’outil Create Big Data Connection (Créer une connexion Big Data).

  • Cet outil permet d’ajouter un ou plusieurs nouveaux jeux de données à une connexion Big Data existante. En outre, il réinscrit les jeux de données qui ont été supprimés à l’aide de l’outil Supprimer un jeu de données d’une connexion Big Data. Voici quelques exemples d’utilisation de cet outil :

    • Vous avez copié un dossier de données dans votre dossier source BDC existant et souhaitez qu’il soit représenté comme jeu de données dans votre connexion Big Data.
    • Vous avez utilisé l’outil Remove Dataset From Big Data Connection (Supprimer un jeu de données d’une connexion Big Data) et souhaitez rajouter les jeux de données supprimés à la connexion Big Data.

  • Cet outil n’actualise pas les propriétés de jeu de données existantes qui ont été mises à jour à l’aide de l’outil Mettre à jour les propriétés d’une connexion Big Data. Toutes les propriétés modifiées sont conservées. Les scénarios suivants incluent les processus recommandés :

  • Les messages de l’outil incluent les informations suivantes sur les jeux de données découverts et leur statut :

    • Skipped (Ignoré(s)) : tous les jeux de données existants sont ignorés lors de l’actualisation et restent tels quels.
    • Succeeded (Réussite) : de nouveaux jeux de données ont été découverts et ajoutés à la connexion Big Data.
    • Failed (Échec) : jeux de données non ajoutés à la connexion Big Data.

    Vous pouvez rencontrer un de ces deux problèmes lorsque vous examinez les jeux de données de votre connexion Big Data :

    • Les jeux de données attendus sont introuvables. Dans ce cas, vérifiez que le chemin d’accès spécifié comme dossier source contenant les sous-dossiers est correct et que son type de données est pris en charge.
    • Impossible d’inscrire un ou de plusieurs jeux de données. Si vous ne parvenez pas à inscrire des jeux de données, vous rencontrez peut-être les problèmes suivants :

      ProblèmeSolutionExemple

      Le jeu de données n’est pas dans le format attendu.

      Ouvrez le fichier pour voir s’il possède l’aspect attendu. Si les données sont structurées de façon incorrecte, mettez le fichier à jour et réessayez.

      Un fichier .csv comporte quelques lignes et un résumé des données, puis uniquement des lignes vides.

      Les structures des jeux de données dans un dossier ne concordent pas.

      Tous les fichiers dans un dossier de jeux de données doivent avoir la même structure. Ouvrez les fichiers pour comparer les structures. Corrigez les structures non concordantes et réessayez d’inscrire le jeu de données.

      Vous disposez d’un fichier .csv avec 10 champs, et d’un autre avec 8.

      Les types de fichiers d’un jeu de données dans un dossier ne concordent pas.

      Tous les fichiers dans un dossier de jeux de données doivent avoir la même extension (type de fichier). Vérifiez les types de fichiers de la localisation de la source de données et supprimez ou relocalisez les fichiers incorrectement positionnés.

      Un jeu de données de shapefile se trouve dans le même dossier qu’un fichier Parquet.

      Vous avez un format de champ non reconnu.

      Même si cette situation est peu probable, elle peut se produire si les fichiers ORC et Parquet utilisent un format inattendu. Vérifiez que vous utilisez des formats de champs valides.

      Vous avez un fichier Parquet avec un format de champ inconnu.

    En savoir plus sur les motifs des échecs d’ajout de jeux de données à un fichier BDC

  • Une fois que vous avez actualisé une connexion Big Data, utilisez l’outil Décrire le jeu de données pour vérifier que le jeu de données mis à jour possède l’aspect attendu.

  • L'outil Refresh Big Data Connection (Actualiser une connexion Big Data) identifie les nouveaux jeux de données. Les outils suivants peuvent également être utilisés pour modifier une connexion Big Data :

  • Cet outil de géotraitement est mis en œuvre par Spark. Pour en savoir plus sur les connexions Big Data et leur utilisation, reportez-vous à la rubrique Connexions Big Data.

Paramètres

ÉtiquetteExplicationType de données
Big Data Connection File (Fichier de connexion Big Data)

Fichier BDC à actualiser.

File
Champ de géométrie visibles
(Facultatif)

Indique si les champs utilisés pour identifier la géométrie sont inclus (visibles) comme champs de l’analyse si le fichier BDC est utilisé dans d’autres outils de géotraitement. Si les champs de géométrie ne sont pas visibles, la géométrie est tout de même appliquée au jeu de données. Le paramètre de visibilité de la géométrie peut être modifié dans la connexion Big Data.

  • Cochée : les champs de géométrie sont inclus comme champs de l’analyse. Il s’agit de l’option par défaut.
  • Non cochée : les champs de géométrie ne sont pas inclus comme champs de l’analyse.

Boolean
Champs temporels visibles
(Facultatif)

Indique si les champs utilisés pour indiquer le temps sont inclus (visibles) comme champs de l’analyse si le fichier BDC est utilisé dans d’autres outils de géotraitement. Si les champs temporels ne sont pas visibles, le temps est tout de même appliqué au jeu de données. Le paramètre de visibilité du temps peut être modifié dans la connexion Big Data.

  • Cochée : les champs temporels sont inclus comme champs de l’analyse. Il s’agit de l’option par défaut.
  • Non cochée : les champs temporels ne sont pas inclus comme champs de l’analyse.

Boolean

Sortie obtenue

ÉtiquetteExplicationType de données
Updated BDC (BDC mis à jour)

Fichier .bdc en entrée avec les jeux de données mis à jour.

File

arcpy.gapro.RefreshBDC(bdc_file, {visible_geometry}, {visible_time})
NomExplicationType de données
bdc_file

Fichier BDC à actualiser.

File
visible_geometry
(Facultatif)

Indique si les champs utilisés pour identifier la géométrie sont inclus (visibles) comme champs de l’analyse si le fichier BDC est utilisé dans d’autres outils de géotraitement. Si les champs de géométrie ne sont pas visibles, la géométrie est tout de même appliquée au jeu de données. Le paramètre de visibilité de la géométrie peut être modifié dans la connexion Big Data.

  • GEOMETRY_VISIBLELes champs de géométrie sont inclus comme champs de l’analyse. Il s’agit de l’option par défaut.
  • GEOMETRY_NOT_VISIBLELes champs de géométrie ne sont pas inclus comme champs de l’analyse.
Boolean
visible_time
(Facultatif)

Indique si les champs utilisés pour indiquer le temps sont inclus (visibles) comme champs de l’analyse si le fichier BDC est utilisé dans d’autres outils de géotraitement. Si les champs temporels ne sont pas visibles, le temps est tout de même appliqué au jeu de données. Le paramètre de visibilité du temps peut être modifié dans la connexion Big Data.

  • TIME_VISIBLELes champs temporels sont inclus comme champs de l’analyse. Il s’agit de l’option par défaut.
  • TIME_NOT_VISIBLELes champs temporels ne sont pas inclus comme champs de l’analyse.
Boolean

Sortie obtenue

NomExplicationType de données
updated_bdc

Fichier .bdc en entrée avec les jeux de données mis à jour.

File

Exemple de code

RefreshBDC (script autonome)

Le script Python ci-dessous montre comment utiliser la fonction RefreshBDC.

# Name: RefreshBDC.py
# Description: Refreshes a big data connection to automatically discover datasets that 
#              have been added.
#
# Requirements: ArcGIS Pro Advanced License

# Import system modules
import arcpy

# Set local variables
bdcFile = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc"

# Execute Refresh Big Data Connection
arcpy.gapro.refreshBDC(bdcFile)

Environnements

Cet outil n’utilise pas d’environnement de géotraitement.

Informations de licence

  • Basic: Non
  • Standard: Non
  • Advanced: Oui

Rubriques connexes