Utiliser des connexions Big Data

Vous pouvez configurer, visualiser et utiliser des connexions Big Data (BDC) dans les analyses.

Utiliser une connexion Big Data (BDC)

Une fois que vous avez structuré vos données, vous pouvez réaliser les opérations suivantes :

  1. Configurer une BDC
  2. Visualiser un jeu de données BDC
  3. Utiliser des jeux de données BDC dans l’analyse

Configurer une BDC

Pour démarrer, vous devez créer une connexion Big Data (BDC). Vous pouvez créer une connexion Big Data (BDC) de deux manières :

  • Avec la boîte de dialogue New Big Data Connection (Nouvelle connexion Big Data). Pour accéder à cette boîte de dialogue, sur le ruban Insert (Insérer), cliquez sur Connections (Connexions), puis sélectionnez New Big Data Connection (Nouvelle connexion Big Data). La boîte de dialogue offre une expérience interactive pour créer une connexion Big Data (BDC) et configurer des propriétés dans chaque jeu de données.
  • Avec l’outil de géotraitement Créer une connexion Big Data.

Vous pouvez rencontrer un de ces deux problèmes lorsque vous examinez les jeux de données de votre connexion Big Data :

  • Les jeux de données attendus sont introuvables. Dans ce cas, vérifiez que le chemin d’accès spécifié comme dossier source contenant les sous-dossiers est correct et que son type de données est pris en charge.
  • Impossible d’inscrire un ou de plusieurs jeux de données. Si vous ne parvenez pas à inscrire des jeux de données, vous rencontrez peut-être les problèmes suivants :

    ProblèmeSolutionExemple

    Le jeu de données n’est pas dans le format attendu.

    Ouvrez le fichier pour voir s’il possède l’aspect attendu. Si les données sont structurées de façon incorrecte, mettez le fichier à jour et réessayez.

    Un fichier .csv comporte quelques lignes et un résumé des données, puis uniquement des lignes vides.

    Les structures des jeux de données dans un dossier ne concordent pas.

    Tous les fichiers dans un dossier de jeux de données doivent avoir la même structure. Ouvrez les fichiers pour comparer les structures. Corrigez les structures non concordantes et réessayez d’inscrire le jeu de données.

    Vous disposez d’un fichier .csv avec 10 champs, et d’un autre avec 8.

    Les types de fichiers d’un jeu de données dans un dossier ne concordent pas.

    Tous les fichiers dans un dossier de jeux de données doivent avoir la même extension (type de fichier). Vérifiez les types de fichiers de la localisation de la source de données et supprimez ou relocalisez les fichiers incorrectement positionnés.

    Un jeu de données de shapefile se trouve dans le même dossier qu’un fichier Parquet.

    Vous avez un format de champ non reconnu.

    Même si cette situation est peu probable, elle peut se produire si les fichiers ORC et Parquet utilisent un format inattendu. Vérifiez que vous utilisez des formats de champs valides.

    Vous avez un fichier Parquet avec un format de champ inconnu.

Si vous créez une BDC à l’aide d’un fichier délimité et que vous ne voyez pas les lignes d’en-tête, il se peut que la ligne d’en-tête ne soit pas valide. Assurez-vous que tous les champs ont un en-tête et qu’aucun n’est vide. Si vous utilisez la boîte de dialogue pour créer le partage de fichiers Big Data, vous pouvez actualiser les en-têtes de champ dans la fenêtre Fields (Champs). Vous pouvez également mettre à jour les noms des champs en utilisant l’outil Mettre à jour les propriétés d’une connexion Big Data.

Lorsque vous créez une connexion Big Data, la structure, la géométrie et l’heure sont indiquées pour chacun de vos jeux de données. Vous pouvez généralement modifier la manière dont les jeux de données représentent ces valeurs. Pour vérifier que chaque jeu de données représente correctement la géométrie, l’heure et les champs, utilisez l’outil de géotraitement Décrire le jeu de données. Par exemple, lorsque vous examinez vos jeux de données, vous pouvez appliquer un ou plusieurs des changements suivants à un ou plusieurs jeux de données dans votre connexion Big Data :

  • Modifier le nom de champ des jeux de données délimités.
  • Modifier les champs visibles pour l’analyse.
  • Changer les champs utilisés pour représenter la géométrie ou l’heure.
  • Ajouter un filtre à un jeu de données.
  • Ajouter un alias à un jeu de données.
  • Supprimer les jeux de données de la connexion Big Data que vous ne souhaitez pas analyser.
  • Actualiser la connexion Big Data pour inclure un jeu de données récemment ajouté (un nouveau sous-dossier dans le dossier source).

Pour apporter ces modifications facultatives, vous pouvez utiliser la boîte de dialogue Nouvelle connexion Big Data ou une combinaison des outils suivants :

Visualiser un jeu de données BDC

Vous pouvez visualiser les jeux de données DBC basés sur des fichiers délimités et des shapefiles sur une carte.

Remarque :
Vous ne pouvez pas visualiser des jeux de données BDC qui utilisent des fichiers source parquet et ORC.

Pour ajouter votre jeu de données à la carte, localisez l’élément BDC dans la fenêtre Catalog (Catalogue), cliquez pour développer les jeux de données, puis ajoutez le jeu de données à la carte.

Dans votre carte, le processus est plus simple pour les jeux de données BDC mais il présente les limitations suivantes :

  • Lors de la visualisation des jeux de données BDC, les propriétés de temps des jeux de données BDC ne sont pas automatiquement définies dans la nouvelle couche. Pour visualiser le jeu de données avec le temps, définissez les propriétés de temps de la couche après avoir ajouté le jeu de données à la carte.
  • Les fichiers délimités permettent de dessiner en zoomant sur l’étendue complète de la référence spatiale du jeu de données BDC.
  • Si vous ajoutez de nouveaux enregistrements à un jeu de données BDC existant, par exemple en ajoutant de nouvelles lignes à un fichier CSV dans une BDC existante, vous devrez redémarrer ArcGIS Pro pour que les nouveaux enregistrements soient dessinés.
  • Si vous ajoutez des fichiers à un jeu de données BDC existant, par exemple en ajoutant un fichier CSV dans un jeu de données BDC existant, vous devrez redémarrer ArcGIS Pro pour que les nouveaux enregistrements soient dessinés.

Utiliser des jeux de données BDC dans l’analyse

Lorsque des jeux de données BDC sont utilisés en entrée dans les outils GeoAnalytics Desktop, l’analyse est optimisée pour lire les données et pour s’exécuter en parallèle sur les cœurs de votre machine. Pour tous les autres outils de géotraitement, la lecture et le traitement des jeux de données BDC ne sont pas optimisés pour fonctionner en parallèle, mais sont plutôt séquentiels et s’exécutent dans un seul thread.

Vous pouvez utiliser les jeux de données BDC basés sur les fichiers délimités ou les shapefiles dans la plupart des outils de géotraitement.

Remarque :
Les jeux de données BDC utilisant les fichiers sources Parquet et ORC ne peuvent être utilisés que dans les outils de GeoAnalytics Desktop.

Vous ne pouvez pas appliquer une sélection à un jeu de données BDC lorsqu’il sert d’entrée à un outil GeoAnalytics Desktop.

Pour utiliser un jeu de données BDC dans un outil de géotraitement, ajoutez un jeu de données BDC à une carte et sélectionnez le nom de la couche dans la liste de choix des paramètres, ou utilisez le bouton Browse (Parcourir) pour accéder à un espace de travail BDC et sélectionnez le jeu de données en entrée. Les outils suivants ne prennent pas en charge les fichiers BDC :