Une connexion d’entités multi-fichier (MFC) permet de se connecter rapidement à des sources de données afin de visualiser et analyser des jeux de données volumineux. Une connexion MFC offre les fonctionnalités et la flexibilité nécessaires pour pouvoir utiliser des données et leur mise en forme.
Elle fait référence à un dossier d’un ou plusieurs jeux de données. Les jeux de données d’une connexion MFC servent de données d’entités en entrée (points, polylignes, polygones et données tabulaires) pour les outils de géotraitement. Lorsque vous créez une connexion MFC, un fichier .mfc est créé. Ce fichier pointe vers un répertoire de jeux de données qui décrit les jeux de données et leur structure dans la connexion MFC, avec notamment des informations sur la géométrie et l’heure. Vous pouvez rechercher des jeux de données MFC dans les outils de géotraitement et les afficher sur la carte. Voici quelques exemples d’utilisation appropriée d’une connexion MFC :
- Vous avez plusieurs shapefiles représentant une zone de grande envergure. Chaque shapefile représente un sous-ensemble de la zone et vous voulez utiliser tous les shapefiles ensemble.
- Vous recevez un nouveau fichier .csv tous les jours avec des relevés de température. Vous voulez inclure le nouveau fichier .csv dans le cadre d’un jeu de données avec vos fichiers .csv existants.
- Vous utilisez des données qui comportent plusieurs champs représentant l’heure d’un événement. Vous voulez utiliser tous les champs pour représenter l’heure.
- Vous avez des fichiers Parquet à utiliser.
Voici quelques raisons d’utiliser une connexion MFC en entrée avec des outils de géotraitement :
- Vous pouvez représenter plusieurs jeux de données de même structure et de même type de fichier en tant que jeu de données unique.
- Sachant qu’une connexion MFC accède aux données pendant l’analyse, vous pouvez continuer à ajouter des données à un jeu de données existant dans une connexion MFC sans avoir à réinscrire ou publier les données.
- Vous pouvez modifier la connexion MFC de façon à supprimer, ajouter ou mettre à jour les jeux de données visibles.
- Les connexions MFC s’avèrent flexibles quant à la manière de définir l’heure et la géométrie et autorisent la présence de plusieurs formats d’heure dans un même jeu de données.
Formats de données pris en charge
Les connexions d’entités multi-fichier prennent en charge les jeux de données suivants :
- Fichiers délimités (tels que .csv, .tsv et .txt)
- Shapefiles (.shp)
- Fichiers Parquet (.parquet)
Remarque :
Seuls les fichiers Parquet non chiffrés sont pris en charge. Les fichiers GeoParquet ne sont pas pris en charge.
- Fichiers ORC (.orc)
Si vous utilisez une connexion MFC dans les outils GeoAnalytics Desktop, tous les formats en entrée sont pris en charge. Si vous utilisez des jeux de données MFC dans un autre outil de géotraitement, les fichiers délimités, les shapefiles et les fichiers parquet sont pris en charge.
Terminologie relative aux connexions d’entités multi-fichier
Le tableau suivant recense les termes couramment utilisés dans le cadre des connexions MFC :
Période | Description |
---|---|
Connexion d’entités multi-fichier | Élément représentant le fichier MFC. Cette connexion MFC peut être développée pour afficher les jeux de données et sélectionnée pour être utilisée dans les outils de géotraitement. Ce fichier de connexion est l’interface ArcGIS Pro du fichier MFC. |
Fichier de connexion d’entités multi-fichier | Fichier (.mfc) qui est créé et stocké lorsque vous créez une connexion MFC avec l’outil Créer une connexion d’entités multi-fichier. Le fichier contient des informations sur les jeux de données et les structures contenues, ainsi que des propriétés géométriques et temporelles. Lorsque vous affichez ce fichier dans ArcGIS Pro, il s’agit d’un élément MFC. En savoir plus sur les fichiers de connexion d’entités multi-fichier |
Jeu de données de connexion d’entités multi-fichier | Jeu de données dans la connexion MFC. Vous pouvez ajouter ce jeu de données dans une carte ou l’utiliser en entrée dans des outils de géotraitement. |
Localisation source | Emplacement de dossiers inscrit en tant que connexion MFC. Cet emplacement contient un ou plusieurs dossiers représentant des jeux de données MFC. Les outils de connexion d’entités multi-fichier ne modifient pas ce dossier. |
Données source | Jeux de données inscrits dans la connexion MFC. Lorsque vous utilisez une connexion MFC, les données source ne sont pas modifiées. Les outils de connexion d’entités multi-fichier ne modifient pas ces données. |
Structurer les données en entrée
Pour utiliser des jeux de données en entrée dans une connexion MFC, les données doivent être structurées correctement. Pour préparer les données à une connexion MFC, formatez les jeux de données en tant que sous-dossiers dans un dossier source unique que vous inscrivez. Dans ce dossier source, les noms des sous-dossiers représentent les noms des jeux de données.
L’image ci-dessus représente la structure appropriée d’une connexion MFC. Le dossier source est inscrit, et chaque sous-dossier dans le dossier source représente un jeu de données. Dans cet exemple, vous inscririez le dossier source et incluriez trois jeux de données dans la connexion MFC : Dataset-1, Dataset-2 et Dataset-3.
Dans les sous-dossiers des jeux de données, vous pouvez structurer les données. Si vos sous-dossiers contiennent plusieurs dossiers ou fichiers, l’ensemble du contenu des sous-dossiers est lu en tant que jeu de données unique. Ils doivent en outre partager la même structure et le même type de fichier.
Remarque :
Tous les fichiers d’un dossier de jeux de données ont la même structure. Si un fichier a une structure différente, il ne sera pas utilisé correctement durant la visualisation et l’analyse.
Dans cet exemple, trois dossiers de jeux de données identiques ont un contenu différent. Chaque jeu de données est décrit ci-dessous :
- Dataset-1 : ce jeu de données se compose d’un seul fichier : D1-1. Lorsque Dataset-1 est utilisé dans le cadre d’une visualisation ou d’une analyse, un seul shapefile est utilisé.
- Dataset-2 : ce jeu de données se compose de deux fichiers texte : D2-1 et D2-2. Lorsque Dataset-2 est utilisé dans le cadre d’une visualisation ou d’une analyse, les deux fichiers sont utilisés.
- Dataset-3 : ce jeu de données se compose de deux dossiers : D3-Folder-1 et D3-Folder-2, chacun contenant un seul jeu de données, D3-1 et D3-2. Lorsque Dataset-3 est utilisé dans le cadre d’une visualisation ou d’une analyse, D3-1 et D3-2 sont tous les deux utilisés.
Remarque :
Si un jeu de données se trouve dans un dossier et que son nom commence par un trait de soulignement (_), il est considéré comme étant masqué et ne peut pas être détecté en tant que jeu de données. Cela ne s’applique pas aux sous-dossiers ou aux fichiers. Les données sont utilisées même si les noms de sous-dossiers et de fichiers commencent par un trait de soulignement.
Ce sont des exemples de la manière dont vous pouvez structurer les données. Le nombre de fichiers ou dossiers ne change pas la façon dont les données sont utilisées pour la visualisation ou l’analyse. Il n’y a aucun avantage à ajouter un sous-dossier ou à supprimer des sous-dossiers dans chaque dossier de jeux de données ; la structuration des dossiers à ce niveau est facultative.
Pour commencer à utiliser des connexions d’entités multi-fichier, reportez-vous à la rubrique Utiliser des connexions d’entités multi-fichier.
Rubriques connexes
Vous avez un commentaire à formuler concernant cette rubrique ?