Foires aux questions sur l’utilisation d’un fichier Parquet dans ArcGIS Pro

Les questions et réponses ci-après fournissent des informations détaillées sur l’utilisation d’un fichier Apache Parquet depuis une connexion aux dossiers locale ou une connexion au stockage Cloud dans ArcGIS Pro.

Caches

Stockage cloud

Cartographie

Partage

Caches

Quelle est la taille des caches locaux qui sont créés pour un fichier Parquet que j’utilise dans ArcGIS Pro ?

Comme Parquet est un format de stockage hautement compressé, les fichiers de cache local que ArcGIS Pro crée sont généralement beaucoup plus grands que le fichier d’origine.

Par exemple, un fichier Parquet contenant 1 million d’enregistrements de point stocké dans un fichier Parquet la taille est 20 Mo peut générer un cache d’une taille de 250 Mo. La différence de taille dépend des données qui figurent dans le fichier Parquet, comme le nombre de colonnes et les types de données et d’entité.

La différence de taille entre le fichier et le cache n’est pas linéaire.

Puis-je effacer les caches locaux ?

Vous pouvez supprimer les fichiers dans le répertoire ParquetCache. L’emplacement par défaut de ce répertoire est C:\Users\<userprofile>\Documents\ArcGIS\ParquetCache. Une fois que vous avez supprimé un fichier de cache, ArcGIS Pro le recrée lorsque vous accédez à nouveau au fichier Parquet de façon à ce que ArcGIS Pro crée un cache local tel que décrit dans Données Parquet mises en cache.

Vous pouvez aussi supprimer les caches locaux et recréer ceux dont vous avez besoin à l’aide de la fonction ArcPy CreateParquetCache.

Stockage cloud

Quel fournisseur Cloud puis-je utiliser pour héberger les fichiers Parquet auxquels j’accède individuellement en vue de leur ajout à une carte ou une scène ?

Vous pouvez créer une connexion au stockage Cloud pour un compartiment Amazon Simple Storage Service (S3).

Quel type d’informations d’identification puis-je utiliser pour créer une connexion au stockage Cloud qui accède à un fichier Parquet dans un compartiment Amazon S3 ?

Vous pouvez utiliser une clé d’accès ou un jeton de session. Si le compartiment est configuré pour l’accès anonyme, aucune information d’identification n’est requise pour accéder au fichier qu’il contient. Reportez-vous à la documentation de l’outil Créer un fichier de connexion au stockage Cloud pour prendre connaissance de la liste des types d’informations d’identification pris en charge.

Quelles autorisations de stratégie basée sur les ressources dois-je configurer pour un rôle IAM afin d’autoriser ArcGIS Pro à utiliser un fichier Parquet dans un compartiment Amazon S3 ?

Le rôle IAM requiert au moins la stratégie suivante :

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Sid": "<statement-id>",
            "Effect": "Allow",
            "Action": [
                "s3:ListBucket",
                "s3:GetObject",
                "s3:GetObjectVersion"
            ],
            "Resource": [
                "arn:aws:s3:::<cache-bucket-name>/*",
                "arn:aws:s3:::<cache-bucket-name>"
            ]
        }
    ]
}

Remplacez les valeurs entre chevrons (<>) par des valeurs propres à votre rôle IAM et à votre compartiment.

La version du format de document de stratégie affichée ci-dessus date du 17 octobre 2012. Si vous changez cette date de version, il pourra également être nécessaire de changer le format de document.

Cartographie

Existe-t-il un moyen d’afficher les entités sur une carte ou dans une scène dans ArcGIS Pro en fonction des informations stockées dans les champs x,y,z dans un fichier Parquet ?

Exécutez l’outil de géotraitement Table XY vers points avec la couche de carte Parquet comme table en entrée pour créer une classe d’entités dans un format en sortie pris en charge. Ensuite, ajoutez la classe d’entités en sortie à la carte ou à la scène.

Puis-je agréger des entités d’un fichier Parquet dans des groupes sur la carte ?

Oui. Si le fichier Parquet contient plus de 10 000 lignes, la couche d’entités qui est ajoutée à la carte sera dessinée avec des groupes de type géocarré. Vous pouvez définir un seuil d’échelle différent pour la couche ou désactiver le regroupement. Cependant, vous ne pouvez pas changer le type de groupe car seuls les groupes de type géocarré sont pris en charge.

Partage

Puis-je publier une couche Web depuis les données d’un fichier Parquet que j’ajoute à une carte ou à une scène à partir d’une connexion aux dossiers ou d’une connexion au stockage Cloud dans ArcGIS Pro  ?

Non, pas pour le moment.

Puis-je inclure les données d’un fichier Parquet dans des paquetages, comme des paquetages de carte ou des paquetages de projet ?

Non, pas pour le moment.