Décrire le jeu de données (GeoAnalytics Desktop)—ArcGIS Pro

Synthèse

Récapitule les fonctionnalités en statistiques de champs calculées, en entités d’échantillons et en limites d’étendues.

Illustration

Diagramme de processus Décrire le jeu de données

Utilisation

Voici des exemples de ce que l’outil Décrire le jeu de données vous permet d’effectuer :
- Vérifier que vous avez correctement enregistré l’heure et la géométrie avec votre partage de fichiers Big Data.
- Comprendre les valeurs attributaires avec les statistiques de champs synthétisées.
- Visualiser votre Big Data avec une couche d’échantillon. Au lieu de dessiner une quantité d’entités, dessiner un échantillon.
- Exécuter des processus à l’aide d’un échantillon des données avant de procéder à un déploiement pour un traitement plus long et à plus grande échelle.
- Déterminer l’emplacement d’un jeu de données en calculant l’étendue géographique.
Par défaut, l’outil produit un tableau en sortie, contenant des statistiques résumées pour chaque champ de la couche en entrée. Par ailleurs, un tableau décrivant les propriétés géométriques ou temporelles de la couche en entrée s’affiche dans la fenêtre de géotraitement.
Si la couche en entrée contient une géométrie, l’outil affiche un tableau décrivant les propriétés géométriques suivantes de la couche en entrée :
- Geometry type : type de géométrie de la couche en entrée (point, ligne ou polygone).
- Spatial reference : référence spatiale de la couche en entrée.
- Count of non-empty features : nombre d’entités comportant une géométrie valide dans l’étendue de la référence spatiale de la couche en entrée.
- Count of empty features : nombre d’entités sans géométrie valide. Ces entités peuvent comporter une géométrie vide, ou la géométrie peut être située en dehors de la référence spatiale utilisée.
- Spatial extent : étendue spatiale des entités de la couche en entrée.
Dans le cas d’une couche en entrée temporelle, l’outil affiche un tableau décrivant les propriétés temporelles suivantes de la couche en entrée :
- Time type : type temporel de la couche en entrée (instant ou intervalle).
- Count of non-empty features : nombre d’entités présentant une valeur temporelle valide.
- Count of empty features : nombre d’entités présentant une valeur temporelle nulle ou non valide.
- Temporal extent : étendue temporelle des entités de la couche en entrée. Cette valeur contient une heure de début et une heure de fin.
Utilisez le paramètre Number of Sample Features (Nombre d’entités d’échantillon) afin de spécifier le nombre d’entités à échantillonner. Si vous le laissez vide ou sélectionnez 0, aucun échantillon ne sera créé. Le sous-ensemble en sortie présentera les mêmes paramètres de schéma, de géométrie et de temps que les entités en sortie. Le sous-ensemble peut être utilisé pour comprendre comment vos jeux de données apparaissent une fois ajoutés à une carte ou visualisés dans une table attributaire. En outre, vous pouvez exécuter une analyse au niveau du sous-ensemble afin de déterminer les meilleures entrées pour des analyses à plus grande échelle.
Si vous spécifiez une taille d’échantillon supérieure au nombre total d’entités en entrée, toutes les entités sont retournées.
La couche d’échantillon ne représente pas une sélection géographique aléatoire réelle et ne doit pas être utilisée pour comprendre l’étendue ou la distribution géographique de vos données. Par exemple, si vous spécifiez 230 entités pour Number of Sample Features (Nombre d’entités d’échantillon), le résultat peut contenir 230 entités en entrée dans n’importe quel ordre ou emplacement.
Créez une entité de contour qui décrit l’étendue de votre jeu de données en entrée à l’aide du paramètre en sortie Extent Layer (Créer une couche d’étendue). La sortie inclura une entité surfacique unique représentant l’étendue géographique des entités en entrée. La couche d’étendue peut être utilisée pour savoir où résident les données ou être utilisée en tant qu’entrée à un autre endroit du processus. Par exemple, utilisez-la en tant que couche surfacique pour découper des entités à l’aide de l’outil Couche de découpage.
Vous ne pouvez créer de couche d’étendue que pour les entités ponctuelles, linéaires et surfaciques. Une couche d’étendue n’est pas créée pour les entités tabulaires.
Le cas échéant, utilisez des paramètres d’environnement pour spécifier le mode de sortie des entités.
Par exemple, utilisez l’environnement Étendue pour produire en sortie une couche d’étendue représentant la zone d’intérêt, ou les entités d’échantillon, dans la zone d´étude définie.
Utilisez également l’environnement Système de coordonnées en sortie pour projeter les sorties vers la référence spatiale désirée.
Vous pouvez améliorer les performances de l’outil Décrire le jeu de données en procédant comme suit :
- Définissez l’étendue des données de manière à analyser uniquement les données d’intérêt.
- Générez moins d’entités d’échantillon.
- Utilisez les données locales de l’environnement de l’analyse.
Cet outil de géotraitement est mis en œuvre par Spark. L'analyse est effectuée sur votre ordinateur de bureau à l'aide de plusieurs cœurs en parallèle. Pour en savoir plus sur l'exécution d'une analyse, reportez-vous à la rubrique Remarques sur les outils de GeoAnalytics Desktop.
Lors de l’exécution d’outils de GeoAnalytics Desktop, l’analyse est effectuée sur votre ordinateur de bureau. Pour des performances optimales, les données doivent être disponibles sur votre bureau : Si vous utilisez une couche d’entités hébergée, il est recommandé d'utiliser ArcGIS GeoAnalytics Server. Si vos données ne sont pas locales, l'exécution d'un outil est plus longue. Pour utiliser votre ArcGIS GeoAnalytics Server en vue d'une analyse, reportez-vous à la rubrique GeoAnalytics Tools.

Paramètres

Étiquette	Explication	Type de données
Couche en entrée	Les entités ponctuelles, polylignes, surfaciques ou tabulaires à décrire.	Table View
Table en sortie	Nouvelle table contenant les informations synthétisés.	Table
Nombre d’entités d’échantillon (Facultatif)	Le nombre d’entités allant être incluses dans la couche d’échantillon en sortie. Aucun échantillon n’est renvoyé si vous sélectionnez 0 entité ou si vous n’indiquez aucun chiffre. Par défaut, aucune couche d’échantillon n’est renvoyée.	Long
Couche d’échantillon (Facultatif)	Une nouvelle classe d’entités contenant un échantillon des données en entrée.	Table; Feature Class
Couche de l’étendue (Facultatif)	Une nouvelle classe d’entités contenant l’étendue spatiale et temporelle des données en entrée.	Feature Class

arcpy.gapro.DescribeDataset(input_layer, output, {sample_features}, {sample_layer}, {extent_layer})

Nom	Explication	Type de données
input_layer	Les entités ponctuelles, polylignes, surfaciques ou tabulaires à décrire.	Table View
output	Nouvelle table contenant les informations synthétisés.	Table
sample_features (Facultatif)	Le nombre d’entités allant être incluses dans la couche d’échantillon en sortie. Aucun échantillon n’est renvoyé si vous sélectionnez 0 entité ou si vous n’indiquez aucun chiffre. Par défaut, aucune couche d’échantillon n’est renvoyée.	Long
sample_layer (Facultatif)	Une nouvelle classe d’entités contenant un échantillon des données en entrée.	Table; Feature Class
extent_layer (Facultatif)	Une nouvelle classe d’entités contenant l’étendue spatiale et temporelle des données en entrée.	Feature Class

Exemple de code

Exemple d’utilisation de l’outil DescribeDataset (fenêtre Python)

Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil DescribeDataset.

Dans ce script, des entités de réseau sont décrites et une couche d’échantillon de 2 500 entités est créée.

#-------------------------------------------------------------------------------
# Name: DescribeDataset.py
# Description: 
# Import system modules
import arcpy
arcpy.env.workspace = "C:/data/RedRiver_basin.gdb"
# Set local variables
inputDataset = "WaterSample"
output = "WSample_summary"
sample = "WSample_sample2500"
# Execute Describe Dataset
arcpy.gapro.DescribeDataset(inputDataset, output, 2500, sample)

Environnements

Système de coordonnées en sortie, Étendue, Espace de travail courant, Facteur de traitement parallèle

Informations de licence

Basic: Non
Standard: Non
Advanced: Oui

Rubriques connexes

Vous avez un commentaire à formuler concernant cette rubrique ?