Décrire le jeu de données (GeoAnalytics Desktop)

Résumé

Récapitule les fonctionnalités en statistiques de champs calculées, en entités d’échantillons et en limites d’étendues.

Illustration

Diagramme de processus Décrire le jeu de données

Utilisation

  • Voici des exemples de ce que l’outil Décrire le jeu de données vous permet d’effectuer :

    • Vérifier que vous avez correctement enregistré l’heure et la géométrie avec votre partage de fichiers Big Data.
    • Comprendre les valeurs attributaires avec les statistiques de champs synthétisées.
    • Visualiser votre Big Data avec une couche d’échantillon. Au lieu de dessiner une quantité d’entités, dessiner un échantillon.
    • Exécuter des processus à l’aide d’un échantillon des données avant de procéder à un déploiement pour un traitement plus long et à plus grande échelle.
    • Déterminer l’emplacement d’un jeu de données en calculant l’étendue géographique.

  • L’outil produit une table contenant des résumés statistiques pour chaque champ et un fichier JSON décrivant les propriétés de la couche en entrée par défaut.

  • Utilisez le paramètre Number of Sample Features (Nombre d’entités d’échantillon) afin de spécifier le nombre d’entités à échantillonner. Si vous le laissez vide ou sélectionnez 0, aucun échantillon ne sera créé. Le sous-ensemble en sortie présentera les mêmes paramètres de schéma, de géométrie et de temps que les entités en sortie. Le sous-ensemble peut être utilisé pour comprendre comment vos jeux de données apparaissent une fois ajoutés à une carte ou visualisés dans une table attributaire. En outre, vous pouvez exécuter une analyse au niveau du sous-ensemble afin de déterminer les meilleures entrées pour des analyses à plus grande échelle.

  • Si vous spécifiez une taille d’échantillon supérieure au nombre total d’entités en entrée, toutes les entités sont retournées.

  • La couche d’échantillon ne représente pas une sélection géographique aléatoire réelle et ne doit pas être utilisée pour comprendre l’étendue ou la distribution géographique de vos données. Par exemple, si vous spécifiez 230 entités pour Number of Sample Features (Nombre d’entités d’échantillon), le résultat peut contenir 230 entités en entrée dans n’importe quel ordre ou emplacement.

  • Créez une entité de contour qui décrit l’étendue de votre jeu de données en entrée à l’aide du paramètre en sortie Extent Layer (Créer une couche d’étendue). La sortie inclura une entité surfacique unique représentant l’étendue géographique des entités en entrée. La couche d’étendue peut être utilisée pour savoir où résident les données ou être utilisée en tant qu’entrée à un autre endroit du processus. Par exemple, utilisez-la en tant que couche surfacique pour découper des entités à l’aide de l’outil Couche de découpage.

  • Vous ne pouvez créer de couche d’étendue que pour les entités ponctuelles, linéaires et surfaciques. Une couche d’étendue n’est pas créée pour les entités tabulaires.

  • Le cas échéant, utilisez des paramètres d’environnement pour spécifier le mode de sortie des entités.

    Par exemple, utilisez l’environnement Étendue pour produire en sortie une couche d’étendue représentant la zone d’intérêt, ou les entités d’échantillon, dans la zone d´étude définie.

    Utilisez également l’environnement Système de coordonnées en sortie pour projeter les sorties vers la référence spatiale désirée.

  • Vous pouvez améliorer les performances de l’outil Décrire le jeu de données en procédant comme suit :

    • Définissez l’étendue des données de manière à analyser uniquement les données d’intérêt.
    • Générez moins d’entités d’échantillon.
    • Utilisez les données locales de l’environnement de l’analyse.

  • Cet outil de géotraitement est mis en œuvre par Spark. L’analyse est effectuée sur votre ordinateur de bureau en utilisant plusieurs cœurs en parallèle. Pour en savoir plus sur l’exécution de l’analyse, reportez-vous à la rubrique Remarques relatives aux outils GeoAnalytics Desktop.

  • Lorsque vous exécutez des outils GeoAnalytics Desktop, l’analyse est effectuée sur votre ordinateur de bureau. Pour des performances optimales, les données doivent être accessibles sur votre bureau. Si vous utilisez une couche d’entités hébergée, nous vous recommandons de faire appel à ArcGIS GeoAnalytics Server. Si vos données ne sont pas enregistrées en local, l’exécution des outils prendra plus de temps. Pour utiliser votre instance ArcGIS GeoAnalytics Server en vue d’une analyse, reportez-vous à la rubrique Outils GeoAnalytics.

Syntaxe

DescribeDataset(input_layer, output, {sample_features}, {sample_layer}, {extent_layer})
ParamètreExplicationType de données
input_layer

Les entités ponctuelles, polylignes, surfaciques ou tabulaires à décrire.

Table View
output

Nouvelle table contenant les informations synthétisés.

Table
sample_features
(Facultatif)

Le nombre d’entités allant être incluses dans la couche d’échantillon en sortie. Aucun échantillon n’est renvoyé si vous sélectionnez 0 entité ou si vous n’indiquez aucun chiffre. Par défaut, aucune couche d’échantillon n’est renvoyée.

Long
sample_layer
(Facultatif)

Une nouvelle classe d’entités contenant un échantillon des données en entrée.

Table; Feature Class
extent_layer
(Facultatif)

Une nouvelle classe d’entités contenant l’étendue spatiale et temporelle des données en entrée.

Feature Class

Exemple de code

Exemple d’utilisation de l’outil DescribeDataset (fenêtre Python)

Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil DescribeDataset.

Dans ce script, des entités de réseau sont décrites et une couche d’échantillon de 2 500 entités est créée.

#-------------------------------------------------------------------------------
# Name: DescribeDataset.py
# Description: 
# Import system modules
import arcpy
arcpy.env.workspace = "C:/data/RedRiver_basin.gdb"
# Set local variables
inputDataset = "WaterSample"
output = "WSample_summary"
sample = "WSample_sample2500"
# Execute Describe Dataset
arcpy.gapro.DescribeDataset(inputDataset, output, 2500, sample)

Informations de licence

  • Basic: Non
  • Standard: Non
  • Advanced: Oui

Rubriques connexes