Décrire le jeu de données (GeoAnalytics)

Résumé

Récapitule les fonctionnalités en statistiques de champs calculées, en entités d’échantillons et en limites d’étendues.

Illustration

Diagramme de processus Décrire le jeu de données

Utilisation

  • Cet outil de géotraitement est disponible avec ArcGIS Enterprise 10.7 ou version ultérieure.

  • Voici des exemples de ce que l’outil Décrire le jeu de données vous permet d’effectuer :

    • Vérifier que vous avez correctement enregistré l’heure et la géométrie avec votre partage de fichiers Big Data.
    • Comprendre les valeurs attributaires avec les statistiques de champs synthétisées.
    • Visualiser votre Big Data avec une couche d’échantillon. Au lieu de dessiner une quantité d’entités, dessiner un échantillon.
    • Exécuter des processus à l’aide d’un échantillon des données avant de procéder à un déploiement pour un traitement plus long et à plus grande échelle.
    • Déterminer l’emplacement d’un jeu de données en calculant l’étendue géographique.

  • Par défaut, l’outil produit un tableau en sortie, contenant des statistiques résumées pour chaque champ de la couche en entrée. Par ailleurs, un tableau décrivant les propriétés géométriques ou temporelles de la couche en entrée s’affiche dans la fenêtre de géotraitement.

    Si la couche en entrée contient une géométrie, l’outil affiche un tableau décrivant les propriétés géométriques suivantes de la couche en entrée :

    • Geometry type : type de géométrie de la couche en entrée (point, ligne ou polygone).
    • Spatial reference : référence spatiale de la couche en entrée.
    • Count of non-empty features : nombre d’entités comportant une géométrie valide dans l’étendue de la référence spatiale de la couche en entrée.
    • Count of empty features : nombre d’entités sans géométrie valide. Ces entités peuvent comporter une géométrie vide, ou la géométrie peut être située en dehors de la référence spatiale utilisée.
    • Spatial extent : étendue spatiale des entités de la couche en entrée.

    Dans le cas d’une couche en entrée temporelle, l’outil affiche un tableau décrivant les propriétés temporelles suivantes de la couche en entrée :

    • Time type : type temporel de la couche en entrée (instant ou intervalle).
    • Count of non-empty features : nombre d’entités présentant une valeur temporelle valide.
    • Count of empty features : nombre d’entités présentant une valeur temporelle nulle ou non valide.
    • Temporal extent : étendue temporelle des entités de la couche en entrée. Cette valeur contient une heure de début et une heure de fin.

  • Utilisez le paramètre Number of Sample Features (Nombre d’entités d’échantillon) afin de spécifier le nombre d’entités à échantillonner. Si vous le laissez vide ou sélectionnez 0, aucun échantillon ne sera créé. Le sous-ensemble en sortie présentera les mêmes paramètres de schéma, de géométrie et de temps que les entités en sortie. Le sous-ensemble peut être utilisé pour comprendre comment vos jeux de données apparaissent une fois ajoutés à une carte ou visualisés dans une table attributaire. En outre, vous pouvez exécuter une analyse au niveau du sous-ensemble afin de déterminer les meilleures entrées pour des analyses à plus grande échelle.

  • Si vous spécifiez une taille d’échantillon supérieure au nombre total d’entités en entrée, toutes les entités sont retournées.

  • La couche d’échantillon ne représente pas une sélection géographique aléatoire réelle et ne doit pas être utilisée pour comprendre l’étendue ou la distribution géographique de vos données. Par exemple, si vous spécifiez 230 entités pour Number of Sample Features (Nombre d’entités d’échantillon), le résultat peut contenir 230 entités en entrée dans n’importe quel ordre ou emplacement.

  • Créez un contour d’entité qui décrit l’étendue de votre jeu de données en entrée à l’aide du paramètre Create Extent Layer (Créer une couche d’étendue). La sortie inclura une entité surfacique unique représentant l’étendue géographique des entités en entrée. La couche d’étendue peut être utilisée pour savoir où résident les données ou être utilisée en tant qu’entrée à un autre endroit du processus. Par exemple, utilisez-la en tant que couche surfacique pour découper des entités à l’aide de l’outil Couche de découpage.

  • Le cas échéant, utilisez des paramètres d’environnement pour spécifier le mode de sortie des entités.

    Par exemple, utilisez l’environnement Étendue pour produire en sortie une couche d’étendue représentant la zone d’intérêt, ou les entités d’échantillon, dans la zone d´étude définie.

    Utilisez également l’environnement Système de coordonnées en sortie pour projeter les sorties vers la référence spatiale désirée.

  • Le paramètre Create Extent Layer (Créer une couche d’étendue) n’est pris en charge que pour les entités ponctuelles, les entités polylignes et les entités surfaciques. Une couche d’étendue n’est pas créée pour les entités tabulaires.

  • Cet outil de géotraitement est mis en œuvre par ArcGIS GeoAnalytics Server. L’analyse est réalisée sur le GeoAnalytics Server et les résultats sont stockés dans votre contenu dans ArcGIS Enterprise.

  • Lors de l’exécution des outils GeoAnalytics Server, l’analyse est réalisée sur GeoAnalytics Server. Pour des performances optimales, GeoAnalytics Server doit pouvoir accéder aux données via les couches d’entités hébergées sur votre portail ArcGIS Enterprise ou les partages de fichiers Big Data. Les données qui ne sont pas locales pour GeoAnalytics Server sont transférées sur GeoAnalytics Server avant le début de l’analyse. Autrement dit, l’exécution d’un outil prend plus de temps et, dans certains cas, le transfert des données entre ArcGIS Pro et GeoAnalytics Server peut échouer. Le seuil d’échec dépend aussi bien des débits du réseau que de la taille et de la complexité des données. Il est par conséquent recommandé de toujours partager les données ou créer un partage de fichiers Big Data.

    Pour en savoir plus sur le partage des données dans votre portail.

    Pour en savoir pus sur la création d'un partage de fichiers Big Data via ArcGIS Server Manager

Paramètres

ÉtiquetteExplicationType de données
Couche en entrée

Les entités ponctuelles, polylignes, surfaciques ou tabulaires à décrire.

Record Set
Nom en sortie

Nom du service d'entités en sortie.

String
Nombre d’entités d’échantillon
(Facultatif)

Le nombre d’entités allant être incluses dans la couche d’échantillon en sortie. Aucun échantillon n’est renvoyé si vous sélectionnez 0 entité ou si vous n’indiquez aucun chiffre. Par défaut, aucune couche d’échantillon n’est renvoyée.

Long
Créer une couche d’étendue
(Facultatif)

Spécifie si une couche d’étendue en sortie sera créée. L’étendue est un polygone qui représente l’étendue spatiale et temporelle des entités en entrées.

  • Activé : une couche d’étendue est créée.
  • Désactivé : une couche d’étendue n’est pas créée.

Boolean
Stockage des données
(Facultatif)

Indique le ArcGIS Data Store dans laquelle la sortie est enregistrée. La valeur par défaut est Stockage de Big Data spatio-temporelles. Tous les résultats stockés dans un répertoire de données Big Data spatio-temporelles seront stockés en WGS84. Les résultats stockés dans un répertoire de données relationnelles conservent leur système de coordonnées.

  • Spatiotemporal Big Data Store —La sortie sera stockée dans un stockage de Big Data spatio-temporelles. Il s’agit de l’option par défaut.
  • Stockage des données relationnelles —La sortie sera stockée dans un data store relationnel.
String

Sortie dérivée

ÉtiquetteExplicationType de données
Sortie

La couche en sortie contenant les calculs de statistiques synthétisés.

Jeu d'enregistrements
Couche de l’étendue

Lorsque le paramètre create_extent_layer est sélectionné, l’outil génère une couche qui contient un polygone unique représentant l’étendue de votre jeu de données.

Jeu d'entités
Couche d’échantillon

Lorsque le paramètre sample_features spécifie une valeur supérieure à zéro, l’outil génère une couche contenant le nombre spécifié d’entités d’échantillon de votre jeu de données.

Jeu d'entités
JSON en sortie

Ce paramètre n’est pas utilisé. Une chaîne JSON contenant toutes les informations de synthèse calculées dans l’analyse est incluse dans les messages de l’outil.

Chaîne

arcpy.geoanalytics.DescribeDataset(input_layer, output_name, {sample_features}, {create_extent_layer}, {data_store})
NomExplicationType de données
input_layer

Les entités ponctuelles, polylignes, surfaciques ou tabulaires à décrire.

Record Set
output_name

Nom du service d'entités en sortie.

String
sample_features
(Facultatif)

Le nombre d’entités allant être incluses dans la couche d’échantillon en sortie. Aucun échantillon n’est renvoyé si vous sélectionnez 0 entité ou si vous n’indiquez aucun chiffre. Par défaut, aucune couche d’échantillon n’est renvoyée.

Long
create_extent_layer
(Facultatif)

Spécifie si une couche d’étendue en sortie sera créée. L’étendue est un polygone qui représente l’étendue spatiale et temporelle des entités en entrées.

  • CREATE_EXTENTUne couche d’étendue est créée.
  • NO_EXTENTUne couche d’étendue n’est pas créée.
Boolean
data_store
(Facultatif)

Indique le ArcGIS Data Store dans laquelle la sortie est enregistrée. La valeur par défaut est SPATIOTEMPORAL_DATA_STORE. Tous les résultats stockés dans un répertoire de données Big Data spatio-temporelles seront stockés en WGS84. Les résultats stockés dans un répertoire de données relationnelles conservent leur système de coordonnées.

  • SPATIOTEMPORAL_DATA_STORELa sortie sera stockée dans un stockage de Big Data spatio-temporelles. Il s’agit de l’option par défaut.
  • RELATIONAL_DATA_STORELa sortie sera stockée dans un data store relationnel.
String

Sortie dérivée

NomExplicationType de données
output

La couche en sortie contenant les calculs de statistiques synthétisés.

Jeu d'enregistrements
extent_layer

Lorsque le paramètre create_extent_layer est sélectionné, l’outil génère une couche qui contient un polygone unique représentant l’étendue de votre jeu de données.

Jeu d'entités
sample_layer

Lorsque le paramètre sample_features spécifie une valeur supérieure à zéro, l’outil génère une couche contenant le nombre spécifié d’entités d’échantillon de votre jeu de données.

Jeu d'entités
output_json

Ce paramètre n’est pas utilisé. Une chaîne JSON contenant toutes les informations de synthèse calculées dans l’analyse est incluse dans les messages de l’outil.

Chaîne

Exemple de code

Exemple d’utilisation de l’outil DescribeDataset (fenêtre Python)

Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil DescribeDataset.

Dans ce script, des entités de réseau sont décrites et une couche d’échantillon de 2 500 entités est créée.

#-------------------------------------------------------------------------------
# Name: DescribeDataset.py
# Description: 
#
# Requirements: ArcGIS GeoAnalytics Server
# Import system modules
import arcpy
# Set local variables
inputDataset = "https://sampleserver.domain.com/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_MyBDFS/BigDataCatalogServer/networkDataset"
outputName = "my_network_described"
dataStore = "RELATIONAL"
# Execute Describe Dataset
arcpy.geoanalytics.DescribeDataset(inputDataset, outputName, 2500, "CREATE_EXTENT", dataStore)

Environnements

Système de coordonnées en sortie

Système de coordonnées qui sera utilisé pour l'analyse. L’analyse sera réalisée dans le système de coordonnées en entrée, à moins que ce paramètre en spécifie un autre. Pour les GeoAnalytics Tools, les résultats finaux seront stockés dans le stockage des données spatio-temporelles dans WGS84.

Informations de licence

  • Basic: Nécessite ArcGIS GeoAnalytics Server
  • Standard: Nécessite ArcGIS GeoAnalytics Server
  • Advanced: Nécessite ArcGIS GeoAnalytics Server

Rubriques connexes