Sous-ensemble d’entités (Gestion des données)

Synthèse

Divise les enregistrements d’une classe d’entités ou d’une table en deux sous-ensembles : un à utiliser comme données d’entraînement, l’autre comme entités de test pour comparer et valider la surface en sortie.

Utilisation

  • Dans l’environnement du Générateur de nombres aléatoires, seule l’option Mersenne Twister est prise en charge. Même si d’autres options sont choisies, c’est Mersenne Twister qui est utilisée.

  • Le fractionnement d’un jeu de données en entités d’entraînement et de test est courant dans le cadre de l’interpolation, du Machine Learning et d’autres processus analytiques impliquant l’estimation et la création de modèles à partir de données.

  • Si des entités multi-parties sont utilisées en entrée, la sortie sera un sous-ensemble d’entités multi-parties, pas d’entités individuelles.

Paramètres

ÉtiquetteExplicationType de données
Entités en entrée

Table ou entités à partir desquelles les sous-ensembles sont créés.

Table View
Classe d’entités d’entraînement en sortie

Sous-ensemble des entités d’entraînement qui seront créés.

Feature Class; Table
Classe d’entités de test en sortie
(Facultatif)

Sous-ensemble des entités de test qui seront créés.

Feature Class; Table
Taille du sous-ensemble d’entités d’entraînement
(Facultatif)

Taille de la classe d’entités d’entraînement en sortie, indiquée sous la forme d’un pourcentage des entités en entrée ou d’un nombre absolu d’entités.

Double
Unités de taille des sous-ensembles
(Facultatif)

Spécifie si la valeur de la taille d’un sous-ensemble sera utilisée sous la forme d’un pourcentage des entités en entrée ou d’un nombre absolu d’entités.

  • Pourcentage de l’entréeLa taille du sous-ensemble sera utilisée sous la forme d’un pourcentage des entités en entrée qui se trouveront dans le jeu de données d’entraînement.
  • Valeur absolueLa taille du sous-ensemble sera utilisée sous la forme du nombre d’entités qui se trouveront dans le jeu de données d’entraînement.
Boolean

arcpy.management.SubsetFeatures(in_features, out_training_feature_class, {out_test_feature_class}, {size_of_training_dataset}, {subset_size_units})
NomExplicationType de données
in_features

Table ou entités à partir desquelles les sous-ensembles sont créés.

Table View
out_training_feature_class

Sous-ensemble des entités d’entraînement qui seront créés.

Feature Class; Table
out_test_feature_class
(Facultatif)

Sous-ensemble des entités de test qui seront créés.

Feature Class; Table
size_of_training_dataset
(Facultatif)

Taille de la classe d’entités d’entraînement en sortie, indiquée sous la forme d’un pourcentage des entités en entrée ou d’un nombre absolu d’entités.

Double
subset_size_units
(Facultatif)

Spécifie si la valeur de la taille d’un sous-ensemble sera utilisée sous la forme d’un pourcentage des entités en entrée ou d’un nombre absolu d’entités.

  • PERCENTAGE_OF_INPUTLa taille du sous-ensemble sera utilisée sous la forme d’un pourcentage des entités en entrée qui se trouveront dans le jeu de données d’entraînement.
  • ABSOLUTE_VALUELa taille du sous-ensemble sera utilisée sous la forme du nombre d’entités qui se trouveront dans le jeu de données d’entraînement.
Boolean

Exemple de code

Exemple 1 d’utilisation de la fonction SubsetFeatures (fenêtre Python)

Fractionne de manière aléatoire les entités en entrée en deux classes d’entités.

import arcpy
arcpy.management.SubsetFeatures("ca_ozone_pts", "C:/gapyexamples/output/training", 
                                "", "", "PERCENTAGE_OF_INPUT")
Exemple 2 d’utilisation de la fonction SubsetFeatures (script autonome)

Fractionne de manière aléatoire les entités en entrée en deux classes d’entités.

# Description: Randomly split the features into two feature classes.

# Import system modules
import arcpy

# Set environment settings
arcpy.env.workspace = "C:/dmpyexamples/data.gdb/data"

# Set local variables
inPointFeatures = "ca_ozone_pts.shp"
outtrainPoints = "C:/dmpyexamples/output.gdb/training"
outtestPoints = "C:/dmpyexamples/output.gdb/training"
subsetSize = 50
subsizeUnits = "PERCENTAGE_OF_INPUT"

# Run SubsetFeatures
arcpy.management.SubsetFeatures(inPointFeatures, outtrainPoints, outtestPoints, 
                                subsetSize, subsizeUnits)

Informations de licence

  • Basic: Oui
  • Standard: Oui
  • Advanced: Oui

Rubriques connexes