Étiquette | Explication | Type de données |
Entités en entrée | Table ou entités à partir desquelles les sous-ensembles sont créés. | Table View |
Classe d’entités d’entraînement en sortie | Sous-ensemble des entités d’entraînement qui seront créés. | Feature Class; Table |
Classe d’entités de test en sortie (Facultatif) | Sous-ensemble des entités de test qui seront créés. | Feature Class; Table |
Taille du sous-ensemble d’entités d’entraînement (Facultatif) | Taille de la classe d’entités d’entraînement en sortie, indiquée sous la forme d’un pourcentage des entités en entrée ou d’un nombre absolu d’entités. | Double |
Unités de taille des sous-ensembles (Facultatif) | Spécifie si la valeur de la taille d’un sous-ensemble sera utilisée sous la forme d’un pourcentage des entités en entrée ou d’un nombre absolu d’entités.
| Boolean |
Synthèse
Divise les enregistrements d’une classe d’entités ou d’une table en deux sous-ensembles : un à utiliser comme données d’entraînement, l’autre comme entités de test pour comparer et valider la surface en sortie.
Utilisation
-
Dans l’environnement du Générateur de nombres aléatoires, seule l’option Mersenne Twister est prise en charge. Même si d’autres options sont choisies, c’est Mersenne Twister qui est utilisée.
Le fractionnement d’un jeu de données en entités d’entraînement et de test est courant dans le cadre de l’interpolation, du Machine Learning et d’autres processus analytiques impliquant l’estimation et la création de modèles à partir de données.
Si des entités multi-parties sont utilisées en entrée, la sortie sera un sous-ensemble d’entités multi-parties, pas d’entités individuelles.
Paramètres
arcpy.management.SubsetFeatures(in_features, out_training_feature_class, {out_test_feature_class}, {size_of_training_dataset}, {subset_size_units})
Nom | Explication | Type de données |
in_features | Table ou entités à partir desquelles les sous-ensembles sont créés. | Table View |
out_training_feature_class | Sous-ensemble des entités d’entraînement qui seront créés. | Feature Class; Table |
out_test_feature_class (Facultatif) | Sous-ensemble des entités de test qui seront créés. | Feature Class; Table |
size_of_training_dataset (Facultatif) | Taille de la classe d’entités d’entraînement en sortie, indiquée sous la forme d’un pourcentage des entités en entrée ou d’un nombre absolu d’entités. | Double |
subset_size_units (Facultatif) | Spécifie si la valeur de la taille d’un sous-ensemble sera utilisée sous la forme d’un pourcentage des entités en entrée ou d’un nombre absolu d’entités.
| Boolean |
Exemple de code
Fractionne de manière aléatoire les entités en entrée en deux classes d’entités.
import arcpy
arcpy.management.SubsetFeatures("ca_ozone_pts", "C:/gapyexamples/output/training",
"", "", "PERCENTAGE_OF_INPUT")
Fractionne de manière aléatoire les entités en entrée en deux classes d’entités.
# Description: Randomly split the features into two feature classes.
# Import system modules
import arcpy
# Set environment settings
arcpy.env.workspace = "C:/dmpyexamples/data.gdb/data"
# Set local variables
inPointFeatures = "ca_ozone_pts.shp"
outtrainPoints = "C:/dmpyexamples/output.gdb/training"
outtestPoints = "C:/dmpyexamples/output.gdb/training"
subsetSize = 50
subsizeUnits = "PERCENTAGE_OF_INPUT"
# Run SubsetFeatures
arcpy.management.SubsetFeatures(inPointFeatures, outtrainPoints, outtestPoints,
subsetSize, subsizeUnits)
Environnements
Informations de licence
- Basic: Oui
- Standard: Oui
- Advanced: Oui
Rubriques connexes
Vous avez un commentaire à formuler concernant cette rubrique ?