Teilmengen aus Features erstellen (Data Management)

Zusammenfassung

Die Datensätze einer Feature-Class oder Tabelle werden in zwei Teilmengen unterteilt: Eine Teilmenge dient als Trainingsdaten, und die andere Teilmenge wird als Test-Features verwendet, mit denen die Ausgabe-Oberfläche verglichen und validiert wird.

Verwendung

  • In der Umgebungseinstellung Zufallszahlengenerator wird nur die Option Mersenne Twister unterstützt. Wenn andere Optionen ausgewählt werden, wird stattdessen Mersenne Twister verwendet.

  • Das Unterteilen eines Datasets in Trainings- und Test-Features ist eine gängige Vorgehensweise bei der Interpolation, dem maschinellen Lernen und anderen Analyse-Workflows, die das Schätzen und Erstellen von Modellen aus Daten umfassen.

  • Wenn Multipart-Features als Eingabe verwendet werden, ist die Ausgabe eine Teilmenge aus Multipart-Features und nicht aus einzelnen Features.

Parameter

BeschriftungErläuterungDatentyp
Eingabe-Features

Die Features oder Tabelle zur Erstellung der Teilmengen.

Table View
Ausgabe-Training-Feature-Class

Die Teilmenge aus Trainings-Features, die erstellt wird.

Feature Class; Table
Ausgabe-Test-Feature-Class
(optional)

Die Teilmenge aus Test-Features, die erstellt wird.

Feature Class; Table
Größe der Trainings-Feature-Teilmenge
(optional)

Die eingegebene Größe der Ausgabe-Training-Feature-Class, entweder als Prozentsatz der Eingabe-Features oder als absolute Anzahl der Features.

Double
Größeneinheiten der Teilmenge
(optional)

Gibt an, ob der Wert für die Teilmengengröße als Prozentsatz an Eingabe-Features oder als absolute Anzahl an Features interpretiert wird.

  • Eingabe-ProzentsatzDie Teilmengengröße wird als Prozentsatz an Eingabe-Features, die in das Training-Dataset aufgenommen werden, interpretiert.
  • Absoluter WertDie Teilmengengröße wird als Anzahl an Features, die in das Training-Dataset aufgenommen werden, interpretiert.
Boolean

arcpy.management.SubsetFeatures(in_features, out_training_feature_class, {out_test_feature_class}, {size_of_training_dataset}, {subset_size_units})
NameErläuterungDatentyp
in_features

Die Features oder Tabelle zur Erstellung der Teilmengen.

Table View
out_training_feature_class

Die Teilmenge aus Trainings-Features, die erstellt wird.

Feature Class; Table
out_test_feature_class
(optional)

Die Teilmenge aus Test-Features, die erstellt wird.

Feature Class; Table
size_of_training_dataset
(optional)

Die eingegebene Größe der Ausgabe-Training-Feature-Class, entweder als Prozentsatz der Eingabe-Features oder als absolute Anzahl der Features.

Double
subset_size_units
(optional)

Gibt an, ob der Wert für die Teilmengengröße als Prozentsatz an Eingabe-Features oder als absolute Anzahl an Features interpretiert wird.

  • PERCENTAGE_OF_INPUTDie Teilmengengröße wird als Prozentsatz an Eingabe-Features, die in das Training-Dataset aufgenommen werden, interpretiert.
  • ABSOLUTE_VALUEDie Teilmengengröße wird als Anzahl an Features, die in das Training-Dataset aufgenommen werden, interpretiert.
Boolean

Codebeispiel

SubsetFeatures: Beispiel 1 (Python-Fenster)

Teilen der Features nach dem Zufallsprinzip in zwei Feature-Classes.

import arcpy
arcpy.management.SubsetFeatures("ca_ozone_pts", "C:/gapyexamples/output/training", 
                                "", "", "PERCENTAGE_OF_INPUT")
SubsetFeatures: Beispiel 2 (eigenständiges Skript)

Teilen der Features nach dem Zufallsprinzip in zwei Feature-Classes.

# Description: Randomly split the features into two feature classes.

# Import system modules
import arcpy

# Set environment settings
arcpy.env.workspace = "C:/dmpyexamples/data.gdb/data"

# Set local variables
inPointFeatures = "ca_ozone_pts.shp"
outtrainPoints = "C:/dmpyexamples/output.gdb/training"
outtestPoints = "C:/dmpyexamples/output.gdb/training"
subsetSize = 50
subsizeUnits = "PERCENTAGE_OF_INPUT"

# Run SubsetFeatures
arcpy.management.SubsetFeatures(inPointFeatures, outtrainPoints, outtestPoints, 
                                subsetSize, subsizeUnits)

Lizenzinformationen

  • Basic: Ja
  • Standard: Ja
  • Advanced: Ja

Verwandte Themen