Entidades de subconjunto (Administración de datos)

Resumen

Divide los registros de una clase o tabla de características en dos subconjuntos: uno que se utilizará como datos de entrenamiento y otro que se utilizará como características de prueba para comparar y validar la superficie de salida.

Uso

  • En el entorno del Generador de números aleatorios, solo se recibe soporte para la opción Mersenne Twister. Si se eligen otras opciones, se utilizará en su lugar Mersenne Twister.

  • Dividir un dataset en datasets de entrenamiento y datasets de prueba es habitual en la interpolación, el aprendizaje automático y otros flujos de trabajo analíticos que implican estimar y construir modelos a partir de los datos.

  • Si se utilizan entidades multiparte como entrada, la salida será un subconjunto de entidades multiparte, no de entidades individuales.

Parámetros

EtiquetaExplicaciónTipo de datos
Entidades de entrada

Las entidades o tabla a partir de las cuales se crearán los subconjuntos.

Table View
Clase de entidad de entrenamiento de salida

Subconjunto de entidades de entrenamiento que se creará.

Feature Class; Table
Clase de entidad de prueba salida
(Opcional)

Subconjunto de entidades de prueba que se creará.

Feature Class; Table
Tamaño del subconjunto de entidades de entrenamiento
(Opcional)

Tamaño de la clase de entidad de formación de salida que se introduce como un porcentaje de las entidades de entrada o como un número absoluto de entidades.

Double
Unidades de tamaño de subconjunto
(Opcional)

Especifica si el valor del tamaño del subconjunto se utilizará como porcentaje de las entidades de entrada o como número absoluto de entidades.

  • Porcentaje de entradaEl tamaño del subconjunto se utilizará como porcentaje de las entidades de entrada que estarán en el dataset de entrenamiento.
  • Valor absolutoEl tamaño del subconjunto se utilizará como el número de características que habrá en el dataset de entrenamiento.
Boolean

arcpy.management.SubsetFeatures(in_features, out_training_feature_class, {out_test_feature_class}, {size_of_training_dataset}, {subset_size_units})
NombreExplicaciónTipo de datos
in_features

Las entidades o tabla a partir de las cuales se crearán los subconjuntos.

Table View
out_training_feature_class

Subconjunto de entidades de entrenamiento que se creará.

Feature Class; Table
out_test_feature_class
(Opcional)

Subconjunto de entidades de prueba que se creará.

Feature Class; Table
size_of_training_dataset
(Opcional)

Tamaño de la clase de entidad de formación de salida que se introduce como un porcentaje de las entidades de entrada o como un número absoluto de entidades.

Double
subset_size_units
(Opcional)

Especifica si el valor del tamaño del subconjunto se utilizará como porcentaje de las entidades de entrada o como número absoluto de entidades.

  • PERCENTAGE_OF_INPUTEl tamaño del subconjunto se utilizará como porcentaje de las entidades de entrada que estarán en el dataset de entrenamiento.
  • ABSOLUTE_VALUEEl tamaño del subconjunto se utilizará como el número de características que habrá en el dataset de entrenamiento.
Boolean

Muestra de código

Ejemplo de SubsetFeatures 1 (ventana de Python)

Dividir aleatoriamente las entidades en dos clases de entidad.

import arcpy
arcpy.management.SubsetFeatures("ca_ozone_pts", "C:/gapyexamples/output/training", 
                                "", "", "PERCENTAGE_OF_INPUT")
Ejemplo de SubsetFeatures 2 (script independiente)

Dividir aleatoriamente las entidades en dos clases de entidad.

# Description: Randomly split the features into two feature classes.

# Import system modules
import arcpy

# Set environment settings
arcpy.env.workspace = "C:/dmpyexamples/data.gdb/data"

# Set local variables
inPointFeatures = "ca_ozone_pts.shp"
outtrainPoints = "C:/dmpyexamples/output.gdb/training"
outtestPoints = "C:/dmpyexamples/output.gdb/training"
subsetSize = 50
subsizeUnits = "PERCENTAGE_OF_INPUT"

# Run SubsetFeatures
arcpy.management.SubsetFeatures(inPointFeatures, outtrainPoints, outtestPoints, 
                                subsetSize, subsizeUnits)

Información de licenciamiento

  • Basic: Sí
  • Standard: Sí
  • Advanced: Sí

Temas relacionados