Entidades de subconjunto (Geostatistical Analyst)

Resumen

Divide los registros de una clase o tabla de características en dos subconjuntos: uno que se utilizará como datos de entrenamiento y otro que se utilizará como características de prueba para comparar y validar la superficie de salida.

Uso

  • En el entorno del Generador de números aleatorios, solo se recibe soporte para la opción Mersenne Twister. Si se eligen otras opciones, se utilizará en su lugar Mersenne Twister.

  • Dividir un dataset en datasets de entrenamiento y datasets de prueba es habitual en la interpolación, el aprendizaje automático y otros flujos de trabajo analíticos que implican estimar y construir modelos a partir de los datos.

  • Si se utilizan entidades multiparte como entrada, la salida será un subconjunto de entidades multiparte, no de entidades individuales.

Parámetros

EtiquetaExplicaciónTipo de datos
Entidades de entrada

Las entidades o tabla a partir de las cuales se crearán los subconjuntos.

Table View
Clase de entidad de entrenamiento de salida

Subconjunto de entidades de entrenamiento que se creará.

Feature Class; Table
Clase de entidad de prueba salida
(Opcional)

Subconjunto de entidades de prueba que se creará.

Feature Class; Table
Tamaño del subconjunto de entidades de entrenamiento
(Opcional)

Tamaño de la clase de entidad de formación de salida que se introduce como un porcentaje de las entidades de entrada o como un número absoluto de entidades.

Double
Unidades de tamaño de subconjunto
(Opcional)

Especifica si el valor del tamaño del subconjunto se utilizará como porcentaje de las entidades de entrada o como número absoluto de entidades.

  • Porcentaje de entradaEl tamaño del subconjunto se utilizará como porcentaje de las entidades de entrada que estarán en el dataset de entrenamiento.
  • Valor absolutoEl tamaño del subconjunto se utilizará como el número de características que habrá en el dataset de entrenamiento.
Boolean

arcpy.ga.SubsetFeatures(in_features, out_training_feature_class, {out_test_feature_class}, {size_of_training_dataset}, {subset_size_units})
NombreExplicaciónTipo de datos
in_features

Las entidades o tabla a partir de las cuales se crearán los subconjuntos.

Table View
out_training_feature_class

Subconjunto de entidades de entrenamiento que se creará.

Feature Class; Table
out_test_feature_class
(Opcional)

Subconjunto de entidades de prueba que se creará.

Feature Class; Table
size_of_training_dataset
(Opcional)

Tamaño de la clase de entidad de formación de salida que se introduce como un porcentaje de las entidades de entrada o como un número absoluto de entidades.

Double
subset_size_units
(Opcional)

Especifica si el valor del tamaño del subconjunto se utilizará como porcentaje de las entidades de entrada o como número absoluto de entidades.

  • PERCENTAGE_OF_INPUTEl tamaño del subconjunto se utilizará como porcentaje de las entidades de entrada que estarán en el dataset de entrenamiento.
  • ABSOLUTE_VALUEEl tamaño del subconjunto se utilizará como el número de características que habrá en el dataset de entrenamiento.
Boolean

Muestra de código

Ejemplo de SubsetFeatures 1 (ventana de Python)

Dividir aleatoriamente las entidades en dos clases de entidad.

import arcpy
arcpy.env.workspace = "C:/gapyexamples/data"
arcpy.SubsetFeatures_ga("ca_ozone_pts", "C:/gapyexamples/output/training", 
                        "", "", "PERCENTAGE_OF_INPUT")
Ejemplo de SubsetFeatures 2 (script independiente)

Dividir aleatoriamente las entidades en dos clases de entidad.

# Name: SubsetFeatures_Example_02.py
# Description: Randomly split the features into two feature classes.
# Requirements: Geostatistical Analyst Extension

# Import system modules
import arcpy

# Set environment settings
arcpy.env.workspace = "C:/gapyexamples/data"

# Set local variables
inPointFeatures = "ca_ozone_pts.shp"
outtrainPoints = "C:/gapyexamples/output/training.shp"
outtestPoints = ""
trainData = ""
subsizeUnits = "PERCENTAGE_OF_INPUT"

# Execute SubsetFeatures
arcpy.SubsetFeatures_ga(inPointFeatures, outtrainPoints, outtestPoints, 
                        trainData, subsizeUnits)

Información de licenciamiento

  • Basic: Sí
  • Standard: Sí
  • Advanced: Sí

Temas relacionados