Componentes principales multidimensionales (Image Analyst)

Disponible con licencia de Image Analyst.

Resumen

Transforma los rásteres multidimensionales en sus componentes principales, cargas y valores propios. La herramienta transforma los datos en un número reducido de componentes que tienen en cuenta la varianza de los datos para poder identificar fácilmente patrones espaciales y temporales.

Uso

  • Utilice valores propios y porcentajes acumulativos de varianzas en la tabla Valores propios de salida para determinar el número de componentes principales necesarios para definir los datos sin perder información esencial.

    Tabla de valores propios

    En el ejemplo anterior, el primer componente muestra el 72,51 por ciento de la varianza. Para alcanzar un valor del 95 por ciento de la varianza, elija los cinco primeros componentes.

  • La opción Reducción de dimensión del parámetro Modo analiza los datos como un conjunto de imágenes. Transforma y reduce los datos en un conjunto de imágenes que capturan las entidades y patrones predominantes. Los componentes principales son un conjunto de rásteres almacenado como un dataset multibanda.

  • La opción Reducción espacial del parámetro Modo analiza los datos como un conjunto de series temporales de píxeles. Busca patrones temporales predominantes y ubicaciones espaciales asociadas de estos patrones temporales. Los componentes principales son una serie de conjuntos unidimensionales almacenados en una tabla.

  • Se crean gráficos automáticamente en las capas de salida para analizar y comprender las cargas, los componentes principales y los eigenvalores.

  • El parámetro Número de componentes principales especifica el número de bandas de la salida. Para evitar la salida de un ráster innecesariamente grande, utilice un porcentaje o un número de componentes adecuados. Normalmente, los primeros componentes cubrirán la mayor varianza de los datos.

Parámetros

EtiquetaExplicaciónTipo de datos
Ráster multidimensional de entrada

El ráster multidimensional de entrada.

La herramienta procesa datos a lo largo de una dimensión, como un ráster de serie temporal o un cubo de datos definido por una dimensión que no es de tiempo [X, Y, Z]. Si una variable de entrada incluye varias dimensiones, como profundidad y tiempo, el primer valor de dimensión se utilizará de forma predeterminada.

Puede usar la herramienta Crear capa ráster multidimensional o la herramienta Ráster multidimensional de subconjunto para redefinir los datos multidimensionales según sea necesario, por ejemplo, configurando datos multidimensionales en un dataset con una dimensión.

Raster Dataset; Mosaic Dataset; Raster Layer; Mosaic Layer; Image Service; File
Modo

Especifica el método que se utilizará para realizar el análisis de componentes principales.

  • Reducción de dimensiónLos datos de la serie temporal de entrada se tratarán como un conjunto de imágenes. Se calcularán los componentes principales que extraen patrones predominantes a lo largo del tiempo. Esta es la opción predeterminada.
  • Reducción espacialLos datos de la serie temporal de entrada se tratarán como un conjunto de píxeles. Los componentes principales que extraen patrones y ubicaciones predominantes a lo largo del tiempo se calcularán como una serie de conjuntos unidimensionales almacenados en una tabla.
String
Dimensión

Nombre de dimensión utilizado para procesar los componentes principales.

String
Componentes principales de salida

Nombre del dataset ráster de salida.

Cuando el parámetro Modo se especifica como Reducción de dimensión, la salida será un ráster multibanda con los componentes como bandas. La primera banda es el primer componente principal con el valor propio más grande, la segunda banda tiene el componente principal con el segundo valor propio más grande y así sucesivamente. La salida está en formato de archivo CRF (.crf), el cual mantiene la información multidimensional.

Cuando el parámetro Modo se especifica como Reducción espacial, la salida es una tabla que contiene un conjunto de datos de serie temporal que representan los componentes principales.

Raster Dataset; Table
Cargas de salida

Los datos de cargas de salida que contribuyen a los componentes principales.

Cuando el parámetro Modo se especifica como Reducción de dimensión, la salida será una tabla que contiene los pesos con los que cada ráster de entrada contribuyó a los componentes principales. Estos pesos definen las correlaciones de los datos de entrada y los componentes principales de salida. Utilice la extensión de archivo .csv para generar las cargas como un archivo de valores separados por comas.

Cuando el parámetro Modo se especifica como Reducción espacial, la salida es un ráster en el que los valores de píxel son los pesos que contribuyen a los componentes principales. Los píxeles con valores más grandes están más correlacionados con los componentes principales. Esta salida puede tener un tamaño de celda más grande que el ráster de entrada porque se aplica una reproyección aleatoria para reducir la complejidad del cómputo.

Los datos de cargas de salida que contribuyen a los componentes principales.

Cuando el parámetro mode se especifica como DIMENSION_REDUCTION, la salida será una tabla que contiene los pesos con los que cada ráster de entrada contribuyó a los componentes principales. Estos pesos definen las correlaciones de los datos de entrada y los componentes principales de salida. Utilice la extensión de archivo .csv para generar las cargas como un archivo de valores separados por comas.

Cuando el parámetro mode se especifica como SPATIAL_REDUCTION, la salida es un ráster en el que los valores de píxel son los pesos que contribuyen a los componentes principales. Los píxeles con valores más grandes están más correlacionados con los componentes principales. Esta salida puede tener un tamaño de celda más grande que el ráster de entrada porque se aplica una reproyección aleatoria para reducir la complejidad del cómputo.

Table; Raster Dataset
Valores propios de salida
(Opcional)

Tabla de valores propios de salida. Los valores propios son valores que indican el porcentaje de varianza de cada componente. Los valores propios ayudan a definir el número de componentes principales necesarios para representar el dataset.

Table
Variable
(Opcional)

Variable del ráster multidimensional de entrada utilizada en el cómputo. Si el ráster de entrada es multidimensional y no se especifica ninguna variable, de forma predeterminada solo se analizará la primera variable.

Por ejemplo, para encontrar los años en los que los valores de temperatura fueron los más altos, especifique la temperatura como la variable que se va a analizar. Si no especifica ninguna variable y cuenta con variables de temperatura y precipitaciones, se analizarán ambas variables y el ráster multidimensional de salida incluirá ambas variables.

String
Número de componentes principales
(Opcional)

Cantidad de componentes principales que se va a calcular, normalmente menor que la cantidad de rásteres de entrada.

Este parámetro también adopta la forma de porcentaje (%). Por ejemplo, un valor del 90% significa que se calculará el número de componentes que pueden explicar el 90 por ciento de varianza en los datos.

String

MultidimensionalPrincipalComponents(in_multidimensional_raster, mode, dimension, out_pc, out_loadings, {out_eigenvalues}, {variable}, {number_of_pc})
NombreExplicaciónTipo de datos
in_multidimensional_raster

El ráster multidimensional de entrada.

La herramienta procesa datos a lo largo de una dimensión, como un ráster de serie temporal o un cubo de datos definido por una dimensión que no es de tiempo [X, Y, Z]. Si una variable de entrada incluye varias dimensiones, como profundidad y tiempo, el primer valor de dimensión se utilizará de forma predeterminada.

Puede usar la herramienta Crear capa ráster multidimensional o la herramienta Ráster multidimensional de subconjunto para redefinir los datos multidimensionales según sea necesario, por ejemplo, configurando datos multidimensionales en un dataset con una dimensión.

Raster Dataset; Mosaic Dataset; Raster Layer; Mosaic Layer; Image Service; File
mode

Especifica el método que se utilizará para realizar el análisis de componentes principales.

  • DIMENSION_REDUCTIONLos datos de la serie temporal de entrada se tratarán como un conjunto de imágenes. Se calcularán los componentes principales que extraen patrones predominantes a lo largo del tiempo. Esta es la opción predeterminada.
  • SPATIAL_REDUCTIONLos datos de la serie temporal de entrada se tratarán como un conjunto de píxeles. Los componentes principales que extraen patrones y ubicaciones predominantes a lo largo del tiempo se calcularán como una serie de conjuntos unidimensionales almacenados en una tabla.
String
dimension

Nombre de dimensión utilizado para procesar los componentes principales.

String
out_pc

Nombre del dataset ráster de salida.

Cuando el parámetro mode se especifica como DIMENSION_REDUCTION, la salida será un ráster multibanda con los componentes como bandas. La primera banda es el primer componente principal con el valor propio más grande, la segunda banda tiene el componente principal con el segundo valor propio más grande y así sucesivamente. La salida está en formato de archivo CRF (.crf), el cual mantiene la información multidimensional.

Cuando el parámetro mode se especifica como SPATIAL_REDUCTION, la salida es una tabla que contiene un conjunto de datos de serie temporal que representan los componentes principales.

Raster Dataset; Table
out_loadings

Los datos de cargas de salida que contribuyen a los componentes principales.

Cuando el parámetro mode se especifica como DIMENSION_REDUCTION, la salida será una tabla que contiene los pesos con los que cada ráster de entrada contribuyó a los componentes principales. Estos pesos definen las correlaciones de los datos de entrada y los componentes principales de salida. Utilice la extensión de archivo .csv para generar las cargas como un archivo de valores separados por comas.

Cuando el parámetro mode se especifica como SPATIAL_REDUCTION, la salida es un ráster en el que los valores de píxel son los pesos que contribuyen a los componentes principales. Los píxeles con valores más grandes están más correlacionados con los componentes principales. Esta salida puede tener un tamaño de celda más grande que el ráster de entrada porque se aplica una reproyección aleatoria para reducir la complejidad del cómputo.

Table; Raster Dataset
out_eigenvalues
(Opcional)

Tabla de valores propios de salida. Los valores propios son valores que indican el porcentaje de varianza de cada componente. Los valores propios ayudan a definir el número de componentes principales necesarios para representar el dataset.

Table
variable
(Opcional)

Variable del ráster multidimensional de entrada utilizada en el cómputo. Si el ráster de entrada es multidimensional y no se especifica ninguna variable, de forma predeterminada solo se analizará la primera variable.

Por ejemplo, para encontrar los años en los que los valores de temperatura fueron los más altos, especifique la temperatura como la variable que se va a analizar. Si no especifica ninguna variable y cuenta con variables de temperatura y precipitaciones, se analizarán ambas variables y el ráster multidimensional de salida incluirá ambas variables.

String
number_of_pc
(Opcional)

Cantidad de componentes principales que se va a calcular, normalmente menor que la cantidad de rásteres de entrada.

Este parámetro también adopta la forma de porcentaje (%). Por ejemplo, un valor del 90% significa que se calculará el número de componentes que pueden explicar el 90 por ciento de varianza en los datos.

String

Muestra de código

Ejemplo 1 de MultidimensionalPrincipalComponents (ventana de Python)

En este ejemplo se calculan tres componentes principales de un ráster de serie temporal NDVI.

# Import system modules 
import arcpy 
from arcpy.ia import *  

# Check out the ArcGIS Image Analyst extension license 
arcpy.CheckOutExtension("ImageAnalyst") 

arcpy.env.workspace = r"c:\data" 
arcpy.ia.MultidimensionalPrincipalComponents('ndviData.crf', 'DIMENSION_REDUCTION', "StdTime", "ndviData_PC.crf", "ndviData_loadings.csv", "ndviData_eiganvalues.csv", None, 3)
Ejemplo 2 de MultidimensionalPrincipalComponents (script independiente)

En este ejemplo se calculan cuatro componentes principales de un ráster de serie temporal NDVI en el modo Reducción de dimensión.

# Import system modules 
import arcpy 
from arcpy.ia import * 

# Check out the ArcGIS Image Analyst extension license 
arcpy.CheckOutExtension("ImageAnalyst") 

# Define input parameters 
inputFile = r"c:\data\ndviData.crf" 
mode = "DIMENSION_REDUCTION" 
dimension = "StdTime" 
out_pc = r"c:\data\ndviData_pc.tif" 
out_loadings = r"c:\data\ndviData_loadings.csv" 
out_eiganvalues = r"c:\data\ndviData_pc.csv" 
variable = "ndvi" 
pc_number = 4 
  
# Execute  

arcpy.ia.MultidimensionalPrincipalComponents(inputFile, mode, dimension, out_pc, out_loadings, out_eiganvalues, variable, pc_number)
Ejemplo 3 de MultidimensionalPrincipalComponents (ventana de Python)

En este ejemplo se calculan tres componentes principales de un ráster de serie temporal en el modo Reducción espacial.

# Import system modules  

import arcpy  
from arcpy.ia import *   

# Check out the ArcGIS Image Analyst extension license  
arcpy.CheckOutExtension("ImageAnalyst")  

arcpy.env.workspace = r"c:\data"  
arcpy.ia.MultidimensionalPrincipalComponents('sstData.crf', 'SPATIAL_REDUCTION', "StdTime", "sstData_temporal_PC.csv", "sstData_loading_raster.crf", "sstData_eiganvalues.csv", None, 3)

Información de licenciamiento

  • Basic: Requiere Image Analyst
  • Standard: Requiere Image Analyst
  • Advanced: Requiere Image Analyst

Temas relacionados