Almacenamiento y administración de datos de imágenes y ráster—ArcGIS Pro

A menudo se procesan datos de imágenes para crear nuevas formas que pueden ser procesadas al vuelo o guardadas como otra versión actualizada. Estos datasets de imagen y colecciones de ellos suelen ser grandes, por lo que contar con buenas capacidades de administración es importante. ArcGIS Pro está diseñado para hacer esto.

Estructuras de datos de imágenes y ráster y modelos de almacenamiento

Hay tres métodos para almacenar imágenes y datos ráster: como archivos en un sistema de archivos, en una geodatabase o administrados desde la geodatabase, pero almacenados en un sistema de archivos. Esta decisión también implica determinar si se almacenan todos los datos en un dataset único o en un catálogo con la posibilidad de tener muchos datasets. Si almacena los datos en un sistema de archivos, almacenará datasets ráster. Una geodatabase puede almacenar tanto datasets ráster como datasets de mosaico.

Dataset ráster

La mayoría de los datos ráster y de imágenes (tales como una ortoimagen o DEM) se proporcionan como un dataset ráster. El término dataset ráster hace referencia a cualquier modelo ráster que se almacena en el disco o está accesible como única imagen almacenada en la nube. Un dataset ráster es el modelo de almacenamiento de datos ráster más básico sobre el que se crea el resto; por ejemplo, los datasets de mosaico administran los datasets ráster. También es la salida de muchas herramientas de geoprocesamiento que procesan datos ráster.

Un dataset ráster es cualquier formato ráster o de imagen válido organizado en una o más bandas. Cada banda está compuesta de un conjunto de píxeles y cada píxel tiene un valor. Un dataset ráster o de imagen tiene por lo menos una banda. ArcGIS Pro admite más de 70 formatos de archivo para datasets ráster, incluidos TIFF, JPEG 2000, formato ráster de nube (CRF) y NITF.

Dataset de mosaico

Un dataset de mosaico es una colección de datasets ráster (imágenes) almacenada como una colección de imágenes y visualizada o accedida como una imagen en mosaico única o como imágenes individuales (rásteres). Estos conjuntos pueden ser muy grandes tanto en tamaño de archivo total como en la cantidad de datasets. Las imágenes de un dataset de mosaico pueden permanecer en su formato nativo en el disco o existir en la geodatabase. Los metadatos se pueden administrar en el registro de la imagen, así como los atributos de la tabla de atributos. El almacenamiento de metadatos como atributos permite administrar más fácilmente parámetros como, por ejemplo, los datos de orientación de sensor, además de realizar consultas rápidas para habilitar selecciones.

Los datos en un dataset de mosaico no tienen que estar adyacentes o superpuestos, pero pueden existir como datasets discontinuos no conectados. Por ejemplo, puede tener imágenes que cubran completamente un área o puede tener muchas tiras de imágenes que pueden no unirse para formar una imagen continua (como ocurre a lo largo de las conducciones).

Cobertura de datos continuos — Se muestra la cobertura de datos continuos.

Cobertura de datos discontinuos — Se muestra la cobertura de datos continuos.

Los datos pueden superponerse total o parcialmente, pero deben capturarse en varias fechas. El dataset de mosaico es un dataset ideal para almacenar datos temporales. Puede consultar el dataset de mosaico para ver las imágenes que necesita en función de la hora o la fecha, y utilizar un método de mosaico para mostrar la imagen en mosaico de acuerdo con un atributo de hora o fecha.

Los datasets de mosaico no están limitados a un tipo determinado de datos de imagen. Puede agregar datos de imagen desde distintos sistemas de sensores en distintas proyecciones, resoluciones, profundidades de píxel y cantidad de bandas. Se pueden generar vistas generales para el conjunto completo de datos. Esto permite ver más rápidamente los datos y proporcionar rápidamente estos datasets. También hay propiedades adicionales para la vista, incluido el establecimiento de un método de creación de mosaicos, que convierten estos datasets en únicos y funcionales en muchas situaciones. También puede consultar un dataset de mosaico basándose en las restricciones de consulta espaciales y no espaciales. Los resultados de esa consulta pueden ser un conjunto de imágenes que podría procesar una por una o podrían ser una imagen en mosaico generada dinámicamente.

Además de los datos de imagen, puede almacenar y administrar datos LIDAR en un dataset de mosaico de la misma manera que lo hace con los datasets de imagen, e incluso junto con los datasets de imagen. Los datos LIDAR se pueden almacenar en el sistema de archivos como archivos .las o datasets LAS, o también en una geodatabase como datasets de terreno.

Nota:

Los datasets de mosaico dependen de la versión de ArcGIS en la que se crearon y son compatibles en toda la plataforma ArcGIS para un ciclo de versión concreto. En general, los datasets de mosaico creados con versiones anteriores de ArcGIS se pueden leer y gestionar con versiones más recientes de ArcGIS. Sin embargo, es posible que un dataset de mosaico creado con una versión más reciente de ArcGIS no sea compatible con versiones anteriores. Consulte la tabla siguiente para ver la compatibilidad con datasets de mosaico:

Tabla de compatibilidad entre versiones del dataset de mosaico

Comparación del modelo de almacenamiento de datos ráster

Almacenar los datasets de imagen individualmente suele ser el mejor método cuando las imágenes no son adyacentes entre sí o se utilizan raramente en los mismos proyectos. La creación de mosaicos de las entradas para formar una gran extensión única de archivo de datos de imagen es adecuada para muchas aplicaciones, pero puede que se prefiera un dataset de mosaico por los siguientes motivos:

La extensión de las imágenes se superpone parcial o totalmente y se desea conservar las áreas comunes.
Los datasets de imagen representan una colección de observaciones de la misma área en diferentes momentos de una serie temporal.
Solo desea visualizar el área de estudio, no todo el conjunto de imágenes.
Desea administrar una colección de imágenes como un conjunto integrado, pero mantener sus estados individuales.
Desea registrar y administrar columnas de atributos adicionales que describen cada imagen.

Comparar los modelos de almacenamiento de datos ráster

Comparación de los modelos de almacenamiento de datos ráster
	Dataset ráster	Dataset de mosaico
Descripción	Una imagen única de un objeto o una imagen sin fisuras que cubre un área espacialmente continua. Puede ser una imagen original única o el resultado de muchas imágenes fusionadas (en mosaico).	Grupo de datasets de imagen almacenado como una colección que permite almacenar, administrar, ver y consultar colecciones de datos de imagen y LIDAR. Se ve como una imagen en mosaico, pero se tiene acceso a cada dataset como un elemento de la colección.
Almacenamiento	Como un archivo en el disco o en una geodatabase.	En una geodatabase, pero puede hacer referencia a los datos de origen almacenados como un archivo en el disco.
Datos homogéneos o heterogéneos	Datos homogéneos: un único formato, tipo de datos y archivo.	Datos heterogéneos: varios formatos, tipos de datos, tamaños de archivo y sistemas de coordenadas.
Metadatos	Se almacenan una vez y se aplican a un dataset completo.	Se puede almacenar en el registro ráster y como atributos en la tabla de atributos.
Datasets submuestreados	Pirámides de todo el dataset de imagen.	Pirámides para cada dataset de imagen, así como vistas generales para el conjunto completo.
Geoprocesamiento y análisis de la imagen	Como fuente de datos en muchas herramientas de análisis y geoprocesamiento, incluidas las funciones ráster y RFT.	Como fuente de datos en muchas herramientas de análisis y geoprocesamiento, incluidas las funciones ráster y RFT.
Ventajas	Visualización rápida a cualquier escala. Se puede mover como un único archivo en la geodatabase.	Administra grandes colecciones de datos de imagen. Se mantienen el nombre y el formato de las imágenes de entrada. Visualización rápida a cualquier escala. No hay pérdida de datos para crear el mosaico. El usuario tiene el acceso al contenido completo de la colección. Se puede establecer propiedades para controlar la visualización del mosaico. Procesamiento al vuelo ("on the fly").
Desventajas	Los datasets de imagen de geodatabases de archivos son más lentos de actualizar porque se debe reescribir el archivo completo. El nombre y el formato de archivo originales se pierden durante la creación. Según el tamaño del archivo y la compresión de las imágenes de entrada, el tamaño de archivo de la salida puede ser mucho mayor que el de los datos de entrada. La creación de archivos únicos puede ser lenta.	Las vistas generales pueden tardar tiempo en generarse. Si las imágenes de origen se mueven a una nueva ubicación de archivo, las referencias en el dataset de mosaico se deben ajustar.
Servicio	Se sirve directamente como un servicio de imágenes.	Se sirve directamente como un servicio de imágenes.
Recomendaciones	Utilice datasets ráster cuando no sea necesario conservar la superposición entre imágenes en mosaico, y para la visualización rápida de grandes cantidades de datos de imagen.	Utilice un dataset de mosaico para administrar y visualizar datos LIDAR y de imagen. Es adecuado para datos multidimensionales, consulta, almacenamiento de metadatos y superposición de datos, y proporciona una solución híbrida.

Almacenamiento de datos ráster en la geodatabase

Almacene los datos ráster en la geodatabase cuando desee administrar las imágenes, agregar comportamiento y controlar el esquema; cuando desee administrar un conjunto bien definido de datasets ráster como parte del sistema de administración de base de datos (DBMS); y cuando necesite una arquitectura de datos para administrar todo el contenido. Hay dos tipos principales de geodatabases: corporativa y de archivos.

La geodatabase corporativa puede admitir varias operaciones en su DBMS. Las geodatabases de archivos están diseñadas para ser editadas por un único usuario y no admiten el versionado. Residen en el directorio del sistema de archivos, por lo que no necesitan contraseña para el acceso. Las geodatabases de archivos y corporativas comparten el mismo esquema de almacenamiento básico.

Nota:

El comportamiento funcional de cada geodatabase es básicamente el mismo; no obstante, al algunas excepciones para herramientas o procedimientos específicos. Para obtener información sobre las diferencias en el comportamiento de una herramienta o procedimiento, consulte la herramienta o el procedimiento específico en la ayuda de referencia.

Comparar el almacenamiento de rásteres en geodatabases de archivos y corporativas

Comparación de geodatabases de archivos y geodatabases corporativas
Característica de almacenamiento de ráster	Geodatabase de archivos	Geodatabase corporativa
Límite de tamaño	1 terabyte (TB) para cada dataset ráster	Sin límite; el límite depende de los límites del DBMS
Formato de archivo de dataset ráster	Dataset ráster de geodatabase de archivos	Dataset ráster de geodatabase corporativa
Almacenamiento	Dataset ráster: administrado Dataset de mosaico: relacionado	Dataset ráster: administrado Dataset de mosaico: relacionado
Almacenamiento	Se almacena en el sistema de archivos	Se almacena en un RDBMS
Compresión	LZ77, JPEG, JPEG 2000 o ninguna	LZ77, JPEG, JPEG 2000 o ninguna
Pirámides	Admite pirámides parciales	Admite pirámides parciales
Realizar mosaicos	Permite anexar a un dataset ráster al disponer en mosaico	Permite anexar a un dataset ráster al disponer en mosaico
Actualizando	Permite la actualización incremental	Permite la actualización incremental
Cantidad de usuarios	Un único usuario y grupos de trabajo pequeños; algunos lectores y un escritor	Multiusuario; muchos usuarios y muchos escritores

Tabla de bloque de ráster en la geodatabase

Los datos de ráster suelen ser de un tamaño mucho más grande que las entidades y requieren una tabla auxiliar para su almacenamiento. Por ejemplo, una ortoimagen pancromática típica puede tener 20.000 filas por 20.000 columnas (400 millones de valores de píxel) o más.

Para optimizar el rendimiento con datasets ráster más grandes, un ráster de geodatabase se divide en teselas más pequeñas (denominadas bloques) con un tamaño típico aproximado de 128 filas por 128 columnas o 256 filas por 256 columnas. Estos bloques más pequeños se mantienen en una tabla auxiliar para cada ráster. Cada tesela independiente se aloja en una fila independiente en una tabla de bloques, como se muestra a continuación.

Esta estructura significa que solo se recuperan los bloques de una extensión cuando se necesitan, en lugar de la imagen completa. Además, los bloques remuestreados que se utilizan para crear pirámides rasterizadas se pueden almacenar y administrar en la misma tabla de bloques como filas adicionales.

Esto permite administrar imágenes de tamaños enormes en un DBMS que produce un rendimiento muy rápido. Un DBMS también proporciona acceso multiusuario seguro.

Geodatabase de archivos

El modelo de almacenamiento de la geodatabase de archivos es similar al de una geodatabase corporativa, que almacena datos en bloques.

Esto proporciona un acceso más eficaz a los datos, especialmente durante la operación de mosaico. Al crear un mosaico de datos en una geodatabase de archivos, solo se actualizan los bloques superpuestos. Si no existe un bloque superpuesto, se inserta un bloque nuevo. Los bloques parciales se rellenan con píxeles NoData. Además, el modelo de almacenamiento de la geodatabase de archivos (y corporativa) utiliza actualizaciones de pirámide parciales, lo que ahorra tiempo. Las estructuras de los datos de las geodatabases de archivos y corporativas son las mismas, lo que permite utilizar tecnología de copiado rápido para copiar y pegar datos entre ellas.

Las geodatabases de archivos aceptan palabras clave de configuración pero, a diferencia de las geodatabases corporativas, las palabras clave de configuración tienen un valor estándar predefinido. Para obtener más información sobre las palabras clave de configuración, vea Palabras clave de configuración para geodatabases de archivos.

Geodatabase corporativa

Cuando se almacenan datos ráster en una geodatabase corporativa, es posible ofrecer un nivel de funcionalidad corporativo como, por ejemplo, seguridad, acceso multiusuario y uso compartido de datos. Existen tres motivos principales para almacenar los datos ráster como una geodatabase corporativa:

No se actualizarán con tanta regularidad (por ejemplo, cada dos o tres años o más).
Se accederá a ellos en casos de uso de solo lectura (por ejemplo, utilizándolos como datos de mapa base bajo datos vectoriales).
Cientos de usuarios (o más) accederán a ellos como un mapa base.

Debido a su estructura de almacenamiento, se considera que los datos ráster son administrados, o totalmente controlados, por la geodatabase. Las geodatabases corporativas almacenan toda la información del ráster (píxeles, referencia espacial, cualquier tabla asociada y otros metadatos) para los datasets ráster y los atributos de ráster en la base de datos relacional asociada. Esto significa que toda la información de ráster de entrada se carga en la base de datos y se puede considerar una conversión de formato.

La geodatabase corporativa divide uniformemente las bandas en bloques de píxeles según una dimensión definida por el usuario (el valor predeterminado es 128 por 128). Ordenar en teselas los datos de bandas de imagen permite un almacenamiento y una recuperación eficaces de los datos ráster. La información de la pirámide se almacena según una resolución en descenso. El número de niveles especificado por la aplicación o el usuario determina la altura de la pirámide.

La tabla de bloques de ráster (la tabla más grande y la que almacena la información de píxel y las pirámides) almacena una fila por bloque (tesela) por banda en un dataset ráster y por nivel de pirámide. Por ejemplo, una imagen de tres bandas dividido en 12 bloques sin pirámides generadas tendrá 36 filas en la tabla BLK: 12 bloques independientes para cada una de las bandas. La columna que contiene los datos de píxel del bloque es un objeto binario grande (BLOB).

Compresión, pirámides y tamaño de tesela

Hay otras estructuras de almacenamiento a considerar al almacenar y administrar datos ráster, como la compresión, los datasets submuestreados (pirámides y vistas generales) y el tamaño de tesela.

Compresión

Hay dos tipos de compresión: sin pérdida y con pérdida. Una compresión sin pérdida de información significa que los valores de píxeles del dataset ráster no se modifican, mientras que la compresión con pérdida de información produce valores de píxel alterados. La cantidad de compresión depende del tipo de datos de píxel; cuanto más homogénea sea la imagen, más alta será la tasa de compresión. Debería almacenar los datos que se vayan a utilizar para el análisis, no solo para mostrar, mediante una compresión sin pérdida de información. La principal ventaja de comprimir los datos es que se necesita menos espacio de almacenamiento; la cantidad de ahorro depende del método de compresión y la redundancia de los datos. Una ventaja adicional es la importante mejora de rendimiento debido a la transferencia de menos paquetes de datos. Por ejemplo, cuando se accede a datos de imagen a través de una red con ancho de banda bajo, el uso de compresión puede ofrecer un rendimiento mejorado porque la cantidad de información que se va a transferir se reduce, lo que permite almacenar datasets de imagen grandes, sin interrupciones, y proporcionarlos rápidamente a un cliente para su visualización.

Los datasets de mosaico también tienen compresión. No se usa para el almacenamiento del dataset de imagen que se va a administrar, sino para la compresión aplicada a la imagen que genera cuando se visualiza. Esto también mejora el acceso a los datos a través de la red, porque se reduce el tamaño del archivo que se transfiere. Para obtener más información sobre la propiedad Método de compresión permitido, consulte Propiedades del dataset de mosaico.

Datasets submuestreados para una visualización rápida

Los datasets submuestreados son rásteres creados a partir de los datos originales para datasets ráster o datasets de mosaico. Se generan para mejorar la velocidad de visualización y el rendimiento. Cuando se crean para los datasets ráster, se denominan pirámides, y cuando se crean para los datasets de mosaico, se denominan vistas generales.

Pirámides y vistas generales

Pirámides y vistas generales
	Pirámides	Vistas generales
Se crean para	Datasets ráster	Datasets de mosaico
Formato	Escribe archivos .ovr, con algunas excepciones. Lee pirámides almacenadas externamente como archivos .ovr o .rrd, o almacenadas internamente.	Escribe archivos .tif.
Almacenamiento	En un único archivo que generalmente se encuentra junto al dataset ráster de origen utilizando el mismo nombre.	De manera predeterminada, en una carpeta situada junto a la geodatabase con la extensión *.overviews o internamente para geodatabases corporativas. La ubicación de almacenamiento se puede personalizar.
Tamaño de almacenamiento	Del 2 al 10% (en comparación con los datasets ráster originales)
Factor de submuestreo	2	El valor predeterminado es 3. Se puede editar.
Extensión	Cada nivel de pirámide cubre todo el dataset ráster. Puede especificar el número de niveles a generar.	Puede cubrir parte o la totalidad del dataset de mosaico. Cada nivel puede estar compuesto de una o varias imágenes.
Opciones para la creación	Cantidad de niveles a crear Método de remuestreo Método de compresión y calidad	Cantidad de niveles a crear Tamaño de tesela Tamaño de píxel base Método de remuestreo Método de compresión y calidad Ubicación de salida Factor de muestreo de vista general

Tamaño de tesela

En una geodatabase corporativa o de archivos, los datos ráster se almacenan en una estructura en la que son divididos en teselas, indexados, estructurados en pirámides y muy frecuentemente comprimidos. Debido al ordenamiento en teselas, la indización y la piramidación, cada vez que se consultan los datos ráster, solo se devuelven las teselas que son necesarias para satisfacer la extensión y resolución de la consulta, en lugar de todo el dataset. El tamaño de tesela controla el número de píxeles que desea almacenar en cada bloque de memoria de base de datos. Esto se especifica como un número de píxeles en x e y. El tamaño de tesela predeterminado es de 128 por 128 píxeles y la mayoría de las aplicaciones no requieren cambiar estos valores predeterminados. En una geodatabase corporativa, las teselas de datos ráster se comprimen antes de almacenarse en la geodatabase.

Temas relacionados

¿Algún comentario sobre este tema?