Introducción a la representación cartográfica de ortofotos

Disponible con una licencia Advanced.

Información general

La fotogrametría es la ciencia consistente en obtener mediciones fiables a partir de fotografías e imágenes digitales. La salida del proceso fotogramétrico suele generar mapas de ortomosaicos, mapas simbólicos, capas SIG o modelos tridimensionales (3D) de escenas u objetos del mundo real. Hay dos tipos generales de fotogrametría, la fotogrametría aérea y la fotogrametría de corto alcance.

En la fotogrametría aérea, el sensor está a bordo de un satélite, un avión tripulado o un dron, y normalmente se orienta en dirección vertical hacia el suelo. Cuando el sensor se orienta hacia abajo, la imagen se denomina vertical o de nadir. Cuando el sensor recorre una ruta de vuelo, denominada imágenes estéreo, se capturan varias imágenes que se solapan. Las imágenes se procesan para generar datos de elevación digitales y ortomosaicos. Las imágenes tienen geometría en perspectiva que provoca distorsiones únicas para cada imagen. Las ortoimágenes se han corregido geométricamente para que la imagen resultante tenga la integridad geométrica de un mapa, y los ortomosaicos son ortoimágenes que forman un mosaico en una sola imagen. Se pueden generar otros productos como, por ejemplo, capas SIG vectoriales con entidades como carreteras, edificios, hidrología y otras entidades del terreno. Estas capas se producen mediante el uso de ortoimágenes como telón de fondo, o desde compilación de imágenes estéreo en ArcGIS Pro.

En la fotogrametría de corto alcance, el sensor suele estar cerca del objeto de interés y no es normalmente una visualización del nadir, sino horizontal, oblicua o incluso hacia arriba en el caso de la representación cartográfica de las estructuras de ingeniería de los puentes. Estas imágenes se modelan matemáticamente de formas algo diferentes, de ahí la necesidad de distinguirlas de la fotogrametría aérea. Los productos son similares a la fotogrametría aérea, como modelos 3D, dibujos de ingeniería y ortoimágenes, pero en lugar de representar entidades de terreno y de paisaje, las entidades suelen representar otros aspectos de la superficie, como edificios, estructuras de ingeniería o torres de transmisión y telefonía móvil.

Las herramientas y prestaciones proporcionadas en el conjunto de funciones de representación cartográfica de ortofotos de Esri se centran en los productos de fotogrametría aérea para permitir la generación y revisión de mapas, la detección de cambios y otras aplicaciones de extracción de entidades. Estas herramientas permiten a los usuarios tomar fotos aéreas, de drones o de satélite y procesarlas para generar diversos productos ortorrectificados.

Ortoimágenes

La ortorrectificación es un proceso que corrige numerosos artefactos relacionados con las imágenes obtenidas mediante teledetección para generar una ortoimagen con precisión comparable a la de un mapa. Es posible unir por los bordes las ortoimágenes, así como equilibrar su color, para generar un ortomosaico sin uniones. Este ortomosaico es preciso a una escala de mapa especificada y se puede usar para realizar mediciones y para generar y actualizar las capas de clase de entidad SIG. Para ello, necesita imágenes con posiciones de sensor y altitudes conocidas, y un modelo geométrico calibrado para el sensor, además de un modelo de elevación digital (DTM).

A veces, las posiciones y la orientación conocidas acompañan a las imágenes cuando se suministran al usuario. Si no, las imágenes se tendrán que ajustar al control del terreno. Los procesos de ajuste utilizan la calibración del sensor, la información de orientación del sensor, los puntos de control del terreno, los puntos de enlace y un DTM para producir orientaciones y posiciones exactas. Con ello, podrá crear ortoimágenes con una precisión comparable a la de un mapa.

Datos de elevación

Si existe un modelo digital de elevación (DEM) adecuado, se usará en el proceso de ortorrectificación. De lo contrario, los datasets de elevación, como los modelos digitales de superficie (DSM) y los DTM, se deben derivar de las imágenes en estéreo. Las imágenes en estéreo se crean a partir de dos o más imágenes de la misma entidad del terreno capturadas en diferentes posiciones de geolocalización. Las imágenes que se solapan se capturan desde distintos puntos de vista. Esta área que se solapa se conoce como imagen en estéreo, que es adecuada para generar datasets digitales de elevación. El modelo para generar estos datasets 3D requiere una colección de varias imágenes superpuestas sin huecos en la superposición, información de orientación y calibración del sensor y puntos de control del terreno y de enlace. A continuación, los datasets 3D se crean automáticamente usando un proceso denominado geocodificación de imágenes, en el que se establece una correlación cruzada entre las imágenes superpuestas para generar nubes de puntos 3D definidos mediante geolocalización (latitud, longitud) y elevación.

Necesidad de una representación cartográfica de ortofotos

La ortorrectificación se refiere a la eliminación de imprecisiones geométricas inducidas por la plataforma, el sensor y, en especial, el desplazamiento del terreno. La representación cartográfica hace referencia al ajuste de bordes, la generación de líneas de corte y el balance de color de varias imágenes para producir un dataset de ortomosaicos. En conjunto, estos procesos se denominan representación cartográfica de ortofotos.

Las imágenes aéreas digitales, las imágenes de drones, las fotografías aéreas escaneadas y las imágenes de satélite son importantes en la representación cartográfica general y en la generación y visualización de datos SIG. De hecho, la información contenida en la mayoría de los mapas y las capas SIG se ha generado a partir de las imágenes. En primer lugar, las imágenes sirven como telón de fondo que proporciona a las capas SIG un contexto importante que permite establecer asociaciones geoespaciales. En segundo lugar, las imágenes se usan para crear o revisar mapas y capas SIG digitalizando y asignando atributos a entidades de interés como carreteras, edificios, hidrología y vegetación.

Para que esta información geoespacial se pueda digitalizar a partir de las imágenes, estas se deben tratar para corregir distintos tipos de errores y distorsiones inherentes a la forma en que se han capturado. Hay dos tipos principales de distorsión que afectan a las imágenes obtenidas mediante teledetección:

  • Distorsión radiométrica: la traslación inexacta de valores de la reflectancia del terreno a valores grises o números digitales (ND) en la imagen. El error radiométrico se debe al acimut y la elevación del sol, las condiciones atmosféricas y las limitaciones de los sensores.
  • Distorsión geométrica: la traslación inexacta de la escala y la ubicación en la imagen. El error geométrico se debe al desplazamiento del terreno, la curvatura de la Tierra, las proyecciones en perspectiva y la instrumentación.

Cada uno de estos tipos de imprecisiones se elimina en el proceso de ortorrectificación y representación cartográfica. Para obtener una lista de los tipos comunes de imprecisiones de imagen, consulte la tabla que aparece a continuación. Una vez que las distorsiones que afectan a las imágenes se eliminan y que se crea un mosaico con las imágenes o escenas individuales para producir un ortomosaico, se puede usar como un mapa simbólico o temático para realizar mediciones precisas de la distancia y el ángulo. La ventaja de la ortoimagen es que contiene toda la información visible en las imágenes, no solo las entidades y las capas SIG extraídas de la imagen y simbolizadas en un mapa. Por ejemplo, una carretera simbolizada en un mapa tiene una anchura uniforme, mientras que en la ortoimagen una carretera tiene una anchura variable y arcenes que permiten que los vehículos de emergencia se abran paso en los atascos de tráfico o almacenar equipos y material de construcción.

Proceso de ortorrectificación

Uno de los productos más importantes generados por el proceso fotogramétrico es una colección de imágenes ortorrectificadas, denominadas mosaico de ortoimágenes, o simplemente ortomosaico. La generación de la ortoimagen exige combar la imagen de origen para que esa distancia y esa área sean uniformes en relación con las mediciones del mundo real. Esto se logra estableciendo una relación entre las coordenadas x,y de la imagen y los GCP del mundo real para determinar el algoritmo para remuestrear la imagen. Del mismo modo, la relación matemática entre las coordenadas del suelo representadas por un DEM y la imagen se calcula y se usa para determinar la posición adecuada de cada píxel de la imagen de origen.

De este modo, las entidades medidas en las ortoimágenes coinciden con la medición, la escala y el ángulo de las mismas entidades del suelo, con independencia de que se encuentren en un terreno inclinado o en una zona llana. La exactitud resultante de la ortoimagen se basa en la precisión de la triangulación, el ángulo de la colección de imágenes fuera del nadir, la resolución de la imagen de origen y la exactitud del modelo de elevación.

Hay varios requisitos para crear una ortoimagen o un ortomosaico a partir de las imágenes sin procesar:

  • Imágenes digitales: pueden tener el formato de una imagen aérea digital, una imagen escaneada o una imagen de satélite.
  • Archivo de calibración de cámara: incluye mediciones de las características del sensor, como la distancia focal, el tamaño y la forma del plano de la imagen, el tamaño del píxel y los parámetros de la distorsión de la lente. En fotogrametría, la medición de estos parámetros se denomina orientación interior (IO) y se recopilan en un archivo de modelo de la cámara. Las cámaras de representación cartográfica aérea de alta precisión se analizan para proporcionar información de calibración de la cámara en un informe empleado para calcular un modelo de la cámara. Otras cámaras de calidad doméstica están calibradas por quienes las usan o se pueden calibrar durante los procesos de ajuste que se producen en la ortorrectificación.
  • Coeficientes polinómicos racionales (RPC): suministrados por los proveedores de imágenes de satélite. Los RPC se calculan para cada imagen de satélite y describen la transformación de coordenadas de la superficie de la Tierra en 3D a coordenadas de imagen 2D en un modelo de sensor matemático que se expresa como la proporción entre dos expresiones polinómicas cúbicas. Los coeficientes de estos dos polinomios racionales los calcula la compañía de satélite a partir de la orientación y la posición orbital del satélite y del riguroso modelo del sensor físico. Los RPC eliminan la necesidad de usar un modelo de cámara riguroso y se denominan a menudo modelos de sensor de reemplazo si se incluyen las matrices de covarianza de error.
  • Puntos de ajuste: compuestos de puntos de control del terreno, puntos de enlace de la imagen y puntos de verificación.
    • Normalmente, los puntos de control del terreno proceden de ubicaciones y mediciones de la topografía del terreno. También pueden existir puntos de control secundarios derivados de un mapa o de una ortoimagen existente con una exactitud conocida, siempre que esa exactitud conocida sea superior a la exactitud esperada de la nueva ortoimagen por un factor lineal de entre tres y cinco. Estos puntos situados en el suelo tienen que estar visibles en las imágenes.
    • Se generan puntos de enlace de imágenes en las áreas de superposición entre las imágenes adyacentes que componen el mosaico. Estos puntos sirven para enlazar todas las imágenes que componen el mosaico de ortoimágenes. Normalmente se computan de forma automática usando técnicas de coincidencia de imágenes en el área de superposición.
    • Se emplean puntos de verificación para evaluar la exactitud del proceso de ortorrectificación. Son puntos topográficos de control del terreno que no se usan en el cálculo del ajuste fotogramétrico.

La información anterior se usa para calcular una orientación de la imagen necesaria para generar un DEM y un mosaico de imágenes ortorrectificadas a partir de las imágenes. Los parámetros de orientación de la imagen derivados incluyen la posición del sensor en el momento de la captura de la imagen en coordenadas como latitud, longitud y altura (x, y, z). La posición del sensor se expresa como omega, fi y kappa (inclinación, alabeo, dirección).

Generación de ortomosaico

El flujo de trabajo general para producir un ortomosaico se describe en esta sección. ArcGIS Pro proporciona herramientas, capacidades y flujos de trabajo guiados para realizar el proceso de creación de productos de DEM y ortoimágenes. Puede encontrar información detallada sobre el procedimiento para crear un ortomosaico usando las herramientas y los asistentes de Representación cartográfica de ortofotos en Representación cartográfica de ortofotos en ArcGIS Pro.

Orientación de la imagen

La orientación de la imagen es un requisito que se debe cumplir para generar modelos digitales de elevación y ortoimágenes. Es un proceso por el cual se determinan la orientación y la posición espacial del sensor en el momento en el que se capturó cada imagen. El conocimiento de la altura del sensor por encima del suelo permite calcular las regiones superpuestas de las imágenes adyacentes, que a continuación se usa para facilitar generación del punto de enlace. El proceso de generación de puntos de enlace colocará las imágenes correctamente en un bloque contiguo. Usa la orientación interior basada en las características físicas del sensor y la orientación exterior basada en los puntos de control del terreno y de enlace entre las imágenes.

Capturar puntos de enlace entre varias imágenes superpuestas puede ser tedioso y requerir mucho tiempo. La herramienta Calcular puntos de unión identifica automáticamente los puntos coincidentes en las áreas de superposición entre las imágenes usando técnicas de correlación cruzada. Estos puntos de enlace se usan junto con los puntos de control del terreno, que también están visibles en varias imágenes, para calcular la orientación exterior de cada imagen que compone el mosaico. Esto significa que el control del terreno debe ser fotoidentificable (o visible) en las imágenes. Los puntos de control del terreno fotoidentificables son entidades persistentes y fácilmente identificables. Pueden ser objetivos pintados en una carretera o el centro de dos calles que se intersecan.

Ajuste de bloques

Usando la información de los puntos de enlace y de control del terreno, un cálculo de ajuste del paquete calcula la orientación exterior para cada imagen, de manera que sean coherentes con las imágenes vecinas. A continuación, la orientación de todo el bloque de imágenes se ajusta para que se adapte al terreno. Este proceso de ajuste del bloque produce el mejor ajuste estadístico entre las imágenes para todo el bloque contiguo y minimiza los errores con el control del terreno y de los puntos de enlace. La transformación ajustada de cada elemento de imagen del bloque se registra en la tabla de soluciones y se almacena en el espacio de trabajo del ortomosaico.

Garantía de calidad y control de calidad

Cuando el bloque de imágenes se ajusta para que encaje en el terreno, el error aparente de los puntos ajustados se presenta en una tabla de errores residuales. Los puntos equivocados se identifican enseguida y los puntos con errores residuales elevados se eliminan o, más frecuentemente, se recolocan de forma manual. El ajuste se vuelve a calcular hasta que tanto el error total como el error residual de cada punto resultan aceptables.

Generación de DEM

Una vez completada la orientación del ajuste de bloques, es posible producir un dataset de elevación mediante el asistente de DEM. Se crea una nube de puntos fotogramétricos para producir el DEM mediante técnicas de correlación cruzada de imágenes. A continuación, el DEM se utiliza en el proceso de ortorrectificación de imágenes a fin de eliminar las distorsiones del terreno y producir un ortomosaico.

Es posible producir dos tipos de DEM:

  • DTM: elevación digital terrestre, sin incluir la elevación de los objetos que contenga. También se conoce como elevación de suelo desnudo. El dataset de DTM de suelo desnudo se usa para producir ortoimágenes y ortomosaicos.
  • DSM: elevación digital terrestre, incluida la elevación de los objetos que contenga, tales como árboles y edificios. El DSM es un dataset analítico valioso que se utiliza para clasificar las entidades de las ortoimágenes, por ejemplo, para diferenciar entre pavimentos de asfalto y cubiertas asfálticas. No se debe usar para la ortorrectificación de imágenes a no ser que las imágenes de origen tengan una visualización de nadir sin inclinación de edificios ni entidades, para así producir ortoimágenes reales.

Nota:

Si un área boscosa presenta una alta densidad de árboles o cuenta con otra cobertura vegetal densa, no será posible derivar una superficie de suelo de DTM ya que el suelo no es visible. El producto de superficie de elevación más adecuado para la cobertura de suelo con alta densidad boscosa es un DSM, que crea específicamente una superficie que representa la parte superior del dosel arbóreo.

El asistente de DEM le permite definir distintos valores de parámetros para generar la nube de puntos de elevación y el DEM. A continuación, el DTM se utiliza en el proceso de ortorrectificación de imágenes a fin de eliminar las distorsiones del terreno y producir un ortomosaico.

Ortorrectificación de imágenes

La imagen ortorrectificada presenta una escala constante tal que las entidades se representan en sus posiciones reales con respecto a su posición en el suelo. Esto permite realizar una medición exacta de las distancias, los ángulos y las áreas de la ortoimagen.

La ortorrectificación se logra estableciendo una relación entre las coordenadas x,y de la imagen y el GCP del mundo real para determinar el algoritmo para remuestrear la imagen. Del mismo modo, la relación matemática entre las coordenadas del suelo representadas por el DTM, y la imagen se calcula y se usa para determinar la posición adecuada de cada píxel en la imagen de origen.

El ortomosaico se produce con el asistente Ortomosaico. Utiliza como entradas los elementos ajustados por bloques que componen la colección de imágenes y el DTM. También se puede utilizar un DEM de suelo desnudo existente. El asistente Ortomosaico le permite definir los ajustes para la producción del mosaico de ortoimágenes, por ejemplo, escala y formato de datos, generación de líneas de unión y equilibrio de color entre imágenes ortorrectificadas, a fin de crear un ortomosaico sin uniones visibles.

Nota:

Las imágenes de satélite de alta resolución del nadir no se ven demasiado afectadas por la distorsión intrínseca a las imágenes aéreas debido a la gran distancia existente entre el sensor y el suelo, la gran distancia focal del sensor (del orden de 10 metros) y el pequeño campo de visión. Estos factores, junto con la información de orientación precisa en forma de RPC, da como resultado que la precisión de DEM y las publicaciones densas sean menos importantes a la hora de producir ortoimágenes precisas, siempre y cuando la orientación exterior ajustada y los puntos de control sean adecuados. Por ello, no se suele usar el paso de generación del DEM y World Elevation de Esri (o los DEM USGS NED o SRTM existentes), junto con los GCP precisos, pueden producir ortoimágenes de Clase I o Clase II a una escala de 1:5.000 o menor.

Si la colección fuera del nadir es grande, o la longitud focal es pequeña, se requiere un DEM más preciso, y de más alta resolución, para obtener la ortorrectificación precisa.

Artefactos de imágenes

En la tabla que aparece a continuación, se describen brevemente los tipos de artefactos que afectan a las imágenes obtenidas mediante teledetección y que se tratan en el proceso de ortorrectificación.

Distorsión de la perspectiva

La distorsión de la perspectiva se ve afectada por el ángulo de oblicuidad y por la distancia entre el sensor y el objetivo en el suelo, así como por las características del sensor. Las distancias focales cortas de los sensores aéreos provocan una distorsión de la perspectiva mayor que las distancias focales largas de los sensores montados en satélites. La perspectiva de visualización mostrará los lados de los edificios orientados al sensor y enmascarará los lados posteriores de los edificios.

Además, en las imágenes en perspectiva, la escala de la imagen se reduce a medida que el usuario se aleja del nadir. En otras palabras, la distancia de la muestra terrestre (GSD) es inferior hacia el nadir de la imagen y superior hacia el borde lejano de esta, y los píxeles tienen una forma trapezoidal.

Campo de visión (FoV)

El campo de visión es la extensión angular que está visible para el sensor durante la exposición. Viene determinado por el tamaño del sensor, la distancia focal y la altitud. La distancia focal es la distancia efectiva entre el punto nodal trasero de la lente y el plano focal. Esto determina la geometría de la perspectiva de la imagen. Cuanto más corta sea la distancia focal, mayor será la distorsión de la perspectiva introducida y más ancho el campo de visión.

Distorsión de la lente

Las lentes solo aproximan la geometría de la perspectiva. Como resultado, distorsionan la ubicación y la forma de los objetos representados en el plano focal. Desde el punto de vista radiométrico, también alteran la cantidad de luz que llega al plano focal. Los dos tipos de distorsión se incrementan en función de la distancia con respecto al centro de la imagen. Estos efectos se minimizan en el centro y se incrementan hacia el borde de la imagen.

Curvatura de la Tierra

La distorsión inducida por la curvatura de la Tierra es más perceptible en las imágenes que cubren extensiones grandes de la Tierra o que se han tomado a ángulos oblicuos desde una altitud elevada. Normalmente afecta a las imágenes aéreas capturadas con una distancia focal corta, a una altitud elevada, con un campo de visión ancho o a las imágenes de satélite en franjas o en bloques.

Desplazamiento del relieve

El desplazamiento del relieve se debe a la elevación variable por encima o por debajo de un datum concreto, que se traduce en un desplazamiento en la posición aparente del objeto en la imagen. Esta variación topográfica, combinada con la orientación de la vista y el campo de visión del sensor, afecta a la distancia y a la escala con las que las entidades se muestran en las imágenes.

Desplazamiento radial

Por ejemplo, en las imágenes verticales, objetos altos como las torres de radio aparecerán inclinados hacia fuera del centro (punto de nadir) de la imagen. Como la parte superior de la torre no se encuentra bajo la parte inferior de la torre en la imagen, el efecto se conoce como desplazamiento del relieve.

Escaneando

Cuando se escanean fotografías aéreas, las distorsiones se introducen primero en el procesamiento y el almacenamiento de la película. Después se pueden introducir otras distorsiones adicionales en el proceso de escaneo debido a la lente o a otros instrumentos de escaneo. Estos errores se tienen que compensar en buena medida en el proceso de ortorrectificación.

Temas relacionados