Skip To Content

Introducción a la representación cartográfica de ortofotos

Información general

La fotogrametría es la ciencia consistente en obtener mediciones fiables a partir de fotografías e imágenes digitales. La fotogrametría suele generar mapas de ortoimágenes, mapas simbólicos, capas SIG o modelos tridimensionales (3D) de escenas u objetos del mundo real. Hay dos tipos generales de fotogrametría, la fotogrametría aérea y la fotogrametría de corto alcance.

En la fotogrametría aérea, el sensor está a bordo de un satélite, un avión tripulado o un dron, y normalmente se orienta en dirección vertical hacia el suelo. Cuando el sensor se orienta hacia abajo, la imagen se denomina vertical o de nadir. Cuando el sensor recorre una ruta de vuelo, se capturan varias imágenes que se solapan. Las imágenes se procesan para generar datos de elevación digitales y mosaicos de imágenes de ortofotos, que se denominan ortomapas. Las imágenes tienen geometría en perspectiva que provoca distorsiones únicas para cada imagen. Las ortoimágenes se han corregido geométricamente para que la imagen resultante tenga la integridad geométrica de un mapa. Se pueden generar otros productos que producen capas SIG vectoriales con entidades como carreteras, edificios, hidrología y otras entidades del terreno.

En la fotogrametría de corto alcance, el sensor suele estar cerca del objeto de interés y no es normalmente una visualización del nadir, sino horizontal, oblicua o incluso hacia arriba en el caso de la representación cartográfica de las estructuras de ingeniería de los puentes. Estas imágenes se modelan matemáticamente de formas algo diferentes, de ahí la necesidad de distinguirlas de la fotogrametría aérea. Los productos son similares a la fotogrametría aérea, por ejemplo modelos 3D, dibujos de ingeniería y ortoimágenes, pero en lugar de representar entidades de terreno y de paisaje, las entidades suelen representar otros aspectos de la superficie, como edificios, estructuras de ingeniería o torres de transmisión y telefonía móvil.

Las herramientas y prestaciones proporcionadas en el conjunto de funciones de representación cartográfica de ortofotos de Esri se centran en los productos de fotogrametría aérea para permitir la generación y revisión de mapas, la detección de cambios y otras aplicaciones de extracción de entidades. Estas herramientas permiten a los usuarios tomar fotos aéreas o de satélite y procesarlas para generar diversos productos.

Ortoimágenes

La ortorrectificación es un proceso que corrige la distorsión geométrica inherente a las imágenes obtenidas mediante teledetección para generar una ortoimagen con precisión comparable a la de un mapa. A continuación, puede unir un grupo de ortoimágenes en una capa denominada ortomosaico. Para ello, necesita imágenes con posiciones de sensor y altitudes conocidas, y un modelo geométrico calibrado para el sensor, además de un modelo de elevación digital (DTM).

A veces, las posiciones y orientaciones conocidas acompañan a las imágenes cuando se suministran al usuario. Si no, las imágenes se tendrán que ajustar al control del terreno. Los procesos de ajuste utilizan la calibración del sensor, la información de orientación del sensor, los puntos de control del terreno, los puntos de enlace y un DTM para producir orientaciones y posiciones exactas. A su vez, esto permitirá la creación de ortoimágenes con una exactitud comparable a la de un mapa. Las distintas ortoimágenes se unen por los bordes y su color se equilibra para generar un mapa ortográfico sin uniones visibles. Este mosaico de ortoimágenes es exacto a una escala de mapa especificada y se puede usar para realizar mediciones y para generar y actualizar las capas de clase de entidad SIG.

Datos de elevación

Si existen datos digitales de elevación adecuados, se usarán en el proceso de ortorrectificación. De lo contrario, los datasets de elevación, como los modelos digitales de superficie (DSM) y los DTM, se deben derivar de las imágenes en estéreo. Las imágenes en estéreo se crean a partir de dos o más imágenes de la misma entidad capturadas en diferentes posiciones de geolocalización. Las imágenes que se solapan se capturan desde distintos puntos de vista. Esta área que se solapa se conoce como imagen en estéreo, que es adecuada para generar datasets digitales de elevación. El modelo para generar estos datasets 3D requiere una colección de varias imágenes superpuestas sin huecos en la superposición, información de orientación y calibración del sensor y puntos de control del terreno y de enlace. A continuación, los datasets 3D se crean automáticamente usando un proceso denominado geocodificación de imágenes, en el que se establece una correlación cruzada entre las imágenes superpuestas para generar puntos 3D definidos mediante geolocalización (latitud, longitud) y elevación.

Necesidad de una representación cartográfica de ortofotos

Las imágenes aéreas digitales, las imágenes aéreas escaneadas y las imágenes de satélite son importantes en la representación cartográfica general y en la generación y visualización de datos SIG. De hecho, la información contenida en la mayoría de los mapas y las capas SIG se ha generado a partir de las imágenes. En primer lugar, las imágenes sirven como telón de fondo que proporciona a las capas SIG un contexto importante que permite establecer asociaciones geoespaciales. En segundo lugar, las imágenes se usan para crear o revisar mapas y capas SIG digitalizando y asignando atributos a entidades de interés como carreteras, edificios, hidrología y vegetación.

Para que esta información geoespacial se pueda digitalizar a partir de las imágenes, estas se deben tratar para corregir distintos tipos de errores y distorsiones inherentes a la forma en que se han capturado. Hay dos tipos principales de distorsión que afectan a las imágenes obtenidas mediante teledetección: la radiométrica y la geométrica. La distorsión radiométrica es la conversión inexacta de valores de la reflectancia del terreno a valores grises en la imagen. A veces, estos valores se denominan números de densidad (DN), condicionados por las influencias atmosféricas y las limitaciones del sensor. Las distorsiones geométricas se deben a las proyecciones en perspectiva y la instrumentación. Entre los tipos frecuentes de distorsiones que afectan a las imágenes no procesadas obtenidas mediante teledetección, se incluyen los errores del sensor y de la plataforma, la curvatura de la Tierra y el desplazamiento del relieve, así como los efectos radiométricos y del ángulo del sol. Cada uno de estos tipos de distorsión se elimina en el proceso de ortorrectificación y representación cartográfica.

La ortorrectificación se refiere a la eliminación de la distorsión geométrica inducida por la plataforma, el sensor y, en especial, el desplazamiento del terreno. La representación cartográfica hace referencia al ajuste de bordes, la generación de líneas de corte y el balance de color de varias imágenes para producir un dataset de ortomosaicos. En conjunto, estos procesos se denominan representación cartográfica de ortofotos.

Una vez que las distorsiones que afectan a las imágenes se eliminan y que se crea un mosaico con las distintas imágenes o escenas para producir un mapa de imágenes de ortomosaico, se puede usar como un mapa simbólico o temático para realizar mediciones exactas de la distancia y el ángulo. La ventaja del mapa de ortoimágenes es que contiene toda la información visible en las imágenes, no solo las entidades y las capas SIG extraídas de la imagen y simbolizadas en un mapa. Por ejemplo, una carretera simbolizada en un mapa tiene una anchura uniforme, mientras que en la ortoimagen una carretera tiene una anchura variable y arcenes que permiten que los vehículos de emergencia se abran paso en los atascos de tráfico o almacenar equipos y material de construcción de carreteras.

Distorsión de la imagen

Los distintos tipos de distorsión que afectan a las imágenes obtenidas mediante teledetección se describen brevemente en la tabla siguiente.

Distorsión de la perspectiva

La distorsión de la perspectiva se ve afectada por el ángulo de oblicuidad y por la distancia entre el sensor y el objetivo en el suelo, así como por las características del sensor. Las distancias focales cortas de los sensores aéreos provocan una distorsión de la perspectiva mayor que las distancias focales largas de los sensores montados en satélites. Las dos distancias focales mostrarán los lados de los edificios orientados al sensor y enmascararán los lados posteriores de los edificios.

Además, en las imágenes en perspectiva, la escala de la imagen se reduce a medida que el usuario se aleja del nadir. En otras palabras, la distancia de la muestra terrestre (GSD) es inferior hacia el nadir de la imagen y superior hacia el borde lejano de esta, y los píxeles tienen una forma trapezoidal.

Campo de visión (FoV)

El campo de visión es la extensión angular que está visible para el sensor durante la exposición. Viene determinado por la lente del sensor, la distancia focal y la altitud. La distancia focal es la distancia efectiva entre el punto nodal trasero de la lente y el plano focal. Esto determina la geometría de la perspectiva de la imagen. Cuanto más corta sea la distancia focal, mayor será la distorsión de la perspectiva introducida y más ancho el campo de visión.

Distorsión de la lente

Las lentes solo aproximan la geometría de la perspectiva. Como resultado, distorsionan la ubicación y la forma de los objetos del suelo representados en el plano focal. Desde el punto de vista radiométrico, también alteran la cantidad de luz que llega al plano focal. Los dos tipos de distorsión se incrementan en función de la distancia con respecto al centro de la imagen. Estos efectos se minimizan en el centro y se incrementan hacia el borde de la imagen.

Curvatura de la Tierra

La distorsión inducida por la curvatura de la Tierra es más perceptible en las imágenes que cubren extensiones grandes de la Tierra o que se han tomado a ángulos oblicuos desde una altitud elevada. Normalmente afecta a las imágenes aéreas capturadas con una distancia focal corta, a una altitud elevada, con un campo de visión ancho o a las imágenes de satélite en franjas o en bloques.

Desplazamiento del relieve

El desplazamiento del relieve se debe a la elevación variable por encima o por debajo de un datum concreto, que se traduce en un desplazamiento en la posición de la imagen del objeto. Esta variación topográfica, combinada con las distorsiones por la inclinación y el campo de visión del sensor, afecta a la distancia y a la escala con las que las entidades se muestran en las imágenes.

Desplazamiento radial

Por ejemplo, en las imágenes verticales, objetos altos como las torres de radio se inclinarán hacia fuera del centro (punto de nadir) de la imagen. Como la parte superior de la torre no se encuentra bajo la parte inferior de la torre en la imagen, el efecto se conoce como desplazamiento del relieve.

Escaneando

Cuando se escanean fotografías aéreas, las distorsiones se introducen primero en el procesamiento y el almacenamiento de la película. Después se pueden introducir otras distorsiones adicionales en el proceso de escaneo debido a la lente o a otros instrumentos de escaneo. Estos errores se tienen que compensar en buena medida en el proceso de ortorrectificación.

Proceso de ortorrectificación

La ortorrectificación es el proceso consistente en eliminar los efectos de la distorsión de la imagen introducida por el sensor, la perspectiva de visualización y el relieve con el fin de crear una imagen correcta desde el punto de vista planimétrico. Las imágenes ortorrectificadas resultantes tienen una escala constante tal que las entidades se representan en sus posiciones reales con respecto a su posición en el suelo. Esto permite realizar una medición exacta de las distancias, los ángulos y las áreas de la ortoimagen.

Hay varios requisitos para crear un mapa de ortoimágenes o un ortomosaico a partir de las imágenes sin procesar:

  • Las imágenes digitales, que pueden tener el formato de una imagen aérea digital, una imagen escaneada o una imagen de satélite.
  • Un archivo de calibración de la cámara que incluye mediciones de las características del sensor, como la distancia focal, el tamaño y la forma del plano de la imagen, el tamaño del píxel y los parámetros de la distorsión de la lente. En fotogrametría, la medición de estos parámetros se denomina orientación interior (IO) y se recopilan en un archivo de modelo de la cámara. Las cámaras de representación cartográfica aérea de alta precisión, denominadas cámaras métricas, se analizan para proporcionar información de calibración de la cámara en un informe empleado para calcular un modelo de la cámara. Otras cámaras de calidad doméstica están calibradas por quienes las usan o se pueden calibrar durante los procesos de ajuste que se producen en la ortorrectificación.
  • Los coeficientes polinómicos racionales (RPC) suministrados por los proveedores de imágenes de satélite. Los RPC se calculan para cada imagen y describen la transformación de coordenadas de imagen 2D a coordenadas de la superficie de la Tierra en 3D en un modelo de sensor matemático que se expresa como la proporción entre dos expresiones polinómicas cúbicas. Los coeficientes de estos dos polinomios racionales los calcula la compañía de satélite a partir de la orientación y la posición orbital del satélite y del riguroso modelo del sensor físico. Los RPC eliminan la necesidad de usar un modelo de cámara riguroso y se denominan a menudo modelos de sensor de reemplazo si se incluyen las matrices de covarianza de error.
  • Los puntos de ajuste, que se componen de puntos de control del terreno, puntos de enlace de la imagen y puntos de verificación.
    • Normalmente, los puntos de control del terreno proceden de la topografía del terreno. También se pueden usar puntos de control secundarios creados a partir de un mapa o de una ortoimagen existente con una exactitud conocida, siempre que esa exactitud conocida sea superior a la exactitud esperada por un factor lineal de entre tres y cinco. Estos puntos situados en el suelo tienen que estar visibles en las imágenes.
    • Los puntos de enlace de imágenes generados en las áreas de superposición entre las imágenes adyacentes que componen el mosaico. Normalmente se generan de forma automática usando técnicas de coincidencia de imágenes.
    • Los puntos de verificación empleados para evaluar la exactitud del proceso de ortorrectificación. Son puntos topográficos de control del terreno que no se usan en el cálculo de la solución fotogramétrica.

La información anterior se usa para calcular una orientación de la imagen necesaria para generar un modelo digital de elevación (DEM) y un mosaico de imágenes ortorrectificadas a partir de las imágenes. Los parámetros de orientación de la imagen derivados incluyen la posición del sensor en el instante de la captura de la imagen en un sistema de referencia global como la latitud, la longitud y la altitud (x, y, z). La posición del sensor se expresa como omega, fi y kappa (inclinación, alabeo, dirección).

Generación de ortomosaico

El flujo de trabajo general para producir un ortomosaico se describe en esta sección. Puede encontrar información detallada sobre el procedimiento para crear un dataset de ortomosaico usando las herramientas y los asistentes de Representación cartográfica de ortofotos en Representación cartográfica de ortofotos en ArcGIS Pro.

Orientación de la imagen

La triangulación aérea es un proceso consistente en unir un bloque de imágenes para crear un mapa de mosaico de imágenes exacto. La orientación de la imagen es un requisito que se debe cumplir para generar modelos digitales de elevación y ortoimágenes. Es un proceso por el cual se determinan la orientación y la posición espacial de las imágenes y las regiones de superposición de las imágenes adyacentes; esto es importante para la generación de puntos de enlace. El proceso de generación de puntos de enlace colocará las imágenes correctamente en un bloque contiguo. Usa la orientación interior basada en parámetros intrínsecos del sensor y la orientación exterior basada en los puntos de control del terreno y de enlace entre las imágenes.

Capturar puntos de enlace entre varias imágenes superpuestas puede ser tedioso y requerir mucho tiempo. La herramienta Calcular puntos de unión identifica automáticamente los puntos coincidentes en las áreas de superposición entre las imágenes usando técnicas de correlación cruzada. Estos puntos de enlace se usan junto con los puntos de control del terreno, que también están visibles en varias imágenes, para calcular la orientación exterior de cada imagen que compone el mosaico. Esto significa que el control del terreno debe ser fotoidentificable (o visible) en las imágenes. Los puntos de control del terreno fotoidentificables son entidades persistentes y fácilmente identificables. Pueden ser objetivos pintados en una carretera o el centro de dos calles que se intersecan.

Ajuste de bloques

Usando la información de los puntos de enlace y de control del terreno, un cálculo de ajuste del paquete calcula la orientación exterior para cada imagen, de manera que sean coherentes con las imágenes vecinas. A continuación, la orientación de todo el bloque de imágenes se ajusta para que se adapte al terreno. Este proceso de ajuste del bloque produce el mejor ajuste estadístico entre las imágenes para todo el bloque contiguo y minimiza los errores con el control del terreno.

Garantía de calidad y control de calidad

Cuando el bloque de imágenes se ajusta para que encaje en el terreno, el error aparente de los puntos ajustados se presenta en una tabla de errores residuales. Los puntos equivocados se identifican enseguida y los puntos con errores se eliminan o, más frecuentemente, se recolocan de forma manual. Otros puntos que tienen errores no aceptables también se recolocan y el ajuste se vuelve a calcular hasta que tanto el error total como el error residual de cada punto resulta aceptable.

Generación de DEM

Una vez que la orientación se ha completado, se produce automáticamente un dataset digital de elevación usando técnicas de correlación cruzada de imágenes. Este dataset digital de elevación se edita a continuación para eliminar la vegetación, los edificios y otras entidades situadas sobre el suelo con el fin de generar un DTM.

Ortorrectificación de imágenes

La ortorrectificación es el proceso consistente en eliminar los efectos de la distorsión de la imagen introducida por el sensor, la perspectiva de visualización y el relieve con el fin de crear una imagen correcta desde el punto de vista planimétrico.

Esto se logra estableciendo una relación entre las coordenadas x,y de la imagen y el GCP del mundo real para determinar el algoritmo para remuestrear la imagen. Del mismo modo, la relación matemática entre las coordenadas del suelo representadas por el DEM y la imagen se calcula y se usa para determinar la posición adecuada de cada píxel en la imagen de origen. La generación de la ortoimagen exige combar la imagen de origen para que esa distancia y esa área sean uniformes en relación con las mediciones del mundo real. De este modo, las entidades medidas en las ortoimágenes coinciden con la medición, la escala y el ángulo de las mismas entidades del suelo, con independencia de que se encuentren en un terreno inclinado o en una zona llana. La exactitud resultante de la ortoimagen se basa en la precisión de la triangulación, la resolución de la imagen de origen y la exactitud del modelo de elevación.

Si se usan imágenes de satélite de nadir de alta resolución para la generación de los ortomosaicos, se puede generar y editar un DSM. Por su parte, las imágenes de satélite de alta resolución del nadir no se ven demasiado afectadas por la distorsión intrínseca a las imágenes aéreas debido a la gran distancia existente entre el sensor y el suelo, la gran distancia focal del sensor (del orden de 10 metros) y el pequeño campo de visión. Estos factores, junto con la información exacta de la orientación proporcionada por los RPC, se traduce en la condición de que la exactitud del DEM y las publicaciones densas son menos importantes para producir ortoimágenes exactas, siempre que la orientación exterior ajustada y los puntos de control sean adecuados. Por ello, con frecuencia, el paso de generación del DEM no se usa y los DEM USGS NED o SRTM existentes, junto con los GCP exactos, pueden producir ortoimágenes de Clase I o Clase II a una escala de 1:5000 o menor.

Temas relacionados