INTEGRACIÓN DE IMÁGENES SATELITALES SENTINEL-2 EN CDCOL
Proyecto de Grado
Harold Enrique Castro Barrera
UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERÍA DEPARTAMENTO DE INGENIERÍA DE SISTEMAS Y COMPUTACIÓN JUNIO 2020
David Felipe Niño Romero
Page 1 of 19
CONTENIDO0 RESUMEN
El instituto de Hidrología, Meteorología y Estudios Ambientales (IDEAM) en conjunto con la Universidad de los Andes desarrolló el cubo de datos de Colombia (CDCol), herramienta que ofrece a los usuarios un flujo de trabajo y capacidad de procesamiento desde la obtención hasta el análisis de las imágenes satelitales Landsat. La misión espacial Landsat desplegó una flota de satélites para la observación terrestre, que en su versión 8, realiza captura de imágenes con resolución de 30 metros por píxel y permite capturar imágenes de un punto de la tierra cada 16 días. La disponibilidad de estas imágenes satelitales fue uno de los motivos por los cuales CDCol usa como input estas imágenes. Sin embargo, la misión espacial recientemente lanzada, Sentinel-2, permite mayor resolución temporal y espacial. Este trabajo propondrá un flujo de trabajo para la obtención y procesamiento de estas imágenes con miras a la posible integración de estas con CDCol.
1 INTRODUCCIÓN
Los cambios a los que somete la tierra por procesos naturales y antropogénicos cambian para siempre la tierra. Detectar y hacer seguimiento a estos cambios permite a las sociedades tomar mejores decisiones y pronosticar contextos futuros (Giuliani, G., et al. 2019).
La agenda para el desarrollo sostenible fue adoptada por todos los estados miembros en 2015. En este marco, los objetivos de desarrollo sostenible (ODS) son la base para trabajar por un futuro mejor y más sostenible para todos (Naciones Unidas. 2015). Los retos que traen los ODS implican mecanismos y herramientas para no solo para lograr dichos objetivos, sino también para hacer seguimiento a los indicadores con los cuales se monitorea el nivel de avance hacia estos objetivos. Específicamente, Colombia acordó unos objetivos para mantener y proteger la vida silvestre y la naturaleza. Como indicadores de estos objetivos, la agenda colombiana incluye “miles de hectáreas protegidas”, “porcentaje de la superficie cubierta por bosque natural”, “Pérdida anualizada de bosque natural” y “áreas en proceso de restauración” (Departamento Nacional de Planeación, 2019). Sin embargo, un monitoreo manual de estos indicadores se hace costoso tanto en tiempo como monetariamente. Alternativas inicialmente podrían ser la toma de fotografías desde aeronaves, toma desde tierra de fotografías en el lugar de interés, uso de drones o uso de imágenes satelitales. Las fotografías desde aeronaves para clasificar y detectar cambios en el suelo se vuelven una alternativa prometedora cuando las áreas de interés no son demasiado grandes y el seguimiento no se debe hacer por tiempos prolongados. En caso contrario, se vuelven una alternativa costosa, operacionalmente compleja y poco escalable. La misma situación ocurre para las imágenes desde drones y fotografías desde tierra.
La información de satélites puede apoyar el logro de los ODS ya que proveen información y estadísticas clave para la toma de decisiones (Metternicht, G., et al. 2020). A pesar de que esta información no contiene métricas directas, su análisis y procesamiento pueden apoyar a países como Colombia en la consecución de estos objetivos. Los satélites de observación terrestre permiten recolectar constantemente información sobre cambios en la tierra. Sin embargo, el uso de estas imágenes conlleva también retos importantes.
Con el creciente número de imágenes, es necesaria una capacidad de procesamiento y almacenamiento que permita que puedan ser empleadas para los análisis. Adicionalmente, un gran reto que conllevan todas las imágenes de observación de la tierra desde el espacio son los efectos atmosféricos. Estos impiden o dificultan el análisis de las imágenes ya que cubren y distorsionan la superficie terrestre. Con miras a un sistema que permita la clasificación de suelos, monitorear cultivos, detectar cambios de uso de suelo a una escala de país, se requiere una metodología que permita automatizar y procesar resultados listos para la toma de decisiones, corrigiendo los efectos de la atmosfera.
En este trabajo se propone una metodología para la descarga y procesamiento de las imágenes de Sentinel-2. Una de las misiones de satélites de acceso libre y con mayor resolucion tanto temporal como espacial. Se comparan herramientas existentes para la automatización de la descarga de las imágenes.
Page 2 of 19
De igual manera, se comparan metodologías para la corrección atmosférica. Finalmente, se analiza la solución encontrad en la que en el proceso de corrección atmosférica se logra una clasificación de suelos a través de la herramienta SEN2COR.
2 Contexto
2.1 Objetivos
Hasta el momento, CDCol ha usado imágenes satelitales de la misión Landsat para hacer mapas de cobertura de tierras y seguimiento a deforestación. Sin embargo, dada la disponibilidad y mejor resolución espaciotemporal de las imágenes de la misión Sentinel-2, integración de estas imágenes con CDCol abriría una ventana a nuevas y mejores aplicaciones como monitoreo de cultivos.
Se busca generar una metodología estándar y automatizable para la descarga y corrección de las imágenes satelitales Sentinel-2. Adicionalmente se propondrá una herramienta para generación de mapas de cobertura de suelos que permitirán ser un input en las clasificaciones más detalladas.
2.2 Antecedentes
La necesidad por detectar y analizar las condiciones y problemas ambientales no es nueva. En los 40s un investigador independiente en Estados Unidos usó fotografías tomadas desde aeronaves en combinación con imágenes desde tierra para construir y validar un mapa de cobertura terrestre sobre todo el país norteamericano. En los 70s, el primer mapa que usaba imágenes satelitales fue construido sobre el sur de Estados Unidos
(
Anderson, J. 1976). Con el lanzamiento de la primera misión Landsat en 1972, los mapas de cobertura terrestre con imágenes satelitales empezaron a tomar fuerza (Defries, R. S. et al. 1999).En los 80s, se empezaban a producir los mapas interpretados por computadores. Una comparación de estos con los mapas producidos con interpretación humana de las imágenes determinaba que aún la capacidad de cómputo era muy limitada para producir resultados tan buenos como los de los humanos (Schneider, S. 1980). Con el tiempo las nuevas técnicas de computación como aprendizaje de máquina se aplicaron a la producción de los mapas de cobertura. En los 90s se aplicaron técnicas de aprendizaje supervisado y redes neuronales. Se encontró un prometedor resultado con las redes neuronales que podría aplicarse con mejores recursos computacionales (Hepner, G. 1990).
En los 2000 se construye un mapa de cobertura de suelos global con una resolucion espacial de 1 km por píxel usando el Radiómetro Avanzado de muy Alta Resolución (AVHRR, por sus siglas en inglés). Este mapa segmentó la tierra en 12 clases sobre un área de 37294 x 1 km pixeles (Hansen, M., et al. 2000). El mapa fue parte de una iniciativa conjunta de varias instituciones para generar mapas de cambios de uso de tierra nacionales.
Proyectos privados también entraron en la carrera por construir una representación digital de la tierra. A pesar de tener un enfoque distinto, en 2005 Google Earth hizo posible para cualquier persona con un pc reciente obtener imágenes y versiones en 3D de la tierra. La noción de “la tierra digital”, un objetivo planteado para que la población pudiese navegar por todo el mundo y a través de la historia de las imágenes, para algunos se había cumplido con este instrumento (Grossner, K. 2006). Este mismo objetivo condujo a la creación de un prototipo Alejandría digital, que aspiraba a facilitar la búsqueda y uso personalizado de las imágenes satelitales con una interfaz de usuario (Smith, T. et al. 2001).
El aumento constante de misiones y, por tanto, del número de imágenes satelitales llevó a que en 2017 se creara una herramienta para estandarizar su acceso y uso. El Cubo de Datos Abierto (ODC, por sus siglas en inglés), adicionalmente, buscaba aumentar el valor e impacto de la información de los satélites proveyendo una arquitectura abierta y gratuita, incentivando su uso en la comunidad científica. El ODC
Page 3 of 19
Programa/País Fuente de datos principal Periodo de estudio Escala
CORINE (EU) Landsat TM/ETM+ 1990 - 2000 - 2006
5 hectáreas - Mínima Unidad de Mapeado
(MMU) EODS / Canadá Landsat TM/ETM+ Intervalos de 5 - 10
años Landsat píxel
NLCD / (EE.UU.) Landsat TM/ETM+ 1992 - 2001 Landsat píxel
NLC / Sudáfrica Landsat TM/ETM+ 1994/95 - 2000 MMU: 1 ha
NCAS - LCCP / Australia
Landsat MSS, TM, ETM+, desde 1972; NOAA NDVI
1972 - 2000, varios periodos de tiempo
50m (1979-88), 25m (desde 1989) LCDB2 / Nueva
Zelanda Spot and Landsat 7 ETM+ 1996/97 - 2001/02 Landsat píxel ESA / Suiza, Países
Bajos, España, Italia Landsat TM/ETM+ 1990 - 2000 Landsat píxel
Tabla 1 : Programas de cobertura o cambio en la cobertura de tierras hasta 2008 (Modificado de Herold, M. et al. 2008)
está basado en la implementación del Cubo de Datos de Geociencia Australiano (AGDC, por sus siglas en inglés) adaptado para permitir la inclusión de una variedad amplia de usuarios (Killough, B. 2018). Como resultado, ofrece un mecanismo para la ingesta (descarga), almacenamiento, procesamiento y análisis eficiente de imágenes satelitales (Rizvi, S. R., et al. 2018). Numerosas implementaciones del ODC se han llevado a cabo incluyendo Australia, Colombia, México, Suiza, Taiwán, y Tanzania. Cada una de estas implementaciones se construyeron teniendo en cuenta los requerimientos y casos de uso de cada situación particular. Por ejemplo, monitoreo del agua en la cuenca del Murray-Darling, Australia, seguimiento de la cobertura de nieve en Suiza, y evaluación de capital ambiental y servicios ecosistémicos en México (Dhu, T., et al. 2019).
Desarrollos recientes han ofrecido evidencia de la capacidad y flexibilidad del ODC. La iniciativa Datos de Observación para Monitoreo de Ecosistemas (EODESM, por sus siglas en inglés), aspiró a ser una aproximación para construir mapas de coberturas terrestre y sus cambios. Logró ser una herramienta para producir mapas a un nivel nacional usando imágenes Landsat y ser integrable con el ODC (Lucas, R. et al. 2019).
La metodología de estandarización de mapas de cobertura terrestre CORINE, desarrollada por la agencia espacial europea (ESA, por sus siglas en inglés), fue aplicada en Colombia en 2009. El objetivo fue crear un mapa de cobertura a escala 1:100000 entre 1992 y 2005 sobre los andes colombianos usando imágenes de la misión satelital IKONOS. Este mapa fue desarrollado en conjunto con La Oficina Nacional de Bosques francesa (ONF, por sus siglas en francés), el Instituto Geográfico Agustín Codazzi (IGAC), la Corporación Autónoma Regional del Magdalena (Cormagdalena), y el IDEAM. Como resultado se encontró aumento en áreas de cultivo y disminución en áreas de bosque y pastizales (Hernández, G., et al. 2009).
Page 4 of 19
CDCol fue desarrollado basado en el ODC para producir una plataforma unificada de análisis de imágenes satelitales en Colombia. Se desarrollaron metodologías altamente replicables y se modificó la implementación para mejor adaptación al área colombiana con imágenes Landsat. Esta herramienta fue aplicada para calcular cobertura de bosques, deforestación, reservas de carbono y emisiones de carbono por deforestación. Los desarrolladores del CDCol procuraron producir una herramienta que fuera independiente de cualquier plataforma externa a la hora de administrar la información, de fácil implementación de nuevos algoritmos para el análisis de las imágenes y altamente replicable (Ariza- Porras, C., et al. 2017).
Dentro de los algoritmos implementados en CDCol se incluyen algoritmos de aprendizaje de máquina para clasificación supervisada, árboles de decisión. Con este, se realizó un mapa de cobertura de tierra sobre la Orinoquía colombiana. Así como este, hay múltiples algoritmos dentro del banco de algoritmos que están disponibles en CDCol para los usuarios. La clasificación de tierras mencionada se realizó con las imágenes Landsat con 7 clases temáticas que incluían cultivos, área urbana, pastizales, bosques, pradera, cuerpos de agua, y otros logrando una precisión de 86% (Pachón, I., et al. 2018).
2.3 Imágenes satelitales de la misión Sentinel-2
El uso de imágenes satelitales para la observación terrestre es una técnica conocida como teledetección.
Este proceso incluye la captura y transferencia de datos desde los sensores satelitales hacia la tierra.
Adicionalmente, los sensores de los satélites, así como una cámara de fotografía, tienen especificaciones que permiten comparar su desempeño. Específicamente, una característica clave de los satélites son sus resoluciones. Hay diferentes tipos de resoluciones, la resolución espacial es la distancia capturada por la parte más pequeña de una imagen. Generalmente se mide esta resolución como metros por píxel. Si un píxel captura menor distancia la imagen tendrá mejor calidad. La resolucion espectral indica cuantas bandas y de cuanto ancho es capaz de percibir el sensor. Mayor numero de bandas indican mejor resolucion espectral. La resolución temporal indica con qué frecuencia pasa el satélite por un punto específico de la tierra (Pardo, C., 2020).
Sentinel-2 es la segunda misión europea de constelación de satélites (Sentinel-2A y 2B) con una órbita polar. Es decir, se mueve casi perpendicular a la línea del ecuador. Es importante no confundirse con la enumeración que contienen las imágenes de esta constelación. Como se mencionó, el nombre Sentinel-2 hace referencia a que es la segunda misión del programa espacial europeo. Sentinel-2A hace referencia al satélite A de la segunda misión de este programa. Adicionalmente, existen niveles de procesamiento de las imágenes. Uno de estos niveles es el Sentinel-L2A, que se mencionará más adelante. Esta misión fue diseñada para alimentar el sistema de monitoreo global para el ambiente y la seguridad (GMES, por sus siglas en inglés). Los dos satélites de la constelación se mueven con un desfase de 180 grados, cada uno con un Instrumento Multi Espectral (MSI). El MSI mide la radiación que refleja la tierra y que atraviesa la atmosfera. Permite la captura de 13 bandas espectrales que incluyen los segmentos del espectro electromagnético visibles y cercanos al infrarrojo (VNIR, por sus siglas en inglés) hasta los Infrarrojos de Onda Corta (SWIR). Las bandas se distribuyen así:
- 4 bandas con 10 metros de resolución espacial que incluyen al azul, verde, rojo y cercano a infrarrojo.
- 6 bandas con 20 metros de resolución espacial: 4 bandas delgadas para caracterización de vegetación, y dos bandas mas anchas que en el segmento SWIR para aplicaciones como detección de nieve/hielo/nubes o la humedad de vegetación.
-3 bandas con 60 metros de resolución espacial principalmente para la detección de nubes y correcciones atmosféricas.
Page 5 of 19
Figura 1: Bandas espectrales de MSI de Sentinel-2 y su resolución espacial. Tomado de Gatti, A., & Galoppo, A. (2018)
Dentro de los objetivos de la misión Sentinel-2 se incluye ofrecer una fuente operacional de información óptica, con alta resolucion temporal, alta cobertura, oportuno, y confiable.
Los niveles de procesamiento de las imágenes Sentinel-2 que están disponibles para su descarga son niveles 1C y 2A. El nivel 1C o L1C proporciona una imagen ortorectificada con reflectancia Top-of- Atmosphere (TOA) con registros multiespectrales y máscaras de agua y nubes. Las máscaras son mapas de pixeles que indican que pixeles están representando agua y cuales están representando nubes. Las imágenes Sentinel L1C no son fieles a lo que se encuentra en la superficie terrestre ya que están distorsionadas por los efectos atmosféricos. El nivel de procesamiento 2A o L2A, proporciona imágenes de reflectancia ortorectificadas Bottom-of-Atmosphere (BOA) con registro multiespectral y una clasificación de escenas por nubes, sombra de nubes, vegetación, tierra/desiertos, agua y nieve y se le considera como la información lista para análisis.
Un producto Sentinel-2 se entrega al usuario dependiendo del área de interés que el mismo haya seleccionado y los metadatos que crea relevantes. Este producto está compuesto por un grupo de
“Granules” o “Tiles” (para productos ortorectificados) que intersecan el área de interés definida por el usuario. Un Granule es la partición mínima e indivisible de un producto que contiene todas las bandas espectrales posibles. Un Tile consiste en una imagen ortorectificada de 100 km x 100 km en proyección cartográfica de referencia UTM/WGS84. La órbita de los satélites sentinel-2 no es completamente perpendicular al ecuador, en otras palabas, se tiene un grado de inclinación de la orbita para que recorra las diferentes zonas de la tierra. Debido a esto, la construcción de un Tile puede llegar a ser la suma de capturas de los dos satélites.
Page 6 of 19
Figura 2: Consolidación de tiles. Tomado de Gatti, A., & Galoppo, A. (2018)
A cada Tile se le asigna un nombre o código de referencia. Los Tiles que cubren Colombia se observan en la figura 3.
Figura 3: Tiles sobre Colombia
Page 7 of 19
Por último, es importante entender cómo se nombran los productos Sentinel-2. Los productos tienen una convención que facilita la identificación de cada una de las características de estos. Cada nombre representa un Tile y se compone de:
MMM_DDDDDD_<id de la instancia>
Donde: <Instance_ID> = [Hora de la toma]_Nxxyy_ROOO_Txxxxx_[Discriminador de producto]
Campo Significado Longitud máxima Ejemplo
MMM Id de la misión (S2A o S2B) 3 S2A
n/a Separador 1 _
DDDDDD Descriptor semántico para describir nivel de procesamiento
6 MSIL2A
n/a Separador 1 _
Hora de la toma
Fecha y hora en UTC con resolución de segundos. YYYYMMDDThhmmss
15 20171103T102201
n/a Separador 1 _
Nxxyy Base de producción 5 N0206
n/a Separador 1 _
ROOO Número de órbita 4 R065
n/a Separador 1 _
Txxxxx Numero de Tile 6 T32TNS
n/a Separador 1 _
Discriminador de Producto
Cadena de caracteres que diferencia cada producto asociado a la toma.
15 20171106T195236
Total caracteres sin la extensión 60
Tabla 2: Identificación de las partes del nombre de un producto Sentinel-2 Tomado de Gatti, A., & Galoppo, A. (2018)
Ejemplo del nombre de un producto:
S2A_MSIL2A_20171103T102201_N0206_R065_T32TNS_20171106T195236.SAFE
La extensión .SAFE es el Formato Estándar de Archivo para Europa (SAFE, por sus siglas en inglés)
2.4 Identificación del problema y de su importancia
En la literatura hay múltiples desafíos comunes en el uso de imágenes satelitales para desarrollar mapas de cobertura de tierra. Principalmente, se encontró que la estandarización de las metodologías es un reto importante, ya que sin esta no es posible comparar resultados de los mapas construidos (Nunnally, N.
1970). Dentro de estos desafíos se encontró la incompatibilidad e inconsistencia de las clases usadas para la clasificación. Asimismo, la duplicación de esfuerzos donde metodologías ya probadas se desarrollaban nuevamente para el mismo fin, lo cual, entre otras cosas, contribuye a la falta de estandarización. Otro reto importante encontrado en múltiples proyectos fue la dificultad para reproducir metodologías de obtención de la información y la dificultad de agrupar diferentes fuentes de datos.
En el mismo sentido, se encuentra el constante reto en la estandarización de los procesos aplicados a las imágenes. Esta categoría abarca las dificultades para emplear una metodología común para la ortorectificación de las imágenes, la corrección atmosférica y la georreferenciación de estas. La corrección atmosférica incluye también la detección de las nubes presentes en la imagen, que consiste en generar un mapa de pixeles donde se clasifica un píxel como nube o no nube dependiendo del color del píxel y su intensidad.
Page 8 of 19
Una de las barreras para el uso de la información de observación terrestre es la dificultad para acceder y manipular a la información. En parte porque la capacidad de computo requerida para manipular estas imágenes es elevada y también porque, para su uso, se les requiere realizar un procesamiento para su corrección y preparamiento. Las metodologías para realizar este proceso aún son poco conocidas para usuarios finales, por lo que desincentivan su uso en proliferado.
3 DISEÑO Y ESPECIFICACIONES
3.1 Definición del problema
Con el aumento de las misiones espaciales para la observación terrestre la cantidad de información que recibimos desde el espacio sobre nuestra superficie terrestre es cada vez mayor. La misión Landsat, por ejemplo, ha recolectado a lo largo del tiempo alrededor de 2 petabytes de información y continúa aumentando (Giuliani, G., et al. 2018).
De la misma forma, la reciente misión espacial Sentinel-2, ha proporcionado un acceso a información de mejor resolución y abiertamente accesible para usuarios. El uso de estas imágenes para aplicaciones de mayor precisión es prometedor. Sin embargo, el acceso, procesamiento y análisis eficiente y estandarizado de esta información es materia de estudio y debate.
3.2 Especificaciones
Se busca encontrar una metodología estándar para la descarga, corrección y análisis de la información proporcionada por los satélites Sentinel-2. Al hacerlo, se busca que se disminuyan las barreras tecnológicas y de conocimiento para el uso de estas imágenes. Se espera incluir a una variedad amplia de usuarios finales, con el objetivo de ampliar el valor del uso de estas imágenes. Por lo tanto, se requiere que esta metodología incluya:
Escalabilidad: esto es, debe ser una metodología que aplique para computadores personales como para maquinas con grandes capacidades como CDCol.
Replicabilidad: uno de los grandes problemas actuales es que soluciones disponibles son difícilmente reproducibles, lo que evita que usuarios puedan desplegar la solución y puedan conseguir y aportar a los resultados ya obtenidos.
Capacidad para ser Automatizable: Para casos en que los análisis de cobertura de tierras se requieran sobre extensiones de tierra importantes y a lo largo de largos periodos, se requiere una solución para que especificando parámetros se puedan obtener las imágenes sin importar el volumen de los datos.
Información lista para análisis: Debido a que el proceso de corrección de las imágenes es un proceso transversal a todas las imágenes que se vayan a analizar, proporcionar una metodología en la que las imágenes disponibles ya se encuentren listas para ser usadas por los analistas incentivaría en gran medida su uso ya que requerirían menores recursos.
Eficiencia económica: Múltiples soluciones para obtener las imágenes Sentinel-2 incluyen costos a pesar de que la información esta disponible gratuitamente. Esto se debe a que el acceso a la información es gratuito, pero, al ser volúmenes de información grandes incurren en costos de transferencia de datos.
3.3 Restricciones
Dada la disponibilidad libre de costos para las imágenes Sentinel-2, se debe encontrar una forma de obtener estas imágenes sin incurrir en gastos por la descarga. Funcionar en pcs personales de mínimo 8
Page 9 of 19
GB de memoria RAM y con un almacenamiento de 512 GB. Este almacenamiento es necesario por el volumen de la información que contienen las imágenes satelitales.
4 IMPLEMENTACIÓN
4.1 Descripción de la implementación
La implementación de esta metodología se dividió en las etapas de descarga, corrección y construcción del mapa de cobertura de tierras.
4.1.1 Ingesta o descarga de imágenes
En esta etapa se evaluaron algunas metodologías disponibles. En primer lugar, se evaluó el método manual de descarga de las imágenes sentinel-2 desde la plataforma desarrollada por ESA, Copernicus (https://scihub.copernicus.eu/). Esta plataforma permite a sus usuarios navegar intuitivamente por una interfaz que ofrece un mapa para seleccionar y filtrar el área de interés por las fechas que se quieren analizar. Se debe estar registrado y se debe iniciar sesión en la plataforma. La transferencia de datos a través de esta plataforma es gratuita, así como el acceso a las imágenes. Sin embargo, aplica un límite de descarga de máximo 2 descargas concurrentes por usuario. La figura 4 muestra una selección de área de interés y filtro por fecha y producto.
El segundo método para obtención de las imágenes implementado fue Google Cloud Platform. Allí las imágenes se encuentran en un conjunto de datos público que se pueden consultar por Big Query también.
Estas imágenes son las producidas por el satélite A de la constelación en niveles de procesamiento L1C y L2A. Consultas a esta plataforma permiten filtrar programáticamente las imágenes por área de interés, fechas y nivel de procesamiento entre otros. Para implementar este método se realizó un script en Python que descarga los metadatos de las imágenes y a partir de esta información construye el resto de la imagen.
Dentro de este método también es posible agrupar la plataforma de Amazon Web Services, que de manera similar ofrece un conjunto de datos accesible públicamente que se puede filtrar por área de interés, cobertura de nubes, y fechas.
La aproximación anterior se probó debido a que el cubo de datos suizo hace uso de esta para su integración con imágenes Sentinel. Sin embargo, debido a problemas con versiones de las dependencias en la instalación, no fue posible reproducir los resultados con este cubo de datos. A pesar de esto, con esta implementación se logra establecer un esquema para un flujo de trabajo y se emplean ideas implementadas en este cubo para ejecutar este proyecto.
Por último, se probó una librería de Python que usa directamente los servicios del API de Copernicus para descargar las imágenes. Por lo tanto, restricciones de la plataforma Copernicus aplican para esta librería también. Sentinelsat es una librería de código abierto creada con el propósito de buscar, filtrar y descargar productos Sentinel desde Copernicus Access Hub (Wille, M. 2020). Ofrece los productos de los satélites A y B, por lo que la resolucion temporal es la máxima posible para la misión Sentinel.
Page 10 of 19
Figure 4: Selección del área de interés en Copernicus Open Access Hub
4.1.2 Corrección de las imágenes Sentinel-2-L1C
Hay varias razones para motivar a realizar las correcciones atmosféricas y no descargar las imágenes corregidas. Entre ellas se encuentra que teniendo control de la corrección se pueden aplicar ejecuciones especificas que se adapten a las condiciones del terreno de interés. Por ejemplo, el uso de Modelos de Elevación Digital (DEM) permiten incluir en la corrección de la imagen la profundidad de la tierra que se esta observando. Lo cual, dependiendo de las características del terreno puede resultar en una menor o mayor calidad de la corrección.
Como se mencionó antes, la disponibilidad de imágenes Sentinel-2 incluye las imágenes con niveles de procesamiento L1C y L2A. Las imágenes L1C están ortorectificadas, por lo que, si se quiere realizar el procesamiento de estas imágenes y tener control sobre su ejecución, se hace necesario realizar su corrección atmosférica. Existen también varias herramientas para realizar la corrección atmosférica de imágenes. Ejemplos de estas son MAJA, 6S, y SEN2COR.
SEN2COR es la herramienta usada por el cubo de datos suizo para realizar la corrección de las imágenes L1C. Adicionalmente, es la herramienta escogida por ESA para ofrecer los productos L2A en su plataforma.
Esta herramienta se basa en tablas de búsqueda ejecutadas con libRadtran, modelo de transferencia de radiación. Estudios han demostrado que el funcionamiento de SEN2COR es muy preciso, encontrando correlaciones de mas de 0.98 para clasificaciones y correcciones y un 92% de las muestras probadas con esta herramienta dentro del requerimiento. La radiometría de reflectancia de la superficie se encontró fuera de las especificaciones para bandas 5 y 12 pero dentro de los requerimientos para las demás bandas. Esto quiere decir que produce resultados acertados y que es una herramienta recomendable para la corrección y clasificación de imágenes Sentinel-2 (Louis, J., et al. 2019).
4.1.3 Ejecución de algoritmos de análisis y cobertura de suelos
Una vez se tienen las imágenes corregidas es posible usarlas para realizar análisis para aplicaciones especializadas. Para el caso de este proyecto se buscaba realizar una clasificación de suelos, por lo que se encontraron dos alternativas automatizables para lograr dicho objetivo.
Page 11 of 19
La primera opción, una colección de paquetes en Python de código abierto llamada eo-learn. Está diseñada para facilitar el acceso y procesamiento de secuencias espaciotemporales de una forma automática. Se usó esta librería para implementar algoritmos que pudieran llevar a obtener una cobertura de suelos. Para hacer esto, se desarrollaron scripts en Python siguiendo el flujo de trabajo propuesto por esta librería. Eo- learn ofrece una gran flexibilidad ya que define áreas de interés georreferenciadas, asocia tareas a estas áreas, ejecuta algoritmos que pueden ser nuevos o ya desarrollados y genera un flujo altamente replicable para otras áreas de interés. Sin embargo, su uso se vio limitado por su capacidad actual de descarga de imágenes.
En segunda instancia, se analizó con mayor profundidad el resultado de SEN2COR. Como resultado de este análisis se pudo encontrar que parte de los productos que produce esta herramienta es una mascara con diferentes clasificaciones de pixeles. Para poder observar esta mascara se usa la herramienta QGIS, donde es posible importar esta imagen (en la opción agregar raster) en formato JP2 y se aplica un filtro de color personalizado. Allí se relaciona cada clase clasificada con un color y se aplican los cambios. Los resultados muestran una imagen clasificada por colores discretos. Esto se explica los siguientes pasos:
Agregar la imagen producida por SEN2COR. El resultado de interés se encuentra en el Path
“…/ProductName.SAFE/GRANULE/ID_Instancia/IMG_DATA/R20m/***_SCL_**.jp2” (Figuras 5 y 6).
Al agregar esta imagen, se tiene como resultado una imagen en escala de grises. Esta imagen es la clasificación de suelos, sin embargo, aún no se han especificado los colores discretos de cada clase. Para esto se seleccionan propiedades de la imagen (Figura 7), en la pestaña de simbología y se selecciona
“Singleband pseudocolor” (Figura 8) y se empiezan a agregar las clases de colores con su descripción (Figura 9). Al terminar y aplicar los cambios se obtiene la clasificación de la tierra.
Figura 5: Proceso para agregar una imagen a QGIS (1)
Figura 6: Proceso para agregar una imagen a QGIS (2)
Page 12 of 19
Figura 7: Proceso para visualizar la clasificación generada (1)
Figura 8: Proceso para visualizar la clasificación generada (2)
Figura 9: Proceso para visualizar la clasificación generada (3)
Page 13 of 19
4.2 Resultados esperadosUno de los problemas encontrados en la revisión literaria fue la duplicación de esfuerzos a la hora de tratar y procesar las imágenes satelitales para producir, por ejemplo, mapas de cobertura terrestre. Como se mencionó anteriormente, se desarrollaban herramientas nuevas para atacar problemas ya trabajados. Esta fue la razón por la que se realizó una búsqueda de herramientas y desarrollos que ya hubiesen trabajado los retos de descarga, corrección y análisis de las imágenes Sentinel-2. Una de estas herramientas fue el cubo de datos suizo que, usando la herramienta SEN2COR producía imágenes listas para análisis. Con esta experiencia se decidió trabajar para reproducir el cubo de datos suizo para poder reproducir también sus resultados y poder adaptar esta implementación al caso colombiano. Dadas las dificultades que se encontraron con las dependencias de esta implementación, se decidió estudiar los componentes principales de esta solución para procurar producir resultados similares. Es allí donde se decidió tomar directamente la herramienta SEN2COR para producir resultados propios. Con esta implementación se esperaba encontrar un flujo de trabajo que permitiera desde la descarga hasta el análisis de las imágenes.
Por el mismo motivo, se buscaron alternativas que hubiesen atacado el problema de proporcionar un flujo de trabajo con imágenes Sentinel-2. Se esperaba encontrar una opción eficiente, replicable, estándar y posiblemente automatizable para implementar esta metodología en el cubo de datos colombiano. Esto llevó a que se pudieran encontrar librerías de código abierto como eo-learn que ofrecen flexibilidad desde la descarga y corrección hasta la ejecución de algoritmos.
6 RESULTADOS
Como resultado del proyecto, se logró identificar y proponer una metodología que es altamente flexible y automatizable. Para ingesta, el resultado más prometedor se ve con la librería Sentinelsat, con la cual la flexibilidad para peticiones hacia la plataforma de Copernicus, el filtrado de imágenes y la gratuidad de la transferencia de datos, la hacen la opción más viable.
Para la corrección atmosférica de las imágenes se tienen opciones por un lado flexible, y por otro lado ágil.
El hecho de que recientemente se haya permitido el acceso libre a las imágenes corregidas en el portal Coperincus y, por tanto, con la librería Sentinelsat, hace que se deba tomar la decisión de si se prefiere tener control sobre las correcciones que se hacen. Si se decide priorizar el control sobre las correcciones la opción viable para la corrección es SEN2COR ya que permite modificaciones y ajustes en la ejecución.
Por otro lado, si se decide usar las correcciones que se encuentran disponibles en Copernicus, se debe tener en cuenta una inconsistencia encontrada en el API a la hora de descarga de imágenes Sentinel-2- L2A. Se encontró que la búsqueda por nombre de Tile es inconsistente con la información encontrada manualmente en la plataforma. Por lo tanto, una forma de resolver esto es evitar la búsqueda por nombre del Tile, en vez de esto, usar un parámetro de referencia de coordenadas. Con este parámetro, el API de Copernicus busca los Tiles que se intersequen con la forma zona seleccionada y no se usa el nombre del Tile para la búsqueda. El área de interés se debe ingresar como parámetro como un archivo de coordenadas con extensión GEOJSON.
Para la ejecución de algoritmos de clasificación de tierras se obtuvieron los siguientes resultados usando las dos opciones automatizables disponibles.
6.1USANDO LA LIBRERÍA EO-LEARN
Con eo-learn se logró obtener una medida de la vegetación conocida como Índice de Diferencia de vegetación Normalizado (NDVI) así como la detección de agua y de nubes. Sin embargo, dadas restricciones que se discutirán más adelante, esta implementación necesita trabajo adicional para poder ser una solución eficiente en costos. Las figuras 9 y 10 muestran los resultados obtenidos con esta librería.
Con esta librería no solo es posible producir resultados de mapas de coberturas de suelos. También se puede exportar un flujo de trabajo con tareas determinadas sobre áreas de interés específicas. Por este
Page 14 of 19
motivo, esta librería tiene un potencial amplio para generar replicabilidad. Adicionalmente, al ser de código abierto, permite desarrollos y aportes de la comunidad. No solo es eficiente para la comunidad, sino que es escalable ya que, al estar distribuido en tareas, se puede implementar en varias máquinas con un poder de procesamiento agregado mayor, como en CDCol.
Figura 10: NDVI sobre área de interés usando eo-learn
6.2 RESULTADOS CON SEN2COR
Como se mencionó, SEN2COR no solo realiza la corrección atmosférica de las imágenes, sino que en el proceso produce una clasificación de la imagen. Esta clasificación tiene 7 clases incluyendo nubes, sombra de nubes, vegetación, tierra/desiertos, agua y nieve. Esta clasificación realizada es una aproximación que puede ser usada como input para la ejecución de otros algoritmos especializados como la detección de cultivos. Adicionalmente, se encontró que es fácilmente replicable ya que no tiene dependencias. Es automatizable y flexible ya que se puede tener control de la ejecución y se puede ejecutar como parte de una rutina. Con esto, es prometedor su uso para casos de ejecuciones en zonas específicas de la topografía colombiana.
Figuras 12 y 13 muestran la clasificación para un área despejada del departamento del Tolima. Figuras 14 y 15 muestran la clasificación para un área con nubes.
Page 15 of 19
Figura 11: Área de interés del Tolima (despejada)
Figura 12: Clasificación de la tierra sobre el área del Tolima (despejada)
Page 16 of 19
Figura 13: Área de interés sobre Tolima (con nubes)
Figura 14: Clasificación de suelo del área de interés sobre Tolima (con nubes)
Page 17 of 19
7 CONCLUSIONES7.1 Discusión
Los resultados muestran el potencial de herramientas como eo-learn y SEN2COR para volverse parte de un marco de trabajo como el CDCol para integrarlo con imágenes Sentinel-2. Se logró obtener los mapas de clasificación en ejecuciones locales, con eficiencia económica y con flexibilidad para las ejecuciones.
Evaluación cualitativa de los resultados muestran una buena aproximación hacia la clasificación. Esto se puede usar como input para algoritmos más específicos de clasificación. Por ejemplo, para el monitoreo de cultivos usar los pixeles que sean marcados como vegetación y no vegetación para así detectar los cambios en estos. Adicionalmente, para las aplicaciones más específicas, se requiere clasificar con mayor detalle esos pixeles de vegetación como cultivos o no cultivos para así poder usar ese producto intermedio para detectar vegetación especifica sobre los cultivos deseados.
Se plantea un potencial de desarrollo con eol-learn ya que se encontró una limitante económica. Esta librería está integrada con AWS a través de Sentinel Hub, un portal de análisis de las imágenes. Razón por la cual, a través de estas plataformas la transferencia de datos tiene un limite gratuito mensual a partir del cual se requiere una suscripción. Por otro lado, ya que es una librería de código abierto, los desarrolladores se muestran abiertos a colaboraciones para implementar análisis con imágenes que se tengan descargadas localmente.
Una opción prometedora que no se logró llevar a cabo fue el despliegue del cubo de datos suizo. Esto muestra la dificultad que hay para desarrollar y mantener una metodología abierta a usuarios que permita que la comunidad pueda aportar con desarrollos. Por otro lado, opciones como SEN2COR y eo-learn solo requieren instalación de librerías que están listas para ser usadas. Estandarización con estas herramientas, por otro lado, sí generaría un incentivo para que desarrolladores trabajen con esta metodología.
7.2 Trabajo futuro
A futuro, se podrían usar las mascaras producidas por la herramienta SEN2COR para potenciar o validar desarrollos de clasificación con imágenes satelitales que se hagan usando aprendizaje de máquina.
Combinación de estas aproximaciones puede potencialmente producir resultados acertados.
Adicionalmente, el uso del flujo de trabajo con estas herramientas para aplicaciones más especializadas se incentiva. Con la facilidad de obtención de imágenes corregidas y listas para análisis, el desarrollador se puede concentrar en los algoritmos de clasificación, invirtiendo menos recursos de tiempo en correcciones y descarga.
Por otro lado, la librería eo-learn, al ser un marco de trabajo desde su concepción puede ser aplicado a imágenes de otros sensores. Por lo que esta metodología puede ser potencialmente escalable para sensores satelitales futuros y de mayor precisión. Por otro lado, hay espacio para que esta librería sea mas eficiente en costos al desarrollar métodos para que la librería use imágenes descargadas sin necesidad de asumir costos de transferencias de datos.
8 REFERENCIAS
Giuliani, G., Chatenoux, B., Honeck, E., & Richard, J. P. (2018, July). Towards sentinel-2 analysis ready data: A swiss data cube perspective. In IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium (pp. 8659-8662). IEEE.
Naciones Unidas, 2015. Transformar nnuestro mundo: La agenda 2030 para el desarrollo sostenible.
Resolucion de aprobación por la asamblea general. Recuperado de
Page 18 of 19
https://www.un.org/ga/search/view_doc.asp?symbol=A/RES/70/1&Lang=S. Accedido el 1ro de julio de
2020
HAO, P. Y., TANG, H. J., CHEN, Z. X., Le, Y. U., & WU, M. Q. (2019). High resolution crop intensity mapping using harmonized Landsat-8 and Sentinel-2 data. Journal of Integrative Agriculture, 18(12), 2883-2897.
Roy, D. P., Huang, H., Boschetti, L., Giglio, L., Yan, L., Zhang, H. H., & Li, Z. (2019). Landsat-8 and Sentinel-2 burned area mapping-A combined sensor multi-temporal change detection approach. Remote Sensing of Environment, 231, 111254.
Giuliani, G., Camara, G., Killough, B., Minchin, S. Earth Observation Open Science: Enhancing Reproducible Science Using Data Cubes” (2019). 1.
Departamento Nacional de Planeación [National Planning Department] (2019). Sustainable Development Goals. 15. Life on Land. https://www.ods.gov.co/en/goals/life-on-land
Metternicht, G., Mueller, N., & Lucas, R. (2020). Digital Earth for Sustainable Development Goals. In Manual of Digital Earth (pp. 443-471). Springer, Singapore.
Anderson, J. R. (1976). A land use and land cover classification system for use with remote sensor data (Vol. 964). US Government Printing Office.
Langford, M., & Bell, W. (1997). Land cover mapping in a tropical hillsides environment: a case study in the Cauca region of Colombia. International Journal of Remote Sensing, 18(6), 1289-1306.
Nunally, N.; Witmer, R. Remote sensing for land-use studies. 1970. Vol 36. (https://trid.trb.org/view/93580) Defries, R. S.; Townshend J. (1999). “Global land cover characterization from satellite data: from research to operational implementation?” Global Ecology and Biogeography, 8: 367–379
Herold, M., Woodcock, C. E., Loveland, T. R., Townshend, J., Brady, M., Steenmans, C., & Schmullius, C.
C. (2008). Land-cover observations as part of a global earth observation system of systems (geoss):
progress, activities, and prospects. Ieee Systems Journal, 2(3).
https://doi.org/10.1109/JSYST.2008.925983
Grossner, K., & Clarke, K. (2007). Is Google Earth,“Digital Earth?”: Defining a vision. In Proceedings of the Fifth International Symposium on Digital Earth. California.
Terence R. Smith, Greg Janee, James Frew, and Anita Coleman. (2001). The Alexandria digital earth prototype. In Proceedings of the 1st ACM/IEEE-CS joint conference on Digital libraries (JCDL ’01).
Association for Computing Machinery, New York, NY, USA, 118–119. DOI:
https://doi.org/10.1145/379437.379463
Guo, H., Nativi, S., Liang, D., Craglia, M., Wang, L., Schade, S., ... & Shirazi, Z. (2020). Big Earth Data science: an information framework for a sustainable planet. International Journal of Digital Earth, 1-25.
Killough, B. (2018, July). Overview of the open data cube initiative. In IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium (pp. 8629-8632). IEEE.
Rizvi, S. R., Killough, B., Cherry, A., & Gowda, S. (2018, July). The Ceos data cube portal: A user-friendly, open source software solution for the distribution, exploration, analysis, and visualization of analysis ready data. In IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium (pp. 8639- 8642). IEEE.
Dhu, T., Giuliani, G., Juárez, J., Kavvada, A., Killough, B., Merodio, P., ... & Ramage, S. (2019). National open data cubes and their contribution to country-level development policies and practices. Data, 4(4), 144.
Page 19 of 19
Lucas, R., Mueller, N., Siggins, A., Owers, C., Clewley, D., Bunting, P., ... & Metternicht, G. (2019). Land Cover Mapping using Digital Earth Australia. Data, 4(4), 143.
Hernández, G. M. V., & Acevedo, J. A. A. (2009). Implementación de la metodología Corine Land Cover con imágenes Ikonos [The Corine land cover method base don Ikonos images]. Revista Ingenierías Universidad de Medellín, 8(15), 39-52.
Ariza-Porras, C., Bravo, G., Villamizar, M., Moreno, A., Castro, H., Galindo, G., ... & Lozano, P. (2017, September). CDCol: A geoscience data cube that meets colombian needs. In Colombian Conference on Computing (pp. 87-99). Springer, Cham.
Pachón, I., Ramírez, S., Fonseca, D., Lozano-Rivera, P., Ariza, C., Mancipe, M. P., ... & Becerra, M. T.
(2018, July). Random forest data cube based algorithm for land cover classification: A colombian case. In IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium (pp. 8651-8654).
IEEE.
Pardo, C., (2020). Metodología para el monitoreo de cultivos a partir de imágenes satelitales con Machine Learning. Universidad de Los Andes.
Gatti, A., & Galoppo, A. (2018). Sentinel-2 products specification document. Available online (accessed June 26, 2020) https://sentinel.esa.int/documents/247904/685211/Sentinel-2-Products-Specification- Document
Huck, A. (n.d.). Products and Algorithms – Sentinel-2 MSI Technical Guide – Sentinel Online. Retrieved June 26, 2020, from https://sentinel.esa.int/web/sentinel/technical-guides/sentinel-2-msi/products- algorithms
Wille, M., Clauss, K. (June 2020). Sentinelsat Documentation. Retrieved June 26, 2020 from https://buildmedia.readthedocs.org/media/pdf/sentinelsat/master/sentinelsat.pdf
Louis, J., Pflug, B., Main-Knorn, M., Debaecker, V., Mueller-Wilm, U., Iannone, R. Q., ... & Gascon, F.
(2019, July). Sentinel-2 global surface reflectance level-2A product generated with Sen2Cor. In IGARSS 2019-2019 IEEE International Geoscience and Remote Sensing Symposium (pp. 8522-8525). IEEE.
Koprivec, F., Peternelj, J., & Kenda, K. Feature Selection in Land-Cover Classification using EO-learn.