Cubos de dados de Observação da Terra
Plataformas orbitais de observação da Terra, ou satélites de observação da Terra, são atualmente uma das formas mais consistentes e amplamente utilizadas para a realização do monitoramento da superfície terrestre e sua biodiversidade. A ampla utilização dessas plataformas está relacionada com sua capacidade de capturar, de forma contínua, imagens das mesmas regiões do planeta em diferentes instantes de tempo, formando assim, coleções de imagens.
A Figura 26 resume como essas coleções de imagens são formadas. Para uma mesma região, tem-se a captura de múltiplas imagens, que registram a variação ocorrida ao longo do tempo.
Com a organização dessa sequência de imagens de forma sistemática, ajustadas no espaço e ordenadas no tempo, tem-se a possibilidade de monitorar o planeta através da investigação e o entendimento das dinâmicas ocorridas na superfície terrestre ao longo do tempo. Por exemplo, [11], utilizando de uma coleção de imagens da missão Landsat, mostra toda a dinâmica do Lago Milh, localizado no Iraque. O resultado obtido pelos autores é apresentado na Figura 27.
Outros exemplos notórios são de trabalhos que utilizam a avaliação temporal de coleções de imagens de satélite para a criação de mapas de Uso e Cobertura da Terra (LULC, do inglês Land Use and Land Cover). Por exemplo, [16], utilizaram de dados séries temporais, extraídas de coleções de dados MODIS, junto a algoritmos de Aprendizado de Máquina para a criação de mapas de LULC para o estado do Mato Grosso/Brasil. Outro exemplo é o trabalho apresentado por [15], em que os autores fizeram o uso de séries temporais, extraídas de coleções de dados Sentinel-2/MSI, para a identificação de áreas desmatadas na Amazônia Legal.
Tip
Para os interessados, está disponível no canal do YouTube da Computação Aplicada/INPE, o curso Geoinformática com Aplicações de Machine Learning, o qual apresenta o uso conjunto de séries temporais e Aprendizado de Máquina para a criação de mapas de LULC.
Entretanto, fazer a utilização dessas coleções de imagens para a realização de avaliações temporais, pode não ser uma tarefa trivial. Isso ocorre já que, no uso desses dados, todas as operações que antecedem a análise temporal, como por exemplo, etapas de pré-processamento, organização e armazenamento dos dados, devem ser feitas para todas as imagens da coleção.
Considerando este cenário, os pesquisadores passaram a produzir Dados Prontos para Análise (ARD, do inglês Analysis Ready Data), os quais são processados e organizados para permitir análises imediatas [17]. Em seguida, esses dados ARD passaram a ser organizados como cubos de dados de imagens de satélite [6], tornando a realização de avaliações temporais, com dados extraídos de coleções de imagens, mais simples e intuitivas [1].
Segundo as definições adotadas pelo Brazil Data Cube [6], um cubo de dados é uma matriz de quatro dimensões: X
(longitude), Y
(latitude), Tempo
e Bandas
. Além disso, para que um conjunto de dados seja considerado um cubo de dados, ele deve atender aos seguintes requisitos [16]:
Suas dimensões espaciais referem-se a um único sistema de referência espacial (SRS, do inglês Spatial Reference System);
As células de um cubo de dados tem um tamanho espacial constante em relação ao SRS do cubo;
Uma célula possui um único valor.
Na Figura 28, é feita uma representação em alto nível de um cubo de dados. À esquerda da Figura, está uma coleção de imagens, a qual não possui as propriedades de um cubo de dados, podendo ter imagens desalinhada no tempo e espaço. Na direta, tem-se um cubo de dados, o qual possui alinhamento espacial e temporal.
Note
Considerando a definição apresentada anteriormente, tem-se que, a representação de cubos de dados apresentada na Figura 28, é repetida para cada uma das bandas que compõe o cubo.
Com as coleções de imagens de satélite sendo organizadas como cubos de dados, pode-se então realizar a seleção de imagens
e a extração de séries temporais
. Na seleção de imagens
, o usuário do cubo de dados, escolhe por um ou mais instantes de tempo e ao aplicar a operação no cubo, tem como retorno um conjunto de imagens 2D válidas.
A Figura 29 ilustra esta operação com dois exemplos. À esquerda é apresentada a seleção de uma imagem em um instante de tempo (Azul claro). Na direita, tem-se a seleção de dois instantes de tempos distintos (Azul claro e Azul escuro).
Para a segunda operação, extração de séries temporais
, o usuário define uma localização no espaço geográfico e ao aplicar a operação no cubo, tem como retorno uma série temporal válida. Esta série temporal é formada pelos valores da localização definida em cada uma das imagens que compõe o cubo.
Na Figura 30, é feita a representação desta operação. Para a localização definida (Amarelo), faz-se a extração dos valores de todas as imagens associadas ao cubo de dados.
Note
Utilizando as ferramentas do Brazil Data Cube, ambas operações de seleção
e extração
, podem ser realizadas, respectivamente, pelos serviços STAC e WTSS, os quais serão apresentados neste minicurso.
Iniciativas de cubos de dados
A utilização dos cubos de dados tem permitido que descobertas, aplicações e estudos inovadores sejam criados. Com o objetivo de operacionalizar a geração desses cubos, diversas iniciativas ao redor do mundo foram criadas, como Australian Data Cube, Swiss Data Cube, Armenian Data Cube, Catalan Data Cube e o Digital Earth Africa.
No Brasil, a iniciativa Brazil Data Cube
está sendo desenvolvida para a geração de cubos de dados para todo território nacional.