Atribuição de classes por threshold (limiarização)

Classificação de imagens digitais é um tópico bastante amplo e consiste em basicamente atribuir rótulos, também chamados classes para alvos em um conjunto de dados. Embora muitas das abordagens de classificação sejam complexas, há algumas abordagens simples para resolução de determinados problemas, como é o caso da limiarização, do inglês thresholding. Entretanto, para isso precisamos rever alguns fundamentos referentes a processamento digital de imagens como histogramas e diagramas de espalhamentos.

Histograma

O histograma de uma imagem digital, também conhecido como distribuição de frequências, é a representação gráfica em colunas de um conjunto de dados que mostra a intensidade de valores e a quantidade de pixels com tal intensidade e são base para diversos tipos de processamento digital de imagens Gonzales & Woods (2007). Alguns tipos de histograma podem ser observados na Figura 69.

Histogram

Figure 69 - Quatro tipos básicos de imagens: escura, clara, baixo contraste e alto contraste, e seus respectivos histogramas. Fonte: Gonzales & Woods (2007).

Diagrama de dispersão (Scatterplot)

Diagramas de dispersão ou scatterplot é a representação gráfica no plano cartesiano do comportomanto de duas ou mais variáveis. Scatterplots são úteis para analisar a correlação entre dados. Em um scatterplot, os dados são exibidos como um conjunto de pontos, cada um com o valor associado a cada varíavel do gráfico. A Figura 70 ilustra um scatterplot em 3 dimensões.

Scatter Plot 3D

Figure 70 - Exemplo de Diagrama de dispersão (scatterplot) 3D utilizando bandas verde, vermelho e infravermelho próximo (NIR). Fonte: modificado de modificado de Cheng (2016).

Devido a dificuldade de visualização de um plano 3d em um plano 2d, é mais comum que scatterplots de 2 dimensões sejam utilizados para análises (2 varíaveis). Exemplos de scatterplots podem ser observados na Figura 71 e Figura 72.

Scatter Plot

Figure 71 - Exemplo de Diagrama de dispersão (scatterplot) utilizando bandas 6 e 7 do sensor MODIS, com linha separando classe de nuvem das demais classes. Fonte: modificado de modificado de PAN et al. (2015).

Scatter Plot

Figure 72 - Exemplo de Diagrama de dispersão (scatterplot) utilizando bandas 11 e 3 do sensor MODIS, com linha separando classes de nuvem e neve das demais classes. Fonte: modificado de modificado de PAN et al. (2015).

Nas figuras de exemplo, um mesmo conjunto de dados de entrada é utilizado, entretanto as váriaveis (eixos) do gráfico são de bandas espectrais diferentes. Nessas figuras é possível observar que há separação de algumas classes, como por exemplo pixels referentes a alvos de água e vegetação. Com isso, é possível estabelecer um valor ou reta limiar (threshold) para separar essas classes.

Notebook Aplicando Threshold

Façamos agora um exercício utilizando imagens do projeto Brazil Data Cube e aplicando um limiar sobre as imagens para separar diferentes alvos presentes na mesmapor meio de Python Notebook:

Referências

  • GONZALEZ, R. C.; WOODS, R. E. Digital image processing (3.ed.). Upper Saddle River, NJ, USA: Pearson, 2007. 976p. ISSN 1098-6596. ISBN 013168728X.

  • PAN, PAIPAI; CHEN, GUOYUE; SARUTA, KAZUKI; TERATA, YUKI. Snow cover detection based on two-dimensional scatter plots from MODIS imagery data. Journal of Applied Remote Sensing 9(1), 2015. https://doi.org/10.1117/1.JRS.9.096083