Análise de densidade de eventos pontuais utilizando o QGIS – Parte I

Análise de densidade de eventos pontuais utilizando o QGIS – Parte I

Resumo

Este tutorial apresenta um roteiro de como realizar a análise de densidade de eventos pontuais utilizando o QGIS. Os eventos pontuais utilizados são dados de focos de calor, obtidos gratuitamente na internet pelo sítio do Banco de Dados de Queimadas do Instituto Nacional de Pesquisas Espaciais, que abrangem o estado do Pará e foram detectados nos anos de 2013 e 2014. Para obtenção do mapa de densidade de eventos pontuais são abordadas três técnicas. A primeira, que é visual e baseada em renderização, corresponde ao estilo “Mapa de Calor”, que se faz presente quando lidamos com dados vetoriais do tipo ponto. A segunda corresponde ao uso do complemento Mapa de Calor (em inglês, HeatMap). Já a terceira, é baseada na ferramenta v.kernel dos comandos GRASS presentes na caixa de ferramentas do QGIS.

1 Apresentação

Neste tutorial, o foco será dado na análise espacial de eventos pontuais, tais como localização de acidentes, ocorrências de crimes, uma residência, etc. Aqui, o evento pontal utilizado nas análises é o chamado de foco de calor. O foco de calor, também denominado de pixel de queima, é um ponto que indica a presença de fogo no interior de um pixel de uma imagem de sensoriamento remoto orbital, que foi gerada por sensor ótico operando na faixa termal. O objetivo desta análise é estudar o padrão de distribuição espacial dos focos de calor, verificando se são pontos isolados, se dispõem em aglomerados, ou se estão regularmente distribuídos. As ferramentas utilizadas permitem obter um dado em formato raster que fornece estimativa da distribuição espacial da ocorrência desses pontos, possibilitando assim, quantificar onde há a maior ou menor concentração dos pontos. O mapa resultante é também chamado de mapa de calor (em inglês, heatmap).

2 Obtenção dos dados necessários

Os focos de calor foram obtidos pela interface web do Banco de Dados de Queimadas (BDQUEIMADAS) do Instituto Nacional de Pesquisas Espaciais, acessada pelo sítio <http://www.dpi.inpe.br/proarco/bdqueimadas/>. Foram selecionados somente os focos de calor detectados no estado do Pará para os anos de 2013 e 2014. A interface do BDQUEIMADAS permite que seja feita ampla variedade de consultas, que inclui informações de janela temporal, região (país, estado, município, bioma ou retângulo envolvente), e o satélite que as imagens foram utilizadas na detecção. Para os dados utilizados foi utilizada a janela temporal referente ao ano de 2014, que abrange as datas 2014-01-01 (data inicial) e 2014-12-31 (data final), como estado o Pará (PA), e todos os satélites (TODOS). Repare que a data segue o padrão dado pela sequência ano (com 4 dígitos), mês (com 2 dígitos) e dia (com 2 dígitos), separados por hífen.

Após a consulta, os focos de calor são exibidos no mapa. Para realizar o download dos pontos, basta ir imediatamente abaixo do mapa e escolher a opção “Exportar Focos como Arquivo shapefile (shp)” e clicar em OK. Uma janela será exibida com a opção para que o e-mail seja fornecido. Depois disto, confirme, e o download se inicia. O arquivo zip obtido contém um diretório de nome “shp” que contém o arquivo shapefile. É importante lembrar que por padrão os dados de focos de calor disponibilizados pelo BDQUEIMADAS são georreferenciados no sistema de coordenadas geográficas (LATLONG) e datum SAD69 (EPSG:4618). Para fins de rapidez, o shapefile dos focos de calor para o estado do Pará no ano de 2014 pode ser obtido no link <http://dl.dropboxusercontent.com/u/104938406/Focos20140101a20141231_Brasil_447.zip> (~6MB).

Os dados do mapeamento básico terrestre podem ser obtidos gratuitamente pela interface do visualizador da Infraestrutura Nacional de Dados Espaciais (INDE), acessada pelo sítio <http://visualizador.inde.gov.br >. Foi utilizado apenas o polígono contendo os limites do estado do Pará, que foi extraído dos limites estaduais do Brasil. Para fins de rapidez na execução deste tutorial, os limites do estado do Pará são disponibilizados pelo link <http://dl.dropboxusercontent.com/u/104938406/LIMITE_PA.zip> (~150KB).

3 Preparar a base de dados

Inicialmente crie um novo projeto QGIS (Projeto > Novo) e em seguida salve-o em um diretório que já contenha os shapefiles de focos de calor e de limites do estado do Pará. É importante frisar que um cuidado deve ser tomado ao definir o caminho em que o diretório será criado. O mesmo não deverá conter diretórios com nome contendo caracteres como espaço, cê-cedilha, ou letras acentuadas. Caso exista, pode haver erro na execução de ferramentas do QGIS. Acesse as propriedades do projeto (Projeto > Propriedades do Projeto) e defina o sistema de referência de coordenadas (SRC) como sendo SAD69 (EPSG:4618). Adicione o shapefile de limites do estado do Pará e, em seguida, o shapefile de focos de calor. Para adicionar os shapefiles, vá em “Camada > Adicionar camada > Adicionar camada vetorial”. Acesse as propriedades da camada LIMITE_PA, e em seguida a opção “Estilo”. Na opção “Símbolos Simples” selecione “Preenchimento Simples”. Em “Cor de Preenchimento” selecione “Preenchimento Transparente”. Em “Cor da Borda” selecione a cor preta. Em “Espessura da Borda” selecione o valor 0,46 milímetros.

A Figura abaixo exibe a base de dados utilizada.

fig01

4 Análise de densidade de eventos pontuais

O mapa de densidade de pontos pode ser obtido mediante o uso de uma ferramenta matemática denominada de estimador de densidade por kernel. Um dado raster é obtido, onde cada pixel possui um valor que depende da distância dele aos pontos. Quanto mais pontos próximos existirem, maior será o valor. Desta forma, pixels com alto valor indicam regiões onde há uma maior concentração espacial de pontos. Pixels com valores baixos representam regiões com pontos esparsos. Os valores dos pixels são representados por uma paleta de cores.

O estimador de densidade por kernel é procedido da seguinte maneira:

  • Para cada ponto é definida uma zona de influência, delimitada por uma função matemática, chamada função kernel. Essa função kernel tem a finalidade de representar a probabilidade de ocorrência do ponto ao longo do espaço. Ou seja, ela terá um valor máximo na posição espacial do ponto, e seu valor diminui à medida que a distância ao ponto aumenta. Existem várias funções que podem ser consideradas uma função kernel. As funções kernel são centradas em x=0 e apresentam simetria. O eixo das abcissas corresponde à distância ao ponto e o eixo das ordenadas é o valor estimado da probabilidade de ocorrência. Para maiores informações a respeito das funções, acesse o link < https://en.wikipedia.org/wiki/Kernel_(statistics)>. A Figura abaixo apresenta uma das principais funções kernel (função gaussiana). fig02
  • Uma função kernel é sobreposta a cada ponto. Em seguida, a soma acumulada de todas as funções kernel é obtida. Esta soma acumulada é a densidade por kernel. As Figuras abaixo ilustram, respectivamente, uma função kernel bidimensional e como ela é aplicada na análise de densidade por kernel. Os pontos ao longo do espaço são representados por círculos pretos.

fig03

O estimador de densidade por kernel possui os seguintes parâmetros básicos:(1) O raio de influência, que define o tamanho da vizinhança que é centrada no ponto. O raio de influência define a largura da função em torno de ponto; e (2) A função de kernel, que deve ser simétrica em relação à origem, centrada no ponto, e cujo valor máximo, na origem, deve ser igual a 1. O raio de influência controla a suavização do mapa de densidade. Um raio de influência com valor muito pequeno gera uma superfície de densidade descontínua, com valores elevados e centrados nos pontos. Um raio de influência com valor muito grande gera uma superfície de densidade muito suavizada, com valores quase homogêneos.A função kernel utilizada pode assumir diversas formas, podendo ser uniforme, triangular, quadrática, gaussiana, cosseno, e outras. O interesse na analise de densidade por kernel é determinar se o evento representado pelos pontos apresenta algum padrão sistemático. Um dos padrões de interesse são os chamados padrões de conglomerados espaciais, onde se constata a coexistência de pontos excessivamente próximos, o chamado hotspot. Um hotspot é uma região que se destaca em relação às vizinhas pela alta densidade de ocorrência dos pontos.

Aqui são apresentadas três ferramentas de análise de densidade de eventos pontuais do QGIS. A primeira, que é visual e baseada em renderização, corresponde ao estilo “Mapa de Calor”, que se faz presente quando lidamos com dados vetoriais do tipo ponto. A segunda corresponde ao uso do complemento Mapa de Calor (em inglês, HeatMap). Já a terceira, é baseada na ferramenta v.kernel dos comandos GRASS presentes na caixa de ferramentas do QGIS.

4.1 Renderizador “Mapa de Calor” (Heat Map)

Em poucas palavras, este renderizador obtém a densidade de pontos por meio de um processamento gráfico, sem a necessidade de gerar um dado geográfico de saída. É uma espécie de visualização de mapa de densidade de pontos em tempo real. Para utilizá-lo, basta: (1) Acessar as propriedades do layer de focos de calor; (2) Ir à guia “Estilo”; (3) Em raio escolher o valor para a largura da função de kernel; (4) Em valor máximo pode deixar automático.

fig04
A Figura abaixo mostra o mapa de densidade obtido.

fig05

4.2 Complemento Mapa de Calor (Heat Map)

O complemento Mapa de Calor (em inglês Heatmap), permite criar um mapa de calor a partir de um mapa de pontos. Primeiramente, este complemento necessita ser ativado no QGIS. Para isto, basta ir ao menu “Complementos > Gerenciar e instalar complementos”. Em seguida, deve-se buscar por “Mapa de Calor”. Caso o QGIS esteja no idioma inglês, busque por “Heatmap”. Caso a opção ao lado do complemento não esteja ativada, deve-se ativá-la. Após a ativação do complemento, este estará disponível no menu “Raster > Mapa de Calor > Mapa de calor…”. A Figura apresenta as opções da janela de complementos.

fig06

As seguintes opções aparecem na janela do complemento:

  • Camada dos pontos de entrada: dado vetorial a ser utilizado como entrada para a análise de densidade por kernel.
  • Raster de saída: Caminho a ser salvo o raster de saída que armazenará o valor da superfície de densidade. É necessário escolher o local onde se deve salvar, clicando no botão ao lado.
  • Formato de saída: O tipo de arquivo raster que será gerado.
  • Raio: o valor do raio de influência. É importante prestar atenção no sistema de referência de coordenadas da camada. Uma vez selecionada a opção “Unidades do Mapa”, se o dado estiver na projeção UTM, o valor do raio será em metros. Se o SRC for sistema de coordenadas geográficas, o valor fornecido será em graus.
  • Em avançado, temos as opções “Número de linhas e colunas ou resolução espacial”. Estes dados estão interligados. Uma vez que se escolha o número de linhas e colunas, os valores da resolução espacial são calculados. Caso contrário, se optar por definir o valor da resolução, os valores de linhas e colunas são calculados.
  • Forma do kernel: função kernel utilizada. Por padrão, a função gaussiana (biponderada) é utilizada.
  • Usar raio a partir do campo: Permite que o raio de influência dos pontos seja não homogêneo e variando a cada ponto. Um atributo da camada deve ser utilizado para definir o valor.
  • Usar peso a partir de um campo: Permite que pesos sejam atribuídos à função kernel de cada ponto. Neste caso, possibilita que a função kernel tenha a sua amplitude de valores não homogênea. Um atributo é utilizado para ser fator multiplicativo no valor da função. Existem certas aplicações onde esta opção pode ser muito bem empregada, como por exemplo, um mapa de densidade onde cada ponto possui um valor associado. Neste caso, o mapa de densidade resultante pondera a função kernel do ponto com este valor.
  • Razão de decaimento: Este parâmetro existe somente para a função kernel triangular, e permite configurar a inclinação do decaimento da função da porção central até o extremo.

Neste tutorial, foram escolhidas as opções conforme mostrado na Figura abaixo:

fig07

A superfície resultante pode ser visualizada na Figura abaixo. Uma característica deste complemento é que, nas áreas onde não há pontos ou não há a zona de influência de algum ponto, o valor do raster de saída é NODATA.

fig08

O próximo passo é escolher uma paleta de cores melhor para visualizar os dados e categorizar os valores nessa paleta. Para isto, vá na opção “Estilo” das Propriedades da camada raster, e em “Tipo de renderização”, escolha a opção “Banda simples falsa-cor”. É importante escolher como mínimo e máximo da paleta os valores do raster. Para isso, marque a opção “Min/Máx” e clique em “Carregar”. Em seguida, escolha a paleta desejada. Neste tutorial, foi escolhida a paleta “RgYlGn” (vermelho-amarelo-verde) invertida. Em “Modo”, escolha “Intervalos Iguais” com 5 classes, e depois clique em “Classificar”. Por razões de visualização, a primeira cor da baleta (verde) foi definida como branca. Depois, os rótulos foram editados como: muito baixa ou nula, baixa, média, alta e muito alta. Estes valores categorizados referem-se à densidade de pontos. A Figura abaixo resume as opções escolhidas para o Estilo da camada raster.

fig09

O mapa de densidade obtido pelo complemento “Mapa de calor”, com as classes de densidade definidas anteriormente, pode ser visualizado na Figura abaixo.

fig10

4.3 Ferramenta v.kernel dos comandos GRASS na caixa de ferramentas

Se o GRASS estiver instalado e as ferramentas do GRASS devidamente configuradas para serem acessadas pelo QGIS, a ferramenta v.kernel pode ser utilizada. Para isto, clique no menu Processar > Caixa de Ferramentas. No painel da Caixa de Ferramentas, selecione a opção “Interface Avançada”. Procure a opção Comandos GRASS > Vetor e execute a ferramenta v.kernel. Se abrir a janela, o GRASS está devidamente configurado. Caso contrário, o leitor é encorajado a configurá-lo. Para isto, basta ir no menu Processar > Opções, e acessar as Opções de Processamento. A Figura abaixo mostra as ferramentas GRASS devidamente configuradas.

fig11

Para saber mais informações sobre a ferramenta v.kernel do GRASS, acesse o link < https://grass.osgeo.org/grass64/manuals/v.kernel.html>. A ferramenta v.kernel tem as seguintes opções:

  • Input vector with training points: Camada de entrada com os pontos.
  • Standard deviation in map units: Valor do desvio padrão em unidades do mapa. Este é o raio de influência. Como a função gaussiana é usada como função kernel padrão nesta ferramenta, o raio de vizinhança é também chamado de desvio padrão.
  • Extensão da região GRASS: Define a extensão da camada, que pode ser selecionada a partir de três opções:
    • A partir de uma camada ou da extensão da tela (canvas)
    • A partir de uma área escolhida
    • A partir da camada de entrada
  • Tamanho da célula da região GRASS: É a resolução espacial da camada raster de saída.
  • Kernel: Indica o caminho onde a camada raster de saída será salva.

Na obtenção do mapa de densidade, é necessário a escolha de uma extensão padrão. Caso contrário, a extensão da camada de pontos será escolhida para definir a área do raster gerado. Neste tutorial, foi utilizada a extensão dos limites do estado do Pará. A Figura abaixo resume as opções escolhidas.

fig12

O mapa de densidade obtido pela ferramenta v.kernel, com as classes de densidade definidas nesse tutorial, é mostrado na Figura abaixo.

fig14

4 comentários

  1. Parabéns pelo artigo. Muito bem escrito.



Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *