segunda-feira, 15 de fevereiro de 2021

Análise de dados e visualização de informação

A pandemia fez-nos pensar que os números muitas vezes representam realidades que nos afectam e evidenciou a importância da visualização de dados  e da comunicação gráfica no mundo de hoje.
Neste primeiro gráfico, representa-se o número de casos e de óbitos CoVid-19 em Portugal dia a dia, desde o dia 2 de Março de 2020, bem como as suas médias móveis de 7 dias.

Dados cronológicos

Os números diários apresentam grandes variações, o que se compreende pela possibilidade de alguns registos não ocorrerem no próprio dia do acontecimento, mas as médias móveis de 7 dias são bastante mais regulares. Ao considerar as médias ao longo de uma semana completa, retiram-se os efeitos dos dias da semana não serem todos iguais do ponto de vista do registo.
As médias de sete dias também permitem melhor identificar os máximos e os mínimos das ocorrências.
Um pormenor importante consiste em saber se os sete dias que são considerados na média são o dia actual e os seis anteriores ou o dia actual, os três anteriores, e os três seguintes.
Normalmente, nestes casos, consideram-se apenas ou dias anteriores, o que quer dizer que há um atraso de 3 dias no cálculo dos valores da média. [alguns leitores recordarão o que são filtros de fase zero e de fase linear, e a noção de atraso de grupo]
Há outra forma de visualizar estes dados, através da trajectória no plano de um ponto com coordenadas (casos, óbitos), e passando a variável cronológica a ser um parâmetro da trajectória.

Trajectórias (casos, óbitos)

Os dias estão numerados desde o dia 2 de Março de 2020 (dia 1) até ao dia 350 (14 de Fevereiro de 2021).
Nesta visualização, inspirada no espaço das fases dos sistemas dinâmicos (posição, velocidade), intui-se que o sistema mostra uma certa "inércia", isto é, que há uma trajectória que não poderá ser modificada de uma forma abrupta sem uma causa externa muito forte.
Aquela seta cor de laranja procura evidenciar que a variação diária da média móvel de 7 dias será 1/7 da variação dos valores entre o dia em causa e o dia homólogo da semana anterior:
     mm7(n) = [x(n)+x(n-1)+x(n-2)+x(n-3)+x(n-4)+x(n-5)+x(n-6)]/7
     mm7(n) = mm7(n-1)+[x(n)-x(n-7)]/7.
[alguns leitores recordarão aqui que os filtros de média podem ser realizados de uma forma recursiva ou não recursiva]
A capacidade de compreender informação apresentada de uma forma gráfica é uma das dimensões do pensamento computacional, e excede muito a representação de variáveis, ou de conjuntos de variáveis função da mesma variável independente.
Os que gostam de usar a linguagem Python podem olhar para esta galeria da biblioteca seaborn.

Sem comentários:

Enviar um comentário