domingo, 28 de fevereiro de 2021

Um ano com o SARS-CoV-2

Completam-se hoje 52 semanas com casos CoVid-19 em Portugal.
Os primeiros casos registaram-se na semana 10 de 2020, que se iniciou em 2 de Março, e, desde então, foram registados 804562 casos e 16317 óbitos.
Estes números tiveram uma evolução complexa, quer no tempo, quer no espaço, dando origem a inúmeras explicações e controvérsias, de que são exemplo as sessões no Infarmed.

Indicadores de incidência por região

Nos sistemas dinâmicos, costuma usar-se uma representação bidimensional (posição, velocidade), ou quantidade de movimento, para caracterizar o seu estado. 
A posição, por si só, tem muito pouca informação. Imaginemos dois carros fotografados numa autoestrada, próximos um do outro. Será que o que vai à frente vai ser o primeiro a chegar ao seu destino? Se soubermos as suas velocidades instantâneas já somos capazes de fazer uma melhor previsão.
Algumas pessoas usam as variáveis (infecções, óbitos) para tentar compreender a evolução da pandemia. Outros usam as variáveis (hospitalizações, camas ocupadas em UCI), por exemplo.
Calculei os números acumulados, semana a semana, de casos e de óbitos em Portugal, desde a semana 10 de 2020 até à semana 8 de 2021, que hoje terminou, e a leitura destas 52 semanas é surpreendente.

(casos, óbitos) acumulados por semana

Há trajectórias muito curiosas.
Entre a semana 10 e a semana 41 de 2020, os números foram contidos, e estiveram sempre bem abaixo dos 10000 casos por semana. 
Na semana 41 (5 de Outubro de 2020) algo ocorreu que impulsionou os casos até mais de 40000 semana, na semana 47, em que os casos começaram a decrescer até aos cerca de 20000 na semana 52.
Nesta semana (21 de dezembro de 2020), verificou-se um novo e brutal impulso, que levou os casos até cerca de 90000 por semana e os óbitos até cerca de 2000 por semana nas semanas 3 e 4 de 2021, estando agora a decrescer até hoje, em que parece que nos aproximamos da posição de partida.
Não vou especular aqui no que se terá passado naquelas duas semanas, em que foi como se ao sistema tivessem sido aplicadas violentas forças externas, mas sem dúvida que há aqui umas trajectórias elípticas (os óbitos estão atrasados em relação aos casos) e umas violentas perturbações.

segunda-feira, 15 de fevereiro de 2021

Análise de dados e visualização de informação

A pandemia fez-nos pensar que os números muitas vezes representam realidades que nos afectam e evidenciou a importância da visualização de dados  e da comunicação gráfica no mundo de hoje.
Neste primeiro gráfico, representa-se o número de casos e de óbitos CoVid-19 em Portugal dia a dia, desde o dia 2 de Março de 2020, bem como as suas médias móveis de 7 dias.

Dados cronológicos

Os números diários apresentam grandes variações, o que se compreende pela possibilidade de alguns registos não ocorrerem no próprio dia do acontecimento, mas as médias móveis de 7 dias são bastante mais regulares. Ao considerar as médias ao longo de uma semana completa, retiram-se os efeitos dos dias da semana não serem todos iguais do ponto de vista do registo.
As médias de sete dias também permitem melhor identificar os máximos e os mínimos das ocorrências.
Um pormenor importante consiste em saber se os sete dias que são considerados na média são o dia actual e os seis anteriores ou o dia actual, os três anteriores, e os três seguintes.
Normalmente, nestes casos, consideram-se apenas ou dias anteriores, o que quer dizer que há um atraso de 3 dias no cálculo dos valores da média. [alguns leitores recordarão o que são filtros de fase zero e de fase linear, e a noção de atraso de grupo]
Há outra forma de visualizar estes dados, através da trajectória no plano de um ponto com coordenadas (casos, óbitos), e passando a variável cronológica a ser um parâmetro da trajectória.

Trajectórias (casos, óbitos)

Os dias estão numerados desde o dia 2 de Março de 2020 (dia 1) até ao dia 350 (14 de Fevereiro de 2021).
Nesta visualização, inspirada no espaço das fases dos sistemas dinâmicos (posição, velocidade), intui-se que o sistema mostra uma certa "inércia", isto é, que há uma trajectória que não poderá ser modificada de uma forma abrupta sem uma causa externa muito forte.
Aquela seta cor de laranja procura evidenciar que a variação diária da média móvel de 7 dias será 1/7 da variação dos valores entre o dia em causa e o dia homólogo da semana anterior:
     mm7(n) = [x(n)+x(n-1)+x(n-2)+x(n-3)+x(n-4)+x(n-5)+x(n-6)]/7
     mm7(n) = mm7(n-1)+[x(n)-x(n-7)]/7.
[alguns leitores recordarão aqui que os filtros de média podem ser realizados de uma forma recursiva ou não recursiva]
A capacidade de compreender informação apresentada de uma forma gráfica é uma das dimensões do pensamento computacional, e excede muito a representação de variáveis, ou de conjuntos de variáveis função da mesma variável independente.
Os que gostam de usar a linguagem Python podem olhar para esta galeria da biblioteca seaborn.