15 outubro 2014

O básico (do básico) sobre Séries Temporais

O acalorado debate político nas eleições presidenciais brasileiras de 2014 trouxe à tona uma imensa quantidade de estatísticas. Tomados pela bipolaridade partidária em vigor, curiosamente algumas das estatíticas foram usadas ao mesmo tempo pelos dois lados para provar pontos opostos. Por trás deste aparente paradoxo está uma combinação de desconhecimento sobre a análise apropriada de dados e desonestidade daqueles que sabem como fazê-la, mas distorcem resultados propositalmente.

Um tipo de estatística bastante citado nos debates é a série temporal. Pessoalmente, considero que as séries temporais são as “estatísticas políticas” que exigem as análises mais complexas. Entretanto, é relativamente fácil subestimar suas nuances e partir para uma tentativa de identificação dos padrões visuais em um gráfico, escolha que muitas vezes se mostra equivocada.

Apresento aqui o mais básico (do básico) sobre o que está por trás de uma série temporal e uma noção do porquê elas serem tão complicadas. Espero poder auxiliar quem não tanta familiaridade com o assunto e que esteja interessado em um debate mais construtivo.

A série temporal e suas peças
Uma série temporal é simplesmente um valor que é mensurado repetidamente ao longo do tempo. Por exemplo, se medirmos a temperatura de hora em hora ao longo de uma semana, teremos uma série temporal. O mesmo se aplica, em economia, para a taxa de juros, a inflação e o PIB, por exemplo.
Do ponto de vista simples, uma série temporal pode ser vista como a combinação de 4 peças com papéis distintos. Vamos analisar cada uma delas a seguir.
Vamos considerar um exemplo simples e construir nossa análise ao longo do texto. Nesse exemplo, o Supermercado XYZ resolveu medir o número de clientes atendidos por semana e vai utilizar esse número para tomar decisões no futuro.

Peça 1: a tendência
Como o nome sugere, a tendência diz, na média, se o valor medido está subindo ou caindo ao longo do tempo. Ela também diz o quanto está subindo ou caindo. Podemos entender a tendência como uma regra que diz como nossa medida vai evoluir ao longo do tempo. Graficamente, podemos representá-la apenas como uma linha reta.


Suponha que a tendência para o Supermercado XYZ é que o número de clientes por semana aumente bastante no próximo ano, porque a atual diretoria resolveu investir bastante em anúncios no canal de TV local.


Peça 2: o ciclo
Também chamado de sazonalidade, é uma regra que diz em que períodos regulares a medida é mais alta ou mais baixa. Por exemplo, se medirmos a temperatura todo dia às 8 da manhã em Porto Alegre, poderemos ver que nos dias de inverno nossas medições serão na média mais baixas que no verão. Já nas medidas de emprego, sabemos que há sempre um pico no final de ano, refletido pelas vendas mais altas do natal.
Em um gráfico, a sazonalidade mostra as médias conforme o período. Para o Supermercado XYZ, o movimento é sempre maior entre outubro e fevereiro, sendo dezembro o ponto alto.


Combinando então a tendência e o ciclo, teríamos algo assim:


Peça 3: o acaso
Quando estamos falando de uma medição como a temperatura ou mesmo o número de clientes por dia, temos uma infinidade de fatores que podem influenciar nossa medição.
Por exemplo, no caso do supermercado, podemos ter semanas em que muitos clientes frequentes saíram de férias, ficaram doentes ou resolveram comer fora naquela semana. Em outras semanas, novos consumidores podem ter resolvido aparecer, antigos resolveram voltar após um longo tempo sem fazer compras ou alguém passando pela cidade resolveu parar para comprar pilhas. São tantas as possibilidades que simplesmente não temos como considerar todas juntas.
O acaso, aqui, é a soma de todos esses efeitos. Quando eles interferem apenas naquela semana e ao longo do tempo, os aumentos causados por esses muitos fatores compensam as quedas, consideramos que essas variações são aleatórias - ou ruído.
Graficamente, poderíamos representar como algo assim:



E se combinarmos com as peças anteriores, tendência e ciclo, temos:



Peça 4: a inércia
Assim como na física, muitas medidas são afetadas pela inércia. Isto é, o valor medido no próximo período depende um pouco (ou muito) do valor no período anterior. Por exemplo, a temperatura medida às 14h depende bastante da temperatura medida às 13h. Isso ocorre porque não há como a temperatura variar tanto em apenas 60 minutos. Então, as condições da medição anterior não se dissipam totalmente e acabam afetando a próxima medição.
A inércia é especialmente relevante em medidas econômicas. O PIB de um ano depende em parte das indústrias instaladas, das pessoas empregadas e afins. Por mais que ocorram mudanças severas, o ano seguinte nunca começa do zero. Portanto, a inércia afeta o PIB.
Voltando para o nosso exemplo, podemos ver a inércia como os clientes que voltam a fazer compras nas semanas seguintes. Supondo que 70% das pessoas que compraram nessa semana voltarão na próxima, e assim por diante, o gráfico ficaria assim:



Agora, se você já está pensando no próximo gráfico, provavelmente já percebeu o problemão que vem pela frente. Quando combinamos as peças anteriores com a inércia, as coisas complicam. O efeito do acaso não dura somente uma semana, mas repercute nas semanas sucessivas. Assim, o que era para ser só um efeito temporário acaba durando mais. E o da semana seguinte também.
No final das contas, cada medida é uma combinação bastante complicada de todos esses efeitos. Para o supermercado do nosso exemplo, ficaria assim:



Juntando as peças

Vamos imaginar que no ano seguinte a diretoria do supermercado resolvesse mudar sua política. Ao invés de anunciar na TV, redirecionou toda sua verba para anúncios no jornal local (em papel). Combinando os dois anos, o resultado foi esse:



Como verificar se a mudança foi boa ou ruim?
No caso mais comum, uma mudança na política como essa altera a tendência. (Pode alterar os outros componentes também, mas geralmente em menor proporção). Então, para saber se a nova estratégia fez algum efeito, teremos que descobrir se a tendência mudou. E caso tenha mudado, se mudou para melhor.
Quando levamos em conta todos os efeitos, você pode perceber que visualmente é bastante complicado fazer isso.
Talvez não pareça muito claro, mas a mudança na política do supermercado foi para pior. Apesar de vermos um aumento no número de clientes, ele se deu a um ritmo que, na média, foi menor. Na verdade, a tendência caiu pela metade! Ou seja, a política anterior é duas vezes melhor. Aqui foi fácil obter esses valores porque montamos os dados por partes. Confira abaixo.




Ultrapassando os limites desse exemplo, você pode imaginar agora o quão complicado é analisar uma curva de PIB, inflação, dólar e outros. Temos ínumeros ciclos que regem cada uma dessas medições, tanto de curta-duração (alguns meses), como de anos (5 a 8 anos são bastante comuns para variáveis como crédito). Temos “efeitos do acaso” que acontecem em um mês e que perduram nos próximos. E temos a tendência, que, em parte, é influenciada pelo regime ou pela política em vigor. Portanto, no modo mais simples, se quisermos comparar duas políticas ao longo do tempo, temos que tentar extrair cada uma dessas peças e analisá-las separadamente. Não é tarefa fácil e existe toda uma vasta área da estatística dedicada a responder esse tipo de questão - análise de séries temporais.


E agora, fico sem poder opinar?
Não! Com algumas soluções mais simples, você pode extrair mais informações da série temporal.  Mas não se esqueça de que a natureza desse tipo de dado é complicada e que essas soluções trazem inúmeras limitações. Vou me ater a somente uma dessas opções aqui.
O mais fácil a se fazer é tentar reduzir o efeito da inércia. Isso é feito analisando não as medições em si, mas o quanto elas variam a cada novo valor. Essa variação pode ser absoluta (valor atual menos o valor anterior) ou percentual. A série que criamos fazendo essa modificação é também chamada de série em diferenças.
É por isso que se utiliza muito comparações entre taxa de crescimento do PIB ao invés do PIB em si. A tendência e o ciclo continuam influenciando a série em diferenças, mas o efeito da inércia é menor. Se você conhece o ciclo, fica mais fácil identificar visualmente se a tendência mudou.

Espero que o texto tenha te ajudado a entender o que está por trás de uma série temporal e o que levar em conta quando for comparar períodos diferentes, seja na política macroeconômica do governo para defender seu candidato ou para dar seu pitaco se amanhã vai estar mais quente ou mais frio que ontem.