Mostrar mensagens com a etiqueta Econometria. Mostrar todas as mensagens
Mostrar mensagens com a etiqueta Econometria. Mostrar todas as mensagens

sábado, 12 de novembro de 2016

O campeonato até agora...

A vitória de Trump deu mais uma machadada na credibilidade das polls. Nesta altura do campeonato, temos de nos questionar se a metodologia das polls está errada ou se as próprias polls afectam os resultados. Será que ao prever uma vitória para Clinton, os eleitores não sentiram um maior à vontade para fazer um voto de protesto, o que não retirou força a Trump, mas retirou a vantagem que Clinton demonstrava ter nas polls? Isto seria consistente com o número de pessoas que não votaram em Trump, nem Clinton, mas ficaram chocadas com a vitória de Trump.

A mesma coisa aconteceu com o Brexit, onde muita gente votou a favor porque não pensava que iria ser esse o resultado -- estavam a contar que um número suficiente de outros votassem a favor porque assim o previam as polls, logo descontaram o risco da opção que não queriam. Isto também é consistente com os resultados das eleições portuguesas, onde muitos dos que votaram em branco, ou não votaram, ou votaram em partidos menores, como forma de protesto, acharam mal que o PS tivesse formado uma Geringonça.

Resumindo e concluindo, é preciso investigar se as polls se tornaram uma variável explicativa do resultado final da eleição. Parece-me também que o voto de protesto, quando a opção não-favorita é má, pode acabar por ser um tiro nos pés.

Análise do dia seguinte

Tenho uma pergunta para colocar aos nossos crânios quantitativos: agora que sabem que Donald Trump ganhou e Barack Obama também ganhou, mas vocês gostam de Barack Obama e detestam Donald Trump, como é que constroem um modelo que acerte em ambas as vitórias? Têm tanta aversão à vitória de Donald Trump que se contentam em construir um modelo que erra na previsão dessa observação?

Já têm dois modelos de partida: o de Nate Silver que acerta em uma e falha a outra e tem em conta todos os escândalos e suspeitas de ambos os candidatos porque é continuamente actualizado com novos dados, ou seja é um modelo dinâmico; o modelo das chaves, que acertou nas duas vitórias, mas ignora toda dinâmica de escândalos e suspeitas e se concentra em treze chaves básicas e é essencialmente um modelo estático.

sexta-feira, 6 de maio de 2016

Contem comigo...

O nosso ilustre Presidente da República acha que se discute demasiado as contas do governo e que parece que se tornou num desporto nacional, em que em cada esquina se encontra um constitucionalista/economista. Se eu fosse constitucionalista, diria que ainda bem que a nossa Constituição permite a liberdade de expressão e nos dá a oportunidade de opinar à vontade as contas dos governos portugueses. Acontece que não sou constitucionalista, logo defiro para o nosso ilustre Presidente da República a forma como interpreta o direito à liberdade de expressão consagrado na Constituição da República Portuguesa.

terça-feira, 12 de abril de 2016

Inacreditável...

Noticia o Expresso que o governo está a rever os números que o PS tinha usado para fazer campanha eleitoral. Afinal, não serão criados 207.000 empregos em quatro anos; no cenário cauteloso, talvez sejam criados 120.000 durante toda a legislatura. Vamos imaginar que sim, que este cenário cauteloso concretizar-se-á. Nesse caso, o erro de cálculo seria de -72,5%. Um erro dessa magnitude devia dar direito a explicações no Parlamento.

Se os meus modelos tivessem erros desta magnitude, eu não teria emprego...

terça-feira, 26 de janeiro de 2016

Proposta

O Nuno e o LA-C corrigiram-me e muito bem: neste momento estamos dependentes da DBRS e não da Fitch, o que me deu ideia para um modelo. Suponho que os ratings das agências exibem algum nível de correlação e possivelmente causalidade; seria interessante perceber como é que o rating de uma agência afecta os ratings das outras. Talvez o Ministério das Finanças queira desenvolver um modelo para ver como é que um choque no rating de uma agência se espalha a outras, ou seja, quanto tempo temos até que todas decidam que Portugal é lixo.

P.S. Note-se que a Fitch apenas ameaçou; ainda não baixou o rating...

sábado, 18 de abril de 2015

Fraude e abuso de crianças

No outro dia, recebi um telefonema a respeito de um dos meus cartões de crédito. Disseram-me que o meu cartão tinha sido usado duas vezes na América do Sul e que o sistema tinha identificado as transacções como potencialmente fraudulentas, logo gostariam que eu os informasse da sua legitimidade. Realmente eram fraudulentas, eu não fui à América do Sul, nem comprei nada na Internet, que pudesse ter sido pago lá.

Quando nós usamos um cartão de crédito, a informação da transacção é enviada para um computador que usa as características da transacção como inputs num modelo para determinar se deve ser aceite. Há vários tipos de modelos para fazer isto, uns mais sofisticados do que outros: modelos de variáveis dependentes limitadas, modelos de Markov escondidos, redes Bayesianas, etc. (Nos links incluí alguns papers como exemplos, mas muitos mais há.) Uns calculam a probabilidade de o cliente pagar o crédito ao banco, outros computam a probabilidade de a transacção ser fraudulenta, etc. A literatura está cheia de estudos destes modelos para efeitos de fraude de cartões de crédito.

Tenho especial carinho pelos modelos de variáveis dependentes limitadas porque são poderosos e relativamente fáceis de construir e usar e aplicam-se a muitas áreas, por exemplo, podem ser usados para determinar os factores de risco que afectam a probabilidade de uma criança ter excesso de peso. Talvez, já se tenham apercebido do que eu estou a pensar. Um modelo deste tipo poderia ser construído para identificar os factores que contribuem ou que estão associados a uma criança estar em risco de ser vítima de violência doméstica. Bastava digitalizar toda a informação dos casos de crianças que estiveram sob a alçada da Comissão de Protecção de Crianças e Jovens, ou outra entidade, e analisar os dados.

Poder-se-ia construir vários modelos: risco no espaço de um mês, risco no espaço de três meses, etc. Risco pode ser definido como uma hospitalização da criança, abuso sexual, morte, etc. Quando a CPCJ recebia uma denúncia, demorava-se uma ou duas semanas a recolher informação acerca da criança e bastaria fazer os inputs das características da criança e da sua família e ter-se-ia uma estimativa de risco, o que permitiria priorizar os casos.

Os modelos deste tipo também teriam uma outra vantagem: permitiriam identificar quais as características que aumentam o sucesso da intervenção, quer dizer, que factores é que estão associados a um nível de risco mais baixo: será que o ideal é fazer uma visita ao domicílio no espaço de um mês após receber a queixa, ou é mais eficaz mandar chamar a família ao gabinete, ou pedir a intervenção do Ministério Público quando se reúnem certas condições, etc. Análises deste tipo também seriam importantes quando se está a formular legislação porque permitiriam ao legislador fazer leis mais eficazes para a protecção de menores.

Os modelos não devem ser a única forma de orientar a acção destes serviços. As profissionais que lá trabalham poderiam ter uma percepção de risco para uma criança muito maior do que o que o modelo indicasse, o que deveria aumentar a prioridade do caso, mas quando os serviços têm recursos escassos e muitos casos, um protocolo de acção que use estes modelos seria bastante benéfico, que o digam as empresas que oferecem cartões de crédito aos clientes.

quinta-feira, 9 de abril de 2015

Três mil milhões de anos

Li hoje, na Bloomberg, um artigo acerca da carta aos accionistas que Jamie Dimon escreveu e que foi publicada na quarta-feira. Nessa carta, Dimon diz que a volatilidade observada em 15 de Outubro do ano passado nos yields dos certificados de tesouraria dos EUA, que foi de quase 0.4%, é um evento que só acontece uma vez em cada três mil milhões de anos. Ele vê isso como indicação de que estamos perante um clima de alto risco, pois a próxima crise pode ser agravada por uma escassez de certificados de tesouraria.

Eu fiquei um bocado parva quando li a coisa dos três mil milhões de anos. Como é que se calcula uma coisa destas? Só usando uma distribuição probabilística teórica é que isto acontece. Notem o contexto disto: o homem existe há, talvez, sete milhões de anos e, em 2014, saiu-nos a sorte grande na variação dos yields dos certificados de tesouraria americana, um país que foi fundado em 1776. Se o evento não tivesse acontecido, continuaríamos a presumir que a probabilidade teórica é uma boa indicação de risco?

Pergunto-me como é possível estes bancos enormes, que têm dinheiro para comprar bons cérebros, continuarem a invocar os resultados de distribuições teóricas, quando foi exactamente essa uma das causas da má gestão de risco que nos levou à crise de 2008. Não seria melhor presumir que a probabilidade deste milagre nas yields dos certificados de tesouro seria muito mais alta do que a distribuição teórica indicava? OK, OK, talvez no contexto da idade do universo isto faça mais sentido, especialmente porque muitos dos cérebros de Wall St. vêm das ciências duras e dizem sempre que nós, economistas, temos uns modelos fraquitos.

quarta-feira, 18 de março de 2015

It's getting hard...

"It's very hard to be an econometrician right now, when everything is fundamentally changed."

Robert Shiller, 18/3/2015

We must, nevertheless, acknowledge the irony of it all. We got into a mess because many people, many of whom were not economists, were playing with econometrics, making predictions outside of sample and assuming that the confidence that they had in the predictions was the same as if they were in-sample predictions. And because they were so damned wrong, the market crashed so hard that they fundamentally changed the behavior of the market. Now we are back to square one: we do not have enough data of this new behavior to learn how it works. We have computer power and tools, but not enough usable data.

The thing is, if you push the data in physics, even if you screw up, you're not going to fundamentally change the laws of the universe. If you push the data in economics, if you screw up, you can fundamentally change the behavior of the agents. In economics, you walk on egg shells, so it is best to slow down and be humble.