That’s the problema with statistics, I think!

Freqüentemente somos confrontados com argumentos estatísticos. E, infelizmente, freqüentemente somos confrontados com argumentos estatísticos… errados. Vi um que achei ótimo, pela diversão, ainda que errado.

é a história do cara que decide viajar de avião com uma bomba, pois, ei, qual a probabilidade de duas bombas num mesmo avião?

Obviamente esse raciocínio é errado, e no entanto ele é, como gosto de dizer às vezes, trick. O erro está em que os dois eventos são independentes. Isto é, a decisão de uma pessoa ir numa avião com uma bomba é independente da decisão do cara que decidiu ir de avião com a bomba para se proteger.

Isso não implica, entretanto, que do ponto de vista estatístico não se possa afirmar que a probabilidade de haver um avião com duas bombas é menor do que um avião com uma bomba apenas (a negação da negação é sempre chato. Eu disse que apesar do exposto, é correto afirmar que duas bombas num avião é menoss provável que uma só). Isso porque essa última afirmativa diz respeito à distribuição de freqüências no longo prazo, e não à probabilidade de ocorrência de um evento específico.

Uma forma de visualizar isso é pensar no experimento de jogar uma moeda. Se ela for justa, então há 50% de chance de cair cara, e 50% de chance de cair coroa. Todos concordarão que a probabilidade de cair cara 4 vezes seguida é menor do que a de não cair cara 4 vezes seguida. Contudo, ainda assim, se após termos jogado a moeda 3 vezes tiver saído cara 3 vezes seguida, a probabilidade de sair cara na próxima vez continuará 50%, pois os eventos anteriores não podem alterar a probabilidade de ocorrer cara ou coroa. Eles são eventos independentes.

Outro exemplo, talvez mais ilustrativo, é o seguinte: Suponha que concordemos que 95% das violações de leis são prejudiciais à sociedade. Suponha também que a desobediência civil (que é uma violação da lei) é benéfica à sociedade. Podemos falar que a desobediência civil é benéfica à sociedade e tem 95% de chance de ser prejudicial? Obviamente não, e o problema aqui é que os 95% se referem a uma espécie de média ou freqüência relativa, nunca a um caso específico.

No fundo, é um problema de misturar estatística freqüentista e bayesiana. Mas esse é um assunto para um outro post.

Anúncios

Sobre Manoel Galdino

Corinthiano, Bayesiano e Doutor em ciência Política pela USP.
Esse post foi publicado em ciência, Manoel Galdino e marcado , . Guardar link permanente.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s