O problema da Urna é um experimento idealizado, muito simples, mas que é bastante utilizado em estatística, pois muitas intuições podem advir desse procedimento.
A idéia mais básica do modelo de urna (que tem a “famosa” urna de polya como uma variação) é o seguinte: uma urna contém V bolas verdades e A bolas azuis. Uma bola é retirada aleatoriamente da urna e sua cor é observada e anotada. Ela é então colocada de volta e o processo é repetido.
A partir daí, podemos entender a intuição de algumas distribuções de probabilidade, com oa binomial e a hypergeométrica.
Para ver a relação com a binomial, lembrem-se que a binomial é a probabilidade de x sucessos em n eventos independentes do tipo sucesso/fracasso (ou ocorre o sucesso ou o fracasso). Se nós considerarmos, por exemplo, que Azul é sucesso e Vermelho é fracasso, então podemos nos perguntar: se nós retirarmos N bolas da urna, qual a probabilidade de obtermos x (x<= N) sucessos?
Para ficarmos num exemplo mais concreto, suponha que eu faça 5 retiradas e me pergunte a probabilidade de 3 sucessos.
Chamando P a probabilidade de azul (sucesso) a/(a+v) e 1 – p a probabilidade de fracasso (vermelho), então, uma possibilidade de obter 3 sucessos é tirando as três primeiras bolas azuis e as duas últimas vermelhas. Como são independentes de cada retirada, isso acontece com a seguinte probabilidade:
p*p*p*(1-p)*(1-p)*(1-p) = p^3*(1-p)^2.
Outra possibilidade é obter azul, azul, vermelha, azul, vermelha, vermelha. Ou então, vermelha, vermelha, azul, azul, azul. Enfim, temos várias combinações possíveis. Para obter a soma de todas as probabilidade, basta notar que eu tenho que calcular o número de maneiras que três bolas podem ser escolhidas de 5 bolas, ou seja, uma C5,3. Assim, a probabilidade de 3 sucesso em 5 retiradas é: C5,3p^3(1-p)^2. Generalizado para n retiradas e x sucessos, (Cn,x)*p^x*(1-p)^n-x.
Na Urna de Polya, quando uma bola é retirada, uma outra da mesma cor da bola retirada é colocada de volta na urna. Pela Urna de Polya podemos chegar à distribuição beta, que é uma distribuição muito conveniente e, protanto, bastante utilizada. Mas falaremos num próximo post da distribuição beta e da Urna de Polya.