estratégias de Identificação em modelos estatísticos

Outro dia estava conversando com um amigo sobre o assunto, e ele não sabia o que era o famoso problema da identificação. Eis então uma explicação o mais didática possível. Vou usar um exemplo da ciência política.

Vamos supor um modelo simples que relacione contribuição de campanha e voto. Suponha que o número de votos, V, recebidos por um deputado i é função do quanto ele recebeu da contribuição de campanha, C, e da diferença entre a ideologia do deputado e do eleitor mediano do distrito, I. Assim,

V_{i} = a_{1} + a_{2}*C_{i} + a_{3}*I_{i} + e_{1i} (1)

Porém, o montate de contribuições de campanha é função do número de votos que o deputado recebe (da expectativa de votos a receber, mas aqui vou assumir que ambas as quantidades são iguais, ou que tomamos uma como proxie da outra).

C_{i} = d_{1} + d_{2} V_{i} + u_{i}   (2)

Definindo -d_{1}/d_{2} = b_{1}, -u_{i}/d_{2} = e_{2i}

e substituindo essas definições na equação (2) acima, e rearranjando ela temos:

V_{i} = b_{ 1}+ b_{2}*C_{i} + e_{2} (3)

Igualando a equação 3 e a equação 1 e resolvendo para a variável contribuição de campanha, temos:

C_{i} = (a_{1} - b_{1} )/ (b_{2} - a_{2}) + a_{3}/ (b_{2} - a_{2}) + (e_{1} - e_{2})/ (b_{2} - a_{2})

É fácil ver que a contribuição de campanha depende do termo de erro e_{1} e, portanto, viola uma das hipóteses do modelo de regressão segundo a qual as variáveis independentes e o termo de erro são não correlacionados. Isso torna as estimativas viesadas e inconsistentes, podendo em alguns casos até mudar o sinal do coeficiente.

 

 

Sobre Manoel Galdino

Corinthiano, Bayesiano e Doutor em ciência Política pela USP.
Esse post foi publicado em estatística, Política e Economia. Bookmark o link permanente.

4 respostas para estratégias de Identificação em modelos estatísticos

  1. Rafael disse:

    Você estná falando de endogeneidade, certo? Como em modelos em que desenvolvimento econômico é correlacionado com o grau de abertura comercial, mas não é possível definir a direção da causalidade. Aí que fica importante achar uma V Instr boa, cuja variação não dependa da variação da V Ind do modelo

  2. Sim, estou falando de endogeneidade.

  3. Rafael disse:

    Tem um cara bom que também escreveu sobre endogeneidade em um bloguezinho por aí, com um pouco menos de formalização: https://prafalardecoisas.wordpress.com/2010/04/21/vies-de-selecao-e-endogeneidade/

  4. Pingback: Causalidade, identificação e viés de seleção | Blog Pra falar de coisas

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s