Outro dia eu falei do problema de identificação, mas faltou uma definição mais precisa sobre o que é identificação e também como resolver o problema de identificação. Nesse post eu vou tentar responder à primeira ausência e estabelecer o framework para responder à segunda ausência.
Nós dizemos que um parâmetro não é identificado quando, dada uma amostra, pelo menos dois valores dos parâmetros são compatíveis com os dados. (Um pouco) mais formalmente, mais de um valor do espaço do parâmetro gera a mesma probabilidade (likelihood) de observar os dados amostrais coletados.
Na prática, isso significa que com as informações disponíveis, não é possível determinar unicamente o parâmetro de interesse. Pelo que entendo, um parâmetro é não identificável mesmo quando uma amostra similar pode aumentar de tamanho indefinidamente, ou seja, não é um problema de ter poucos dados, mas de aqueles dados não permitirem responder a uma determinada questão.
Se nós temos como determinar se um parâmetro é ou não identificável, podemos evitar fazer perguntas que não podem ser respondidas.
Dito isso, podemos falar de identificação causal, na linha de Angrist e Krueger (1999), e mais recentemente do livro Mostly Harmless Econometrics: “Angrist and Krueger (1999) used the term identification strategy to describe the manner in which a researcher uses observational data (i.e., data not generated by a randomized trial) to approximate a real experiment” (p. 7).
Em outras palavras, uma estratégia de identificação (causal) é uma forma de identificar parâmetros por meio de técnicas que aproximam um estudo observacional de um experimento. O pressuposto, claro, é que um experimento permite identificar parâmetros de um modelo causal. É isso que iremos mostrar agora.
O modelo mainstream de causalidade nas ciências sociais hoje é o chamado modelo Neyman-Rubin de resultados potenciais ou contrafactuais. Ele tem esse nome porque envolve imaginar um mundo alternativo ou contrafactual, inexistente.
Vamos assumir, então, que nós estamos interessados no efeito causal de uma variável sobre uma variável
. Assumindo que
é uma variável binária, que assume valor 1 ou 0. Usualmente, estamos pensando em um tratamento (valor 1) e um grupo controle (valor 0), como por exemplo no efeito causal de um droga. Definamos então o efeito causal de
sobre
num indivíduo
como sendo:
, em que
é o resultado ou valor de
no indivíduo
quando
, e
é o resultado ou valor de
no indivíduo
quando
, num mundo alternativo (contrafactual) em que tudo o mais é igual, exceto o valor da variável
.
Contudo, não é possível observar, simultaneamente no mesmo indivíduo, ambos e
. Ou o indivíduo recebe o tratamento ou está no grupo controle, não sendo possível observar o mesmo indivíduo em dois estados diferentes ao mesmo tempo. Essa “dificuldade” (impossibilidade?) é designada por problema fundamental da inferência causal (Holland, 1986).
Essa definição de causalidade é, obviamente, uma entre várias possíveis. Já falei aqui da abordagem de Pearl, que não define causalidade tendo em vista o modelo experimental nem diretamente a noção de contrafactual ou resultados potenciais. Na própria filosofia, há ainda outras definições. Mas como não é nosso objetivo detalhar essas visões, concentremo-nos no modelo de Neyman-Rubin.
Voltando então ao modelo Neyman-Rubin de contrafactuais. Se eu não posso observar o restulado do tratamento e controle no mesmo indivíduo, eu posso porém estimar o efeito causal médio (Average Treatment Effect, ATE). O efeito causal médio é o efeito causal do tratamento na média em uma população. Isso significa que o efeito causal pode variar de indivíduo para indivíduo, mas é possível estimar o efeito médio.
Numa população com indivíduos, o efeito causal médio,
é a média de
nos
indivíduos. Utilizando a esperança matemática (denotada pelo símbolo
para a média de
, por exemplo) para calcular a média na população, temos então:
Como a média da diferença é a diferença das médias*,
,
e com isso queremos dizer apenas que o efeito causal médio é a diferença entre o resultado dos tratados e o resultado do grupo controle. Essa informação adicional (Representada pela indicação do valor de T) pode parecer redundante, na medida em que nós indexamos com 1 ou 0, para indicar justamente se era grupo de tratamento ou controle. Porém, a distinção será útil pra facilitar a notação de quando quisermos pensar qual seria o resultado no grupo controle que seria observado com os indivíduos do grupo do tratamento (
) se eles tivessem sido alocados para o grupo controle.
Por exemplo, suponha que o tratamento é uma droga nova, e o resultado é a pressão arterial. Nós temos o grupo controle e o grupo do tratamento
. O grupo controle é formado pelos indivíduos que não recebem droga alguma (ou recebem um placebo, como nos experimentos reais nas ciências médicas) e
é a pressão arterial observada dos indivíduos do grupo de tratamento, e
é a pressão arterial do grupo controle. Agora, se eu quiser me perguntar qual seria a pressão arterial dos indivíduos do grupo de tratamento
se estivessem no controle, não é suficiente me referir apenas a
, pois não saberei diferenciar a pressão arterial do grupo controle original com a pressão arterial dos indivíduos do tratamento se estivessem no controle. Assim, nós introduzimos a notação
para nos referirmos a esse último grupo (qual seria a pressão arterial dos indivíduos no tratamento se estivessem no controle).
Tomemos agora a equação:
adicionando e substraindo o termo da equação não altera a mesma.
,
rearranjando:
,
é o efeito médio dos tratados (Average Causal Effect on the Treated, ATT ou ATET) e;
, é o viés de seleção.
Comecemos pelo viés de seleção. O viés de seleção é a diferença no resultado entre os tratados e os não tratados. No nosso exemplo, é a diferença na pressão arterial entre os que receberam a nova droga e e os que não receberam a droga, se ambos estivessem no grupo controle. Se na média não houver diferença na pressão arterial, o viés de seleção é zero. Se contudo o grupo tratado tiver na média uma diferença na pressão arterial, então a seleção de indivíduos para o grupo controle e tratamento não é balanceada, isto é, há diferenças sistemáticas na pressão arterial dos dois grupos, mesmo se ambos estiverem no grupo controle. Se, por exemplo, no grupo do tratamento tivéssemos pessoas obesas e no grupo controle pessoas não obesas, então a pressão arterial média dos dois grupos seria diferente mesmo que ambos não recebessem a droga. É por essa razão que estudos observacionais não podem assumir que identificam o efeito causal apenas porque compararam grupos de pessoas com característias diferentes. Por exemplo, estudos observacionais mostraram que a terapia de reposição hormonal para mulheres na menopausa reduzia o risco de doenças coronárias. Porém, mulheres com reposição hormonal praticavam mais exercícios que o grupo das mulheres sem reposição hormonal, causando viés de seleção. O viés de seleção, portanto, tornava o efeito causal médio não-identificável.
O outro termo da equação, o efeito causal médio sobre os tratados, captura a diferença média entre a pressão arterial com a droga e a pressão arterial que teria sido observada se não tivessem tomado a droga.
Na ausência de viés de seleção, a comparação entre o resultado dos tratados e não tratados (grupo controle) é igual ao ATT (efeito causal médio nos tratados) e podemos saber se há um efeito causal médio do tratamento.
Por fim, a ideia de que um experimento permite identificar o efeito causal médio depende de algumas suposições que eu não apresentei para simplificar a exposição. Além disso, eu não quis discutir algumas premissas desse modelo que, a mim, parecem complicadas ou pelo menos difíceis de entender para manter as coisas simples. Mas para não ficar sem mencionar quais as naturezas de minhas dúvidas, exponha uma delas aqui: faz sentido pensar efetivamente em causalidade a partir de contrafactual? Em que sentido poderíamos modificar apenas o status do tratamento de um indivíduo, e tudo o mais permanecer constante? Se eu alterar uma única variável que seja no sistema, não é possível que, por meio de um efeito borboleta, todo o resto se altere e, nesse caso, a própria noção de contrafactual perde o sentido? Quais seriam as condições, portanto, para que esse modelo seja válido, ou em outras palavras, quais as hipóteses implícitas desse modelo?
Num outro post, quando eutiver algum tempo, desenvolvo essa e outras dúvidas minhas.
*a linearidade da média pode ser provada facilmente. Seja a média de
, e
a média de
. Então,
que é a média ou esperença da diferença, .
Sobre o problema fundamental da inferência causal, eu acho que forçaram a mão no nome. Muitas situações interessantes podem ser estudadas observando-se os resultados no mesmo indivíduo em momentos diferentes. Portanto, o problema fundamental da inferência causal só o é para um tempo t fixo. Suponhamos o seguinte exemplo: 1) Eu tenho uma dor de cabeça, tomo um comprimido e não funciona. 2) Passam-se dois dias, tenho uma dor de cabeça novamente, tomo dois comprimidos e a dor passa. 3) Passam-se outros dois dias e volto ao estágio (1). Se sempre observo os mesmos resultados, é plausível concluir que estabeleci o efeito causal da dosagem, já que não vejo muito problema quanto à SUTVA. O que você acha?
Concordo em parte com você, e por isso que coloquei uma interrogação no “impossibilidade”. Além do que, tem aqueles exemplos da Rebecca em que num experimento o indivíduo elabora seu plano de estratégias.
Mas, por outro lado, eu entendo que, de t1 para t2 não é mais tudo constante e, portanto, a definição de contrafactual como sendo tudo o mais constante, exceto pelo valor do tratamento (ou assignment no tratamento) fica complicada se passou algum tempo. Mas você tem razão que se eu possoa supor STUVA entre indivíduos, porque não SUTVA no mesmo indivíduo?
Esse post aqui (http://blogs.iq.harvard.edu/sss/archives/2006/02/thoughts_on_sut.shtml) aborda um pouco isso, acho.
Pingback: Identificação em modelos estatísticos | Blog Pra falar de coisas