stringtranslate.com

Modelo causal de Rubin

El modelo causal de Rubin ( RCM ), también conocido como modelo causal de Neyman-Rubin , [1] es un enfoque para el análisis estadístico de causa y efecto basado en el marco de resultados potenciales , que lleva el nombre de Donald Rubin . El nombre "modelo causal de Rubin" fue acuñado por primera vez por Paul W. Holland . [2] El marco de resultados potenciales fue propuesto por primera vez por Jerzy Neyman en su tesis de maestría de 1923, [3] aunque lo discutió sólo en el contexto de experimentos completamente aleatorios. [4] Rubin lo amplió a un marco general para pensar sobre la causalidad en estudios tanto observacionales como experimentales. [1]

Introducción

El modelo causal de Rubin se basa en la idea de resultados potenciales. Por ejemplo, una persona tendría un ingreso particular a los 40 años si hubiera asistido a la universidad, mientras que tendría un ingreso diferente a los 40 años si no hubiera asistido a la universidad. Para medir el efecto causal de ir a la universidad para esta persona, necesitamos comparar el resultado para el mismo individuo en ambos futuros alternativos. Dado que es imposible ver ambos resultados potenciales a la vez, siempre falta uno de los resultados potenciales. Este dilema es el "problema fundamental de la inferencia causal ". [2]

Debido al problema fundamental de la inferencia causal, los efectos causales a nivel unitario no pueden observarse directamente. Sin embargo, los experimentos aleatorios permiten estimar los efectos causales a nivel de población. [5] Un experimento aleatorio asigna personas al azar a tratamientos: universidad o no universidad. Debido a esta asignación aleatoria, los grupos son (en promedio) equivalentes, y la diferencia en ingresos a los 40 años puede atribuirse a la asignación universitaria, ya que esa fue la única diferencia entre los grupos. Luego se puede obtener una estimación del efecto causal promedio (también conocido como efecto promedio del tratamiento o ATE) calculando la diferencia de medias entre las muestras tratadas (que asisten a la universidad) y de control (que no asisten a la universidad).

Sin embargo, en muchas circunstancias, los experimentos aleatorios no son posibles debido a preocupaciones éticas o prácticas. En tales escenarios existe un mecanismo de asignación no aleatoria. Este es el caso del ejemplo de la asistencia a la universidad: las personas no son asignadas al azar para asistir a la universidad. Más bien, las personas pueden optar por asistir a la universidad basándose en su situación financiera, la educación de sus padres, etc. Se han desarrollado muchos métodos estadísticos para la inferencia causal, como el emparejamiento por puntuación de propensión . Estos métodos intentan corregir el mecanismo de asignación encontrando unidades de control similares a las unidades de tratamiento.

Un ejemplo extendido

Rubin define un efecto causal:

Intuitivamente, el efecto causal de un tratamiento, E, sobre otro, C, para una unidad particular y un intervalo de tiempo desde hasta es la diferencia entre lo que habría sucedido en ese momento si la unidad hubiera estado expuesta a E iniciado en y lo que habría ocurrido en ese momento. habría sucedido en si la unidad hubiera estado expuesta a C iniciada en : 'Si hace una hora hubiera tomado dos aspirinas en lugar de solo un vaso de agua, mi dolor de cabeza ahora habría desaparecido', o 'porque hace una hora tomé dos aspirinas En lugar de solo un vaso de agua, ya no tengo dolor de cabeza.' Nuestra definición del efecto causal del tratamiento E versus C reflejará este significado intuitivo." [5]

Según el RCM, el efecto causal de tomar o no tomar aspirina hace una hora es la diferencia entre cómo se habría sentido la cabeza en el caso 1 (tomar aspirina) y en el caso 2 (no tomar aspirina). Si su dolor de cabeza persiste sin aspirina pero desaparece si toma aspirina, entonces el efecto causal de tomar aspirina es el alivio del dolor de cabeza. En la mayoría de las circunstancias, nos interesa comparar dos futuros, uno generalmente denominado "tratamiento" y el otro "control". Estas etiquetas son algo arbitrarias.

Resultados potenciales

Supongamos que Joe participa en una prueba de la FDA para un nuevo medicamento para la hipertensión. Si fuéramos omniscientes, sabríamos los resultados de Joe tanto bajo el tratamiento (el nuevo fármaco) como bajo el control (ya sea sin tratamiento o con el tratamiento estándar actual). El efecto causal, o efecto del tratamiento, es la diferencia entre estos dos resultados potenciales.

es la presión arterial de Joe si toma la nueva pastilla. En general, esta notación expresa el resultado potencial que resulta de un tratamiento, t , en una unidad, u . De manera similar, ¿es el efecto de un tratamiento diferente, c o control, en una unidad, u ? En este caso, es la presión arterial de Joe si no toma la pastilla. es el efecto causal de tomar el nuevo medicamento.

De esta tabla sólo conocemos el efecto causal sobre Joe. Todos los demás participantes del estudio podrían tener un aumento de la presión arterial si toman la píldora. Sin embargo, independientemente de cuál sea el efecto causal para los otros sujetos, el efecto causal para Joe es una presión arterial más baja, en relación con lo que habría sido su presión arterial si no hubiera tomado la píldora.

Considere una muestra más grande de pacientes:

El efecto causal es diferente para cada sujeto, pero la droga funciona para Joe, Mary y Bob porque el efecto causal es negativo. Su presión arterial es más baja con el medicamento que si no lo hubieran tomado. Para Sally, en cambio, el fármaco provoca un aumento de la presión arterial.

Para que un resultado potencial tenga sentido, debe ser posible, al menos a priori . Por ejemplo, si Joe no tiene forma, bajo ninguna circunstancia, de obtener el nuevo medicamento, entonces le resulta imposible. Nunca puede suceder. Y si nunca se puede observar, ni siquiera en teoría, entonces el efecto causal del tratamiento sobre la presión arterial de Joe no está definido.

Sin causalidad sin manipulación

El efecto causal de un nuevo fármaco está bien definido porque es la simple diferencia de dos resultados potenciales, los cuales podrían ocurrir. En este caso, nosotros (u otra cosa) podemos manipular el mundo, al menos conceptualmente, de modo que sea posible que suceda una cosa u otra diferente.

Esta definición de efectos causales se vuelve mucho más problemática si no hay forma de que uno de los posibles resultados ocurra alguna vez. Por ejemplo, ¿cuál es el efecto causal de la altura de Joe sobre su peso? Ingenuamente, esto parece similar a nuestros otros ejemplos. Solo necesitamos comparar dos resultados potenciales: cuál sería el peso de Joe bajo el tratamiento (donde el tratamiento se define como ser 3 pulgadas más alto) y cuál sería el peso de Joe bajo el control (donde el control se define como su altura actual).

Un momento de reflexión resalta el problema: no podemos aumentar la altura de Joe. No hay manera de observar, ni siquiera conceptualmente, cuál sería el peso de Joe si fuera más alto porque no hay manera de hacerlo más alto. No podemos manipular la altura de Joe, por lo que no tiene sentido investigar el efecto causal de la altura sobre el peso. De ahí el lema: No hay causalidad sin manipulación .

Supuesto de valor de tratamiento unitario estable (SUTVA)

Requerimos que "la observación [de resultado potencial] en una unidad no se vea afectada por la asignación particular de tratamientos a las otras unidades" (Cox 1958, §2.4). Esto se denomina supuesto de valor de tratamiento unitario estable (SUTVA), que va más allá del concepto de independencia.

En el contexto de nuestro ejemplo, la presión arterial de Joe no debería depender de si Mary recibe o no el medicamento. Pero ¿y si lo hace? Supongamos que Joe y Mary viven en la misma casa y Mary siempre cocina. La droga hace que Mary anhele alimentos salados, por lo que si toma la droga, cocinará con más sal de la que usaría de otra manera. Una dieta rica en sal aumenta la presión arterial de Joe. Por lo tanto, su resultado dependerá tanto del tratamiento que recibió como del tratamiento que reciba Mary.

La violación del SUTVA dificulta la inferencia causal. Podemos dar cuenta de las observaciones dependientes considerando más tratamientos. Creamos 4 tratamientos teniendo en cuenta si Mary recibe tratamiento o no.

Recuerde que un efecto causal se define como la diferencia entre dos resultados potenciales. En este caso, existen múltiples efectos causales porque hay más de dos resultados potenciales. Uno es el efecto causal de la droga sobre Joe cuando Mary recibe tratamiento y se calcula . Otro es el efecto causal sobre Joe cuando Mary no recibe tratamiento y se calcula . El tercero es el efecto causal del tratamiento de María sobre Joe cuando Joe no recibe tratamiento. Esto se calcula como . El tratamiento que recibe Mary tiene un efecto causal mayor en Joe que el tratamiento que Joe recibió en Joe, y está en la dirección opuesta.

Al considerar más resultados potenciales de esta manera, podemos hacer que SUTVA se mantenga. Sin embargo, si otras unidades además de Joe dependen de Mary, entonces debemos considerar otros resultados potenciales. Cuanto mayor es el número de unidades dependientes, más resultados potenciales debemos considerar y más complejos se vuelven los cálculos (considérese un experimento con 20 personas diferentes, cada una de cuyo estado de tratamiento puede afectar los resultados de todos los demás). Para estimar (fácilmente) el efecto causal de un único tratamiento en relación con un control, SUTVA debería mantenerse.

Efecto causal promedio

Considerar:

Se puede calcular el efecto causal promedio (también conocido como efecto de tratamiento promedio o ATE) tomando la media de todos los efectos causales.

La forma en que medimos la respuesta afecta las inferencias que hacemos. Supongamos que medimos los cambios en la presión arterial como un cambio porcentual en lugar de en valores absolutos. Entonces, dependiendo de las cifras exactas, el efecto causal promedio podría ser un aumento de la presión arterial. Por ejemplo, supongamos que la presión arterial de George sería 154 bajo control y 140 con tratamiento. El tamaño absoluto del efecto causal es −14, pero la diferencia porcentual (en términos del nivel de tratamiento de 140) es −10%. Si la presión arterial de Sarah es 200 bajo tratamiento y 184 bajo control, entonces el efecto causal es 16 en términos absolutos pero 8% en términos del valor del tratamiento. Un cambio absoluto más pequeño en la presión arterial (-14 versus 16) produce un cambio porcentual mayor (-10% versus 8%) para George. Aunque el efecto causal promedio para George y Sarah es +2 en términos absolutos, es −2 en términos porcentuales.

El problema fundamental de la inferencia causal.

Los resultados que hemos visto hasta ahora nunca se medirían en la práctica. Por definición, es imposible observar el efecto de más de un tratamiento en un sujeto durante un período de tiempo específico. Joe no puede tomar la píldora y no tomarla al mismo tiempo. Por lo tanto, los datos se verían así:

Los signos de interrogación son respuestas que no se pudieron observar. El problema fundamental de la inferencia causal [2] es que es imposible observar directamente los efectos causales. Sin embargo, esto no hace imposible la inferencia causal . Ciertas técnicas y supuestos permiten superar el problema fundamental.

Supongamos que tenemos los siguientes datos:

Podemos inferir cuál habría sido el resultado potencial de Joe bajo control si asumimos un efecto constante:

y

Donde T es el efecto promedio del tratamiento... en este caso -10.

Si quisiéramos inferir los valores no observados, podríamos asumir un efecto constante. Las siguientes tablas ilustran datos consistentes con el supuesto de un efecto constante.

Todos los sujetos tienen el mismo efecto causal aunque tengan diferentes resultados bajo el tratamiento.

El mecanismo de asignación

El mecanismo de asignación, el método mediante el cual se asigna el tratamiento a las unidades, afecta el cálculo del efecto causal promedio. Uno de esos mecanismos de asignación es la aleatorización. Para cada sujeto podríamos lanzar una moneda para determinar si recibe tratamiento. Si quisiéramos que cinco sujetos recibieran tratamiento, podríamos asignar tratamiento a los primeros cinco nombres que escogiéramos de un sombrero. Cuando asignamos tratamientos al azar podemos obtener respuestas diferentes.

Supongamos que estos datos son ciertos:

El verdadero efecto causal promedio es −8. Pero el efecto causal para estos individuos nunca es igual a este promedio. El efecto causal varía, como generalmente (¿siempre?) ocurre en la vida real. Después de asignar tratamientos al azar, podríamos estimar el efecto causal como:

Una asignación aleatoria diferente de tratamientos produce una estimación diferente del efecto causal promedio.

El efecto causal promedio varía porque nuestra muestra es pequeña y las respuestas tienen una gran varianza . Si la muestra fuera más grande y la varianza fuera menor, el efecto causal promedio estaría más cerca del efecto causal promedio verdadero, independientemente de las unidades específicas asignadas aleatoriamente al tratamiento.

Alternativamente, supongamos que el mecanismo asigna el tratamiento a todos los hombres y sólo a ellos.

Según este mecanismo de asignación, es imposible que las mujeres reciban tratamiento y, por lo tanto, es imposible determinar el efecto causal promedio en las mujeres. Para hacer inferencias de un efecto causal sobre un sujeto, la probabilidad de que el sujeto reciba tratamiento debe ser mayor que 0 y menor que 1.

el medico perfecto

Considere el uso del médico perfecto como mecanismo de asignación. El médico perfecto sabe cómo responderá cada sujeto al fármaco o al control y asigna a cada sujeto el tratamiento que más le beneficiará. El médico perfecto conoce esta información sobre una muestra de pacientes:

Con base en este conocimiento, realizaría las siguientes asignaciones de tratamiento:

El médico perfecto distorsiona ambos promedios al filtrar las respuestas deficientes tanto al tratamiento como al control. La diferencia entre medias, que es el supuesto efecto causal promedio, se distorsiona en una dirección que depende de los detalles. Por ejemplo, un médico perfecto asignaría a un sujeto como Laila, que resulta perjudicado por tomar el medicamento, al grupo de control y así se enmascararía el efecto negativo del medicamento.

Conclusión

El efecto causal de un tratamiento en una sola unidad en un momento dado es la diferencia entre la variable de resultado con el tratamiento y sin el tratamiento. El problema fundamental de la inferencia causal es que es imposible observar el efecto causal en una sola unidad. O te tomas la aspirina ahora o no. En consecuencia, se deben hacer suposiciones para estimar los contrafactuales faltantes.

El modelo causal de Rubin también se ha relacionado con variables instrumentales (Angrist, Imbens y Rubin, 1996) [6] y otras técnicas de inferencia causal. Para obtener más información sobre las conexiones entre el modelo causal de Rubin, el modelado de ecuaciones estructurales y otros métodos estadísticos para la inferencia causal, consulte Morgan y Winship (2007) [7] y Pearl (2000). [8] Pearl (2000) sostiene que todos los resultados potenciales pueden derivarse de modelos de ecuaciones estructurales (SEM), unificando así la econometría y el análisis causal moderno.

Ver también

Referencias

  1. ^ ab Sekhon, Jasjeet (2007). "El modelo Neyman-Rubin de inferencia causal y estimación mediante métodos de comparación" (PDF) . El manual de Oxford de metodología política . Archivado desde el original (PDF) el 13 de mayo de 2015 . Consultado el 14 de junio de 2013 .
  2. ^ abc Holanda, Paul W. (1986). "Estadística e inferencia causal". J.Amer. Estadístico. Asociación 81 (396): 945–960. doi :10.1080/01621459.1986.10478354. JSTOR  2289064. S2CID  14377504.
  3. ^ Neyman, Jerzy. Sobre las aplicaciones de la teoría de las probabilidades en las experiencias agrícolas: Ensayo de los principios. Tesis de Maestría (1923). Extractos reimpresos en inglés, Statistical Science, vol. 5, págs. 463–472. ( DM Dabrowska y TP Speed, Traductores).
  4. ^ Rubin, Donald (2005). "Inferencia causal utilizando resultados potenciales". J.Amer. Estadístico. Asociación 100 (469): 322–331. doi :10.1198/016214504000001880. S2CID  842793.
  5. ^ ab Rubin, Donald (1974). "Estimación de los efectos causales de los tratamientos en estudios aleatorizados y no aleatorizados". J. Educación. Psicólogo. 66 (5): 688–701 [p. 689]. doi :10.1037/h0037350.
  6. ^ Angrist, J.; Imbens, G.; Rubin, D. (1996). "Identificación de efectos causales mediante variables instrumentales" (PDF) . J.Amer. Estadístico. Asociación 91 (434): 444–455. doi :10.1080/01621459.1996.10476902.
  7. ^ Morgan, S.; Winship, C. (2007). Contrafácticos e inferencia causal: métodos y principios para la investigación social . Nueva York: Cambridge University Press . ISBN 978-0-521-67193-4.
  8. ^ Perla, Judea (2000). Causalidad: modelos, razonamiento e inferencia (2ª edición de 2009). Prensa de la Universidad de Cambridge.

Otras lecturas

enlaces externos