stringtranslate.com

Modelo causal de Rubin

El modelo causal de Rubin ( RCM ), también conocido como modelo causal de Neyman-Rubin , [1] es un enfoque para el análisis estadístico de causa y efecto basado en el marco de resultados potenciales , llamado así por Donald Rubin . El nombre "modelo causal de Rubin" fue acuñado por primera vez por Paul W. Holland . [2] El marco de resultados potenciales fue propuesto por primera vez por Jerzy Neyman en su tesis de maestría de 1923, [3] aunque lo discutió solo en el contexto de experimentos completamente aleatorios. [4] Rubin lo extendió a un marco general para pensar sobre la causalidad en estudios tanto observacionales como experimentales. [1]

Introducción

El modelo causal de Rubin se basa en la idea de los resultados potenciales. Por ejemplo, una persona tendría un ingreso determinado a los 40 años si hubiera asistido a la universidad, mientras que tendría un ingreso diferente a los 40 años si no hubiera asistido a la universidad. Para medir el efecto causal de ir a la universidad para esta persona, necesitamos comparar el resultado para el mismo individuo en ambos futuros alternativos. Como es imposible ver ambos resultados potenciales a la vez, uno de los resultados potenciales siempre falta. Este dilema es el "problema fundamental de la inferencia causal ". [2]

Debido al problema fundamental de la inferencia causal, los efectos causales a nivel de unidad no se pueden observar directamente. Sin embargo, los experimentos aleatorios permiten la estimación de los efectos causales a nivel de población. [5] Un experimento aleatorio asigna aleatoriamente a las personas a tratamientos: universidad o no universidad. Debido a esta asignación aleatoria, los grupos son (en promedio) equivalentes, y la diferencia en ingresos a los 40 años se puede atribuir a la asignación a la universidad, ya que esa fue la única diferencia entre los grupos. Luego se puede obtener una estimación del efecto causal promedio (también conocido como efecto promedio del tratamiento o ATE) calculando la diferencia en las medias entre las muestras tratadas (que asisten a la universidad) y las de control (que no asisten a la universidad).

Sin embargo, en muchas circunstancias, los experimentos aleatorios no son posibles debido a cuestiones éticas o prácticas. En tales escenarios existe un mecanismo de asignación no aleatorio. Este es el caso del ejemplo de la asistencia a la universidad: las personas no son asignadas aleatoriamente para asistir a la universidad. Más bien, las personas pueden elegir asistir a la universidad en función de su situación financiera, la educación de sus padres, etc. Se han desarrollado muchos métodos estadísticos para la inferencia causal, como el emparejamiento por puntaje de propensión . Estos métodos intentan corregir el mecanismo de asignación al encontrar unidades de control similares a las unidades de tratamiento.

Un ejemplo ampliado

Rubin define un efecto causal:

Intuitivamente, el efecto causal de un tratamiento, E, sobre otro, C, para una unidad particular y un intervalo de tiempo desde hasta es la diferencia entre lo que habría sucedido en el momento si la unidad hubiera estado expuesta a E iniciada en y lo que habría sucedido en si la unidad hubiera estado expuesta a C iniciada en : 'Si hace una hora hubiera tomado dos aspirinas en lugar de sólo un vaso de agua, mi dolor de cabeza ahora habría desaparecido', o 'debido a que hace una hora tomé dos aspirinas en lugar de sólo un vaso de agua, mi dolor de cabeza ahora ha desaparecido'. Nuestra definición del efecto causal del tratamiento E frente al tratamiento C reflejará este significado intuitivo". [5]

Según el RCM, el efecto causal de haber tomado o no aspirina hace una hora es la diferencia entre cómo se habría sentido su cabeza en el caso 1 (haber tomado aspirina) y en el caso 2 (no haber tomado aspirina). Si su dolor de cabeza persistiría sin aspirina pero desaparecería si tomara aspirina, entonces el efecto causal de tomar aspirina es el alivio del dolor de cabeza. En la mayoría de las circunstancias, nos interesa comparar dos futuros, uno generalmente denominado "tratamiento" y el otro "control". Estas etiquetas son algo arbitrarias.

Resultados potenciales

Supongamos que Joe participa en una prueba de la FDA para un nuevo medicamento contra la hipertensión. Un observador que lo sepa todo sabría los resultados para Joe tanto con el tratamiento (el nuevo medicamento) como con el control (ya sea sin tratamiento o con el tratamiento estándar actual). El efecto causal, o efecto del tratamiento, es la diferencia entre estos dos resultados potenciales.

es la presión arterial de Joe si toma la nueva pastilla. En general, esta notación expresa el resultado potencial que se obtiene de un tratamiento, t , en una unidad, u . De manera similar, es el efecto de un tratamiento diferente, c o control, en una unidad, u . En este caso, es la presión arterial de Joe si no toma la pastilla. es el efecto causal de tomar el nuevo medicamento.

De esta tabla sólo conocemos el efecto causal en Joe. Todos los demás participantes del estudio podrían tener un aumento de la presión arterial si toman la píldora. Sin embargo, independientemente de cuál sea el efecto causal para los demás sujetos, el efecto causal para Joe es una presión arterial más baja, en relación con lo que habría sido su presión arterial si no hubiera tomado la píldora.

Consideremos una muestra más grande de pacientes:

El efecto causal es diferente para cada sujeto, pero el medicamento funciona para Joe, Mary y Bob porque el efecto causal es negativo. Su presión arterial es más baja con el medicamento de lo que habría sido si no lo hubieran tomado. En cambio, para Sally, el medicamento provoca un aumento de la presión arterial.

Para que un resultado potencial tenga sentido, debe ser posible, al menos a priori . Por ejemplo, si no hay forma de que Joe, bajo ninguna circunstancia, obtenga el nuevo medicamento, entonces es imposible para él. Nunca puede suceder. Y si nunca puede observarse, ni siquiera en teoría, entonces el efecto causal del tratamiento sobre la presión arterial de Joe no está definido.

No hay causalidad sin manipulación

El efecto causal de un nuevo fármaco está bien definido porque es la simple diferencia entre dos resultados posibles, ambos de los cuales podrían ocurrir. En este caso, nosotros (o algo más) podemos manipular el mundo, al menos conceptualmente, de modo que sea posible que suceda una cosa u otra diferente.

Esta definición de efectos causales se vuelve mucho más problemática si no hay forma de que uno de los resultados potenciales suceda, nunca. Por ejemplo, ¿cuál es el efecto causal de la altura de Joe sobre su peso? Ingenuamente, esto parece similar a nuestros otros ejemplos. Solo necesitamos comparar dos resultados potenciales: cuál sería el peso de Joe con el tratamiento (donde el tratamiento se define como ser 3 pulgadas más alto) y cuál sería el peso de Joe con el control (donde el control se define como su altura actual).

Un momento de reflexión pone de relieve el problema: no podemos aumentar la altura de Joe. No hay forma de observar, ni siquiera conceptualmente, cuál sería el peso de Joe si fuera más alto, porque no hay forma de hacerlo más alto. No podemos manipular la altura de Joe, por lo que no tiene sentido investigar el efecto causal de la altura sobre el peso. De ahí el lema: No hay causalidad sin manipulación .

Supuesto de valor de tratamiento unitario estable (SUTVA)

Requerimos que "la observación [del resultado potencial] en una unidad no se vea afectada por la asignación particular de tratamientos a las otras unidades" (Cox 1958, §2.4). Esto se denomina supuesto de valor de tratamiento de unidad estable (SUTVA), que va más allá del concepto de independencia.

En el contexto de nuestro ejemplo, la presión arterial de Joe no debería depender de si Mary recibe o no el medicamento. Pero ¿qué pasa si así fuera? Supongamos que Joe y Mary viven en la misma casa y Mary siempre cocina. El medicamento hace que Mary tenga antojo de alimentos salados, por lo que si toma el medicamento cocinará con más sal de la que hubiera utilizado de otra manera. Una dieta alta en sal aumenta la presión arterial de Joe. Por lo tanto, su resultado dependerá tanto del tratamiento que haya recibido él como del tratamiento que reciba Mary.

La violación de SUTVA dificulta la inferencia causal. Podemos explicar las observaciones dependientes considerando más tratamientos. Creamos 4 tratamientos teniendo en cuenta si Mary recibe tratamiento o no.

Recordemos que un efecto causal se define como la diferencia entre dos resultados potenciales. En este caso, hay múltiples efectos causales porque hay más de dos resultados potenciales. Uno es el efecto causal del fármaco sobre Joe cuando Mary recibe tratamiento y se calcula, . Otro es el efecto causal sobre Joe cuando Mary no recibe tratamiento y se calcula . El tercero es el efecto causal del tratamiento de Mary sobre Joe cuando Joe no recibe tratamiento. Este se calcula como . El tratamiento que recibe Mary tiene un mayor efecto causal sobre Joe que el tratamiento que Joe recibió sobre Joe, y es en la dirección opuesta.

Al considerar más resultados potenciales de esta manera, podemos hacer que SUTVA se cumpla. Sin embargo, si otras unidades además de Joe dependen de Mary, entonces debemos considerar más resultados potenciales. Cuanto mayor sea el número de unidades dependientes, más resultados potenciales debemos considerar y más complejos se vuelven los cálculos (consideremos un experimento con 20 personas diferentes, cada una de las cuales cuyo estado de tratamiento puede afectar los resultados de todas las demás). Para estimar (fácilmente) el efecto causal de un solo tratamiento en relación con un control, SUTVA debería cumplirse.

Efecto causal medio

Considerar:

Se puede calcular el efecto causal promedio (también conocido como efecto promedio del tratamiento o ATE) tomando la media de todos los efectos causales.

La forma en que medimos la respuesta afecta las inferencias que extraemos. Supongamos que medimos los cambios en la presión arterial como un cambio porcentual en lugar de en valores absolutos. Entonces, dependiendo de los números exactos, el efecto causal promedio podría ser un aumento en la presión arterial. Por ejemplo, supongamos que la presión arterial de George sería 154 con control y 140 con tratamiento. El tamaño absoluto del efecto causal es -14, pero la diferencia porcentual (en términos del nivel de tratamiento de 140) es -10%. Si la presión arterial de Sarah es 200 con tratamiento y 184 con control, entonces el efecto causal es 16 en términos absolutos, pero 8% en términos del valor del tratamiento. Un cambio absoluto menor en la presión arterial (-14 frente a 16) produce un cambio porcentual mayor (-10% frente a 8%) para George. Aunque el efecto causal promedio para George y Sarah es +2 en términos absolutos, es -2 en términos porcentuales.

El problema fundamental de la inferencia causal

Los resultados que hemos visto hasta ahora nunca se podrían medir en la práctica. Es imposible, por definición, observar el efecto de más de un tratamiento en un sujeto durante un período de tiempo específico. Joe no puede tomar la píldora y no tomarla al mismo tiempo. Por lo tanto, los datos serían algo así:

Los signos de interrogación son respuestas que no se pudieron observar. El problema fundamental de la inferencia causal [2] es que es imposible observar directamente los efectos causales. Sin embargo, esto no hace que la inferencia causal sea imposible. Ciertas técnicas y suposiciones permiten superar el problema fundamental.

Supongamos que tenemos los siguientes datos:

Podemos inferir cuál habría sido el resultado potencial de Joe bajo control si asumimos un efecto constante:

y

Donde T es el efecto promedio del tratamiento... en este caso -10.

Si quisiéramos inferir los valores no observados podríamos suponer un efecto constante. Las siguientes tablas ilustran datos consistentes con el supuesto de un efecto constante.

Todos los sujetos tienen el mismo efecto causal aunque tengan resultados diferentes bajo el tratamiento.

El mecanismo de asignación

El mecanismo de asignación, el método por el cual se asigna el tratamiento a las unidades, afecta el cálculo del efecto causal promedio. Uno de esos mecanismos de asignación es la aleatorización. Para cada sujeto, podríamos lanzar una moneda al aire para determinar si recibe tratamiento. Si quisiéramos que cinco sujetos recibieran tratamiento, podríamos asignar el tratamiento a los primeros cinco nombres que saquemos de un sombrero. Cuando asignamos tratamientos al azar, podemos obtener diferentes respuestas.

Supongamos que estos datos son verdaderos:

El efecto causal promedio real es −8, pero el efecto causal para estos individuos nunca es igual a este promedio. El efecto causal varía, como suele ocurrir (¿siempre?) en la vida real. Después de asignar los tratamientos aleatoriamente, podríamos estimar el efecto causal como:

Una asignación aleatoria diferente de tratamientos produce una estimación diferente del efecto causal promedio.

El efecto causal promedio varía porque nuestra muestra es pequeña y las respuestas tienen una gran varianza . Si la muestra fuera más grande y la varianza fuera menor, el efecto causal promedio estaría más cerca del efecto causal promedio real, independientemente de las unidades específicas asignadas aleatoriamente al tratamiento.

Alternativamente, supongamos que el mecanismo asigna el tratamiento a todos los hombres y sólo a ellos.

Con este mecanismo de asignación, es imposible que las mujeres reciban tratamiento y, por lo tanto, es imposible determinar el efecto causal promedio en los sujetos femeninos. Para poder hacer inferencias sobre el efecto causal en un sujeto, la probabilidad de que el sujeto reciba tratamiento debe ser mayor que 0 y menor que 1.

El doctor perfecto

Consideremos el uso del médico perfecto como mecanismo de asignación. El médico perfecto sabe cómo responderá cada sujeto al fármaco o al control y asigna a cada sujeto el tratamiento que más lo beneficiará. El médico perfecto conoce esta información sobre una muestra de pacientes:

En base a este conocimiento ella realizaría las siguientes asignaciones de tratamiento:

El médico perfecto distorsiona ambos promedios al filtrar las respuestas negativas tanto al tratamiento como al grupo de control. La diferencia entre las medias, que es el supuesto efecto causal promedio, se distorsiona en una dirección que depende de los detalles. Por ejemplo, un sujeto como Laila, que sufre daños al tomar el medicamento, sería asignado al grupo de control por el médico perfecto y, por lo tanto, el efecto negativo del medicamento quedaría enmascarado.

Conclusión

El efecto causal de un tratamiento sobre una sola unidad en un momento dado es la diferencia entre la variable de resultado con el tratamiento y sin el tratamiento. El problema fundamental de la inferencia causal es que es imposible observar el efecto causal sobre una sola unidad. O tomas la aspirina ahora o no la tomas. En consecuencia, se deben hacer suposiciones para estimar los contrafácticos faltantes.

El modelo causal de Rubin también se ha relacionado con variables instrumentales (Angrist, Imbens y Rubin, 1996) [6] y otras técnicas de inferencia causal. Para obtener más información sobre las conexiones entre el modelo causal de Rubin, el modelado de ecuaciones estructurales y otros métodos estadísticos para la inferencia causal, consulte Morgan y Winship (2007) [7] , Pearl (2000) [8] , Peters et al. (2017) [9] e Ibeling e Icard (2023) [10] . Pearl (2000) sostiene que todos los resultados potenciales pueden derivarse de los modelos de ecuaciones estructurales (SEM), unificando así la econometría y el análisis causal moderno.

Véase también

Referencias

  1. ^ ab Sekhon, Jasjeet (2007). "El modelo Neyman-Rubin de inferencia causal y estimación mediante métodos de emparejamiento" (PDF) . The Oxford Handbook of Political Methodology . Archivado desde el original (PDF) el 2015-05-13 . Consultado el 2013-06-14 .
  2. ^ abc Holland, Paul W. (1986). "Estadísticas e inferencia causal". J. Amer. Statist. Assoc. 81 (396): 945–960. doi :10.1080/01621459.1986.10478354. JSTOR  2289064. S2CID  14377504.
  3. ^ Neyman, Jerzy. Sobre las aplicaciones de la teoría de las probabilidades en las experiencias agrícolas: Ensayo de principios. Tesis de maestría (1923). Extractos reimpresos en inglés, Statistical Science, vol. 5, págs. 463–472. ( DM Dabrowska y TP Speed, traductores).
  4. ^ Rubin, Donald (2005). "Inferencia causal utilizando resultados potenciales". J. Amer. Statist. Assoc. 100 (469): 322–331. doi :10.1198/016214504000001880. S2CID  842793.
  5. ^ ab Rubin, Donald (1974). "Estimación de los efectos causales de los tratamientos en estudios aleatorios y no aleatorios". J. Educ. Psychol. 66 (5): 688–701 [p. 689]. doi :10.1037/h0037350.
  6. ^ Angrist, J.; Imbens, G.; Rubin, D. (1996). "Identificación de efectos causales utilizando variables instrumentales" (PDF) . J. Amer. Statist. Assoc. 91 (434): 444–455. doi :10.1080/01621459.1996.10476902.
  7. ^ Morgan, S.; Winship, C. (2007). Contrafácticos e inferencia causal: métodos y principios para la investigación social . Nueva York: Cambridge University Press . ISBN. 978-0-521-67193-4.
  8. ^ Pearl, Judea (2000). Causalidad: modelos, razonamiento e inferencia (2.ª edición, 2009). Cambridge University Press.
  9. ^ Peters, Jonas; Janzing, Dominik; Schölkopf, Bernhard (2017). Elementos de inferencia causal: fundamentos y algoritmos de aprendizaje (1.ª edición de 2017). MIT Press.
  10. ^ Ibeling, Duligur; Icard, Thomas (2023). "Comparación de marcos causales: resultados potenciales, modelos estructurales, gráficos y abstracciones". arXiv : 2306.14351 [stat.ME].

Lectura adicional

Enlaces externos