Efecto promedio del tratamiento

El efecto promedio del tratamiento ( ATE ) es una medida utilizada para comparar tratamientos (o intervenciones) en experimentos aleatorios, evaluación de intervenciones políticas y ensayos médicos. El ATE mide la diferencia en los resultados medios (promedio) entre las unidades asignadas al tratamiento y las unidades asignadas al control. En un ensayo aleatorio (es decir, un estudio experimental), el efecto promedio del tratamiento se puede estimar a partir de una muestra mediante una comparación de los resultados medios de las unidades tratadas y no tratadas. Sin embargo, el ATE generalmente se entiende como un parámetro causal (es decir, una estimación o propiedad de una población ) que un investigador desea conocer, definido sin referencia al diseño del estudio o al procedimiento de estimación. Tanto los estudios observacionales como los diseños de estudios experimentales con asignación aleatoria pueden permitir estimar un ATE de diversas maneras.

Definición general

Originado en los primeros análisis estadísticos en los campos de la agricultura y la medicina, el término "tratamiento" ahora se aplica, de manera más general, a otros campos de las ciencias naturales y sociales, especialmente la psicología , las ciencias políticas y la economía , como, por ejemplo, la evaluación. del impacto de las políticas públicas. La naturaleza de un tratamiento o resultado es relativamente poco importante en la estimación de la ATE; es decir, el cálculo de la ATE requiere que un tratamiento se aplique a algunas unidades y no a otras, pero la naturaleza de ese tratamiento (p. ej., un producto farmacéutico) , un pago de incentivo, un anuncio político) es irrelevante para la definición y estimación del ATE.

La expresión "efecto del tratamiento" se refiere al efecto causal de un tratamiento o intervención determinado (por ejemplo, la administración de un fármaco) sobre una variable de resultado de interés (por ejemplo, la salud del paciente). En el "marco de causalidad de resultados potenciales" de Neyman-Rubin, un efecto de tratamiento se define para cada unidad individual en términos de dos "resultados potenciales". Cada unidad tiene un resultado que se manifestaría si la unidad estuviera expuesta al tratamiento y otro resultado que se manifestaría si la unidad estuviera expuesta al control. El "efecto del tratamiento" es la diferencia entre estos dos resultados potenciales. Sin embargo, este efecto del tratamiento a nivel individual no es observable porque las unidades individuales sólo pueden recibir el tratamiento o el control, pero no ambos. La asignación aleatoria al tratamiento garantiza que las unidades asignadas al tratamiento y las unidades asignadas al control sean idénticas (en un gran número de iteraciones del experimento). De hecho, las unidades de ambos grupos tienen distribuciones idénticas de covariables y resultados potenciales. Por lo tanto, el resultado promedio entre las unidades de tratamiento sirve como contrafactual para el resultado promedio entre las unidades de control. La diferencia entre estos dos promedios es el ATE, que es una estimación de la tendencia central de la distribución de los efectos del tratamiento no observables a nivel individual. ^[1] Si una muestra se constituye aleatoriamente a partir de una población, la muestra ATE (abreviada SATE) es también una estimación de la población ATE (abreviada PATE). ^[2]

Mientras que un experimento garantiza, con la expectativa , que los resultados potenciales (y todas las covariables) se distribuyan de manera equivalente en los grupos de tratamiento y control, este no es el caso en un estudio observacional . En un estudio observacional, las unidades no se asignan al tratamiento y al control de forma aleatoria, por lo que su asignación al tratamiento puede depender de factores no observados o no observables. Los factores observados pueden controlarse estadísticamente (p. ej., mediante regresión o emparejamiento ), pero cualquier estimación del ATE podría verse confundida por factores no observables que influyeron en qué unidades recibieron el tratamiento versus el control.

Definicion formal

Para definir formalmente el ATE, definimos dos resultados potenciales: es el valor de la variable de resultado para el individuo si no recibe tratamiento, es el valor de la variable de resultado para el individuo si recibe tratamiento. Por ejemplo, es el estado de salud del individuo si no se le administra el medicamento en estudio y es el estado de salud si se le administra el medicamento. $y_{0}(i)$ $i$ $y_{1}(i)$ $i$ $y_{0}(i)$ $y_{1}(i)$

El efecto del tratamiento para cada individuo viene dado por . En el caso general, no hay razón para esperar que este efecto sea constante entre los individuos. El efecto promedio del tratamiento viene dado por $i$ $y_{1}(i)-y_{0}(i)=\beta (i)$

{\text{ATE}}=\mathbb {E} [y_ {1}-y_ {0}]

y se puede estimar (si se cumple una ley de grandes números )

{\widehat {ATE}}={\frac {1}{N}}\sum _{i}(y_{1}(i)-y_{0}(i))

donde la sumatoria ocurre sobre todos los individuos de la población. $N$

Si pudiéramos observar, para cada individuo y entre una muestra grande y representativa de la población, podríamos estimar el ATE simplemente tomando el valor promedio de toda la muestra. Sin embargo, no podemos observar ambos y para cada individuo, ya que un individuo no puede ser tratado y no tratado al mismo tiempo. Por ejemplo, en el ejemplo de las drogas, solo podemos observar las personas que han recibido la droga y las que no la recibieron. Este es el principal problema al que se enfrentan los científicos en la evaluación de los efectos de los tratamientos y ha desencadenado un gran conjunto de técnicas de estimación. $y_{1}(i)$ $y_{0}(i)$ ${\ Displaystyle y_ {1} (i) -y_ {0} (i)}$ $y_{1}(i)$ $y_{0}(i)$ $y_{1}(i)$ $y_{0}(i)$

Estimacion

Dependiendo de los datos y sus circunstancias subyacentes, se pueden utilizar muchos métodos para estimar el ATE. Los más comunes son:

Un ejemplo

Consideremos un ejemplo en el que todas las unidades son personas desempleadas y algunas experimentan una intervención política (el grupo de tratamiento), mientras que otras no (el grupo de control). El efecto causal de interés es el impacto que tiene una política de seguimiento de la búsqueda de empleo (el tratamiento) sobre la duración de un período de desempleo: en promedio, ¿cuánto más corto sería el desempleo si experimentaran la intervención? El ATE, en este caso, es la diferencia en los valores esperados (medias) de la duración del desempleo de los grupos de tratamiento y control.

Un ATE positivo, en este ejemplo, sugeriría que la política laboral aumentó la duración del desempleo. Un ATE negativo sugeriría que la política laboral redujo la duración del desempleo. Una estimación de ATE igual a cero sugeriría que no existe ninguna ventaja o desventaja en brindar el tratamiento en términos de la duración del desempleo. Determinar si una estimación de ATE se puede distinguir de cero (ya sea positiva o negativamente) requiere una inferencia estadística .

Debido a que el ATE es una estimación del efecto promedio del tratamiento, un ATE positivo o negativo no indica que algún individuo en particular se beneficiaría o resultaría perjudicado por el tratamiento. Por tanto, el efecto promedio del tratamiento ignora la distribución del efecto del tratamiento. Algunas partes de la población podrían estar peor con el tratamiento incluso si el efecto medio es positivo.

Efectos del tratamiento heterogéneo.

Algunos investigadores llaman "heterogéneo" al efecto de un tratamiento si afecta a diferentes individuos de manera diferente (heterogéneamente). Por ejemplo, tal vez el tratamiento mencionado anteriormente de una política de seguimiento de la búsqueda de empleo afectó de manera diferente a hombres y mujeres, o a personas que viven en diferentes estados de manera diferente. ATE requiere un supuesto sólido conocido como supuesto de valor de tratamiento unitario estable (SUTVA), que requiere que el valor del resultado potencial no se vea afectado por el mecanismo utilizado para asignar el tratamiento y la exposición al tratamiento de todos los demás individuos. Sea el tratamiento, el efecto del tratamiento para el individuo viene dado por . El supuesto SUTVA nos permite declarar . $y(i)$ $d$ $i$ $y_{1}(i,d)-y_{0}(i,d)$ $y_{1}(i,d)=y_{1}(i),y_{0}(i,d)=y_{0}(i)$

Una forma de buscar efectos de tratamiento heterogéneos es dividir los datos del estudio en subgrupos (p. ej., hombres y mujeres, o por estado) y ver si los efectos promedio del tratamiento son diferentes por subgrupo. Si los efectos promedio del tratamiento son diferentes, se viola SUTVA. Un ATE por subgrupo se denomina "efecto de tratamiento promedio condicional" (CATE), es decir, el ATE condicionado a la pertenencia al subgrupo. CATE se puede utilizar como estimación si SUTVA no se cumple.

Un desafío con este enfoque es que cada subgrupo puede tener sustancialmente menos datos que el estudio en su conjunto, por lo que si el estudio ha sido diseñado para detectar los efectos principales sin un análisis de subgrupos, es posible que no haya datos suficientes para juzgar adecuadamente los efectos en los subgrupos. .

Hay algunos trabajos sobre la detección de efectos de tratamiento heterogéneos utilizando bosques aleatorios ^[3]^[4] , así como sobre la detección de subpoblaciones heterogéneas mediante análisis de conglomerados . ^[5]^[6] Recientemente, se han desarrollado enfoques de metaaprendizaje que utilizan marcos de regresión arbitrarios como estudiantes base para inferir el CATE. ^[7]^[8] El aprendizaje de representación se puede utilizar para mejorar aún más el rendimiento de estos métodos. ^[9]^[10]

Referencias

^ Holanda, Paul W. (1986). "Estadística e inferencia causal". J.Amer. Estadístico. Asociación. 81 (396): 945–960. doi :10.1080/01621459.1986.10478354. JSTOR 2289064.
^ Imai, Kosuke; Rey, Gary; Estuardo, Elizabeth A. (2008). "Malentendidos entre experimentalistas y observacionalistas sobre la inferencia causal". Estadística JR. Soc. Ser. A . 171 (2): 481–502. doi :10.1111/j.1467-985X.2007.00527.x. S2CID 17852724.
^ Apuesta, Stefan; Athey, Susan (2015). "Estimación e inferencia de efectos de tratamientos heterogéneos utilizando bosques aleatorios". arXiv : 1510.04342 [estad.ME].
^ "Optimización explícita de los efectos causales a través del bosque aleatorio causal: una introducción práctica y un tutorial". 14 de octubre de 2018.
^ Markham, Alex; Das, Richeek; Grosse-Wentrup, Moritz (2022). "Un núcleo basado en covarianza de distancia para agrupación causal no lineal en poblaciones heterogéneas". Proc. Claro . PMLR 177: 542–558.
^ Huang, Biwei; Zhang, Kun; Xie, Pengtao; Gong, Mingming; Xing, Eric P.; Glymour, Clark (2019). "Modelado de relaciones causales específicas y compartidas y agrupación basada en mecanismos". Avances en los sistemas de procesamiento de información neuronal (NeurIPS) . 32 .
^ Nie, Xinkun; Apuesta, Stefan (2021). "Estimación cuasi-oráculo de efectos de tratamiento heterogéneos". Biometrika . 108 (2): 299–319. arXiv : 1712.04912 . doi : 10.1093/biomet/asaa076.
^ Künzel, Sören; Sekhon, Jasjeet; Bickel, Peter; Yu, Bin (2019). "Metaleaprendices para estimar efectos de tratamientos heterogéneos mediante el aprendizaje automático". Procedimientos de la Academia Nacional de Ciencias . 116 (10): 4156–4165. doi : 10.1073/pnas.1804597116 . PMC 6410831 . PMID 30770453.
^ Johansson, Fredrik; Shalit, Uri; Sontag, David (2016). "Representaciones de aprendizaje para la inferencia contrafactual". Proc. ICML . PMLR 48: 3020–3029.
^ Burkhart, Michael C.; Ruiz, Gabriel (2022). "Representaciones de características neuroevolutivas para la inferencia causal". Ciencias Computacionales – ICCS 2022 . Apuntes de conferencias sobre informática. vol. 13351, págs. 3–10. arXiv : 2205.10541 . doi :10.1007/978-3-031-08754-7_1. ISBN 978-3-031-08753-0. S2CID 248987304.

Otras lecturas

Wooldridge, Jeffrey M. (2013). "Análisis de políticas con secciones transversales agrupadas". Introducción a la econometría: un enfoque moderno . Mason, OH: Thomson suroeste. págs. 438–443. ISBN 978-1-111-53104-1.