El efecto promedio del tratamiento ( ATE ) es una medida utilizada para comparar tratamientos (o intervenciones) en experimentos aleatorios, evaluación de intervenciones de políticas y ensayos médicos. El ATE mide la diferencia en los resultados medios (promedio) entre las unidades asignadas al tratamiento y las unidades asignadas al control. En un ensayo aleatorio (es decir, un estudio experimental), el efecto promedio del tratamiento se puede estimar a partir de una muestra utilizando una comparación en los resultados medios para las unidades tratadas y no tratadas. Sin embargo, el ATE generalmente se entiende como un parámetro causal (es decir, una estimación o propiedad de una población ) que un investigador desea conocer, definido sin referencia al diseño del estudio o al procedimiento de estimación. Tanto los estudios observacionales como los diseños de estudios experimentales con asignación aleatoria pueden permitir estimar un ATE de diversas maneras.
El efecto promedio del tratamiento está bajo ciertas condiciones directamente relacionado con el gráfico de dependencia parcial [1]
El término "tratamiento", que tiene su origen en los primeros análisis estadísticos en los campos de la agricultura y la medicina, se aplica ahora, de manera más general, a otros campos de las ciencias naturales y sociales, especialmente la psicología , la ciencia política y la economía, como, por ejemplo, la evaluación del impacto de las políticas públicas. La naturaleza de un tratamiento o resultado es relativamente poco importante en la estimación del ATE; es decir, el cálculo del ATE requiere que se aplique un tratamiento a algunas unidades y no a otras, pero la naturaleza de ese tratamiento (por ejemplo, un producto farmacéutico, un pago de incentivos, un anuncio político) es irrelevante para la definición y estimación del ATE.
La expresión "efecto del tratamiento" se refiere al efecto causal de un tratamiento o intervención dados (por ejemplo, la administración de un fármaco) sobre una variable de resultado de interés (por ejemplo, la salud del paciente). En el "marco de resultados potenciales" de causalidad de Neyman-Rubin , un efecto del tratamiento se define para cada unidad individual en términos de dos "resultados potenciales". Cada unidad tiene un resultado que se manifestaría si la unidad fuera expuesta al tratamiento y otro resultado que se manifestaría si la unidad fuera expuesta al control. El "efecto del tratamiento" es la diferencia entre estos dos resultados potenciales. Sin embargo, este efecto del tratamiento a nivel individual no es observable porque las unidades individuales solo pueden recibir el tratamiento o el control, pero no ambos. La asignación aleatoria al tratamiento garantiza que las unidades asignadas al tratamiento y las unidades asignadas al control sean idénticas (a lo largo de un gran número de iteraciones del experimento). De hecho, las unidades de ambos grupos tienen distribuciones idénticas de covariables y resultados potenciales. Por lo tanto, el resultado promedio entre las unidades de tratamiento sirve como contrafactual para el resultado promedio entre las unidades de control. Las diferencias entre estos dos promedios constituyen el ATE, que es una estimación de la tendencia central de la distribución de los efectos del tratamiento no observables a nivel individual. [2] Si una muestra se constituye aleatoriamente a partir de una población, el ATE de la muestra (abreviado como SATE) es también una estimación del ATE de la población (abreviado como PATE). [3]
Si bien un experimento asegura, en expectativa , que los resultados potenciales (y todas las covariables) se distribuyan de manera equivalente en los grupos de tratamiento y control, este no es el caso en un estudio observacional . En un estudio observacional, las unidades no se asignan al tratamiento y al control de manera aleatoria, por lo que su asignación al tratamiento puede depender de factores no observados o no observables. Los factores observados pueden controlarse estadísticamente (por ejemplo, a través de regresión o emparejamiento ), pero cualquier estimación del ATE podría verse confundida por factores no observables que influyeron en qué unidades recibieron el tratamiento frente al control.
Para definir formalmente el ATE, definimos dos resultados potenciales: es el valor de la variable de resultado para el individuo si no recibe tratamiento, es el valor de la variable de resultado para el individuo si recibe tratamiento. Por ejemplo, es el estado de salud del individuo si no se le administra el fármaco en estudio y es el estado de salud si se le administra el fármaco.
El efecto del tratamiento para cada individuo se expresa mediante . En el caso general, no hay motivos para esperar que este efecto sea constante entre los individuos. El efecto promedio del tratamiento se expresa mediante
y puede estimarse (si se cumple una ley de grandes números )
donde la suma ocurre sobre todos los individuos de la población.
Si pudiéramos observar, para cada individuo, y entre una muestra representativa grande de la población, podríamos estimar el ATE simplemente tomando el valor promedio de en toda la muestra. Sin embargo, no podemos observar tanto y para cada individuo ya que un individuo no puede ser tratado y no tratado al mismo tiempo. Por ejemplo, en el ejemplo del medicamento, solo podemos observar para los individuos que han recibido el medicamento y para aquellos que no lo recibieron. Este es el principal problema al que se enfrentan los científicos en la evaluación de los efectos del tratamiento y ha desencadenado un gran cuerpo de técnicas de estimación.
Dependiendo de los datos y de las circunstancias subyacentes, se pueden utilizar muchos métodos para estimar la ATE. Los más comunes son:
Consideremos un ejemplo en el que todas las unidades son personas desempleadas y algunas experimentan una intervención de política (el grupo de tratamiento), mientras que otras no (el grupo de control). El efecto causal de interés es el impacto que tiene una política de seguimiento de la búsqueda de empleo (el tratamiento) sobre la duración de un período de desempleo: en promedio, ¿cuánto más corto sería el desempleo de una persona si experimentara la intervención? El ATE, en este caso, es la diferencia en los valores esperados (medias) de la duración del desempleo de los grupos de tratamiento y control.
En este ejemplo, una ATE positiva sugeriría que la política laboral aumentó la duración del desempleo. Una ATE negativa sugeriría que la política laboral disminuyó la duración del desempleo. Una estimación de ATE igual a cero sugeriría que no hubo ventaja ni desventaja en brindar el tratamiento en términos de duración del desempleo. Determinar si una estimación de ATE se puede distinguir de cero (ya sea positiva o negativamente) requiere inferencia estadística .
Dado que el ATE es una estimación del efecto promedio del tratamiento, un ATE positivo o negativo no indica que algún individuo en particular se beneficiaría o se vería perjudicado por el tratamiento. Por lo tanto, el efecto promedio del tratamiento no tiene en cuenta la distribución del efecto del tratamiento. Algunas partes de la población podrían verse en peores condiciones con el tratamiento incluso si el efecto medio es positivo.
Algunos investigadores llaman "heterogéneo" al efecto de un tratamiento si afecta a diferentes individuos de manera diferente (heterogéneamente). Por ejemplo, tal vez el tratamiento anterior de una política de monitoreo de búsqueda de empleo afectó a hombres y mujeres de manera diferente, o a personas que viven en diferentes estados de manera diferente. ATE requiere un supuesto sólido conocido como el supuesto de valor de tratamiento unitario estable (SUTVA), que requiere que el valor del resultado potencial no se vea afectado por el mecanismo utilizado para asignar el tratamiento y la exposición al tratamiento de todos los demás individuos. Sea el tratamiento, el efecto del tratamiento para el individuo está dado por . El supuesto SUTVA nos permite declarar .
Una forma de buscar efectos heterogéneos del tratamiento es dividir los datos del estudio en subgrupos (por ejemplo, hombres y mujeres, o por estado) y ver si los efectos promedio del tratamiento son diferentes por subgrupo. Si los efectos promedio del tratamiento son diferentes, se viola el SUTVA. Un ATE por subgrupo se denomina "efecto promedio condicional del tratamiento" (CATE), es decir, el ATE condicionado a la pertenencia al subgrupo. El CATE se puede utilizar como una estimación si el SUTVA no se cumple.
Un desafío con este enfoque es que cada subgrupo puede tener sustancialmente menos datos que el estudio en su conjunto, por lo que si el estudio ha sido diseñado para detectar los efectos principales sin análisis de subgrupos, puede que no haya suficientes datos para juzgar adecuadamente los efectos sobre los subgrupos.
Existen algunos trabajos sobre la detección de efectos de tratamiento heterogéneos utilizando bosques aleatorios [4] [5], así como la detección de subpoblaciones heterogéneas utilizando análisis de conglomerados . [6] [7] Recientemente, se han desarrollado enfoques de metaaprendizaje que utilizan marcos de regresión arbitrarios como aprendices base para inferir el CATE. [8] [9] El aprendizaje de representación se puede utilizar para mejorar aún más el rendimiento de estos métodos. [10] [11]