Derrame (experimento)

En los experimentos , un efecto indirecto es un efecto que se produce de manera indirecta sobre un sujeto que no se trata directamente en el experimento. Estos efectos son útiles para el análisis de políticas, pero complican el análisis estadístico de los experimentos.

El análisis de los efectos indirectos implica relajar el supuesto de no interferencia, o SUTVA (Supuesto de valor de tratamiento de unidad estable). Este supuesto requiere que la revelación del sujeto i de sus resultados potenciales dependa solo del estado de tratamiento de ese propio sujeto i , y no se vea afectada por el estado de tratamiento de otro sujeto j . En entornos ordinarios donde el investigador busca estimar el efecto promedio del tratamiento ( ), la violación del supuesto de no interferencia significa que los estimadores tradicionales para el ATE, como la diferencia de medias, pueden estar sesgados . Sin embargo, hay muchos casos del mundo real en los que la revelación de resultados potenciales de una unidad depende de la asignación de tratamiento de otra unidad, y analizar estos efectos puede ser tan importante como analizar el efecto directo del tratamiento. ${\widehat {ATE}}$

Una solución a este problema es redefinir el estimador causal de interés redefiniendo los resultados potenciales de un sujeto en términos de su propio estado de tratamiento y del estado de tratamiento de sujetos relacionados. El investigador puede entonces analizar varios estimadores de interés por separado. Una suposición importante aquí es que este proceso captura todos los patrones de efectos indirectos y que no quedan efectos indirectos no modelados (por ejemplo, los efectos indirectos ocurren dentro de un hogar de dos personas pero no más allá).

Una vez que se redefinen los resultados potenciales, el resto del análisis estadístico implica modelar las probabilidades de estar expuesto al tratamiento dado un programa de asignación de tratamiento y usar la ponderación de probabilidad inversa (IPW) para producir estimaciones imparciales (o asintóticamente imparciales) del estimando de interés.

Ejemplos de efectos indirectos

Los efectos indirectos pueden ocurrir de distintas maneras. Entre las aplicaciones más comunes se encuentran el análisis de los efectos indirectos en las redes sociales y en la geografía. Algunos ejemplos son los siguientes:

Comunicación : Una intervención que transmite información sobre una tecnología o un producto puede influir en las decisiones de adopción de otros en su red si se difunde más allá del usuario inicial. ^[1]
Competencia : La asistencia para la colocación laboral de jóvenes solicitantes de empleo puede influir en las perspectivas laborales de las personas que no recibieron la formación pero que compiten por los mismos puestos de trabajo. ^[2]
Contagio: Recibir medicamentos antiparasitarios puede disminuir la probabilidad de que otras personas contraigan la enfermedad. ^[3]
Disuasión : La información sobre auditorías gubernamentales en municipios específicos puede difundirse a municipios cercanos. ^[4]
Desplazamiento: Una intervención policial en un punto crítico que aumenta la presencia policial en una calle determinada puede conducir al desplazamiento del delito a calles cercanas que no hayan sido tratadas. ^[5]
Reasignación de recursos : una intervención policial en un punto crítico que aumenta la presencia policial en una calle determinada puede disminuir la presencia policial en las calles cercanas.
Comparación social : Un programa que asigna aleatoriamente a individuos para que reciban un vale para mudarse a un nuevo vecindario puede influir adicionalmente en las creencias del grupo de control sobre sus condiciones de vivienda. ^[6]

En tales ejemplos, el tratamiento en un ensayo controlado aleatorio puede tener un efecto directo en quienes reciben la intervención y también un efecto indirecto en quienes no fueron tratados directamente.

Cuestiones estadísticas

La estimación de los efectos indirectos en los experimentos introduce tres cuestiones estadísticas que los investigadores deben tener en cuenta.

Relajar el supuesto de no interferencia

Un supuesto clave para la inferencia imparcial es el supuesto de no interferencia, que postula que los resultados potenciales de un individuo solo se revelan por su propia asignación de tratamiento y no por la asignación de tratamiento de otros. ^[7] Este supuesto también se ha llamado la Respuesta de Tratamiento Individualista ^[8] o el supuesto de valor de tratamiento de unidad estable . La no interferencia se viola cuando los sujetos pueden comunicarse entre sí sobre sus tratamientos, decisiones o experiencias, influyendo así en los resultados potenciales de los demás. Si el supuesto de no interferencia no se cumple, las unidades ya no tienen solo dos resultados potenciales (tratado y control), sino una variedad de otros resultados potenciales que dependen de las asignaciones de tratamiento de otras unidades, ^[9] lo que complica la estimación del efecto promedio del tratamiento .

Para estimar los efectos indirectos es necesario relajar el supuesto de no interferencia, ya que los resultados de una unidad dependen no solo de su asignación de tratamiento, sino también de la asignación de tratamiento de sus vecinos. El investigador debe postular un conjunto de resultados potenciales que limiten el tipo de interferencia. Como ejemplo, considere un experimento que envía información política a estudiantes universitarios para aumentar su participación política. Si la población del estudio consiste en todos los estudiantes que viven con un compañero de habitación en una residencia universitaria, se pueden imaginar cuatro conjuntos de resultados potenciales, dependiendo de si el estudiante o su pareja recibieron la información (suponga que no hay efectos indirectos fuera de cada habitación para dos personas):

Y _0,0 se refiere a los resultados potenciales de un individuo cuando no recibe tratamiento (0) y tampoco lo recibió su compañero de habitación (0).
Y _0,1 se refiere al resultado potencial de un individuo cuando no recibe tratamiento (0) pero su compañero de habitación sí lo recibe (1).
Y _1,0 se refiere al resultado potencial de un individuo cuando recibe tratamiento (1) pero su compañero de habitación no recibe tratamiento (0).
Y _1,1 se refiere al resultado potencial de un individuo cuando es tratado (1) y su compañero de habitación fue tratado (1).

Ahora bien, los resultados de un individuo se ven influidos tanto por el hecho de que haya recibido el tratamiento como por el hecho de que su compañero de habitación lo haya recibido. Podemos estimar un tipo de efecto de contagio observando cómo cambian los resultados de una persona dependiendo de si su compañero de habitación recibió el tratamiento o no, dado que el individuo no recibió el tratamiento directamente. Esto se reflejaría en la diferencia Y _0,1 - Y _0,0 . De manera similar, podemos medir cómo cambian los resultados de una persona dependiendo del estado de tratamiento de su compañero de habitación, cuando el propio individuo recibe tratamiento. Esto equivale a tomar la diferencia Y _1,1 - Y _1,0 .

Aunque los investigadores suelen optar por los experimentos porque requieren suposiciones menos exigentes, los efectos indirectos pueden ser “ilimitados en su extensión e imposibles de especificar en su forma”. ^[10] El investigador debe hacer suposiciones específicas sobre qué tipos de efectos indirectos son operativos. Se puede relajar el supuesto de no interferencia de diversas maneras dependiendo de cómo se piensa que ocurren los efectos indirectos en un entorno determinado. Una forma de modelar los efectos indirectos es un indicador binario de si un vecino inmediato también fue tratado, como en el ejemplo anterior. También se pueden postular efectos indirectos que dependen de la cantidad de vecinos inmediatos que también fueron tratados, también conocidos como efectos de nivel k. ^[11]

Mapeos de exposición

El siguiente paso después de redefinir el estimador causal de interés es caracterizar la probabilidad de exposición a efectos indirectos para cada sujeto en el análisis, dado un vector de asignación de tratamiento. Aronow y Samii (2017) ^[12] presentan un método para obtener una matriz de probabilidades de exposición para cada unidad en el análisis.

Primero, defina una matriz diagonal con un vector de probabilidades de asignación de tratamiento. $\mathbf {P} =\operatorname {diag} \left(p_{\mathbf {z} _{1}},p_{\mathbf {z} _{2}},\dots ,p_{\mathbf {z} _{|\Omega |}}\right).$

En segundo lugar, se define una matriz de indicadores que indique si la unidad está expuesta a efectos de contagio o no. Esto se hace utilizando una matriz de adyacencia como la que se muestra a la derecha, donde la información sobre una red se puede transformar en una matriz de indicadores. Esta matriz de indicadores resultante contendrá valores de , los valores obtenidos de una variable binaria aleatoria , que indica si esa unidad ha estado expuesta a efectos de contagio o no. $\mathbf {yo}$ $estilo de visualización d_ {k}}$ $D_{i}=f\left(\mathbf {Z} ,\theta _{i}\right)$

En tercer lugar, obtenga el producto sándwich , una matriz N × N que contiene dos elementos: la probabilidad individual de exposición en la diagonal y las probabilidades de exposición conjuntas en las diagonales opuestas: $\mathbf {I} _{k}\mathbf {P} \mathbf {I} _{k}^{\prime }$ $\pi _{i}\left(d_{k}\right)$ $\pi _{ij}\left(d_{k}\right)$

\mathbf {I} _{k}\mathbf {P} \mathbf {I} _{k}^{\prime }=\left[{\begin{array}{cccc}{\pi _{1}(d_{k})}&\pi _{12}(d_{k})&\cdots &\pi _{1N}(d_{k})\\\pi _{21}(d_{k})&\pi _{2}(d_{k})&\cdots &\pi _{2N}(d_{k})\\\vdots &\vdots &\ddots &\\\pi _{N1}(d_{k})&\pi _{N2}(d_{k})&{}&\pi _{N}(d_{k})\end{array}}\right]

De manera similar, la probabilidad conjunta de exposición de i estando en condición de exposición y j estando en una condición de exposición diferente se puede obtener calculando :

d_{k}

d_{l}

\mathbf {I} _{k}\mathbf {P} \mathbf {I} _{l}^{\prime }

$\mathbf {I} _{k}\mathbf {P} \mathbf {I} _{l}^{\prime }=\left[{\begin{array}{c c c c }{0}&{\pi _{12}\left(d_{k},d_{l}\right)}&{\dots }&{\pi _{1N}\left(d_{k},d_{l}\right)}\\{\pi _{21}\left(d_{k},d_{l}\right)}&{0}&{\ldots }&{\pi _{2N}\left(d_{k},d_{l}\right)}\\{\vdots }&{\vdots }&{\ddots }&{}\\\pi _{N1}(d_{k},d_{l})&\pi _{N2}(d_{k},d_{l})&&0\end{array}}\right]$ Nótese que las diagonales de la segunda matriz son 0 porque un sujeto no puede estar expuesto simultáneamente a dos condiciones de exposición diferentes a la vez, de la misma manera que un sujeto no puede revelar dos resultados potenciales diferentes a la vez.

Las probabilidades de exposición obtenidas pueden luego usarse para la ponderación de probabilidad inversa (IPW, descrita a continuación), en un estimador como el estimador de Horvitz-Thompson . $\pi$

Una advertencia importante es que este procedimiento excluye todas las unidades cuya probabilidad de exposición es cero (por ejemplo, una unidad que no está conectada a ninguna otra unidad), ya que estos números terminan en el denominador de la regresión IPW.

Necesidad de ponderaciones de probabilidad inversa

La estimación de los efectos indirectos requiere un cuidado adicional: aunque el tratamiento se asigna directamente, el estado de efecto indirecto se asigna indirectamente y puede conducir a probabilidades diferenciales de asignación de efecto indirecto para las unidades. Por ejemplo, un sujeto con 10 conexiones de amistad tiene más probabilidades de estar expuesto indirectamente al tratamiento en comparación con un sujeto con solo una conexión de amistad. No tener en cuenta las probabilidades variables de exposición al efecto indirecto puede sesgar las estimaciones del efecto indirecto promedio.

La figura 1 muestra un ejemplo en el que las unidades tienen distintas probabilidades de ser asignadas a la condición de derrame. La subfigura A muestra una red de 25 nodos en la que las unidades en verde son elegibles para recibir tratamiento. Los derrames se definen como compartir al menos un borde con una unidad tratada. Por ejemplo, si se trata el nodo 16, los nodos 11, 17 y 21 se clasificarían como unidades de derrame. Supongamos que se seleccionan aleatoriamente tres de estas seis unidades verdes para ser tratadas, de modo que sean posibles diferentes conjuntos de asignaciones de tratamiento. En este caso, la subfigura B muestra la probabilidad de cada nodo de ser asignado a la condición de derrame. El nodo 3 se asigna al derrame en el 95 % de las aleatorizaciones porque comparte bordes con tres unidades que son tratadas. Este nodo solo será un nodo de control en el 5% de las aleatorizaciones: es decir, cuando los tres nodos tratados son 14, 16 y 18. Mientras tanto, el nodo 15 se asigna al desbordamiento solo el 50% del tiempo; si el nodo 14 no se trata directamente, el nodo 15 no se asignará al desbordamiento. ${\binom {6}{3}}=20$

Uso de pesos de probabilidad inversa

Al analizar experimentos con distintas probabilidades de asignación, se deben tomar precauciones especiales. Estas diferencias en las probabilidades de asignación se pueden neutralizar mediante la regresión ponderada por probabilidad inversa (IPW) , donde cada observación se pondera por la inversa de su probabilidad de ser asignada a la condición de tratamiento observada utilizando el estimador de Horvitz-Thompson . ^[13] Este enfoque aborda el sesgo que podría surgir si los resultados potenciales se relacionaran sistemáticamente con las probabilidades de asignación. La desventaja de este estimador es que puede estar plagado de variabilidad de muestreo si a algunas observaciones se les asigna una gran cantidad de peso (es decir, una unidad con una baja probabilidad de ser derrame se asigna a la condición de derrame por casualidad).

Uso de la inferencia aleatoria para probar hipótesis

En algunos entornos, estimar la variabilidad de un efecto de derrame crea una dificultad adicional. Cuando el estudio de investigación tiene una unidad fija de agrupamiento , como una escuela o un hogar, los investigadores pueden usar herramientas de ajuste de error estándar tradicionales como errores estándar robustos a los conglomerados, que permiten correlaciones en términos de error dentro de los conglomerados pero no entre ellos. ^[14] En otros entornos, sin embargo, no hay una unidad fija de agrupamiento. Para realizar pruebas de hipótesis en estos entornos, se recomienda el uso de inferencia de aleatorización . ^[15] Esta técnica permite generar valores p e intervalos de confianza incluso cuando los derrames no se adhieren a una unidad fija de agrupamiento, pero las unidades cercanas tienden a asignarse a condiciones de derrame similares, como en el caso del agrupamiento difuso .

Véase también

Efecto multiplicador social

Referencias

^ "Difusión de tecnologías en redes sociales: evidencia de un programa de capacitación sobre café en Ruanda". IGC . 31 de marzo de 2010 . Consultado el 11 de diciembre de 2018 .
^ Zamora, Philippe; Rathelot, Roland; Gurgand, Marc; Duflo, Esther; Crépon, Bruno (1 de mayo de 2013). "¿Tienen las políticas del mercado laboral efectos de desplazamiento? Evidencia de un experimento aleatorio agrupado". The Quarterly Journal of Economics . 128 (2): 531–580. doi :10.1093/qje/qjt001. hdl : 1721.1/82896 . ISSN 0033-5533. S2CID 15381050.
^ "Gusanos: Identificación de impactos en la educación y la salud en presencia de externalidades de tratamiento | Edward Miguel, Profesor de Economía, Universidad de California, Berkeley". emiguel.econ.berkeley.edu . Consultado el 11 de diciembre de 2018 .
^ Avis, Eric; Ferraz, Claudio; Finan, Frederico (2018). "¿Las auditorías gubernamentales reducen la corrupción? Estimación de los impactos de exponer a políticos corruptos" (PDF) . Revista de Economía Política . 126 (5): 1912–1964. doi :10.1086/699209. hdl :10419/176135. S2CID 36161954.
^ Weisburd, David; Telep, Cody W. (1 de mayo de 2014). "Policía de puntos calientes: qué sabemos y qué necesitamos saber". Revista de justicia penal contemporánea . 30 (2): 200–220. doi :10.1177/1043986214525083. ISSN 1043-9862. S2CID 145692978.
^ Sobel, Michael (2006). "¿Qué demuestran los estudios aleatorios sobre movilidad en la vivienda?". Journal of the American Statistical Association . 101 (476): 1398–1407. doi :10.1198/016214506000000636. S2CID 739283.
^ "PsycNET". psycnet.apa.org . Consultado el 11 de diciembre de 2018 .
^ Manski, Charles F. (1 de febrero de 2013). "Identificación de la respuesta al tratamiento con interacciones sociales" (PDF) . The Econometrics Journal . 16 (1): S1–S23. doi :10.1111/j.1368-423X.2012.00368.x. hdl : 10419/64721 . ISSN 1368-4221. S2CID 1559596.
^ Rosenbaum, Paul R. (2007). "Interferencia entre unidades en experimentos aleatorios". Revista de la Asociación Estadounidense de Estadística . 102 (477): 191–200. CiteSeerX 10.1.1.571.7817 . doi :10.1198/016214506000001112. S2CID 38153548.
^ Rosenbaum, Paul R. (2007). "Interferencia entre unidades en experimentos aleatorios". Revista de la Asociación Estadounidense de Estadística . 102 (477): 191–200. CiteSeerX 10.1.1.571.7817 . doi :10.1198/016214506000001112. S2CID 38153548.
^ Kao, Edward; Toulis, Panos (13 de febrero de 2013). "Estimación de los efectos de la influencia causal entre pares". Conferencia internacional sobre aprendizaje automático : 1489-1497.
^ Aronow, Peter M.; Samii, Cyrus (1 de diciembre de 2017). "Estimación de efectos causales promedio bajo interferencia general, con aplicación a un experimento de redes sociales". Anales de estadística aplicada . 11 (4): 1912–1947. arXiv : 1305.6156 . doi :10.1214/16-aoas1005. ISSN 1932-6157. S2CID 26963450.
^ Hortvitz, DG; Thompson, DJ (1952). "Una generalización del muestreo sin reemplazo a partir de un universo finito". Revista de la Asociación Estadounidense de Estadística . 47 (260): 663–685. doi :10.1080/01621459.1952.10483446. JSTOR 2280784. S2CID 120274071.
^ A. Colin Cameron; Douglas L. Miller. "Guía práctica para la inferencia robusta de conglomerados" (PDF) . Cameron.econ.ucdavis.edu . Consultado el 19 de diciembre de 2018 .
^ "10 cosas que debe saber sobre la inferencia aleatoria". Egap.org . Consultado el 11 de diciembre de 2018 .