Diseño de discontinuidad de regresión.

En estadística , econometría , ciencias políticas , epidemiología y disciplinas relacionadas, un diseño de regresión discontinua (RDD) es un diseño cuasiexperimental pretest-postest que tiene como objetivo determinar los efectos causales de las intervenciones asignando un punto de corte o umbral por encima o por debajo del cual una Se asigna la intervención. Al comparar las observaciones que se encuentran estrechamente a ambos lados del umbral, es posible estimar el efecto promedio del tratamiento en entornos en los que la aleatorización es inviable. Sin embargo, sigue siendo imposible hacer una verdadera inferencia causal con este método solo, ya que no rechaza automáticamente los efectos causales de ninguna variable potencial de confusión. Aplicado por primera vez por Donald Thistlethwaite y Donald Campbell (1960) a la evaluación de programas de becas, ^[1] el RDD se ha vuelto cada vez más popular en los últimos años. ^[2] Las comparaciones de estudios recientes de ensayos controlados aleatorios (ECA) y RDD han demostrado empíricamente la validez interna del diseño. ^[3]

Ejemplo

La intuición detrás del RDD queda bien ilustrada mediante la evaluación de becas basadas en el mérito. El principal problema al estimar el efecto causal de tal intervención es la homogeneidad del desempeño con respecto a la asignación del tratamiento (por ejemplo, una beca). Dado que los estudiantes de alto rendimiento tienen más probabilidades de recibir la beca por mérito y continuar con un buen desempeño al mismo tiempo, comparar los resultados de los premiados y los no beneficiarios llevaría a un sesgo hacia arriba en las estimaciones. Incluso si la beca no mejorara las calificaciones en absoluto, los beneficiarios habrían obtenido mejores resultados que los no beneficiarios, simplemente porque las becas se otorgaron a estudiantes que antes tenían un buen desempeño.

A pesar de la ausencia de un diseño experimental , un RDD puede explotar características exógenas de la intervención para provocar efectos causales . Si todos los estudiantes por encima de un grado determinado (por ejemplo, el 80%) reciben la beca, es posible obtener el efecto del tratamiento local comparando a los estudiantes alrededor del límite del 80%. La intuición aquí es que un estudiante con una puntuación del 79% probablemente sea muy similar a un estudiante con una puntuación del 81%, dado el umbral predefinido del 80%. Sin embargo, un estudiante recibirá la beca mientras que el otro no. Comparar el resultado del adjudicatario (grupo de tratamiento) con el resultado contrafactual del no receptor (grupo de control) generará, por lo tanto, el efecto del tratamiento local.

Metodología

Los dos enfoques más comunes para la estimación utilizando un RDD son el no paramétrico y el paramétrico (normalmente regresión polinómica ).

Estimación no paramétrica

El método no paramétrico más común utilizado en el contexto RDD es la regresión lineal local. Este es de la forma:

Y=\alpha +\tau D+\beta _{1}(Xc)+\beta _{2}D(Xc)+\varepsilon ,

donde es el límite de tratamiento y es una variable binaria igual a uno si . Dejando ser el ancho de banda de datos utilizados, tenemos . Diferentes pendientes e interceptos ajustan los datos a cada lado del límite. Normalmente se utiliza un núcleo rectangular (sin ponderación) o un núcleo triangular. El núcleo rectangular tiene una interpretación más sencilla que los núcleos sofisticados que producen pocas ganancias de eficiencia. ^[4] $c$ $D$ $X\geq c$ $h$ $ch\leq X\leq c+h$

El principal beneficio de utilizar métodos no paramétricos en un RDD es que proporcionan estimaciones basadas en datos más cercanos al límite, lo cual resulta intuitivamente atractivo. Esto reduce algunos sesgos que pueden resultar del uso de datos más alejados del límite para estimar la discontinuidad en el límite. ^[4] Más formalmente, se prefieren las regresiones lineales locales porque tienen mejores propiedades de sesgo ^[5] y tienen una mejor convergencia. ^[6] Sin embargo, el uso de ambos tipos de estimación, si es factible, es una forma útil de argumentar que los resultados estimados no dependen demasiado del enfoque particular adoptado.

Estimación paramétrica

Un ejemplo de estimación paramétrica es:

Y=\alpha +\beta _ {1}x_ {i}+\beta _ {2}c_ {i}+\beta _ {3}c_ {i}^{2}+\beta _ {4 }c_ {i}^{3}+\varepsilon ,

dónde

x_{i}={\begin{casos}1{\text{ si }}c_{i}\geq {\bar {c}}\\0{\text{ si }}c_{i}< {\bar {c}}\end{casos}}

y es el límite de tratamiento. Tenga en cuenta que la parte polinómica se puede acortar o ampliar según las necesidades. ${\bar {c}}$

Otros ejemplos

Políticas en las que el tratamiento está determinado por un criterio de elegibilidad de edad (por ejemplo, pensiones, edad mínima legal para beber). ^[7]^[8]
Elecciones en las que un político gana por mayoría marginal. ^[9]^[10]
Puntajes de ubicación dentro de la educación que clasifican a los estudiantes en programas de tratamiento. ^[11]

Supuestos requeridos

El diseño de discontinuidad de regresión requiere que todas las variables potencialmente relevantes, además de la variable de tratamiento y la variable de resultado, sean continuas en el punto donde ocurren las discontinuidades del tratamiento y de los resultados. Una condición suficiente, aunque no necesaria, ^[10] es que la asignación del tratamiento sea "tan buena como aleatoria" en el umbral del tratamiento. ^[9] Si esto es así, entonces garantiza que aquellos que apenas recibieron tratamiento sean comparables con aquellos que apenas no recibieron tratamiento, ya que el estado del tratamiento es efectivamente aleatorio.

La asignación de tratamiento en el umbral puede ser "tan buena como aleatoria" si hay aleatoriedad en la variable de asignación y los agentes considerados (individuos, empresas, etc.) no pueden manipular perfectamente su estado de tratamiento. Por ejemplo, supongamos que el tratamiento es aprobar un examen, donde se requiere una calificación del 50%. En este caso, este ejemplo es un diseño de discontinuidad de regresión válido siempre que las calificaciones sean algo aleatorias, debido ya sea a la aleatoriedad de las calificaciones o a la aleatoriedad del desempeño de los estudiantes.

Los estudiantes tampoco deben poder manipular perfectamente su calificación para determinar perfectamente su estado de tratamiento. Dos ejemplos incluyen que los estudiantes puedan convencer a los maestros para que "los aprueben", o que se les permita a los estudiantes volver a tomar el examen hasta que lo aprueben. En el primer caso, aquellos estudiantes que apenas fracasan pero son capaces de conseguir un "pase de misericordia" pueden diferir de aquellos que apenas fracasan pero no pueden conseguir un "pase de misericordia". Esto conduce a un sesgo de selección , ya que los grupos de tratamiento y control ahora difieren. En este último caso, algunos estudiantes pueden decidir volver a realizar el examen y suspenderlo una vez que lo aprueben. Esto también conduce a un sesgo de selección, ya que sólo algunos estudiantes decidirán volver a realizar el examen. ^[4]

Probar la validez de los supuestos.

Es imposible probar definitivamente la validez si los agentes pueden determinar perfectamente el estado de su tratamiento. Sin embargo, algunas pruebas pueden proporcionar evidencia que respalde o descarte la validez del diseño de regresión discontinua.

prueba de densidad

McCrary (2008) sugirió examinar la densidad de observaciones de la variable de asignación. ^[12] Supongamos que hay una discontinuidad en la densidad de la variable de asignación en el umbral de tratamiento. En este caso, esto puede sugerir que algunos agentes pudieron manipular perfectamente el estado de su tratamiento.

Por ejemplo, si varios estudiantes logran obtener un "pase de misericordia", entonces habrá más estudiantes que apenas aprobaron el examen que los que apenas reprobaron. De manera similar, si a los estudiantes se les permite volver a tomar el examen hasta que lo aprueben, habrá un resultado similar. En ambos casos, esto probablemente se mostrará cuando se examine la densidad de las calificaciones de los exámenes. "Aprovechar el sistema" de esta manera podría sesgar la estimación del efecto del tratamiento.

Continuidad de variables observables.

Dado que la validez del diseño de discontinuidad de regresión depende de que aquellos que apenas recibieron tratamiento sean los mismos que aquellos que apenas recibieron tratamiento, tiene sentido examinar si estos grupos se basan de manera similar en variables observables. Para el ejemplo anterior, se podría comprobar si aquellos que apenas aprobaron tienen características diferentes (demográficas, ingresos familiares, etc.) que aquellos que apenas reprobaron. Aunque algunas variables pueden diferir para los dos grupos según el azar, la mayoría de estas variables deberían ser iguales. ^[13]

Pruebas de falsificación

Variables predeterminadas

De manera similar a la continuidad de las variables observables, uno esperaría que hubiera continuidad en las variables predeterminadas en el punto de corte del tratamiento. Dado que estas variables se determinaron antes de la decisión del tratamiento, el estado del tratamiento no debería afectarlas. Consideremos el ejemplo anterior de las becas basadas en el mérito. Si el resultado de interés son las calificaciones futuras, entonces no esperaríamos que la beca afecte las calificaciones anteriores. Si hay una discontinuidad en variables predeterminadas en el punto de corte del tratamiento, entonces esto pone en duda la validez del diseño de discontinuidad de regresión.

Otras discontinuidades

Si hay discontinuidades presentes en otros puntos de la variable de asignación, donde no se esperan, entonces esto puede hacer que el diseño de discontinuidad de regresión sea sospechoso. Consideremos el ejemplo de Carpenter y Dobkin (2011), quienes estudiaron el efecto del acceso legal al alcohol en Estados Unidos. ^[8] A medida que aumenta el acceso al alcohol a los 21 años, esto conduce a cambios en diversos resultados, como las tasas de mortalidad y morbilidad. Si las tasas de mortalidad y morbilidad también aumentan de manera discontinua en otras edades, entonces se cuestiona la interpretación de la discontinuidad a los 21 años.

Inclusión y exclusión de covariables.

Si las estimaciones de los parámetros son sensibles a la eliminación o adición de covariables al modelo, esto puede generar dudas sobre la validez del diseño de regresión discontinua. Un cambio significativo puede sugerir que aquellos que apenas recibieron tratamiento difieren en estas covariables de aquellos que apenas no recibieron tratamiento. La inclusión de covariables eliminaría parte de este sesgo. Si hay una gran cantidad de sesgo presente y las covariables explican una cantidad significativa de esto, entonces su inclusión o exclusión cambiaría significativamente la estimación del parámetro. ^[4]

Trabajos recientes han demostrado cómo agregar covariables, bajo qué condiciones es válido hacerlo y el potencial para una mayor precisión. ^[14]

Ventajas

Cuando se implementa y analiza adecuadamente, el RDD produce una estimación insesgada del efecto del tratamiento local. ^[15] El RDD puede ser casi tan bueno como un experimento aleatorio para medir el efecto de un tratamiento.
RDD, como cuasiexperimento , no requiere aleatorización ex ante y elude las cuestiones éticas de la asignación aleatoria .
Los estudios RDD bien ejecutados pueden generar estimaciones del efecto del tratamiento similares a las estimaciones de estudios aleatorios. ^[dieciséis]

Desventajas

Los efectos estimados sólo son insesgados si la forma funcional de la relación entre el tratamiento y el resultado se modela correctamente. Las advertencias más populares son las relaciones no lineales que se confunden con una discontinuidad.
Contaminación por otros tratamientos. Supongamos que se produce otro tratamiento con el mismo valor de corte de la misma variable de asignación. En ese caso, la discontinuidad medida en la variable de resultado puede atribuirse parcialmente a este otro tratamiento. Por ejemplo, supongamos que un investigador desea estudiar el impacto del acceso legal al alcohol en la salud mental utilizando un diseño de regresión discontinua en la edad mínima legal para beber. El impacto medido podría confundirse con el acceso legal al juego, que puede ocurrir a la misma edad.

Extensiones

RDD difuso

La identificación de los efectos causales depende del supuesto crucial de que efectivamente existe un límite brusco, alrededor del cual hay una discontinuidad en la probabilidad de asignación de 0 a 1. Sin embargo, en la realidad, los límites a menudo no se implementan estrictamente (por ejemplo, se ejercen). discreción para los estudiantes que no alcanzaron el umbral) y, por lo tanto, las estimaciones estarán sesgadas .

A diferencia del diseño de regresión discontinua marcada, un diseño de regresión discontinua difusa (FRDD) no requiere una discontinuidad marcada en la probabilidad de asignación. Aún así, es aplicable siempre que la probabilidad de asignación sea diferente. La intuición detrás de esto está relacionada con la variable instrumental estrategia e intención de tratar . Fuzzy RDD no proporciona una estimación insesgada cuando la cantidad de interés es el efecto proporcional (por ejemplo, eficacia de la vacuna ), pero existen extensiones que sí lo hacen. ^[17]

Diseño de regresión

Cuando la variable de asignación es continua (por ejemplo, ayuda estudiantil) y depende de manera predecible de otra variable observada (por ejemplo, el ingreso familiar), se pueden identificar los efectos del tratamiento utilizando cambios bruscos en la pendiente de la función de tratamiento. Esta técnica fue denominada diseño de regresión retorcida por Nielsen, Sørensen y Taber (2010), aunque citan análisis anteriores similares. ^[18] Escriben: "Este enfoque se asemeja a la idea de la discontinuidad de la regresión. En lugar de una discontinuidad en el nivel de la función estipendio-ingreso, tenemos una discontinuidad en la pendiente de la función". Card et al. proporcionaron fundamentos teóricos rigurosos. (2012) ^[19] y una aplicación empírica de Bockerman et al. (2018). ^[20]

Tenga en cuenta que los puntos de regresión (o regresión retorcida ) también pueden significar un tipo de regresión segmentada , que es un tipo diferente de análisis.

Consideraciones finales

El diseño RD toma la forma de un diseño de investigación cuasiexperimental con una estructura clara que carece de características experimentales aleatorias. Varios aspectos niegan que los diseños del RD tengan en cuenta el status quo. Por ejemplo, los diseños a menudo implican problemas serios que no ofrecen espacio para experimentos aleatorios. Además, el diseño de los experimentos depende de la precisión del proceso de modelado y de la relación entre entradas y salidas.

Ver también

Referencias

^ Thistlethwaite, D.; Campbell, D. (1960). "Análisis de regresión-discontinuidad: una alternativa al experimento ex post facto". Revista de Psicología Educativa . 51 (6): 309–317. doi :10.1037/h0044319. S2CID 13668989.
^ Imbens, G.; Lemieux, T. (2008). "Diseños de discontinuidad de regresión: una guía para la práctica" (PDF) . Revista de Econometría . 142 (2): 615–635. doi :10.1016/j.jeconom.2007.05.001.
^ Chaplin, Duncan D.; Cocinero, Thomas D.; Zurovac, Jelena; Coopersmith, Jared S.; Finucane, Mariel M.; Vollmer, Lauren N.; Morris, Rebecca E. (2018). "La validez interna y externa del diseño de discontinuidad de regresión: un metanálisis de 15 comparaciones dentro del estudio". Revista de análisis y gestión de políticas . 37 (2): 403–429. doi : 10.1002/pam.22051 . ISSN 1520-6688.
^ abcd Lee; Lemieux (2010). "Diseños de discontinuidad de regresión en economía". Revista de Literatura Económica . 48 (2): 281–355. doi :10.1257/jel.48.2.281. S2CID 14166110.
^ Abanico; Gijbels (1996). Modelado polinómico local y sus aplicaciones . Londres: Chapman y Hall. ISBN 978-0-412-98321-4.
^ Portero (2003). "Estimación en el modelo de regresión discontinua" (PDF) . Manuscrito inédito .
^ Duflo (2003). "Abuelas y nietas: pensiones de vejez y asignación dentro del hogar en Sudáfrica". Revisión económica del Banco Mundial . 17 (1): 1–25. doi :10.1093/wber/lhg013. hdl : 10986/17173 .
^ ab carpintero; Dobkin (2011). "La edad mínima legal para beber y la salud pública". Revista de perspectivas económicas . 25 (2): 133-156. doi :10.1257/jep.25.2.133. JSTOR 23049457. PMC 3182479 . PMID 21595328.
^ ab Lee (2008). "Experimentos aleatorios de selección no aleatoria en las elecciones a la Cámara de Representantes de Estados Unidos". Revista de Econometría . 142 (2): 675–697. CiteSeerX 10.1.1.409.5179 . doi :10.1016/j.jeconom.2007.05.004. S2CID 2293046.
^ ab de la Cuesta, B; Imai, K (2016). "Malentendidos sobre el diseño de discontinuidad de regresión en el estudio de elecciones cerradas". Revista Anual de Ciencias Políticas . 19 (1): 375–396. doi : 10.1146/annurev-polisci-032015-010115 .
^ Musgo, BG; Yeaton, WH; Lloyd, JE (2014). "Evaluación de la eficacia de las matemáticas del desarrollo mediante la incorporación de un experimento aleatorio dentro de un diseño de regresión discontinua". Evaluación educativa y análisis de políticas . 36 (2): 170–185. doi :10.3102/0162373713504988. S2CID 123440758.
^ ab McCrary (2008). "Manipulación de la variable corriente en el diseño de discontinuidad de regresión: una prueba de densidad". Revista de Econometría . 142 (2): 698–714. CiteSeerX 10.1.1.395.6501 . doi :10.1016/j.jeconom.2007.05.005.
^ ab Lee; Moretti; Mayordomo (2004). "¿Los votantes afectan o eligen las políticas? Evidencia de la Cámara de Representantes de Estados Unidos". Revista Trimestral de Economía . 119 (3): 807–859. doi :10.1162/0033553041502153.
^ Calónico; Cattáneo; Farrell; Titiunik (2018). "Diseños de discontinuidad de regresión utilizando covariables". arXiv : 1809.03904 [econ.EM].
^ Rubin (1977). "Asignación al tratamiento sobre la base de una covariable". Revista de estadísticas educativas y del comportamiento . 2 (1): 1–26. doi :10.3102/10769986002001001. S2CID 123013161.
^ Musgo, BG; Yeaton, WH; Lloyd, JE (2014). "Evaluación de la eficacia de las matemáticas del desarrollo mediante la incorporación de un experimento aleatorio dentro de un diseño de regresión discontinua". Evaluación educativa y análisis de políticas . 36 (2): 170–185. doi :10.3102/0162373713504988. S2CID 123440758.
^ Mukherjee, Abhiroop; Panayotov, George; Sen, Rik; Dutta, Harsha; Ghosh, Pulak (2022). "Medición de la eficacia de la vacuna a partir de conjuntos de datos de salud pública limitados: marco y estimaciones de la segunda ola de COVID en la India". Avances científicos . 8 (18): eabn4274. Código Bib : 2022SciA....8N4274M. doi :10.1126/sciadv.abn4274. PMC 9075799 . PMID 35522748.
^ Nielsen, SA; Sorensen, T.; Taber, CR (2010). "Estimación del efecto de la ayuda estudiantil en la matrícula universitaria: evidencia de una reforma de la política de subvenciones del gobierno". Revista económica estadounidense: política económica . 2 (2): 185–215. doi :10.1257/pol.2.2.185. hdl : 10419/35588 . JSTOR 25760068.
^ Tarjeta, David; Lee, David S.; Pei, Zhuan; Weber, Andrea (2012). "Reglas de política no lineal y la identificación y estimación de efectos causales en un diseño de regresión generalizada". Documento de trabajo NBER n.º W18564 . doi : 10.3386/w18564 . SSRN 2179402.
^ Bockerman, Petri; Kanninen, Ohto; Suoniemi, Ilpo (2018). "Un problema que te enferma: el efecto de la paga por enfermedad en la ausencia". Revista de Econometría Aplicada . 33 (4): 568–579. doi : 10.1002/jae.2620 .

Otras lecturas

Angrist, JD ; Pischke, J.-S. (2008). "Ponerse un poco nervioso: diseños de discontinuidad de regresión". Econometría mayoritariamente inofensiva: la compañera de un empirista . Prensa de la Universidad de Princeton. págs. 251–268. ISBN 978-0-691-12035-5.
Cattaneo, Matías D.; Titiunik, Rocío (2022). "Diseños de discontinuidad de regresión". Revista Anual de Economía . 14 : 821–851. doi :10.1146/annurev-economics-051520-021409. S2CID 125763727.
Cattaneo, Matías D.; Idrobo, Nicolás; Titiunik, Rocío (2024). Una introducción práctica a los diseños de discontinuidades de regresión: extensiones . Prensa de la Universidad de Cambridge.
Cocinero, Thomas D. (2008). "'Esperando que llegue la vida': una historia del diseño de regresión-discontinuidad en psicología, estadística y economía". Journal of Econometrics . 142 (2): 636–654. doi :10.1016/j.jeconom.2007.05.002.
Imbens, Guido W.; Wooldridge, Jeffrey M. (2009). "Desarrollos recientes en la econometría de la evaluación de programas". Revista de Literatura Económica . 47 (1): 5–86. doi :10.1257/jel.47.1.5.
Maas, Iris L.; Nolte, Sandra; Walter, Otto B.; Berger, Thomas; Hautzinger, Martín (2017). "El diseño de regresión discontinua demostró ser una alternativa válida a un ensayo controlado aleatorio para estimar los efectos del tratamiento". Revista de epidemiología clínica . 82 : 94-102. doi :10.1016/j.jclinepi.2016.11.008. PMID 27865902.

enlaces externos

Análisis de regresión-discontinuidad en la base de conocimientos de métodos de investigación