stringtranslate.com

Diseño de regresión discontinua

En estadística , econometría , ciencia política , epidemiología y disciplinas relacionadas, un diseño de regresión discontinua (RDD) es un diseño pretest-postest cuasi-experimental que tiene como objetivo determinar los efectos causales de las intervenciones mediante la asignación de un punto de corte o umbral por encima o por debajo del cual se asigna una intervención. Al comparar las observaciones que se encuentran cerca de ambos lados del umbral, es posible estimar el efecto promedio del tratamiento en entornos en los que la aleatorización no es factible. Sin embargo, sigue siendo imposible hacer una verdadera inferencia causal con este método solo, ya que no rechaza automáticamente los efectos causales por cualquier variable de confusión potencial. Aplicado por primera vez por Donald Thistlethwaite y Donald Campbell (1960) a la evaluación de programas de becas, [1] el RDD se ha vuelto cada vez más popular en los últimos años. [2] Las comparaciones de estudios recientes de ensayos controlados aleatorios (ECA) y RDD han demostrado empíricamente la validez interna del diseño. [3]

Ejemplo

La intuición que sustenta el RDD se ilustra bien con la evaluación de las becas basadas en el mérito. El principal problema con la estimación del efecto causal de una intervención de este tipo es la homogeneidad del desempeño con respecto a la asignación del tratamiento (por ejemplo, la concesión de una beca). Dado que los estudiantes con un alto rendimiento tienen más probabilidades de recibir la beca basada en el mérito y seguir teniendo un buen rendimiento al mismo tiempo, la comparación de los resultados de los beneficiarios y los no beneficiarios conduciría a un sesgo al alza de las estimaciones. Incluso si la beca no mejorara en absoluto las calificaciones, los beneficiarios habrían tenido un mejor rendimiento que los no beneficiarios, simplemente porque las becas se otorgaron a estudiantes que tenían un buen rendimiento antes.

A pesar de la ausencia de un diseño experimental , un RDD puede explotar características exógenas de la intervención para obtener efectos causales . Si todos los estudiantes por encima de una nota dada (por ejemplo, el 80 %) reciben la beca, es posible obtener el efecto local del tratamiento comparando a los estudiantes que se encuentran alrededor del umbral del 80 %. La intuición aquí es que un estudiante que obtiene un puntaje del 79 % es probablemente muy similar a un estudiante que obtiene un puntaje del 81 %, dado el umbral predefinido del 80 %. Sin embargo, un estudiante recibirá la beca mientras que el otro no. Por lo tanto, comparar el resultado del beneficiario (grupo de tratamiento) con el resultado contrafactual del no beneficiario (grupo de control) proporcionará el efecto local del tratamiento.

Metodología

Los dos enfoques más comunes para la estimación utilizando un RDD son el no paramétrico y el paramétrico (normalmente la regresión polinomial ).

Estimación no paramétrica

El método no paramétrico más común que se utiliza en el contexto de RDD es una regresión lineal local. Esta tiene la forma:

donde es el valor de corte del tratamiento y es una variable binaria igual a uno si . Si , es el ancho de banda de los datos utilizados, tenemos . Diferentes pendientes e intersecciones se ajustan a los datos en ambos lados del valor de corte. Normalmente se utiliza un kernel rectangular (sin ponderación) o un kernel triangular. El kernel rectangular tiene una interpretación más sencilla que los kernels sofisticados que producen pocas ganancias de eficiencia. [4]

El principal beneficio de utilizar métodos no paramétricos en un RDD es que proporcionan estimaciones basadas en datos más cercanos al punto de corte, lo que resulta intuitivamente atractivo. Esto reduce parte del sesgo que puede resultar del uso de datos más alejados del punto de corte para estimar la discontinuidad en el punto de corte. [4] De manera más formal, se prefieren las regresiones lineales locales porque tienen mejores propiedades de sesgo [5] y una mejor convergencia. [6] Sin embargo, el uso de ambos tipos de estimación, si es factible, es una forma útil de argumentar que los resultados estimados no dependen demasiado del enfoque particular adoptado.

Estimación paramétrica

Un ejemplo de estimación paramétrica es:

dónde

y es el punto de corte del tratamiento. Tenga en cuenta que la parte polinómica se puede acortar o extender según las necesidades.

Otros ejemplos

Supuestos obligatorios

El diseño de regresión discontinua requiere que todas las variables potencialmente relevantes, además de la variable de tratamiento y la variable de resultado, sean continuas en el punto donde se producen las discontinuidades de tratamiento y resultado. Una condición suficiente, aunque no necesaria, [10] es que la asignación del tratamiento sea "casi aleatoria" en el umbral para el tratamiento. [9] Si esto se cumple, entonces se garantiza que aquellos que apenas recibieron tratamiento sean comparables con aquellos que apenas no recibieron tratamiento, ya que el estado del tratamiento es efectivamente aleatorio.

La asignación de un tratamiento en el umbral puede ser "casi aleatoria" si hay aleatoriedad en la variable de asignación y los agentes considerados (individuos, empresas, etc.) no pueden manipular perfectamente su estatus de tratamiento. Por ejemplo, supongamos que el tratamiento consiste en aprobar un examen, en el que se requiere una nota del 50%. En este caso, este ejemplo es un diseño de regresión discontinua válido siempre que las notas sean algo aleatorias, ya sea por la aleatoriedad de la calificación o por la aleatoriedad del rendimiento de los estudiantes.

Los estudiantes tampoco deben ser capaces de manipular perfectamente su calificación para determinar perfectamente su estatus de tratamiento. Dos ejemplos incluyen que los estudiantes puedan convencer a los maestros para que los "aprueben por gracia" o que se les permita volver a tomar el examen hasta que lo aprueben. En el primer caso, aquellos estudiantes que apenas suspenden pero pueden obtener un "aprobado por gracia" pueden ser diferentes de aquellos que apenas suspenden pero no pueden obtener un "aprobado por gracia". Esto conduce a un sesgo de selección , ya que los grupos de tratamiento y control ahora son diferentes. En el último caso, algunos estudiantes pueden decidir volver a tomar el examen, deteniéndose una vez que lo aprueben. Esto también conduce a un sesgo de selección , ya que solo algunos estudiantes decidirán volver a tomar el examen. [4]

Poniendo a prueba la validez de los supuestos

Es imposible probar definitivamente la validez si los agentes pueden determinar perfectamente su estado de tratamiento. Sin embargo, algunas pruebas pueden proporcionar evidencia que apoye o descarte la validez del diseño de regresión discontinua.

Prueba de densidad

Prueba de densidad de McCrary (2008) [12] sobre datos de Lee, Moretti y Butler (2004). [13]

McCrary (2008) sugirió examinar la densidad de observaciones de la variable de asignación. [12] Supongamos que hay una discontinuidad en la densidad de la variable de asignación en el umbral del tratamiento. En este caso, esto puede sugerir que algunos agentes pudieron manipular perfectamente su estado de tratamiento.

Por ejemplo, si varios estudiantes pueden obtener un "pase de gracia", entonces habrá más estudiantes que apenas aprobaron el examen que los que apenas reprobaron. De manera similar, si se permite a los estudiantes volver a tomar el examen hasta que aprueben, entonces el resultado será similar. En ambos casos, esto probablemente se pondrá de manifiesto cuando se examine la densidad de calificaciones de los exámenes. "Jugar con el sistema" de esta manera podría sesgar la estimación del efecto del tratamiento.

Continuidad de las variables observables

Dado que la validez del diseño de regresión discontinua depende de que quienes apenas recibieron tratamiento sean los mismos que quienes apenas no recibieron tratamiento, tiene sentido examinar si estos grupos son similares en función de variables observables. En el ejemplo anterior, se podría comprobar si quienes apenas aprobaron tienen características diferentes (demografía, ingresos familiares, etc.) que quienes apenas reprobaron. Aunque algunas variables pueden diferir para los dos grupos en función del azar, la mayoría de estas variables deberían ser las mismas. [13]

Pruebas de falsificación

Variables predeterminadas

De manera similar a la continuidad de las variables observables, se esperaría que hubiera continuidad en las variables predeterminadas en el punto de corte del tratamiento. Dado que estas variables se determinaron antes de la decisión del tratamiento, el estado del tratamiento no debería afectarlas. Considere el ejemplo anterior de la beca basada en el mérito. Si el resultado de interés son las calificaciones futuras, entonces no esperaríamos que la beca afectara las calificaciones anteriores. Si hay una discontinuidad en las variables predeterminadas en el punto de corte del tratamiento, esto pone en duda la validez del diseño de regresión discontinua.

Otras discontinuidades

Si hay discontinuidades en otros puntos de la variable de asignación, donde no se esperan, entonces esto puede hacer que el diseño de regresión discontinua sea sospechoso. Considere el ejemplo de Carpenter y Dobkin (2011) que estudiaron el efecto del acceso legal al alcohol en los Estados Unidos. [8] A medida que el acceso al alcohol aumenta a la edad de 21 años, esto conduce a cambios en varios resultados, como las tasas de mortalidad y morbilidad. Si las tasas de mortalidad y morbilidad también aumentan de manera discontinua a otras edades, entonces pone en tela de juicio la interpretación de la discontinuidad a la edad de 21 años.

Inclusión y exclusión de covariables

Si las estimaciones de los parámetros son sensibles a la eliminación o adición de covariables al modelo, esto puede generar dudas sobre la validez del diseño de regresión discontinua. Un cambio significativo puede sugerir que quienes apenas recibieron tratamiento difieren en estas covariables de quienes apenas no recibieron tratamiento. La inclusión de covariables eliminaría parte de este sesgo. Si hay una gran cantidad de sesgo y las covariables explican una cantidad significativa de éste, entonces su inclusión o exclusión cambiaría significativamente la estimación de los parámetros. [4]

Trabajos recientes han demostrado cómo agregar covariables, bajo qué condiciones es válido hacerlo y el potencial para una mayor precisión. [14]

Ventajas

Desventajas

Extensiones

RDD difuso

La identificación de los efectos causales depende del supuesto crucial de que efectivamente existe un límite claro, alrededor del cual hay una discontinuidad en la probabilidad de asignación de 0 a 1. En la realidad, sin embargo, los límites a menudo no se implementan estrictamente (por ejemplo, se ejerce discreción para los estudiantes que apenas no lograron pasar el umbral) y, por lo tanto, las estimaciones estarán sesgadas .

A diferencia del diseño de regresión discontinua aguda, un diseño de regresión discontinua difusa (RDD) no requiere una discontinuidad aguda en la probabilidad de asignación. Aun así, es aplicable siempre que la probabilidad de asignación sea diferente. La intuición detrás de esto está relacionada con la variable instrumental estrategia e intención de tratar . El RDD difuso no proporciona una estimación imparcial cuando la cantidad de interés es el efecto proporcional (por ejemplo, efectividad de la vacuna ), pero existen extensiones que sí lo hacen. [17]

Diseño de regresión de torceduras

Cuando la variable de asignación es continua (por ejemplo, la ayuda estudiantil) y depende previsiblemente de otra variable observada (por ejemplo, los ingresos familiares), se pueden identificar los efectos del tratamiento utilizando cambios bruscos en la pendiente de la función de tratamiento. Esta técnica fue acuñada por Nielsen, Sørensen y Taber (2010) como diseño de regresión kink , aunque citan análisis anteriores similares. [18] Escriben: "Este enfoque se asemeja a la idea de discontinuidad de la regresión. En lugar de una discontinuidad en el nivel de la función estipendio-ingreso, tenemos una discontinuidad en la pendiente de la función". Card et al. (2012) [19] proporcionaron fundamentos teóricos rigurosos y Bockerman et al. (2018) una aplicación empírica. [20]

Tenga en cuenta que los giros de regresión (o regresión con giros ) también pueden significar un tipo de regresión segmentada , que es un tipo diferente de análisis.

Consideraciones finales

El diseño de investigación experimental adopta la forma de un diseño de investigación cuasiexperimental con una estructura clara que carece de características experimentales aleatorias. Varios aspectos niegan a los diseños de investigación experimental la posibilidad de mantener el status quo. Por ejemplo, los diseños a menudo implican cuestiones serias que no dejan lugar a experimentos aleatorios. Además, el diseño de los experimentos depende de la precisión del proceso de modelado y de la relación entre las entradas y las salidas.

Véase también

Referencias

  1. ^ Thistlethwaite, D.; Campbell, D. (1960). "Análisis de regresión discontinua: una alternativa al experimento ex post facto". Revista de psicología educativa . 51 (6): 309–317. doi :10.1037/h0044319. S2CID  13668989.
  2. ^ Imbens, G.; Lemieux, T. (2008). "Diseños de regresión discontinua: una guía para la práctica" (PDF) . Revista de econometría . 142 (2): 615–635. doi :10.1016/j.jeconom.2007.05.001.
  3. ^ Chaplin, Duncan D.; Cook, Thomas D.; Zurovac, Jelena; Coopersmith, Jared S.; Finucane, Mariel M.; Vollmer, Lauren N.; Morris, Rebecca E. (2018). "La validez interna y externa del diseño de regresión discontinua: un metaanálisis de 15 comparaciones dentro del estudio". Revista de análisis y gestión de políticas . 37 (2): 403–429. doi : 10.1002/pam.22051 . ISSN  1520-6688.
  4. ^ abcd Lee; Lemieux (2010). "Diseños de regresión discontinua en economía". Revista de literatura económica . 48 (2): 281–355. doi :10.1257/jel.48.2.281. S2CID  14166110.
  5. ^ Fan; Gijbels (1996). Modelado polinomial local y sus aplicaciones . Londres: Chapman and Hall. ISBN 978-0-412-98321-4.
  6. ^ Porter (2003). "Estimación en el modelo de regresión discontinua" (PDF) . Manuscrito inédito .
  7. ^ Duflo (2003). "Abuelas y nietas: pensiones de vejez y asignación intrafamiliar en Sudáfrica". Revista Económica del Banco Mundial . 17 (1): 1–25. doi :10.1093/wber/lhg013. hdl : 10986/17173 .
  8. ^ ab Carpenter; Dobkin (2011). "La edad mínima legal para consumir alcohol y la salud pública". Revista de perspectivas económicas . 25 (2): 133–156. doi :10.1257/jep.25.2.133. JSTOR  23049457. PMC 3182479. PMID  21595328 . 
  9. ^ ab Lee (2008). "Experimentos aleatorios a partir de una selección no aleatoria en las elecciones a la Cámara de Representantes de Estados Unidos". Revista de Econometría . 142 (2): 675–697. CiteSeerX 10.1.1.409.5179 . doi :10.1016/j.jeconom.2007.05.004. S2CID  2293046. 
  10. ^ ab de la Cuesta, B; Imai, K (2016). "Malentendidos sobre el diseño de regresión discontinua en el estudio de elecciones reñidas". Revista Anual de Ciencias Políticas . 19 (1): 375–396. doi : 10.1146/annurev-polisci-032015-010115 .
  11. ^ Moss, BG; Yeaton, WH; Lloyd, JE (2014). "Evaluación de la eficacia de las matemáticas de desarrollo mediante la incorporación de un experimento aleatorio dentro de un diseño de regresión discontinua". Evaluación educativa y análisis de políticas . 36 (2): 170–185. doi :10.3102/0162373713504988. S2CID  123440758.
  12. ^ ab McCrary (2008). "Manipulación de la variable móvil en el diseño de regresión discontinua: una prueba de densidad". Journal of Econometrics . 142 (2): 698–714. CiteSeerX 10.1.1.395.6501 . doi :10.1016/j.jeconom.2007.05.005. 
  13. ^ ab Lee; Moretti; Butler (2004). "¿Los votantes afectan o eligen las políticas? Evidencia de la Cámara de Representantes de Estados Unidos". Quarterly Journal of Economics . 119 (3): 807–859. doi :10.1162/0033553041502153.
  14. ^ Calonico; Cattaneo; Farrell; Titiunik (2018). "Diseños de regresión discontinua utilizando covariables". arXiv : 1809.03904 [econ.EM].
  15. ^ Rubin (1977). "Asignación al tratamiento en función de una covariable". Revista de estadística educativa y conductual . 2 (1): 1–26. doi :10.3102/10769986002001001. S2CID  123013161.
  16. ^ Moss, BG; Yeaton, WH; Lloyd, JE (2014). "Evaluación de la eficacia de las matemáticas de desarrollo mediante la incorporación de un experimento aleatorio dentro de un diseño de regresión discontinua". Evaluación educativa y análisis de políticas . 36 (2): 170–185. doi :10.3102/0162373713504988. S2CID  123440758.
  17. ^ Mukherjee, Abhiroop; Panayotov, George; Sen, Rik; Dutta, Harsha; Ghosh, Pulak (2022). "Medición de la eficacia de las vacunas a partir de conjuntos de datos de salud pública limitados: marco y estimaciones de la segunda ola de COVID en la India". Science Advances . 8 (18): eabn4274. Bibcode :2022SciA....8N4274M. doi :10.1126/sciadv.abn4274. PMC 9075799 . PMID  35522748. 
  18. ^ Nielsen, HS; Sørensen, T.; Taber, CR (2010). "Estimación del efecto de la ayuda estudiantil en la matriculación universitaria: evidencia de una reforma de la política de subvenciones del gobierno". American Economic Journal: Economic Policy . 2 (2): 185–215. doi :10.1257/pol.2.2.185. hdl : 10419/35588 . JSTOR  25760068.
  19. ^ Card, David; Lee, David S.; Pei, Zhuan; Weber, Andrea (2012). "Reglas de política no lineales y la identificación y estimación de efectos causales en un diseño de regresión generalizada". Documento de trabajo del NBER n.º W18564 . doi : 10.3386/w18564 . SSRN  2179402.
  20. ^ Bockerman, Petri; Kanninen, Ohto; Suoniemi, Ilpo (2018). "Un problema que te enferma: el efecto de la paga por enfermedad en la ausencia". Revista de Econometría Aplicada . 33 (4): 568–579. doi : 10.1002/jae.2620 .

Lectura adicional

Enlaces externos