En estadística , econometría , ciencias políticas , epidemiología y disciplinas relacionadas, un diseño de regresión discontinua (RDD) es un diseño cuasiexperimental pretest-postest que tiene como objetivo determinar los efectos causales de las intervenciones asignando un punto de corte o umbral por encima o por debajo del cual una Se asigna la intervención. Al comparar las observaciones que se encuentran estrechamente a ambos lados del umbral, es posible estimar el efecto promedio del tratamiento en entornos en los que la aleatorización es inviable. Sin embargo, sigue siendo imposible hacer una verdadera inferencia causal con este método solo, ya que no rechaza automáticamente los efectos causales de ninguna variable potencial de confusión. Aplicado por primera vez por Donald Thistlethwaite y Donald Campbell (1960) a la evaluación de programas de becas, [1] el RDD se ha vuelto cada vez más popular en los últimos años. [2] Las comparaciones de estudios recientes de ensayos controlados aleatorios (ECA) y RDD han demostrado empíricamente la validez interna del diseño. [3]
La intuición detrás del RDD queda bien ilustrada mediante la evaluación de becas basadas en el mérito. El principal problema al estimar el efecto causal de tal intervención es la homogeneidad del desempeño con respecto a la asignación del tratamiento (por ejemplo, una beca). Dado que los estudiantes de alto rendimiento tienen más probabilidades de recibir la beca por mérito y continuar con un buen desempeño al mismo tiempo, comparar los resultados de los premiados y los no beneficiarios llevaría a un sesgo hacia arriba en las estimaciones. Incluso si la beca no mejorara las calificaciones en absoluto, los beneficiarios habrían obtenido mejores resultados que los no beneficiarios, simplemente porque las becas se otorgaron a estudiantes que antes tenían un buen desempeño.
A pesar de la ausencia de un diseño experimental , un RDD puede explotar características exógenas de la intervención para provocar efectos causales . Si todos los estudiantes por encima de un grado determinado (por ejemplo, el 80%) reciben la beca, es posible obtener el efecto del tratamiento local comparando a los estudiantes alrededor del límite del 80%. La intuición aquí es que un estudiante con una puntuación del 79% probablemente sea muy similar a un estudiante con una puntuación del 81%, dado el umbral predefinido del 80%. Sin embargo, un estudiante recibirá la beca mientras que el otro no. Comparar el resultado del adjudicatario (grupo de tratamiento) con el resultado contrafactual del no receptor (grupo de control) generará, por lo tanto, el efecto del tratamiento local.
Los dos enfoques más comunes para la estimación utilizando un RDD son el no paramétrico y el paramétrico (normalmente regresión polinómica ).
El método no paramétrico más común utilizado en el contexto RDD es la regresión lineal local. Este es de la forma:
donde es el límite de tratamiento y es una variable binaria igual a uno si . Dejando ser el ancho de banda de datos utilizados, tenemos . Diferentes pendientes e interceptos ajustan los datos a cada lado del límite. Normalmente se utiliza un núcleo rectangular (sin ponderación) o un núcleo triangular. El núcleo rectangular tiene una interpretación más sencilla que los núcleos sofisticados que producen pocas ganancias de eficiencia. [4]
El principal beneficio de utilizar métodos no paramétricos en un RDD es que proporcionan estimaciones basadas en datos más cercanos al límite, lo cual resulta intuitivamente atractivo. Esto reduce algunos sesgos que pueden resultar del uso de datos más alejados del límite para estimar la discontinuidad en el límite. [4] Más formalmente, se prefieren las regresiones lineales locales porque tienen mejores propiedades de sesgo [5] y tienen una mejor convergencia. [6] Sin embargo, el uso de ambos tipos de estimación, si es factible, es una forma útil de argumentar que los resultados estimados no dependen demasiado del enfoque particular adoptado.
Un ejemplo de estimación paramétrica es:
dónde
y es el límite de tratamiento. Tenga en cuenta que la parte polinómica se puede acortar o ampliar según las necesidades.
El diseño de discontinuidad de regresión requiere que todas las variables potencialmente relevantes, además de la variable de tratamiento y la variable de resultado, sean continuas en el punto donde ocurren las discontinuidades del tratamiento y de los resultados. Una condición suficiente, aunque no necesaria, [10] es que la asignación del tratamiento sea "tan buena como aleatoria" en el umbral del tratamiento. [9] Si esto es así, entonces garantiza que aquellos que apenas recibieron tratamiento sean comparables con aquellos que apenas no recibieron tratamiento, ya que el estado del tratamiento es efectivamente aleatorio.
La asignación de tratamiento en el umbral puede ser "tan buena como aleatoria" si hay aleatoriedad en la variable de asignación y los agentes considerados (individuos, empresas, etc.) no pueden manipular perfectamente su estado de tratamiento. Por ejemplo, supongamos que el tratamiento es aprobar un examen, donde se requiere una calificación del 50%. En este caso, este ejemplo es un diseño de discontinuidad de regresión válido siempre que las calificaciones sean algo aleatorias, debido ya sea a la aleatoriedad de las calificaciones o a la aleatoriedad del desempeño de los estudiantes.
Los estudiantes tampoco deben poder manipular perfectamente su calificación para determinar perfectamente su estado de tratamiento. Dos ejemplos incluyen que los estudiantes puedan convencer a los maestros para que "los aprueben", o que se les permita a los estudiantes volver a tomar el examen hasta que lo aprueben. En el primer caso, aquellos estudiantes que apenas fracasan pero son capaces de conseguir un "pase de misericordia" pueden diferir de aquellos que apenas fracasan pero no pueden conseguir un "pase de misericordia". Esto conduce a un sesgo de selección , ya que los grupos de tratamiento y control ahora difieren. En este último caso, algunos estudiantes pueden decidir volver a realizar el examen y suspenderlo una vez que lo aprueben. Esto también conduce a un sesgo de selección, ya que sólo algunos estudiantes decidirán volver a realizar el examen. [4]
Es imposible probar definitivamente la validez si los agentes pueden determinar perfectamente el estado de su tratamiento. Sin embargo, algunas pruebas pueden proporcionar evidencia que respalde o descarte la validez del diseño de regresión discontinua.
McCrary (2008) sugirió examinar la densidad de observaciones de la variable de asignación. [12] Supongamos que hay una discontinuidad en la densidad de la variable de asignación en el umbral de tratamiento. En este caso, esto puede sugerir que algunos agentes pudieron manipular perfectamente el estado de su tratamiento.
Por ejemplo, si varios estudiantes logran obtener un "pase de misericordia", entonces habrá más estudiantes que apenas aprobaron el examen que los que apenas reprobaron. De manera similar, si a los estudiantes se les permite volver a tomar el examen hasta que lo aprueben, habrá un resultado similar. En ambos casos, esto probablemente se mostrará cuando se examine la densidad de las calificaciones de los exámenes. "Aprovechar el sistema" de esta manera podría sesgar la estimación del efecto del tratamiento.
Dado que la validez del diseño de discontinuidad de regresión depende de que aquellos que apenas recibieron tratamiento sean los mismos que aquellos que apenas recibieron tratamiento, tiene sentido examinar si estos grupos se basan de manera similar en variables observables. Para el ejemplo anterior, se podría comprobar si aquellos que apenas aprobaron tienen características diferentes (demográficas, ingresos familiares, etc.) que aquellos que apenas reprobaron. Aunque algunas variables pueden diferir para los dos grupos según el azar, la mayoría de estas variables deberían ser iguales. [13]
De manera similar a la continuidad de las variables observables, uno esperaría que hubiera continuidad en las variables predeterminadas en el punto de corte del tratamiento. Dado que estas variables se determinaron antes de la decisión del tratamiento, el estado del tratamiento no debería afectarlas. Consideremos el ejemplo anterior de las becas basadas en el mérito. Si el resultado de interés son las calificaciones futuras, entonces no esperaríamos que la beca afecte las calificaciones anteriores. Si hay una discontinuidad en variables predeterminadas en el punto de corte del tratamiento, entonces esto pone en duda la validez del diseño de discontinuidad de regresión.
Si hay discontinuidades presentes en otros puntos de la variable de asignación, donde no se esperan, entonces esto puede hacer que el diseño de discontinuidad de regresión sea sospechoso. Consideremos el ejemplo de Carpenter y Dobkin (2011), quienes estudiaron el efecto del acceso legal al alcohol en Estados Unidos. [8] A medida que aumenta el acceso al alcohol a los 21 años, esto conduce a cambios en diversos resultados, como las tasas de mortalidad y morbilidad. Si las tasas de mortalidad y morbilidad también aumentan de manera discontinua en otras edades, entonces se cuestiona la interpretación de la discontinuidad a los 21 años.
Si las estimaciones de los parámetros son sensibles a la eliminación o adición de covariables al modelo, esto puede generar dudas sobre la validez del diseño de regresión discontinua. Un cambio significativo puede sugerir que aquellos que apenas recibieron tratamiento difieren en estas covariables de aquellos que apenas no recibieron tratamiento. La inclusión de covariables eliminaría parte de este sesgo. Si hay una gran cantidad de sesgo presente y las covariables explican una cantidad significativa de esto, entonces su inclusión o exclusión cambiaría significativamente la estimación del parámetro. [4]
Trabajos recientes han demostrado cómo agregar covariables, bajo qué condiciones es válido hacerlo y el potencial para una mayor precisión. [14]
La identificación de los efectos causales depende del supuesto crucial de que efectivamente existe un límite brusco, alrededor del cual hay una discontinuidad en la probabilidad de asignación de 0 a 1. Sin embargo, en la realidad, los límites a menudo no se implementan estrictamente (por ejemplo, se ejercen). discreción para los estudiantes que no alcanzaron el umbral) y, por lo tanto, las estimaciones estarán sesgadas .
A diferencia del diseño de regresión discontinua marcada, un diseño de regresión discontinua difusa (FRDD) no requiere una discontinuidad marcada en la probabilidad de asignación. Aún así, es aplicable siempre que la probabilidad de asignación sea diferente. La intuición detrás de esto está relacionada con la variable instrumental estrategia e intención de tratar . Fuzzy RDD no proporciona una estimación insesgada cuando la cantidad de interés es el efecto proporcional (por ejemplo, eficacia de la vacuna ), pero existen extensiones que sí lo hacen. [17]
Cuando la variable de asignación es continua (por ejemplo, ayuda estudiantil) y depende de manera predecible de otra variable observada (por ejemplo, el ingreso familiar), se pueden identificar los efectos del tratamiento utilizando cambios bruscos en la pendiente de la función de tratamiento. Esta técnica fue denominada diseño de regresión retorcida por Nielsen, Sørensen y Taber (2010), aunque citan análisis anteriores similares. [18] Escriben: "Este enfoque se asemeja a la idea de la discontinuidad de la regresión. En lugar de una discontinuidad en el nivel de la función estipendio-ingreso, tenemos una discontinuidad en la pendiente de la función". Card et al. proporcionaron fundamentos teóricos rigurosos. (2012) [19] y una aplicación empírica de Bockerman et al. (2018). [20]
Tenga en cuenta que los puntos de regresión (o regresión retorcida ) también pueden significar un tipo de regresión segmentada , que es un tipo diferente de análisis.
Consideraciones finales
El diseño RD toma la forma de un diseño de investigación cuasiexperimental con una estructura clara que carece de características experimentales aleatorias. Varios aspectos niegan que los diseños del RD tengan en cuenta el status quo. Por ejemplo, los diseños a menudo implican problemas serios que no ofrecen espacio para experimentos aleatorios. Además, el diseño de los experimentos depende de la precisión del proceso de modelado y de la relación entre entradas y salidas.