En el análisis estadístico de datos observacionales , el emparejamiento por puntuación de propensión ( PSM ) es una técnica de emparejamiento estadístico que intenta estimar el efecto de un tratamiento, política u otra intervención teniendo en cuenta las covariables que predicen recibir el tratamiento. PSM intenta reducir el sesgo debido a las variables de confusión que podrían encontrarse en una estimación del efecto del tratamiento obtenida simplemente comparando los resultados entre las unidades que recibieron el tratamiento versus aquellas que no lo recibieron . Paul R. Rosenbaum y Donald Rubin introdujeron la técnica en 1983. [1]
La posibilidad de sesgo surge porque una diferencia en el resultado del tratamiento (como el efecto promedio del tratamiento ) entre los grupos tratados y no tratados puede ser causada por un factor que predice el tratamiento en lugar del tratamiento en sí. En los experimentos aleatorios , la aleatorización permite una estimación imparcial de los efectos del tratamiento; Para cada covariable, la aleatorización implica que los grupos de tratamiento estarán equilibrados en promedio, según la ley de los grandes números . Desafortunadamente, en los estudios observacionales, la asignación de tratamientos a los sujetos de investigación no suele ser aleatoria. El emparejamiento intenta reducir el sesgo de asignación de tratamientos e imitar la aleatorización, creando una muestra de unidades que recibieron el tratamiento que sea comparable en todas las covariables observadas con una muestra de unidades que no recibieron el tratamiento.
La "propensión" describe la probabilidad de que una unidad haya sido tratada, dados sus valores de covariables. Cuanto más fuerte sea la confusión del tratamiento y las covariables y, por tanto, cuanto más fuerte sea el sesgo en el análisis del efecto del tratamiento ingenuo, mejor predicen las covariables si una unidad recibe tratamiento o no. Al tener unidades con puntuaciones de propensión similares tanto en el tratamiento como en el control, se reduce dicha confusión.
Por ejemplo, a uno le puede interesar conocer las consecuencias de fumar . Se requiere un estudio observacional ya que no es ético asignar aleatoriamente a personas al tratamiento de "tabaquismo". El efecto del tratamiento estimado simplemente comparando a los que fumaban con los que no fumaban estaría sesgado por cualquier factor que prediga el tabaquismo (p. ej., sexo y edad). PSM intenta controlar estos sesgos haciendo que los grupos que reciben tratamiento y los que no lo reciben sean comparables con respecto a las variables de control.
PSM es para casos de inferencia causal y sesgo de confusión en entornos no experimentales en los que: (i) pocas unidades en el grupo de comparación sin tratamiento son comparables a las unidades de tratamiento; y (ii) seleccionar un subconjunto de unidades de comparación similar a la unidad de tratamiento es difícil porque las unidades deben compararse a través de un conjunto de características previas al tratamiento de alta dimensión. [ cita necesaria ]
En el emparejamiento normal, las características únicas que distinguen a los grupos de tratamiento y de control se emparejan en un intento de hacer que los grupos sean más parecidos. Pero si los dos grupos no tienen una superposición sustancial, entonces se puede introducir un error sustancial. Por ejemplo, si sólo se comparan los peores casos del grupo de "comparación" no tratado con sólo los mejores casos del grupo de tratamiento , el resultado puede ser una regresión hacia la media , lo que puede hacer que el grupo de comparación parezca mejor o peor que la realidad. [ cita necesaria ]
PSM emplea una probabilidad predicha de pertenencia a un grupo (por ejemplo, grupo de tratamiento versus grupo de control) basada en predictores observados, generalmente obtenidos a partir de regresión logística , para crear un grupo contrafactual . Las puntuaciones de propensión se pueden utilizar para el emparejamiento o como covariables , solas o con otras variables o covariables de emparejamiento.
1. Estimar puntuaciones de propensión, por ejemplo, con regresión logística :
2. Relacione a cada participante con uno o más no participantes según su puntuación de propensión, utilizando uno de estos métodos:
3. Verificar que las covariables estén equilibradas entre los grupos de tratamiento y de comparación dentro de los estratos de la puntuación de propensión.
4. Estimar los efectos basándose en una nueva muestra.
El caso básico [1] es el de dos tratamientos (numerados 1 y 0), con N sujetos con variables aleatorias independientes e idénticamente distribuidas . Cada sujeto respondería al tratamiento con y al control con . La cantidad a estimar es el efecto promedio del tratamiento : . La variable indica si el sujeto recibió tratamiento ( ) o control ( ). Sea un vector de mediciones observadas previas al tratamiento (o covariables) para el iésimo sujeto. Las observaciones de se realizan antes de la asignación del tratamiento, pero las características de pueden no incluir todas (o algunas) de las utilizadas para decidir la asignación del tratamiento. Se supone que la numeración de las unidades (es decir: i = 1, ..., N ) no contiene ninguna información más allá de la contenida en . Las siguientes secciones omitirán el índice i mientras aún analizan el comportamiento estocástico de algún tema.
Supongamos que algún sujeto tenga un vector de covariables X (es decir, condicionalmente sin confusión) y algunos resultados potenciales r 0 y r 1 bajo control y tratamiento, respectivamente. Se dice que la asignación del tratamiento es totalmente ignorable si los resultados potenciales son independientes del tratamiento ( Z ) y están condicionados a las variables de fondo X . Esto se puede escribir de forma compacta como
donde denota independencia estadística . [1]
Una puntuación de equilibrio b ( X ) es una función de las covariables observadas X tal que la distribución condicional de X dada b ( X ) es la misma para las unidades tratadas ( Z = 1) y de control ( Z = 0):
La función más trivial es .
Una puntuación de propensión es la probabilidad de que una unidad (p. ej., persona, aula, escuela) sea asignada a un tratamiento particular dado un conjunto de covariables observadas. Las puntuaciones de propensión se utilizan para reducir la confusión equiparando grupos en función de estas covariables.
Supongamos que tenemos un indicador de tratamiento binario Z , una variable de respuesta r y covariables observadas de fondo X. La puntuación de propensión se define como la probabilidad condicional de tratamiento dadas las variables de fondo:
En el contexto de la inferencia causal y la metodología de encuestas , las puntuaciones de propensión se estiman (mediante métodos como la regresión logística , los bosques aleatorios u otros), utilizando algún conjunto de covariables. Estos puntajes de propensión se utilizan luego como estimadores de ponderaciones que se utilizarán con métodos de ponderación de probabilidad inversa .
Rosenbaum y Rubin presentaron y demostraron por primera vez lo siguiente en 1983: [1]
Si pensamos en el valor de Z como un parámetro de la población que afecta la distribución de X , entonces la puntuación de equilibrio sirve como estadística suficiente para Z. Además, los teoremas anteriores indican que la puntuación de propensión es una estadística mínima suficiente si se piensa en Z como un parámetro de X. Por último, si la asignación de tratamiento Z es totalmente ignorable dado X , entonces la puntuación de propensión es una estadística mínima suficiente para la distribución conjunta de .
Judea Pearl ha demostrado que existe una prueba gráfica sencilla, denominada criterio de puerta trasera, que detecta la presencia de variables de confusión. Para estimar el efecto del tratamiento, las variables de fondo X deben bloquear todos los caminos de puerta trasera en el gráfico. Este bloqueo se puede realizar agregando la variable de confusión como control en la regresión o haciendo coincidir la variable de confusión. [2]
Se ha demostrado que el PSM aumenta el "desequilibrio, la ineficiencia, la dependencia del modelo y el sesgo" del modelo, lo que no ocurre con la mayoría de los otros métodos de comparación. [3] Las ideas detrás del uso de la comparación aún son válidas, pero deben aplicarse con otros métodos de comparación; Los puntajes de propensión también tienen otros usos productivos en la ponderación y la estimación doblemente robusta.
Al igual que otros procedimientos de comparación, el PSM estima un efecto de tratamiento promedio a partir de datos de observación. Las ventajas clave del PSM eran, en el momento de su introducción, que al utilizar una combinación lineal de covariables para una puntuación única, equilibra los grupos de tratamiento y control en una gran cantidad de covariables sin perder una gran cantidad de observaciones. Si las unidades de tratamiento y control se equilibraran con un gran número de covariables una a la vez, se necesitarían grandes números de observaciones para superar el " problema de dimensionalidad " por el cual la introducción de una nueva covariable de equilibrio aumenta el número mínimo necesario de observaciones en la muestra geométricamente .
Una desventaja del PSM es que sólo tiene en cuenta las covariables observadas (y observables) y no las características latentes. Los factores que afectan la asignación al tratamiento y el resultado pero que no pueden observarse no pueden tenerse en cuenta en el procedimiento de comparación. [4] Como el procedimiento solo controla las variables observadas, cualquier sesgo oculto debido a variables latentes puede permanecer después del emparejamiento. [5] Otro problema es que el PSM requiere muestras grandes, con una superposición sustancial entre los grupos de tratamiento y control.
Judea Pearl también ha planteado preocupaciones generales sobre el emparejamiento , quien ha argumentado que el sesgo oculto puede en realidad aumentar porque el emparejamiento de variables observadas puede desencadenar un sesgo debido a factores de confusión latentes no observados. De manera similar, Pearl ha argumentado que la reducción del sesgo sólo puede garantizarse (asintóticamente) modelando las relaciones causales cualitativas entre el tratamiento, el resultado y las covariables observadas y no observadas. [6] La confusión ocurre cuando el experimentador es incapaz de controlar explicaciones alternativas y no causales para una relación observada entre variables independientes y dependientes. Dicho control debería satisfacer el " criterio de puerta trasera " de Pearl. [2]
MatchIt
, [7] [8] optmatch
, [9] u otros paquetes.OneToManyMTCH
observaciones de macrocoincidencia basadas en una puntuación de propensión. [10]psmatch2
. [12] Stata versión 13 y posteriores también ofrece el comando incorporado teffects psmatch
. [13]PsmPy
una biblioteca para la comparación de puntajes de propensión en Python{{cite web}}
: Mantenimiento CS1: ubicación ( enlace )