En el análisis estadístico de datos observacionales , el emparejamiento por puntaje de propensión ( PSM ) es una técnica de emparejamiento estadístico que intenta estimar el efecto de un tratamiento, política u otra intervención al tener en cuenta las covariables que predicen la recepción del tratamiento. El PSM intenta reducir el sesgo debido a las variables de confusión que podrían encontrarse en una estimación del efecto del tratamiento obtenida simplemente comparando los resultados entre las unidades que recibieron el tratamiento frente a las que no lo recibieron .
Paul R. Rosenbaum y Donald Rubin introdujeron la técnica en 1983, definiendo el puntaje de propensión como la probabilidad condicional de que una unidad (por ejemplo, persona, aula, escuela) sea asignada al tratamiento, dado un conjunto de covariables observadas. [1]
La posibilidad de sesgo surge porque una diferencia en el resultado del tratamiento (como el efecto promedio del tratamiento ) entre los grupos tratados y no tratados puede ser causada por un factor que predice el tratamiento en lugar del tratamiento en sí. En experimentos aleatorios , la aleatorización permite una estimación imparcial de los efectos del tratamiento; para cada covariable, la aleatorización implica que los grupos de tratamiento estarán equilibrados en promedio, por la ley de los grandes números . Desafortunadamente, para los estudios observacionales, la asignación de tratamientos a los sujetos de investigación normalmente no es aleatoria. El emparejamiento intenta reducir el sesgo de asignación del tratamiento e imitar la aleatorización creando una muestra de unidades que recibieron el tratamiento que es comparable en todas las covariables observadas a una muestra de unidades que no recibieron el tratamiento.
La "propensión" describe la probabilidad de que una unidad haya sido tratada, dados los valores de sus covariables. Cuanto mayor sea el factor de confusión entre el tratamiento y las covariables y, por lo tanto, cuanto mayor sea el sesgo en el análisis del efecto del tratamiento ingenuo, mejor predecirán las covariables si una unidad es tratada o no. Al tener unidades con puntuaciones de propensión similares tanto en el tratamiento como en el control, se reduce dicho factor de confusión.
Por ejemplo, puede interesarle saber las consecuencias de fumar . Se requiere un estudio observacional, ya que no es ético asignar aleatoriamente a las personas al tratamiento de “fumar”. El efecto del tratamiento estimado simplemente comparando a quienes fuman con quienes no fuman estaría sesgado por cualquier factor que prediga el tabaquismo (por ejemplo, género y edad). PSM intenta controlar estos sesgos haciendo que los grupos que reciben tratamiento y los que no lo reciben sean comparables con respecto a las variables de control.
El PSM emplea una probabilidad predicha de pertenencia a un grupo (por ejemplo, grupo de tratamiento versus grupo de control) basada en predictores observados, generalmente obtenidos a partir de una regresión logística para crear un grupo contrafactual . Los puntajes de propensión se pueden usar para emparejar o como covariables , solos o con otras variables de emparejamiento o covariables.
1. Estimar puntuaciones de propensión, por ejemplo, con regresión logística :
2. Empareje cada participante con uno o más no participantes según su puntuación de propensión, utilizando uno de estos métodos:
3. Verifique que las covariables estén equilibradas entre los grupos de tratamiento y comparación dentro de los estratos del puntaje de propensión.
4. Estimar los efectos basándose en la nueva muestra
El caso básico [1] es el de dos tratamientos (numerados 1 y 0), con N sujetos de variables aleatorias independientes e idénticamente distribuidas . Cada sujeto i respondería al tratamiento con y al control con . La cantidad a estimar es el efecto promedio del tratamiento : . La variable indica si el sujeto i recibió tratamiento ( ) o control ( ). Sea un vector de mediciones previas al tratamiento observadas (o covariables) para el i ésimo sujeto. Las observaciones de se realizan antes de la asignación del tratamiento, pero las características en pueden no incluir todas (o alguna) de las utilizadas para decidir la asignación del tratamiento. Se supone que la numeración de las unidades (es decir: i = 1, ..., N ) no contiene ninguna información más allá de la contenida en . Las siguientes secciones omitirán el índice i mientras siguen discutiendo el comportamiento estocástico de algún sujeto.
Sea un sujeto con un vector de covariables X (es decir, condicionalmente sin factores de confusión) y algunos resultados potenciales r 0 y r 1 bajo control y tratamiento, respectivamente. Se dice que la asignación del tratamiento es fuertemente ignorable si los resultados potenciales son independientes del tratamiento ( Z ) condicionales a las variables de fondo X . Esto se puede escribir de forma compacta como
donde denota independencia estadística . [1]
Una puntuación de equilibrio b ( X ) es una función de las covariables observadas X tal que la distribución condicional de X dado b ( X ) es la misma para las unidades tratadas ( Z = 1) y de control ( Z = 0):
La función más trivial es .
Un puntaje de propensión es la probabilidad condicional de que una unidad (por ejemplo, una persona, un aula, una escuela) sea asignada a un tratamiento en particular, dado un conjunto de covariables observadas. Los puntajes de propensión se utilizan para reducir la confusión al equiparar grupos en función de estas covariables.
Supongamos que tenemos un indicador binario de tratamiento Z , una variable de respuesta r y covariables observadas de fondo X . El puntaje de propensión se define como la probabilidad condicional de tratamiento dadas las variables de fondo:
En el contexto de la inferencia causal y la metodología de encuestas , se estiman los puntajes de propensión (a través de métodos como la regresión logística , los bosques aleatorios u otros), utilizando un conjunto de covariables. Estos puntajes de propensión se utilizan luego como estimadores de ponderaciones que se utilizarán con métodos de ponderación de probabilidad inversa .
Los siguientes fueron presentados y probados por primera vez por Rosenbaum y Rubin en 1983: [1]
Si pensamos en el valor de Z como un parámetro de la población que impacta la distribución de X entonces el puntaje de equilibrio sirve como una estadística suficiente para Z . Además, los teoremas anteriores indican que el puntaje de propensión es una estadística mínima suficiente si pensamos en Z como un parámetro de X . Por último, si la asignación de tratamiento Z es fuertemente ignorable dado X entonces el puntaje de propensión es una estadística mínima suficiente para la distribución conjunta de .
Judea Pearl ha demostrado que existe una prueba gráfica sencilla, llamada criterio de la puerta trasera, que detecta la presencia de variables de confusión. Para estimar el efecto del tratamiento, las variables de fondo X deben bloquear todos los caminos de la puerta trasera en el gráfico. Este bloqueo se puede realizar añadiendo la variable de confusión como control en la regresión o haciendo coincidir la variable de confusión. [2]
Se ha demostrado que el PSM aumenta el "desequilibrio, la ineficiencia, la dependencia y el sesgo" del modelo, lo que no sucede con la mayoría de los demás métodos de emparejamiento. [3] Los conocimientos que sustentan el uso del emparejamiento siguen siendo válidos, pero deberían aplicarse con otros métodos de emparejamiento; los puntajes de propensión también tienen otros usos productivos en la ponderación y la estimación doblemente robusta.
Al igual que otros procedimientos de emparejamiento, el PSM estima un efecto de tratamiento promedio a partir de datos observacionales. Las principales ventajas del PSM fueron, en el momento de su introducción, que al utilizar una combinación lineal de covariables para una sola puntuación, equilibra los grupos de tratamiento y control en una gran cantidad de covariables sin perder una gran cantidad de observaciones. Si las unidades en el tratamiento y el control se equilibraran en una gran cantidad de covariables de una en una, se necesitarían grandes cantidades de observaciones para superar el " problema de dimensionalidad ", por el cual la introducción de una nueva covariable de equilibrio aumenta geométricamente la cantidad mínima necesaria de observaciones en la muestra .
Una desventaja del PSM es que sólo tiene en cuenta las covariables observadas (y observables) y no las características latentes. Los factores que afectan la asignación al tratamiento y al resultado pero que no se pueden observar no se pueden tener en cuenta en el procedimiento de emparejamiento. [4] Como el procedimiento sólo controla las variables observadas, cualquier sesgo oculto debido a las variables latentes puede permanecer después del emparejamiento. [5] Otro problema es que el PSM requiere muestras grandes, con una superposición sustancial entre los grupos de tratamiento y control.
Judea Pearl también ha planteado inquietudes generales sobre el emparejamiento , quien ha argumentado que el sesgo oculto puede en realidad aumentar porque el emparejamiento en variables observadas puede desencadenar sesgo debido a factores de confusión latentes no observados. De manera similar, Pearl ha argumentado que la reducción del sesgo solo se puede asegurar (asintóticamente) modelando las relaciones causales cualitativas entre el tratamiento, el resultado, las covariables observadas y no observadas. [6] La confusión ocurre cuando el experimentador no puede controlar explicaciones alternativas, no causales, para una relación observada entre variables independientes y dependientes. Tal control debería satisfacer el " criterio de la puerta trasera " de Pearl. [2]
MatchIt
[ 8] , [9] u otros paquetes. optmatch
OneToManyMTCH
observaciones de coincidencia macro basadas en una puntuación de propensión. [10]psmatch2
. [12] La versión 13 de Stata y posteriores también ofrecen el comando incorporado teffects psmatch
. [13]PsmPy
una biblioteca para la comparación de puntuaciones de propensión en Python{{cite web}}
: Mantenimiento de CS1: ubicación ( enlace )