stringtranslate.com

Emparejamiento por puntuación de propensión

En el análisis estadístico de datos observacionales , el emparejamiento por puntaje de propensión ( PSM ) es una técnica de emparejamiento estadístico que intenta estimar el efecto de un tratamiento, política u otra intervención al tener en cuenta las covariables que predicen la recepción del tratamiento. El PSM intenta reducir el sesgo debido a las variables de confusión que podrían encontrarse en una estimación del efecto del tratamiento obtenida simplemente comparando los resultados entre las unidades que recibieron el tratamiento frente a las que no lo recibieron .

Paul R. Rosenbaum y Donald Rubin introdujeron la técnica en 1983, definiendo el puntaje de propensión como la probabilidad condicional de que una unidad (por ejemplo, persona, aula, escuela) sea asignada al tratamiento, dado un conjunto de covariables observadas. [1]

La posibilidad de sesgo surge porque una diferencia en el resultado del tratamiento (como el efecto promedio del tratamiento ) entre los grupos tratados y no tratados puede ser causada por un factor que predice el tratamiento en lugar del tratamiento en sí. En experimentos aleatorios , la aleatorización permite una estimación imparcial de los efectos del tratamiento; para cada covariable, la aleatorización implica que los grupos de tratamiento estarán equilibrados en promedio, por la ley de los grandes números . Desafortunadamente, para los estudios observacionales, la asignación de tratamientos a los sujetos de investigación normalmente no es aleatoria. El emparejamiento intenta reducir el sesgo de asignación del tratamiento e imitar la aleatorización creando una muestra de unidades que recibieron el tratamiento que es comparable en todas las covariables observadas a una muestra de unidades que no recibieron el tratamiento.

La "propensión" describe la probabilidad de que una unidad haya sido tratada, dados los valores de sus covariables. Cuanto mayor sea el factor de confusión entre el tratamiento y las covariables y, por lo tanto, cuanto mayor sea el sesgo en el análisis del efecto del tratamiento ingenuo, mejor predecirán las covariables si una unidad es tratada o no. Al tener unidades con puntuaciones de propensión similares tanto en el tratamiento como en el control, se reduce dicho factor de confusión.

Por ejemplo, puede interesarle saber las consecuencias de fumar . Se requiere un estudio observacional, ya que no es ético asignar aleatoriamente a las personas al tratamiento de “fumar”. El efecto del tratamiento estimado simplemente comparando a quienes fuman con quienes no fuman estaría sesgado por cualquier factor que prediga el tabaquismo (por ejemplo, género y edad). PSM intenta controlar estos sesgos haciendo que los grupos que reciben tratamiento y los que no lo reciben sean comparables con respecto a las variables de control.

El PSM emplea una probabilidad predicha de pertenencia a un grupo (por ejemplo, grupo de tratamiento versus grupo de control) basada en predictores observados, generalmente obtenidos a partir de una regresión logística para crear un grupo contrafactual . Los puntajes de propensión se pueden usar para emparejar o como covariables , solos o con otras variables de emparejamiento o covariables.

Procedimiento general

1. Estimar puntuaciones de propensión, por ejemplo, con regresión logística :

2. Empareje cada participante con uno o más no participantes según su puntuación de propensión, utilizando uno de estos métodos:

3. Verifique que las covariables estén equilibradas entre los grupos de tratamiento y comparación dentro de los estratos del puntaje de propensión.

4. Estimar los efectos basándose en la nueva muestra

Definiciones formales

Ajustes básicos

El caso básico [1] es el de dos tratamientos (numerados 1 y 0), con N sujetos de variables aleatorias independientes e idénticamente distribuidas . Cada sujeto i respondería al tratamiento con y al control con . La cantidad a estimar es el efecto promedio del tratamiento : . La variable indica si el sujeto i recibió tratamiento ( ) o control ( ). Sea un vector de mediciones previas al tratamiento observadas (o covariables) para el i ésimo sujeto. Las observaciones de se realizan antes de la asignación del tratamiento, pero las características en pueden no incluir todas (o alguna) de las utilizadas para decidir la asignación del tratamiento. Se supone que la numeración de las unidades (es decir: i  = 1, ...,  N ) no contiene ninguna información más allá de la contenida en . Las siguientes secciones omitirán el índice i mientras siguen discutiendo el comportamiento estocástico de algún sujeto.

Asignación de tratamiento fuertemente ignorable

Sea un sujeto con un vector de covariables X (es decir, condicionalmente sin factores de confusión) y algunos resultados potenciales r 0 y r 1 bajo control y tratamiento, respectivamente. Se dice que la asignación del tratamiento es fuertemente ignorable si los resultados potenciales son independientes del tratamiento ( Z ) condicionales a las variables de fondo X . Esto se puede escribir de forma compacta como

donde denota independencia estadística . [1]

Puntuación de equilibrio

Una puntuación de equilibrio b ( X ) es una función de las covariables observadas X tal que la distribución condicional de X dado b ( X ) es la misma para  las unidades tratadas ( Z  = 1) y de control ( Z = 0):

La función más trivial es .

Puntuación de propensión

Un puntaje de propensión es la probabilidad condicional de que una unidad (por ejemplo, una persona, un aula, una escuela) sea asignada a un tratamiento en particular, dado un conjunto de covariables observadas. Los puntajes de propensión se utilizan para reducir la confusión al equiparar grupos en función de estas covariables.

Supongamos que tenemos un indicador binario de tratamiento Z , una variable de respuesta r y covariables observadas de fondo X . El puntaje de propensión se define como la probabilidad condicional de tratamiento dadas las variables de fondo:

En el contexto de la inferencia causal y la metodología de encuestas , se estiman los puntajes de propensión (a través de métodos como la regresión logística , los bosques aleatorios u otros), utilizando un conjunto de covariables. Estos puntajes de propensión se utilizan luego como estimadores de ponderaciones que se utilizarán con métodos de ponderación de probabilidad inversa .

Teoremas principales

Los siguientes fueron presentados y probados por primera vez por Rosenbaum y Rubin en 1983: [1]

  • También es muy ignorable dada cualquier función de equilibrio. En concreto, dada la puntuación de propensión:
  • Para cualquier valor de una puntuación de equilibrio, la diferencia entre las medias de tratamiento y control de las muestras en cuestión (es decir: ), basada en sujetos que tienen el mismo valor de la puntuación de equilibrio, puede servir como un estimador imparcial del efecto promedio del tratamiento : .

Relación con la suficiencia

Si pensamos en el valor de Z como un parámetro de la población que impacta la distribución de X entonces el puntaje de equilibrio sirve como una estadística suficiente para Z . Además, los teoremas anteriores indican que el puntaje de propensión es una estadística mínima suficiente si pensamos en Z como un parámetro de X . Por último, si la asignación de tratamiento Z es fuertemente ignorable dado X entonces el puntaje de propensión es una estadística mínima suficiente para la distribución conjunta de .

Prueba gráfica para detectar la presencia de variables de confusión

Judea Pearl ha demostrado que existe una prueba gráfica sencilla, llamada criterio de la puerta trasera, que detecta la presencia de variables de confusión. Para estimar el efecto del tratamiento, las variables de fondo X deben bloquear todos los caminos de la puerta trasera en el gráfico. Este bloqueo se puede realizar añadiendo la variable de confusión como control en la regresión o haciendo coincidir la variable de confusión. [2]

Desventajas

Se ha demostrado que el PSM aumenta el "desequilibrio, la ineficiencia, la dependencia y el sesgo" del modelo, lo que no sucede con la mayoría de los demás métodos de emparejamiento. [3] Los conocimientos que sustentan el uso del emparejamiento siguen siendo válidos, pero deberían aplicarse con otros métodos de emparejamiento; los puntajes de propensión también tienen otros usos productivos en la ponderación y la estimación doblemente robusta.

Al igual que otros procedimientos de emparejamiento, el PSM estima un efecto de tratamiento promedio a partir de datos observacionales. Las principales ventajas del PSM fueron, en el momento de su introducción, que al utilizar una combinación lineal de covariables para una sola puntuación, equilibra los grupos de tratamiento y control en una gran cantidad de covariables sin perder una gran cantidad de observaciones. Si las unidades en el tratamiento y el control se equilibraran en una gran cantidad de covariables de una en una, se necesitarían grandes cantidades de observaciones para superar el " problema de dimensionalidad ", por el cual la introducción de una nueva covariable de equilibrio aumenta geométricamente la cantidad mínima necesaria de observaciones en la muestra .

Una desventaja del PSM es que sólo tiene en cuenta las covariables observadas (y observables) y no las características latentes. Los factores que afectan la asignación al tratamiento y al resultado pero que no se pueden observar no se pueden tener en cuenta en el procedimiento de emparejamiento. [4] Como el procedimiento sólo controla las variables observadas, cualquier sesgo oculto debido a las variables latentes puede permanecer después del emparejamiento. [5] Otro problema es que el PSM requiere muestras grandes, con una superposición sustancial entre los grupos de tratamiento y control.

Judea Pearl también ha planteado inquietudes generales sobre el emparejamiento , quien ha argumentado que el sesgo oculto puede en realidad aumentar porque el emparejamiento en variables observadas puede desencadenar sesgo debido a factores de confusión latentes no observados. De manera similar, Pearl ha argumentado que la reducción del sesgo solo se puede asegurar (asintóticamente) modelando las relaciones causales cualitativas entre el tratamiento, el resultado, las covariables observadas y no observadas. [6] La confusión ocurre cuando el experimentador no puede controlar explicaciones alternativas, no causales, para una relación observada entre variables independientes y dependientes. Tal control debería satisfacer el " criterio de la puerta trasera " de Pearl. [2]

Implementaciones en paquetes de estadísticas

Véase también

Referencias

  1. ^ abcd Rosenbaum, Paul R.; Rubin, Donald B. (1983). "El papel central del índice de propensión en los estudios observacionales de efectos causales". Biometrika . 70 (1): 41–55. doi : 10.1093/biomet/70.1.41 .
  2. ^ ab Pearl, J. (2000). Causalidad: modelos, razonamiento e inferencia . Nueva York: Cambridge University Press. ISBN 978-0-521-77362-1.
  3. ^ King, Gary; Nielsen, Richard (7 de mayo de 2019). "Por qué no se deberían utilizar los puntajes de propensión para el emparejamiento". Análisis político . 27 (4): 435–454. doi : 10.1017/pan.2019.11 . hdl : 1721.1/128459 . ISSN  1047-1987.| Enlace al artículo completo (desde la página del autor)
  4. ^ Garrido MM, et al. (2014). "Métodos para la construcción y evaluación de puntuaciones de propensión". Investigación en servicios de salud . 49 (5): 1701–20. doi :10.1111/1475-6773.12182. PMC 4213057 . PMID  24779867. 
  5. ^ Shadish, WR; Cook, TD; Campbell, DT (2002). Diseños experimentales y cuasiexperimentales para la inferencia causal generalizada . Boston: Houghton Mifflin. ISBN 978-0-395-61556-0.
  6. ^ Pearl, J. (2009). "Entender los puntajes de propensión". Causalidad: modelos, razonamiento e inferencia (segunda edición). Nueva York: Cambridge University Press. ISBN 978-0-521-89560-6.
  7. ^ Ho, Daniel; Imai, Kosuke; King, Gary ; Stuart, Elizabeth (2007). "Matching como preprocesamiento no paramétrico para reducir la dependencia del modelo en la inferencia causal paramétrica". Political Analysis . 15 (3): 199–236. doi : 10.1093/pan/mpl013 .
  8. ^ "MatchIt: preprocesamiento no paramétrico para inferencia causal paramétrica". Proyecto R . 16 de noviembre de 2022.
  9. ^ Hansen, Ben B; Klopfer, Stephanie Olsen (2006). "Coincidencia completa óptima y diseños relacionados mediante flujos de red". Revista de estadística computacional y gráfica . 15 (3). Informa UK Limited: 609–627. doi :10.1198/106186006x137047. ISSN  1061-8600. S2CID  10138048.
  10. ^ Parsons, Lori. "Realización de un emparejamiento de casos y controles 1:N en el índice de propensión" (PDF) . SUGI 29: SAS Institute . Consultado el 10 de junio de 2016 .{{cite web}}: Mantenimiento de CS1: ubicación ( enlace )
  11. ^ Implementación de estimadores de emparejamiento por puntaje de propensión con STATA. Notas de clase 2001
  12. ^ Leuven, E.; Sianesi, B. (2003). "PSMATCH2: módulo de Stata para realizar emparejamiento completo de Mahalanobis y puntaje de propensión, gráficos de soporte común y pruebas de desequilibrio de covariables". Componentes de software estadístico .
  13. ^ "teffects psmatch — Emparejamiento por puntaje de propensión" (PDF) . Manual de Stata .

Bibliografía