stringtranslate.com

Coincidencia de puntuación de propensión

En el análisis estadístico de datos observacionales , el emparejamiento por puntuación de propensión ( PSM ) es una técnica de emparejamiento estadístico que intenta estimar el efecto de un tratamiento, política u otra intervención teniendo en cuenta las covariables que predicen recibir el tratamiento. PSM intenta reducir el sesgo debido a las variables de confusión que podrían encontrarse en una estimación del efecto del tratamiento obtenida simplemente comparando los resultados entre las unidades que recibieron el tratamiento versus aquellas que no lo recibieron . Paul R. Rosenbaum y Donald Rubin introdujeron la técnica en 1983. [1]

La posibilidad de sesgo surge porque una diferencia en el resultado del tratamiento (como el efecto promedio del tratamiento ) entre los grupos tratados y no tratados puede ser causada por un factor que predice el tratamiento en lugar del tratamiento en sí. En los experimentos aleatorios , la aleatorización permite una estimación imparcial de los efectos del tratamiento; Para cada covariable, la aleatorización implica que los grupos de tratamiento estarán equilibrados en promedio, según la ley de los grandes números . Desafortunadamente, en los estudios observacionales, la asignación de tratamientos a los sujetos de investigación no suele ser aleatoria. El emparejamiento intenta reducir el sesgo de asignación de tratamientos e imitar la aleatorización, creando una muestra de unidades que recibieron el tratamiento que sea comparable en todas las covariables observadas con una muestra de unidades que no recibieron el tratamiento.

La "propensión" describe la probabilidad de que una unidad haya sido tratada, dados sus valores de covariables. Cuanto más fuerte sea la confusión del tratamiento y las covariables y, por tanto, cuanto más fuerte sea el sesgo en el análisis del efecto del tratamiento ingenuo, mejor predicen las covariables si una unidad recibe tratamiento o no. Al tener unidades con puntuaciones de propensión similares tanto en el tratamiento como en el control, se reduce dicha confusión.

Por ejemplo, a uno le puede interesar conocer las consecuencias de fumar . Se requiere un estudio observacional ya que no es ético asignar aleatoriamente a personas al tratamiento de "tabaquismo". El efecto del tratamiento estimado simplemente comparando a los que fumaban con los que no fumaban estaría sesgado por cualquier factor que prediga el tabaquismo (p. ej., sexo y edad). PSM intenta controlar estos sesgos haciendo que los grupos que reciben tratamiento y los que no lo reciben sean comparables con respecto a las variables de control.

Descripción general

PSM es para casos de inferencia causal y sesgo de confusión en entornos no experimentales en los que: (i) pocas unidades en el grupo de comparación sin tratamiento son comparables a las unidades de tratamiento; y (ii) seleccionar un subconjunto de unidades de comparación similar a la unidad de tratamiento es difícil porque las unidades deben compararse a través de un conjunto de características previas al tratamiento de alta dimensión. [ cita necesaria ]

En el emparejamiento normal, las características únicas que distinguen a los grupos de tratamiento y de control se emparejan en un intento de hacer que los grupos sean más parecidos. Pero si los dos grupos no tienen una superposición sustancial, entonces se puede introducir un error sustancial. Por ejemplo, si sólo se comparan los peores casos del grupo de "comparación" no tratado con sólo los mejores casos del grupo de tratamiento , el resultado puede ser una regresión hacia la media , lo que puede hacer que el grupo de comparación parezca mejor o peor que la realidad. [ cita necesaria ]

PSM emplea una probabilidad predicha de pertenencia a un grupo (por ejemplo, grupo de tratamiento versus grupo de control) basada en predictores observados, generalmente obtenidos a partir de regresión logística , para crear un grupo contrafactual . Las puntuaciones de propensión se pueden utilizar para el emparejamiento o como covariables , solas o con otras variables o covariables de emparejamiento.

Procedimiento general

1. Estimar puntuaciones de propensión, por ejemplo, con regresión logística :

2. Relacione a cada participante con uno o más no participantes según su puntuación de propensión, utilizando uno de estos métodos:

3. Verificar que las covariables estén equilibradas entre los grupos de tratamiento y de comparación dentro de los estratos de la puntuación de propensión.

4. Estimar los efectos basándose en una nueva muestra.

Definiciones formales

Ajustes básicos

El caso básico [1] es el de dos tratamientos (numerados 1 y 0), con N sujetos con variables aleatorias independientes e idénticamente distribuidas . Cada sujeto respondería al tratamiento con y al control con . La cantidad a estimar es el efecto promedio del tratamiento : . La variable indica si el sujeto recibió tratamiento ( ) o control ( ). Sea un vector de mediciones observadas previas al tratamiento (o covariables) para el iésimo sujeto. Las observaciones de se realizan antes de la asignación del tratamiento, pero las características de pueden no incluir todas (o algunas) de las utilizadas para decidir la asignación del tratamiento. Se supone que la numeración de las unidades (es decir: i  = 1, ...,  N ) no contiene ninguna información más allá de la contenida en . Las siguientes secciones omitirán el índice i mientras aún analizan el comportamiento estocástico de algún tema.

Asignación de tratamiento fuertemente ignorable

Supongamos que algún sujeto tenga un vector de covariables X (es decir, condicionalmente sin confusión) y algunos resultados potenciales r 0 y r 1 bajo control y tratamiento, respectivamente. Se dice que la asignación del tratamiento es totalmente ignorable si los resultados potenciales son independientes del tratamiento ( Z ) y están condicionados a las variables de fondo X . Esto se puede escribir de forma compacta como

donde denota independencia estadística . [1]

Puntuación de equilibrio

Una puntuación de equilibrio b ( X ) es una función de las covariables observadas X tal que la distribución condicional de X dada b ( X ) es la misma para las unidades tratadas ( Z  = 1) y de control ( Z  = 0):

La función más trivial es .

Puntuación de propensión

Una puntuación de propensión es la probabilidad de que una unidad (p. ej., persona, aula, escuela) sea asignada a un tratamiento particular dado un conjunto de covariables observadas. Las puntuaciones de propensión se utilizan para reducir la confusión equiparando grupos en función de estas covariables.

Supongamos que tenemos un indicador de tratamiento binario Z , una variable de respuesta r y covariables observadas de fondo X. La puntuación de propensión se define como la probabilidad condicional de tratamiento dadas las variables de fondo:

En el contexto de la inferencia causal y la metodología de encuestas , las puntuaciones de propensión se estiman (mediante métodos como la regresión logística , los bosques aleatorios u otros), utilizando algún conjunto de covariables. Estos puntajes de propensión se utilizan luego como estimadores de ponderaciones que se utilizarán con métodos de ponderación de probabilidad inversa .

Teoremas principales

Rosenbaum y Rubin presentaron y demostraron por primera vez lo siguiente en 1983: [1]

  • También es totalmente ignorable dada cualquier función de equilibrio. Específicamente, dada la puntuación de propensión:
  • Para cualquier valor de una puntuación de equilibrio, la diferencia entre las medias de tratamiento y control de las muestras disponibles (es decir: ), basada en sujetos que tienen el mismo valor de la puntuación de equilibrio, puede servir como un estimador insesgado del efecto promedio del tratamiento. : .

Relación con la suficiencia

Si pensamos en el valor de Z como un parámetro de la población que afecta la distribución de X , entonces la puntuación de equilibrio sirve como estadística suficiente para Z. Además, los teoremas anteriores indican que la puntuación de propensión es una estadística mínima suficiente si se piensa en Z como un parámetro de X. Por último, si la asignación de tratamiento Z es totalmente ignorable dado X , entonces la puntuación de propensión es una estadística mínima suficiente para la distribución conjunta de .

Prueba gráfica para detectar la presencia de variables de confusión

Judea Pearl ha demostrado que existe una prueba gráfica sencilla, denominada criterio de puerta trasera, que detecta la presencia de variables de confusión. Para estimar el efecto del tratamiento, las variables de fondo X deben bloquear todos los caminos de puerta trasera en el gráfico. Este bloqueo se puede realizar agregando la variable de confusión como control en la regresión o haciendo coincidir la variable de confusión. [2]

Desventajas

Se ha demostrado que el PSM aumenta el "desequilibrio, la ineficiencia, la dependencia del modelo y el sesgo" del modelo, lo que no ocurre con la mayoría de los otros métodos de comparación. [3] Las ideas detrás del uso de la comparación aún son válidas, pero deben aplicarse con otros métodos de comparación; Los puntajes de propensión también tienen otros usos productivos en la ponderación y la estimación doblemente robusta.

Al igual que otros procedimientos de comparación, el PSM estima un efecto de tratamiento promedio a partir de datos de observación. Las ventajas clave del PSM eran, en el momento de su introducción, que al utilizar una combinación lineal de covariables para una puntuación única, equilibra los grupos de tratamiento y control en una gran cantidad de covariables sin perder una gran cantidad de observaciones. Si las unidades de tratamiento y control se equilibraran con un gran número de covariables una a la vez, se necesitarían grandes números de observaciones para superar el " problema de dimensionalidad " por el cual la introducción de una nueva covariable de equilibrio aumenta el número mínimo necesario de observaciones en la muestra geométricamente .

Una desventaja del PSM es que sólo tiene en cuenta las covariables observadas (y observables) y no las características latentes. Los factores que afectan la asignación al tratamiento y el resultado pero que no pueden observarse no pueden tenerse en cuenta en el procedimiento de comparación. [4] Como el procedimiento solo controla las variables observadas, cualquier sesgo oculto debido a variables latentes puede permanecer después del emparejamiento. [5] Otro problema es que el PSM requiere muestras grandes, con una superposición sustancial entre los grupos de tratamiento y control.

Judea Pearl también ha planteado preocupaciones generales sobre el emparejamiento , quien ha argumentado que el sesgo oculto puede en realidad aumentar porque el emparejamiento de variables observadas puede desencadenar un sesgo debido a factores de confusión latentes no observados. De manera similar, Pearl ha argumentado que la reducción del sesgo sólo puede garantizarse (asintóticamente) modelando las relaciones causales cualitativas entre el tratamiento, el resultado y las covariables observadas y no observadas. [6] La confusión ocurre cuando el experimentador es incapaz de controlar explicaciones alternativas y no causales para una relación observada entre variables independientes y dependientes. Dicho control debería satisfacer el " criterio de puerta trasera " de Pearl. [2]

Implementaciones en paquetes estadísticos.

Ver también

Referencias

  1. ^ abcd Rosenbaum, Paul R.; Rubin, Donald B. (1983). "El papel central de la puntuación de propensión en estudios observacionales de efectos causales". Biometrika . 70 (1): 41–55. doi : 10.1093/biomet/70.1.41 .
  2. ^ ab Perla, J. (2000). Causalidad: modelos, razonamiento e inferencia . Nueva York: Cambridge University Press. ISBN 978-0-521-77362-1.
  3. ^ Rey, Gary; Nielsen, Richard (7 de mayo de 2019). "Por qué las puntuaciones de propensión no deberían utilizarse para el emparejamiento". Análisis Político . 27 (4): 435–454. doi : 10.1017/pan.2019.11 . hdl : 1721.1/128459 . ISSN  1047-1987.| enlace al artículo completo (desde la página de inicio del autor)
  4. ^ Garrido MM, et al. (2014). "Métodos para construir y evaluar puntuaciones de propensión". Investigación de Servicios de Salud . 49 (5): 1701–20. doi :10.1111/1475-6773.12182. PMC 4213057 . PMID  24779867. 
  5. ^ Sádish, WR; Cocinero, TD; Campbell, DT (2002). Diseños experimentales y cuasiexperimentales para inferencia causal generalizada . Boston: Houghton Mifflin. ISBN 978-0-395-61556-0.
  6. ^ Perla, J. (2009). "Comprensión de las puntuaciones de propensión". Causalidad: modelos, razonamiento e inferencia (Segunda ed.). Nueva York: Cambridge University Press. ISBN 978-0-521-89560-6.
  7. ^ Hola, Daniel; Imai, Kosuke; Rey, Gary ; Estuardo, Isabel (2007). "Coincidencia como preprocesamiento no paramétrico para reducir la dependencia del modelo en la inferencia causal paramétrica". Análisis Político . 15 (3): 199–236. doi : 10.1093/pan/mpl013 .
  8. ^ "MatchIt: preprocesamiento no paramétrico para inferencia causal paramétrica". Proyecto R. 16 de noviembre de 2022.
  9. ^ Hansen, Ben B; Klopfer, Stephanie Olsen (2006). "Diseños relacionados y de coincidencia completa óptima a través de flujos de red". Revista de Estadística Computacional y Gráfica . Informa Reino Unido Limited. 15 (3): 609–627. doi :10.1198/106186006x137047. ISSN  1061-8600. S2CID  10138048.
  10. ^ Parsons, Lori. "Realización de una comparación de casos y controles 1:N sobre la puntuación de propensión" (PDF) . SUGI 29: Instituto SAS . Consultado el 10 de junio de 2016 .{{cite web}}: Mantenimiento CS1: ubicación ( enlace )
  11. ^ Implementación de estimadores de coincidencia de puntuación de propensión con STATA. Notas de conferencias 2001
  12. ^ Lovaina, E.; Sianesi, B. (2003). "PSMATCH2: módulo de Stata para realizar Mahalanobis completo y coincidencia de puntuación de propensión, gráficos de soporte común y pruebas de desequilibrio de covariables". Componentes de software estadístico .
  13. ^ "teffects psmatch - Coincidencia de puntuación de propensión" (PDF) . Manual de estadísticas .

Bibliografía