Coincidencia (estadísticas)

El emparejamiento es una técnica estadística que evalúa el efecto de un tratamiento comparando las unidades tratadas y no tratadas en un estudio observacional o cuasiexperimento (es decir, cuando el tratamiento no se asigna aleatoriamente). El objetivo del emparejamiento es reducir el sesgo del efecto estimado del tratamiento en un estudio de datos observacionales, encontrando, para cada unidad tratada, una (o más) unidad(es) no tratada(s) con características observables similares contra las cuales se equilibran las covariables (similar al algoritmo de los K vecinos más cercanos ). Al emparejar las unidades tratadas con unidades no tratadas similares, el emparejamiento permite una comparación de resultados entre unidades tratadas y no tratadas para estimar el efecto del tratamiento reduciendo el sesgo debido a la confusión . ^[1]^[2]^[3] El emparejamiento por puntaje de propensión , una técnica de emparejamiento temprana, se desarrolló como parte del modelo causal de Rubin , ^[4] pero se ha demostrado que aumenta la dependencia, el sesgo, la ineficiencia y el poder del modelo y ya no se recomienda en comparación con otros métodos de emparejamiento. ^[5] Un método de comparación simple, fácil de entender y estadísticamente poderoso, conocido como Comparación Exacta Bruta o CEM. ^[6]

El emparejamiento ha sido promovido por Donald Rubin ^[4] . Fue criticado prominentemente en economía por Robert LaLonde (1986), ^[7] quien comparó estimaciones de los efectos del tratamiento de un experimento con estimaciones comparables producidas con métodos de emparejamiento y demostró que los métodos de emparejamiento están sesgados . Rajeev Dehejia y Sadek Wahba (1999) reevaluaron la crítica de LaLonde y demostraron que el emparejamiento es una buena solución. ^[8] Se han planteado críticas similares en revistas de ciencias políticas ^[9] y sociología ^[10] .

Análisis

Cuando el resultado de interés es binario, la herramienta más general para el análisis de datos emparejados es la regresión logística condicional , ya que maneja estratos de tamaño arbitrario y tratamientos continuos o binarios (predictores) y puede controlar las covariables. En casos particulares, están disponibles pruebas más simples como la prueba de diferencias pareadas , la prueba de McNemar y la prueba de Cochran-Mantel-Haenszel .

Cuando el resultado de interés es continuo, se realiza la estimación del efecto promedio del tratamiento .

La comparación también se puede utilizar para "preprocesar" una muestra antes del análisis mediante otra técnica, como el análisis de regresión . ^[11]

Superación

El sobreemparejamiento, o sesgo posterior al tratamiento, es el emparejamiento de un mediador aparente que en realidad es resultado de la exposición. ^[12] Si el mediador en sí está estratificado, sería muy probable que se indujera una relación oculta de la exposición a la enfermedad. ^[13] Por lo tanto, el sobreemparejamiento causa sesgo estadístico . ^[13]

Por ejemplo, hacer coincidir el grupo de control por la duración de la gestación y/o el número de nacimientos múltiples al estimar la mortalidad perinatal y el peso al nacer después de la fertilización in vitro (FIV) es sobreemparejar, ya que la FIV en sí misma aumenta el riesgo de nacimiento prematuro y nacimiento múltiple. ^[14]

Puede considerarse un sesgo de muestreo que disminuye la validez externa de un estudio, porque los controles se vuelven más similares a los casos en cuanto a exposición que la población general.

Véase también

Emparejamiento por puntuación de propensión

Referencias

^ Rubin, Donald B. (1973). "Coincidencia para eliminar sesgos en estudios observacionales". Biometrics . 29 (1): 159–183. doi :10.2307/2529684. JSTOR 2529684.
^ Anderson, Dallas W.; Kish, Leslie; Cornell, Richard G. (1980). "Sobre estratificación, agrupamiento y emparejamiento". Revista escandinava de estadística . 7 (2): 61–66. JSTOR 4615774.
^ Kupper, Lawrence L.; Karon, John M.; Kleinbaum, David G.; Morgenstern, Hal; Lewis, Donald K. (1981). "Coincidencia en estudios epidemiológicos: consideraciones de validez y eficiencia". Biometrics . 37 (2): 271–291. CiteSeerX 10.1.1.154.1197 . doi :10.2307/2530417. JSTOR 2530417. PMID 7272415.
^ ab Rosenbaum, Paul R.; Rubin, Donald B. (1983). "El papel central del índice de propensión en los estudios observacionales de efectos causales". Biometrika . 70 (1): 41–55. doi : 10.1093/biomet/70.1.41 .
^ King, Gary; Nielsen, Richard (octubre de 2019). "Por qué no se deben utilizar los puntajes de propensión para el emparejamiento". Análisis político . 27 (4): 435–454. doi : 10.1017/pan.2019.11 . hdl : 1721.1/128459 . ISSN 1047-1987.
^ Iacus, Stefano M.; King, Gary; Porro, Giuseppe (2011). "Métodos de emparejamiento multivariante que limitan el desequilibrio monótono". Revista de la Asociación Estadounidense de Estadística . 106 (493): 345–361. doi :10.1198/jasa.2011.tm09599. hdl : 2434/151476 . ISSN 0162-1459. S2CID 14790456.
^ LaLonde, Robert J. (1986). "Evaluación de las evaluaciones econométricas de programas de capacitación con datos experimentales". American Economic Review . 76 (4): 604–620. JSTOR 1806062.
^ Dehejia, RH; Wahba, S. (1999). "Efectos causales en estudios no experimentales: reevaluación de la evaluación de programas de capacitación" (PDF) . Revista de la Asociación Estadounidense de Estadística . 94 (448): 1053–1062. doi :10.1080/01621459.1999.10473858.
^ Arceneaux, Kevin; Gerber, Alan S.; Green, Donald P. (2006). "Comparación de métodos experimentales y de emparejamiento mediante un experimento de campo a gran escala sobre la movilización de votantes". Análisis político . 14 (1): 37–62. doi :10.1093/pan/mpj001.
^ Arceneaux, Kevin; Gerber, Alan S.; Green, Donald P. (2010). "Una nota de advertencia sobre el uso del emparejamiento para estimar efectos causales: un ejemplo empírico que compara las estimaciones de emparejamiento con un punto de referencia experimental". Métodos sociológicos e investigación . 39 (2): 256–282. doi :10.1177/0049124110378098. S2CID 37012563.
^ Ho, Daniel E.; Imai, Kosuke; King, Gary; Stuart, Elizabeth A. (2007). "Matching como preprocesamiento no paramétrico para reducir la dependencia del modelo en la inferencia causal paramétrica". Political Analysis . 15 (3): 199–236. doi : 10.1093/pan/mpl013 .
^ King, Gary; Zeng, Langche (2007). "Detección de la dependencia del modelo en la inferencia estadística: una respuesta". International Studies Quarterly . 51 (1): 231–241. doi :10.1111/j.1468-2478.2007.00449.x. ISSN 0020-8833. JSTOR 4621711. S2CID 12669035.
^ ab Marsh, JL; Hutton, JL ; Binks, K. (2002). "Eliminación de los efectos de la respuesta a la dosis de radiación: un ejemplo de sobreadaptación". British Medical Journal . 325 (7359): 327–330. doi :10.1136/bmj.325.7359.327. PMC 1123834 . PMID 12169512.
^ Gissler, M.; Hemminki, E. (1996). "El peligro del sobreemparejamiento en los estudios de mortalidad perinatal y peso al nacer de los bebés nacidos después de la concepción asistida". Eur J Obstet Gynecol Reprod Biol . 69 (2): 73–75. doi :10.1016/0301-2115(95)02517-0. PMID 8902436.

Lectura adicional

Angrist, Joshua D.; Pischke, Jörn-Steffen (2009). "La regresión se encuentra con el emparejamiento". Econometría casi inofensiva: un compañero empirista . Princeton University Press. págs. 69–80. ISBN 978-0-691-12034-8.