Prueba utilizada en el análisis de datos categóricos estratificados o emparejados
En estadística , la prueba de Cochran–Mantel–Haenszel ( CMH ) es una prueba utilizada en el análisis de datos categóricos estratificados o emparejados . Permite a un investigador probar la asociación entre un predictor binario o tratamiento y un resultado binario como el estado de caso o control mientras se tiene en cuenta la estratificación. [1] A diferencia de la prueba de McNemar , que solo puede manejar pares, la prueba CMH maneja tamaños de estratos arbitrarios. Lleva el nombre de William G. Cochran , Nathan Mantel y William Haenszel . [2] [3] Las extensiones de esta prueba a una respuesta categórica y/o a varios grupos se denominan comúnmente estadísticas de Cochran–Mantel–Haenszel. [4] A menudo se utiliza en estudios observacionales en los que la asignación aleatoria de sujetos a diferentes tratamientos no se puede controlar, pero se pueden medir las covariables de confusión .
Definición
Consideramos una variable de resultado binaria como el estado del caso (por ejemplo, cáncer de pulmón) y un predictor binario como el estado del tratamiento (por ejemplo, tabaquismo). Las observaciones se agrupan en estratos. Los datos estratificados se resumen en una serie de tablas de contingencia 2 × 2, una para cada estrato. La i -ésima tabla de contingencia es:
La razón de probabilidades común de las tablas de contingencia K se define como:
La hipótesis nula es que no existe asociación entre el tratamiento y el resultado. Más precisamente, la hipótesis nula es y la hipótesis alternativa es . La estadística de prueba es:
Sigue una distribución asintóticamente con 1 gl bajo la hipótesis nula. [1]
Estabilidad del subconjunto
Se podría calcular la razón de riesgo o de probabilidades estándar de todos los estratos, dando como resultado razones de riesgo , donde es el número de estratos. Si se eliminara la estratificación, habría una razón de riesgo agregada de la tabla colapsada; sea . [ cita requerida ]
En general, se espera que el riesgo de un evento incondicional a la estratificación esté limitado entre el riesgo más alto y el más bajo dentro de los estratos (o de manera idéntica con los odds ratios ). Es fácil construir ejemplos donde este no es el caso, y es mayor o menor que todos para . Esto es comparable pero no idéntico a la paradoja de Simpson , y al igual que con la paradoja de Simpson, es difícil interpretar la estadística y decidir políticas en base a ella.
Klemens [5]
define una estadística como estable en subconjuntos si y solo si está acotada entre y , y una estadística de buen comportamiento como infinitamente diferenciable y no dependiente del orden de los estratos. Entonces, la estadística CMH es la única estadística de buen comportamiento que satisface la estabilidad de subconjuntos. [ cita requerida ]
Pruebas relacionadas
- La prueba de McNemar solo puede manejar pares. La prueba CMH es una generalización de la prueba de McNemar , ya que sus estadísticas de prueba son idénticas cuando cada estrato muestra un par. [6]
- La regresión logística condicional es más general que la prueba CMH, ya que puede manejar variables continuas y realizar análisis multivariados. Cuando se puede aplicar la prueba CMH, la estadística de prueba CMH y la estadística de prueba de puntuación de la regresión logística condicional son idénticas. [7]
- Prueba de Breslow-Day para asociación homogénea. La prueba CMH supone que el efecto del tratamiento es homogéneo en todos los estratos. La prueba de Breslow-Day permite comprobar este supuesto. Esto no supone un problema si los estratos son pequeños, por ejemplo, pares.
Notas
- ^ ab Agresti, Alan (2002). Análisis de datos categóricos . Hoboken, Nueva Jersey: John Wiley & Sons, Inc., págs. 231-232. ISBN 0-471-36093-7.
- ^ William G. Cochran (diciembre de 1954). "Algunos métodos para reforzar las pruebas χ2 comunes". Biometrics . 10 (4): 417–451. doi :10.2307/3001616. JSTOR 3001616.
- ^ Nathan Mantel y William Haenszel (abril de 1959). "Aspectos estadísticos del análisis de datos de estudios retrospectivos de enfermedades". Revista del Instituto Nacional del Cáncer . 22 (4): 719–748. doi :10.1093/jnci/22.4.719. PMID 13655060.
- ^ Nathan Mantel (septiembre de 1963). "Pruebas de chi-cuadrado con un grado de libertad, extensiones del procedimiento de Mantel-Haenszel". Revista de la Asociación Estadounidense de Estadística . 58 (303): 690–700. doi :10.1080/01621459.1963.10500879. JSTOR 2282717.
- ^ Ben Klemens (junio de 2021). "An Analysis of US Domestic Migration via Subset-stable Measures of Administrative Data" (Un análisis de la migración interna en Estados Unidos mediante medidas de datos administrativos estables en subconjuntos) . Journal of Computational Social Science (Revista de Ciencias Sociales Computacionales) . 5 : 351–382. doi :10.1007/s42001-021-00124-w. S2CID : 236308711.
- ^ Agresti, Alan (2002). Análisis de datos categóricos . Hoboken, Nueva Jersey: John Wiley & Sons, Inc., pág. 413. ISBN 0-471-36093-7.
- ^ Day NE, Byar DP (septiembre de 1979). "Prueba de hipótesis en estudios de casos y controles: equivalencia de las pruebas de puntuación de Mantel-Haenszel y de las pruebas de puntuación logit". Biometrics . 35 (3): 623–630. doi :10.2307/2530253. JSTOR 2530253. PMID 497345.
Enlaces externos
- Introducción a la prueba de Cochran-Mantel-Haenszel