Estadísticas de Cochran-Mantel-Haenszel

En estadística , la prueba de Cochran–Mantel–Haenszel ( CMH ) es una prueba utilizada en el análisis de datos categóricos estratificados o emparejados . Permite a un investigador probar la asociación entre un predictor binario o tratamiento y un resultado binario como el estado de caso o control mientras se tiene en cuenta la estratificación. ^[1] A diferencia de la prueba de McNemar , que solo puede manejar pares, la prueba CMH maneja tamaños de estratos arbitrarios. Lleva el nombre de William G. Cochran , Nathan Mantel y William Haenszel . ^[2]^[3] Las extensiones de esta prueba a una respuesta categórica y/o a varios grupos se denominan comúnmente estadísticas de Cochran–Mantel–Haenszel. ^[4] A menudo se utiliza en estudios observacionales en los que la asignación aleatoria de sujetos a diferentes tratamientos no se puede controlar, pero se pueden medir las covariables de confusión .

Definición

Consideramos una variable de resultado binaria como el estado del caso (por ejemplo, cáncer de pulmón) y un predictor binario como el estado del tratamiento (por ejemplo, tabaquismo). Las observaciones se agrupan en estratos. Los datos estratificados se resumen en una serie de tablas de contingencia 2 × 2, una para cada estrato. La i -ésima tabla de contingencia es:

La razón de probabilidades común de las tablas de contingencia K se define como:

R={{\suma _{i=1}^{K}{\frac {A_{i}D_{i}}{T_{i}}}} \sobre {\suma _{i=1}^{K}{B_{i}C_{i} \sobre T_{i}}}},

La hipótesis nula es que no existe asociación entre el tratamiento y el resultado. Más precisamente, la hipótesis nula es y la hipótesis alternativa es . La estadística de prueba es: $H_{0}:R=1$ $Estilo de visualización H_{1}:R\neq 1$

\xi _{\text{CMH}}={\frac {\left[\sum _{i=1}^{K}\left(A_{i}-{\frac {N_{1i}M_{1i}}{T_{i}}}\right)\right]^{2}}{\sum _{i=1}^{K}{N_{1i}N_{2i}M_{1i}M_{2i} \over T_{i}^{2}(T_{i}-1)}}}.

Sigue una distribución asintóticamente con 1 gl bajo la hipótesis nula. ^[1] $\chi ^{2}$

Estabilidad del subconjunto

Se podría calcular la razón de riesgo o de probabilidades estándar de todos los estratos, dando como resultado razones de riesgo , donde es el número de estratos. Si se eliminara la estratificación, habría una razón de riesgo agregada de la tabla colapsada; sea . ^[^{cita requerida}^] $r_{1},r_{2},\puntos ,r_{n}$ ${\estilo de visualización n}$ ${\estilo de visualización R}$

En general, se espera que el riesgo de un evento incondicional a la estratificación esté limitado entre el riesgo más alto y el más bajo dentro de los estratos (o de manera idéntica con los odds ratios ). Es fácil construir ejemplos donde este no es el caso, y es mayor o menor que todos para . Esto es comparable pero no idéntico a la paradoja de Simpson , y al igual que con la paradoja de Simpson, es difícil interpretar la estadística y decidir políticas en base a ella. ${\estilo de visualización R}$ $estilo de visualización r_{i}}$ $i\en 1,\puntos ,n$

Klemens ^[5] define una estadística como estable en subconjuntos si y solo si está acotada entre y , y una estadística de buen comportamiento como infinitamente diferenciable y no dependiente del orden de los estratos. Entonces, la estadística CMH es la única estadística de buen comportamiento que satisface la estabilidad de subconjuntos. ^[^{cita requerida}^] ${\estilo de visualización R}$ $\min(r_{i})$ $\max(r_{i})$

Pruebas relacionadas

La prueba de McNemar solo puede manejar pares. La prueba CMH es una generalización de la prueba de McNemar , ya que sus estadísticas de prueba son idénticas cuando cada estrato muestra un par. ^[6]
La regresión logística condicional es más general que la prueba CMH, ya que puede manejar variables continuas y realizar análisis multivariados. Cuando se puede aplicar la prueba CMH, la estadística de prueba CMH y la estadística de prueba de puntuación de la regresión logística condicional son idénticas. ^[7]
Prueba de Breslow-Day para asociación homogénea. La prueba CMH supone que el efecto del tratamiento es homogéneo en todos los estratos. La prueba de Breslow-Day permite comprobar este supuesto. Esto no supone un problema si los estratos son pequeños, por ejemplo, pares.

Notas

^ ab Agresti, Alan (2002). Análisis de datos categóricos . Hoboken, Nueva Jersey: John Wiley & Sons, Inc., págs. 231-232. ISBN 0-471-36093-7.
^ William G. Cochran (diciembre de 1954). "Algunos métodos para reforzar las pruebas χ2 comunes". Biometrics . 10 (4): 417–451. doi :10.2307/3001616. JSTOR 3001616.
^ Nathan Mantel y William Haenszel (abril de 1959). "Aspectos estadísticos del análisis de datos de estudios retrospectivos de enfermedades". Revista del Instituto Nacional del Cáncer . 22 (4): 719–748. doi :10.1093/jnci/22.4.719. PMID 13655060.
^ Nathan Mantel (septiembre de 1963). "Pruebas de chi-cuadrado con un grado de libertad, extensiones del procedimiento de Mantel-Haenszel". Revista de la Asociación Estadounidense de Estadística . 58 (303): 690–700. doi :10.1080/01621459.1963.10500879. JSTOR 2282717.
^ Ben Klemens (junio de 2021). "An Analysis of US Domestic Migration via Subset-stable Measures of Administrative Data" (Un análisis de la migración interna en Estados Unidos mediante medidas de datos administrativos estables en subconjuntos) . Journal of Computational Social Science (Revista de Ciencias Sociales Computacionales) . 5 : 351–382. doi :10.1007/s42001-021-00124-w. S2CID : 236308711.
^ Agresti, Alan (2002). Análisis de datos categóricos . Hoboken, Nueva Jersey: John Wiley & Sons, Inc., pág. 413. ISBN 0-471-36093-7.
^ Day NE, Byar DP (septiembre de 1979). "Prueba de hipótesis en estudios de casos y controles: equivalencia de las pruebas de puntuación de Mantel-Haenszel y de las pruebas de puntuación logit". Biometrics . 35 (3): 623–630. doi :10.2307/2530253. JSTOR 2530253. PMID 497345.

Enlaces externos

Introducción a la prueba de Cochran-Mantel-Haenszel