Prueba utilizada en el análisis de datos categóricos estratificados o emparejados.
En estadística , la prueba de Cochran-Mantel-Haenszel ( CMH ) es una prueba utilizada en el análisis de datos categóricos estratificados o emparejados . Permite al investigador probar la asociación entre un predictor o tratamiento binario y un resultado binario, como el estado de caso o control, teniendo en cuenta la estratificación. [1] A diferencia de la prueba de McNemar , que solo puede manejar pares, la prueba CMH maneja tamaños de estratos arbitrarios. Lleva el nombre de William G. Cochran , Nathan Mantel y William Haenszel . [2] [3] Las extensiones de esta prueba a una respuesta categórica y/o a varios grupos se denominan comúnmente estadísticas Cochran-Mantel-Haenszel. [4] A menudo se utiliza en estudios observacionales en los que no se puede controlar la asignación aleatoria de sujetos a diferentes tratamientos, pero se pueden medir las covariables de confusión .
Definición
Consideramos una variable de resultado binaria como el estado del caso (p. ej., cáncer de pulmón) y un predictor binario como el estado del tratamiento (p. ej., tabaquismo). Las observaciones se agrupan en estratos. Los datos estratificados se resumen en una serie de tablas de contingencia de 2 × 2, una para cada estrato. La i -ésima tabla de contingencia es:
El odds ratio común de las tablas de contingencia K se define como:
![{\displaystyle R={{\sum _{i=1}^{K}{\frac {A_{i}D_{i}}{T_{i}}}} \over {\sum _{i=1 }^{K}{B_{i}C_{i} \sobre T_{i}}}},}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
La hipótesis nula es que no existe asociación entre el tratamiento y el resultado. Más precisamente, la hipótesis nula es y la hipótesis alternativa es . El estadístico de prueba es:![{\displaystyle H_{0}:R=1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle H_{1}:R\neq 1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \xi _{\text{CMH}}={\frac {\left[\sum _{i=1}^{K}\left(A_{i}-{\frac {N_{1i}M_ {1i}}{T_{i}}}\right)\right]^{2}}{\sum _{i=1}^{K}{N_{1i}N_{2i}M_{1i}M_{ 2i} \sobre T_{i}^{2}(T_{i}-1)}}}.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Sigue una distribución asintóticamente con 1 gl bajo la hipótesis nula. [1]![{\displaystyle \chi^{2}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Estabilidad del subconjunto
Se podría calcular el odds ratio o riesgo estándar de todos los estratos, dando los ratios de riesgo , donde es el número de estratos. Si se eliminara la estratificación, habría un índice de riesgo agregado en la tabla colapsada; deja que esto sea . [ cita necesaria ]![{\ Displaystyle r_ {1}, r_ {2}, \ puntos, r_ {n}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle n}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle R}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Generalmente se espera que el riesgo de un evento incondicional en la estratificación esté limitado entre el riesgo más alto y el más bajo dentro de los estratos (o de manera idéntica con los odds ratios ). Es fácil construir ejemplos donde este no es el caso y es mayor o menor que todo for . Esto es comparable, pero no idéntico, a la paradoja de Simpson y, al igual que con la paradoja de Simpson, es difícil interpretar la estadística y decidir políticas basadas en ella.![{\displaystyle R}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle r_{i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle i\en 1,\puntos,n}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Klemens [5]
define una estadística como subconjunto estable si está limitada entre y y una estadística de buen comportamiento como infinitamente diferenciable y no dependiente del orden de los estratos. Entonces, la estadística CMH es la única estadística de buen comportamiento que satisface la estabilidad del subconjunto. [ cita necesaria ]![{\displaystyle R}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \min(r_{i})}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \max(r_{i})}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Pruebas relacionadas
- La prueba de McNemar sólo puede manejar pares. La prueba CMH es una generalización de la prueba de McNemar, ya que sus estadísticas de prueba son idénticas cuando cada estrato muestra un par. [6]
- La regresión logística condicional es más general que la prueba CMH, ya que puede manejar variables continuas y realizar análisis multivariados. Cuando se puede aplicar la prueba CMH, la estadística de la prueba CMH y la estadística de la prueba de puntuación de la regresión logística condicional son idénticas. [7]
- Prueba de Breslow-Day para asociación homogénea. La prueba CMH supone que el efecto del tratamiento es homogéneo en todos los estratos. La prueba de Breslow-Day permite comprobar este supuesto. Esto no es motivo de preocupación si los estratos son pequeños, por ejemplo, pares.
Notas
- ^ ab Agresti, Alan (2002). Análisis de datos categóricos . Hoboken, Nueva Jersey: John Wiley & Sons, Inc. págs. ISBN 0-471-36093-7.
- ^ William G. Cochran (diciembre de 1954). "Algunos métodos para fortalecer las pruebas comunes de χ2". Biometría . 10 (4): 417–451. doi :10.2307/3001616. JSTOR 3001616.
- ^ Nathan Mantel y William Haenszel (abril de 1959). "Aspectos estadísticos del análisis de datos de estudios retrospectivos de enfermedades". Revista del Instituto Nacional del Cáncer . 22 (4): 719–748. doi :10.1093/jnci/22.4.719. PMID 13655060.
- ^ Nathan Mantel (septiembre de 1963). "Pruebas de chi-cuadrado con un grado de libertad, extensiones del procedimiento de Mantel-Haenszel". Revista de la Asociación Estadounidense de Estadística . 58 (303): 690–700. doi :10.1080/01621459.1963.10500879. JSTOR 2282717.
- ^ Ben Klemens (junio de 2021). "Un análisis de la migración interna de EE. UU. a través de medidas de datos administrativos estables en subconjuntos" . Revista de Ciencias Sociales Computacionales . 5 : 351–382. doi :10.1007/s42001-021-00124-w. S2CID 236308711.
- ^ Agresti, Alan (2002). Análisis de datos categóricos . Hoboken, Nueva Jersey: John Wiley & Sons, Inc. p. 413.ISBN 0-471-36093-7.
- ^ Día NE, Byar DP (septiembre de 1979). "Prueba de hipótesis en estudios de casos y controles: equivalencia de estadísticas de Mantel-Haenszel y pruebas de puntuación logit". Biometría . 35 (3): 623–630. doi :10.2307/2530253. JSTOR 2530253. PMID 497345.
enlaces externos
- Introducción a la prueba de Cochran-Mantel-Haenszel