Prueba de hipótesis para comparar las distribuciones de supervivencia de dos muestras
La prueba de rango logarítmico , o prueba de rango logarítmico , es una prueba de hipótesis para comparar las distribuciones de supervivencia de dos muestras. Es una prueba no paramétrica y es adecuada para usar cuando los datos están sesgados a la derecha y censurados (técnicamente, la censura debe ser no informativa). Se usa ampliamente en ensayos clínicos para establecer la eficacia de un nuevo tratamiento en comparación con un tratamiento de control cuando la medición es el tiempo hasta el evento (como el tiempo desde el tratamiento inicial hasta un ataque cardíaco). La prueba a veces se denomina prueba de Mantel-Cox . La prueba de rango logarítmico también puede verse como una prueba de Cochran-Mantel-Haenszel estratificada en el tiempo .
La prueba fue propuesta por primera vez por Nathan Mantel y Richard y Julian Peto la llamaron prueba del rango logarítmico . [1] [2] [3 ]
Definición
La estadística de prueba del rango logarítmico compara las estimaciones de las funciones de riesgo de los dos grupos en cada momento de evento observado. Se construye calculando el número observado y esperado de eventos en uno de los grupos en cada momento de evento observado y luego sumándolos para obtener un resumen general de todos los puntos de tiempo en los que hay un evento.
Consideremos dos grupos de pacientes, por ejemplo, tratamiento vs. control. Sean los distintos momentos de los eventos observados en cada grupo. Sean y el número de sujetos "en riesgo" (que aún no han tenido un evento o han sido censurados) al comienzo del período en los grupos, respectivamente. Sea y el número observado de eventos en los grupos en el momento . Finalmente, defina y .
La hipótesis nula es que los dos grupos tienen funciones de riesgo idénticas, . Por lo tanto, bajo , para cada grupo , sigue una distribución hipergeométrica con parámetros , , . Esta distribución tiene un valor esperado y una varianza .
Para todos , la estadística del rango logarítmico se compara con su expectativa bajo . Se define como
- (para o )
Según el teorema del límite central , la distribución de cada una de ellas converge a la de una distribución normal estándar a medida que se acerca al infinito y, por lo tanto, se puede aproximar mediante la distribución normal estándar para un valor suficientemente grande . Se puede obtener una aproximación mejorada equiparando esta cantidad a las distribuciones de Pearson tipo I o II (beta) con los primeros cuatro momentos coincidentes, como se describe en el Apéndice B del artículo de Peto y Peto. [2]
Distribución asintótica
Si los dos grupos tienen la misma función de supervivencia, la estadística del rango logarítmico es aproximadamente normal estándar. Una prueba de nivel unilateral rechazará la hipótesis nula si donde es el cuartil superior de la distribución normal estándar. Si el cociente de riesgo es , hay un total de sujetos, es la probabilidad de que un sujeto en cualquiera de los grupos eventualmente tenga un evento (de modo que ese es el número esperado de eventos en el momento del análisis), y la proporción de sujetos asignados aleatoriamente a cada grupo es del 50%, entonces la estadística del rango logarítmico es aproximadamente normal con media y varianza 1. [4] Para una prueba de nivel unilateral con potencia , el tamaño de muestra requerido es
donde y son los cuartiles de la distribución normal estándar.
Distribución conjunta
Supongamos que y son las estadísticas del rango logarítmico en dos puntos temporales diferentes en el mismo estudio ( anteriormente). Nuevamente, supongamos que las funciones de riesgo en los dos grupos son proporcionales a la razón de riesgo y y son las probabilidades de que un sujeto tenga un evento en los dos puntos temporales donde . y son aproximadamente normales bivariadas con medias y y correlación . Se necesitan cálculos que involucren la distribución conjunta para mantener correctamente la tasa de error cuando un Comité de Monitoreo de Datos examina los datos varias veces dentro de un estudio .
Relación con otras estadísticas
- La estadística del rango logarítmico se puede derivar como la prueba de puntuación para el modelo de riesgos proporcionales de Cox que compara dos grupos. Por lo tanto, es asintóticamente equivalente a la estadística de la prueba de razón de verosimilitud basada en ese modelo.
- La estadística del rango logarítmico es asintóticamente equivalente a la estadística de prueba de razón de verosimilitud para cualquier familia de distribuciones con alternativa de riesgo proporcional. Por ejemplo, si los datos de las dos muestras tienen distribuciones exponenciales .
- Si es la estadística del rango logarítmico, es el número de eventos observados y es la estimación del cociente de riesgo, entonces . Esta relación es útil cuando se conocen dos de las cantidades (por ejemplo, de un artículo publicado), pero se necesita la tercera.
- La estadística del rango logarítmico se puede utilizar cuando las observaciones están censuradas. Si no hay observaciones censuradas en los datos, entonces es adecuada la prueba de suma de rangos de Wilcoxon .
- La estadística del rango logarítmico otorga a todos los cálculos el mismo peso, independientemente del momento en el que se produce un evento. La estadística de la prueba del rango logarítmico de Peto otorga más peso a los eventos anteriores cuando hay una gran cantidad de observaciones.
Supuestos de prueba
La prueba del rango logarítmico se basa en los mismos supuestos que la curva de supervivencia de Kaplan-Meier : es decir, que la censura no está relacionada con el pronóstico, las probabilidades de supervivencia son las mismas para los sujetos reclutados al principio y al final del estudio, y los eventos sucedieron en los momentos especificados. Las desviaciones de estos supuestos son más importantes si se cumplen de manera diferente en los grupos que se comparan, por ejemplo, si la censura es más probable en un grupo que en otro. [5]
Véase también
Referencias
- ^ Mantel, Nathan (1966). "Evaluación de los datos de supervivencia y dos nuevas estadísticas de orden de clasificación que surgen de su consideración". Cancer Chemotherapy Reports . 50 (3): 163–70. PMID 5910392.
- ^ ab Peto, Richard ; Peto, Julian (1972). "Procedimientos de prueba invariantes de rango asintóticamente eficientes". Revista de la Royal Statistical Society, Serie A . 135 (2). Blackwell Publishing: 185–207. doi :10.2307/2344317. hdl : 10338.dmlcz/103602 . JSTOR 2344317.
- ^ Harrington, David (2005). "Pruebas de rango lineal en análisis de supervivencia". Enciclopedia de bioestadística . Wiley Interscience. doi :10.1002/0470011815.b2a11047. ISBN . 047084907X.
- ^ Schoenfeld, D (1981). "Las propiedades asintóticas de las pruebas no paramétricas para comparar distribuciones de supervivencia". Biometrika . 68 (1): 316–319. doi :10.1093/biomet/68.1.316. JSTOR 2335833.
- ^ Bland, JM ; Altman, DG (2004). "La prueba del rango logarítmico". BMJ . 328 (7447): 1073. doi :10.1136/bmj.328.7447.1073. PMC 403858 . PMID 15117797.