stringtranslate.com

Modelo de riesgos proporcionales

Los modelos de riesgos proporcionales son una clase de modelos de supervivencia en estadística . Los modelos de supervivencia relacionan el tiempo que pasa, antes de que ocurra algún evento, con una o más covariables que pueden estar asociadas con esa cantidad de tiempo. En un modelo de riesgos proporcionales, el efecto único de un aumento de una unidad en una covariable es multiplicativo con respecto a la tasa de riesgo . La tasa de riesgo en el momento t es la probabilidad por corto tiempo d t de que ocurra un evento entre t y t+d t dado que hasta el momento t todavía no ha ocurrido ningún evento. Por ejemplo, tomar un medicamento puede reducir a la mitad la tasa de riesgo de que ocurra un derrame cerebral, o cambiar el material del que está construido un componente fabricado puede duplicar su tasa de riesgo de falla. Otros tipos de modelos de supervivencia, como los modelos de tiempo de falla acelerado, no muestran riesgos proporcionales. El modelo de tiempo de falla acelerado describe una situación en la que la historia de vida biológica o mecánica de un evento se acelera (o desacelera).

Fondo

Los modelos de supervivencia pueden considerarse compuestos por dos partes: la función de riesgo basal subyacente , a menudo denominada , que describe cómo el riesgo de evento por unidad de tiempo cambia con el tiempo en los niveles basales de covariables; y los parámetros de efecto, que describen cómo varía el riesgo en respuesta a covariables explicativas. Un ejemplo médico típico incluiría covariables como la asignación del tratamiento, así como características del paciente como la edad al inicio del estudio, el género y la presencia de otras enfermedades al inicio del estudio, con el fin de reducir la variabilidad y/o controlar los factores de confusión.

La condición de riesgos proporcionales [1] establece que las covariables están relacionadas multiplicativamente con el riesgo. En el caso más simple de coeficientes estacionarios, por ejemplo, un tratamiento con un fármaco puede, digamos, reducir a la mitad el riesgo de un sujeto en un momento dado , mientras que el riesgo de referencia puede variar. Sin embargo, hay que tener en cuenta que esto no duplica la vida del sujeto; el efecto preciso de las covariables en la vida depende del tipo de . La covariable no se limita a predictores binarios; en el caso de una covariable continua , normalmente se supone que el riesgo responde de forma exponencial; cada aumento unitario de da como resultado un escalamiento proporcional del riesgo.

El modelo de Cox

Introducción

Sir David Cox observó que si se cumple el supuesto de riesgos proporcionales (o se supone que se cumple), entonces es posible estimar el parámetro o los parámetros de efecto, indicados a continuación, sin tener en cuenta la función de riesgo completa. Este enfoque para los datos de supervivencia se denomina aplicación del modelo de riesgos proporcionales de Cox [2] , a veces abreviado como modelo de Cox o modelo de riesgos proporcionales [3] . Sin embargo, Cox también señaló que la interpretación biológica del supuesto de riesgos proporcionales puede ser bastante complicada [4] [5]

Sea X i = ( X i 1 , … , X ip ) los valores realizados de las covariables p para el sujeto i . La función de riesgo para el modelo de riesgos proporcionales de Cox tiene la forma Esta expresión da la función de riesgo en el tiempo t para el sujeto i con vector de covariables (variables explicativas) X i . Nótese que entre sujetos, el riesgo de referencia es idéntico (no depende de i ). La única diferencia entre los riesgos de los sujetos proviene del factor de escala de referencia .

¿Por qué se llama “proporcional”?

Para empezar, supongamos que solo tenemos una única covariable, , y por lo tanto un único coeficiente, . Consideremos el efecto de aumentar en 1:

Podemos ver que al aumentar una covariable en 1, el riesgo original se escala por la constante . Si reorganizamos un poco las cosas, vemos que:

El lado derecho es constante en el tiempo (ningún término tiene una ). Esta relación, , se denomina relación proporcional .

En términos más generales, considere dos sujetos, i y j , con covariables y respectivamente. Considere la relación de sus riesgos:

El lado derecho no depende del tiempo, ya que el único factor dependiente del tiempo, , se canceló. Por lo tanto, la relación de riesgos de dos sujetos es una constante, es decir, los riesgos son proporcionales.

Ausencia de un término de intersección

A menudo, en los modelos de regresión se utiliza un término de intersección (también llamado término constante o término de sesgo). El modelo de Cox carece de uno porque el riesgo de referencia, , lo reemplaza. Veamos qué sucedería si incluyéramos un término de intersección de todos modos, denotado como : donde hemos redefinido como un nuevo riesgo de referencia, . Por lo tanto, el riesgo de referencia incorpora todas las partes del riesgo que no dependen de las covariables de los sujetos, lo que incluye cualquier término de intersección (que es constante para todos los sujetos, por definición).

Probabilidad de tiempos únicos

La probabilidad parcial de Cox , que se muestra a continuación, se obtiene utilizando la estimación de Breslow de la función de riesgo de referencia, introduciéndola en la probabilidad total y observando luego que el resultado es un producto de dos factores. El primer factor es la probabilidad parcial que se muestra a continuación, en la que el riesgo de referencia se ha "cancelado". Es simplemente la probabilidad de que los sujetos hayan experimentado eventos en el orden en que realmente han ocurrido, dado el conjunto de momentos de ocurrencia y dadas las covariables de los sujetos. El segundo factor está libre de los coeficientes de regresión y depende de los datos solo a través del patrón de censura . El efecto de las covariables estimadas por cualquier modelo de riesgos proporcionales se puede informar como razones de riesgo .

Para calcular la probabilidad parcial, la probabilidad para el orden de eventos, indexemos las M muestras para las cuales los eventos ya han ocurrido incrementando el tiempo de ocurrencia, Y 1 < Y ​​2 < ... < Y M . Las covariables de todos los demás sujetos para los cuales no ha ocurrido ningún evento obtienen índices M +1,.., N . La probabilidad parcial puede factorizarse en un factor para cada evento que ha ocurrido. El factor i 'ésimo es la probabilidad de que de todos los sujetos ( i , i +1,..., N ) para los cuales no ha ocurrido ningún evento antes del tiempo Y i , el que realmente ocurrió en el tiempo Y i sea el evento para el sujeto i : donde θ j = exp( X jβ ) y la suma es sobre el conjunto de sujetos j donde el evento no ha ocurrido antes del tiempo Y i (incluyendo el sujeto i mismo). Obviamente 0 <  L i (β) ≤ 1.

Si consideramos a los sujetos como estadísticamente independientes entre sí, la probabilidad parcial para el orden de los eventos [6] es donde los sujetos para los que ocurrió un evento se indican mediante C i  = 1 y todos los demás mediante C i  = 0. La probabilidad parcial logarítmica correspondiente es donde hemos escrito utilizando la indexación introducida anteriormente de una manera más general, como . Fundamentalmente, el efecto de las covariables se puede estimar sin la necesidad de especificar la función de riesgo a lo largo del tiempo. La probabilidad parcial se puede maximizar sobre β para producir estimaciones de probabilidad parcial máxima de los parámetros del modelo.

La función de puntuación parcial es

y la matriz hessiana de la verosimilitud parcial es

Utilizando esta función de puntuación y la matriz de Hesse, se puede maximizar la verosimilitud parcial utilizando el algoritmo de Newton-Raphson . La inversa de la matriz de Hesse, evaluada en la estimación de β , se puede utilizar como una matriz de varianza-covarianza aproximada para la estimación y se puede utilizar para producir errores estándar aproximados para los coeficientes de regresión.

Probabilidad cuando existen tiempos empatados

Se han propuesto varios enfoques para manejar situaciones en las que existen empates en los datos de tiempo. El método de Breslow describe el enfoque en el que se utiliza el procedimiento descrito anteriormente sin modificaciones, incluso cuando existen empates. Un enfoque alternativo que se considera que da mejores resultados es el método de Efron . [7] Sea t j los tiempos únicos, sea H j el conjunto de índices i tales que Y i  =  t j ​​y C i  = 1, y sea m j  = | H j |. El enfoque de Efron maximiza la siguiente verosimilitud parcial.

La verosimilitud parcial logarítmica correspondiente es la función de puntuación y la matriz hessiana es donde

Tenga en cuenta que cuando H j está vacío (todas las observaciones con tiempo t j están censuradas), los sumandos en estas expresiones se tratan como cero.

Ejemplos

A continuación se presentan algunos ejemplos prácticos del modelo de Cox.

Una única covariable binaria

Supongamos que el punto final que nos interesa es la supervivencia del paciente durante un período de observación de 5 años después de una cirugía. Los pacientes pueden morir dentro del período de 5 años, y registramos cuándo murieron, o los pacientes pueden vivir más de 5 años, y solo registramos que vivieron más de 5 años. La cirugía se realizó en uno de dos hospitales, A o B , y nos gustaría saber si la ubicación del hospital está asociada con la supervivencia a 5 años. Específicamente, nos gustaría saber el aumento relativo (o disminución) en el riesgo de una cirugía realizada en el hospital A en comparación con el hospital B. Se proporcionan algunos datos (falsos), donde cada fila representa un paciente: T es el tiempo durante el cual el paciente fue observado antes de morir o 5 años (medidos en meses), y C denota si el paciente murió en el período de 5 años. Hemos codificado el hospital como una variable binaria denotada X : 1 si es del hospital A , 0 si es del hospital B.

Nuestro modelo proporcional de Cox de una sola covariable se ve como el siguiente, con i representando el efecto del hospital e i indexando cada paciente:

Usando un software estadístico, podemos estimar que es 2,12. El cociente de riesgo es el exponencial de este valor, . Para ver por qué, considere el cociente de riesgos, específicamente:

Por lo tanto, el cociente de riesgo del hospital A con respecto al hospital B es . Dejando de lado por un momento la significancia estadística, podemos afirmar que los pacientes del hospital A tienen un riesgo 8,3 veces mayor de morir en un período corto de tiempo en comparación con los del hospital B.

Hay algunas salvedades importantes que mencionar sobre la interpretación:

  1. Un riesgo de muerte 8,3 veces mayor no significa que 8,3 veces más pacientes morirán en el hospital R: El análisis de supervivencia examina la rapidez con la que ocurren los acontecimientos, no simplemente si ocurren o no.
  2. Más concretamente, el "riesgo de muerte" es una medida de una tasa. Una tasa tiene unidades, como los metros por segundo. Sin embargo, una tasa relativa no las tiene: una bicicleta puede ir dos veces más rápido que otra bicicleta (la bicicleta de referencia), sin especificar ninguna unidad. Del mismo modo, el riesgo de muerte (tasa de muerte) en el hospital A es 8,3 veces mayor (más rápido) que el riesgo de muerte en el hospital B (el grupo de referencia).
  3. La cantidad inversa es el cociente de riesgo del hospital B en relación con el hospital A.
  4. No hemos realizado ninguna inferencia sobre las probabilidades de supervivencia entre los hospitales. Esto se debe a que necesitaríamos una estimación de la tasa de riesgo de referencia, , además de nuestra estimación. Sin embargo, la estimación estándar del modelo de riesgo proporcional de Cox no estima directamente la tasa de riesgo de referencia.
  5. Como hemos ignorado el único componente del modelo que varía con el tiempo, la tasa de riesgo de referencia, nuestra estimación es invariable en la escala temporal. Por ejemplo, si hubiéramos medido el tiempo en años en lugar de meses, habríamos obtenido la misma estimación.
  6. Es tentador decir que el hospital causó la diferencia de riesgos entre los dos grupos, pero como nuestro estudio no es causal (es decir, no sabemos cómo se generaron los datos), nos quedamos con una terminología como "asociado".

Una única covariable continua

Para demostrar un caso de uso menos tradicional del análisis de supervivencia, el siguiente ejemplo será una pregunta económica: ¿cuál es la relación entre la relación precio-beneficio (P/E) de una empresa en su primer aniversario de salida a bolsa y su supervivencia futura? Más específicamente, si consideramos que el "evento de nacimiento" de una empresa es su primer aniversario de salida a bolsa, y cualquier quiebra, venta, salida a bolsa, etc. como un evento de "muerte" de la empresa, nos gustaría saber la influencia de la relación precio-beneficio de la empresa en su "nacimiento" (primer aniversario de salida a bolsa) en su supervivencia.

Se proporciona un conjunto de datos (falso) con datos de supervivencia de 12 empresas: T representa el número de días entre el primer aniversario de la IPO y la muerte (o una fecha de finalización del 01-01-2022, si no murió). C representa si la empresa murió antes del 01-01-2022 o no. P/E representa la relación precio-beneficio de la empresa en su primer aniversario de la IPO.

A diferencia del ejemplo anterior, donde había una variable binaria, este conjunto de datos tiene una variable continua, P/E; sin embargo, el modelo parece similar: donde representa la relación P/E de una empresa. Al ejecutar este conjunto de datos a través de un modelo de Cox, se obtiene una estimación del valor de la variable desconocida , que es -0,34. Por lo tanto, una estimación del riesgo total es:

Dado que no se ha estimado el riesgo de referencia , no es posible calcular el riesgo total. Sin embargo, considere la relación entre los riesgos de las empresas i y j :

Todos los términos de la derecha son conocidos, por lo que es posible calcular la proporción de riesgos entre las empresas. Dado que no hay ningún término dependiente del tiempo a la derecha (todos los términos son constantes), los riesgos son proporcionales entre sí. Por ejemplo, la proporción de riesgos de la empresa 5 con respecto a la empresa 2 es . Esto significa que, dentro del intervalo de estudio, el riesgo de "muerte" de la empresa 5 es 0,33 ≈ 1/3 del riesgo de muerte de la empresa 2.

Hay algunas salvedades importantes que mencionar sobre la interpretación:

  1. El cociente de riesgo es la cantidad , que se encuentra en el ejemplo anterior. Del último cálculo anterior, una interpretación de esto es como la relación de riesgos entre dos "sujetos" cuyas variables difieren en una unidad: si , entonces . La elección de "difieren en una unidad" es conveniente, ya que comunica con precisión el valor de .
  2. El riesgo de referencia se puede representar cuando el factor de escala es 1, es decir , . ¿Podemos interpretar el riesgo de referencia como el riesgo de una empresa "de referencia" cuyo P/E resulta ser 0? Esta interpretación del riesgo de referencia como "riesgo de un sujeto de referencia" es imperfecta, ya que es posible que sea imposible que la covariable sea 0. En esta aplicación, un P/E de 0 no tiene sentido (significa que el precio de las acciones de la empresa es 0, es decir, está "muerta"). Una interpretación más apropiada sería "el riesgo cuando todas las variables son nulas".
  1. Resulta tentador querer comprender e interpretar un valor como el que representa el riesgo de una empresa. Sin embargo, considere lo que esto representa en realidad: . Aquí hay implícitamente una relación de riesgos, que compara el riesgo de la empresa i con el de una empresa de referencia imaginaria con un P/E de 0. Sin embargo, como se explicó anteriormente, un P/E de 0 es imposible en esta aplicación, por lo que no tiene sentido en este ejemplo. Sin embargo, las relaciones entre los riesgos plausibles son significativas.

Predictores y coeficientes que varían con el tiempo

Las extensiones a variables dependientes del tiempo, estratos dependientes del tiempo y eventos múltiples por sujeto pueden incorporarse mediante la formulación del proceso de conteo de Andersen y Gill. [8] Un ejemplo del uso de modelos de riesgo con regresores que varían con el tiempo es la estimación del efecto del seguro de desempleo sobre los períodos de desempleo. [9] [10]

Además de permitir covariables variables en el tiempo (es decir, predictores), el modelo de Cox también puede generalizarse a coeficientes variables en el tiempo. Es decir, el efecto proporcional de un tratamiento puede variar con el tiempo; por ejemplo, un fármaco puede ser muy eficaz si se administra dentro del mes siguiente a la aparición de la enfermedad y volverse menos eficaz a medida que pasa el tiempo. La hipótesis de que no hay cambios con el tiempo (estacionariedad) del coeficiente puede entonces probarse. Los detalles y el software ( paquete R ) están disponibles en Martinussen y Scheike (2006). [11] [12]

En este contexto, también se podría mencionar que es teóricamente posible especificar el efecto de las covariables mediante el uso de riesgos aditivos, [13] es decir, especificando Si se utilizan dichos modelos de riesgos aditivos en situaciones en las que el objetivo es la maximización de la (log-)verosimilitud, se debe tener cuidado de restringirlos a valores no negativos. Quizás como resultado de esta complicación, estos modelos rara vez se ven. Si el objetivo son, en cambio, los mínimos cuadrados, la restricción de no negatividad no es estrictamente necesaria.

Especificación de la función de riesgo de referencia

El modelo de Cox puede especializarse si existe una razón para suponer que el riesgo de referencia sigue una forma particular. En este caso, el riesgo de referencia se reemplaza por una función dada. Por ejemplo, suponiendo que la función de riesgo es la función de riesgo de Weibull , se obtiene el modelo de riesgos proporcionales de Weibull .

Por cierto, el uso del riesgo de referencia de Weibull es la única circunstancia en la que el modelo satisface tanto los modelos de riesgos proporcionales como los de tiempo de falla acelerado .

El término genérico modelos de riesgos proporcionales paramétricos se puede utilizar para describir modelos de riesgos proporcionales en los que se especifica la función de riesgo. El modelo de riesgos proporcionales de Cox a veces se denomina modelo semiparamétrico por el contrario.

Algunos autores utilizan el término modelo de riesgos proporcionales de Cox incluso cuando especifican la función de riesgo subyacente, [14] para reconocer la deuda de todo el campo con David Cox.

El término modelo de regresión de Cox (omitiendo los riesgos proporcionales ) se utiliza a veces para describir la extensión del modelo de Cox para incluir factores dependientes del tiempo. Sin embargo, este uso es potencialmente ambiguo ya que el modelo de riesgos proporcionales de Cox puede describirse como un modelo de regresión.

Relación con los modelos de Poisson

Existe una relación entre los modelos de riesgos proporcionales y los modelos de regresión de Poisson que a veces se utiliza para ajustar modelos de riesgos proporcionales aproximados en software para regresión de Poisson. La razón habitual para hacer esto es que el cálculo es mucho más rápido. Esto era más importante en la época de las computadoras más lentas, pero aún puede ser útil para conjuntos de datos particularmente grandes o problemas complejos. Laird y Olivier (1981) [15] proporcionan los detalles matemáticos. Señalan que "no asumimos que [el modelo de Poisson] sea verdadero, sino que simplemente lo usamos como un dispositivo para derivar la probabilidad". El libro de McCullagh y Nelder [16] sobre modelos lineales generalizados tiene un capítulo sobre la conversión de modelos de riesgos proporcionales a modelos lineales generalizados .

Bajo configuración de alta dimensión

En alta dimensión, cuando el número de covariables p es grande en comparación con el tamaño de la muestra n, el método LASSO es una de las estrategias clásicas de selección de modelos. Tibshirani (1997) ha propuesto un procedimiento Lasso para el parámetro de regresión de riesgo proporcional. [17] El estimador Lasso del parámetro de regresión β se define como el minimizador del opuesto de la log-verosimilitud parcial de Cox bajo una restricción de tipo L 1 -norma .

Recientemente se han producido avances teóricos sobre este tema. [18] [19] [20] [21]

Implementaciones de software

Véase también

Notas

  1. ^ Breslow, NE (1975). "Análisis de datos de supervivencia según el modelo de riesgos proporcionales". Revista Internacional de Estadística / Revue Internationale de Statistique . 43 (1): 45–57. doi :10.2307/1402659. JSTOR  1402659.
  2. ^ Cox, David R (1972). "Modelos de regresión y tablas de mortalidad". Revista de la Royal Statistical Society, Serie B. 34 ( 2): 187–220. JSTOR  2985181. MR  0341758.
  3. ^ Kalbfleisch, John D.; Schaubel, Douglas E. (10 de marzo de 2023). "Cincuenta años del modelo de Cox". Revisión anual de estadística y su aplicación . 10 (1): 1–23. Bibcode :2023AnRSA..10....1K. doi : 10.1146/annurev-statistics-033021-014043 . ISSN  2326-8298.
  4. ^ Reid, N. (1994). "Una conversación con Sir David Cox". Ciencia estadística . 9 (3): 439–455. doi : 10.1214/ss/1177010394 .
  5. ^ Cox, DR (1997). Algunas observaciones sobre el análisis de datos de supervivencia . Primer Simposio de Bioestadística de Seattle: Análisis de supervivencia.
  6. ^ "Cada fallo contribuye a la función de verosimilitud", Cox (1972), página 191.
  7. ^ Efron, Bradley (1974). "La eficiencia de la función de verosimilitud de Cox para datos censurados". Revista de la Asociación Estadounidense de Estadística . 72 (359): 557–565. doi :10.1080/01621459.1977.10480613. JSTOR  2286217.
  8. ^ Andersen, P.; Gill, R. (1982). "Modelo de regresión de Cox para procesos de recuento, un estudio de muestra grande". Anales de Estadística . 10 (4): 1100–1120. doi : 10.1214/aos/1176345976 . JSTOR  2240714.
  9. ^ Meyer, BD (1990). "Seguro de desempleo y períodos de desempleo" (PDF) . Econometrica . 58 (4): 757–782. doi :10.2307/2938349. JSTOR  2938349.
  10. ^ Bover, O.; Arellano, M .; Bentolila, S. (2002). "Duración del desempleo, duración de los beneficios y el ciclo económico" (PDF) . The Economic Journal . 112 (479): 223–265. doi :10.1111/1468-0297.00034. S2CID  15575103.
  11. ^ Martinussen; Scheike (2006). Modelos de regresión dinámica para datos de supervivencia . Saltador. doi :10.1007/0-387-33960-4. ISBN 978-0-387-20274-7.
  12. ^ "timereg: Modelos de regresión flexibles para datos de supervivencia". CRAN .
  13. ^ Cox, DR (1997). Algunas observaciones sobre el análisis de datos de supervivencia . Primer Simposio de Bioestadística de Seattle: Análisis de supervivencia.
  14. ^ Bender, R.; Augustin, T.; Blettner, M. (2006). "Generación de tiempos de supervivencia para simular modelos de riesgos proporcionales de Cox". Estadísticas en Medicina . 24 (11): 1713–1723. doi : 10.1002/sim.2369 . PMID  16680804. S2CID  43875995.
  15. ^ Nan Laird y Donald Olivier (1981). "Análisis de covarianza de datos de supervivencia censurados utilizando técnicas de análisis log-lineal". Revista de la Asociación Estadounidense de Estadística . 76 (374): 231–240. doi :10.2307/2287816. JSTOR  2287816.
  16. ^ P. McCullagh y JA Nelder (2000). "Capítulo 13: Modelos para datos de supervivencia". Modelos lineales generalizados (segunda edición). Boca Raton, Florida: Chapman & Hall/CRC. ISBN 978-0-412-31760-6.(Segunda edición 1989; primera reimpresión del CRC 1999.)
  17. ^ Tibshirani, R. (1997). "El método Lasso para la selección de variables en el modelo de Cox". Estadística en Medicina . 16 (4): 385–395. CiteSeerX 10.1.1.411.8024 . doi :10.1002/(SICI)1097-0258(19970228)16:4<385::AID-SIM380>3.0.CO;2-3. PMID  9044528. 
  18. ^ Bradić, J.; Fan, J.; Jiang, J. (2011). "Regularización para el modelo de riesgos proporcionales de Cox con NP-dimensionalidad". Anales de Estadística . 39 (6): 3092–3120. arXiv : 1010.5233 . doi :10.1214/11-AOS911. PMC 3468162 . PMID  23066171. 
  19. ^ Bradić, J.; Song, R. (2015). "Estimación estructurada en el modelo de Cox no paramétrico". Revista electrónica de estadística . 9 (1): 492–534. arXiv : 1207.4510 . doi :10.1214/15-EJS1004. S2CID  88519017.
  20. ^ Kong, S.; Nan, B. (2014). "Desigualdades de oráculo no asintóticas para la regresión de Cox de alta dimensión mediante Lasso". Statistica Sinica . 24 (1): 25–42. arXiv : 1204.1992 . doi :10.5705/ss.2012.240. PMC 3916829 . PMID  24516328. 
  21. ^ Huang, J.; Sun, T.; Ying, Z.; Yu, Y.; Zhang, CH (2011). "Inigualdades de Oracle para el lazo en el modelo de Cox". Anales de Estadística . 41 (3): 1142–1165. arXiv : 1306.4847 . doi :10.1214/13-AOS1098. PMC 3786146 . PMID  24086091. 
  22. ^ "CoxModelFit". Centro de documentación de lenguajes y sistemas Wolfram .

Referencias