stringtranslate.com

Modelo de riesgos proporcionales

Los modelos de riesgos proporcionales son una clase de modelos de supervivencia en estadística . Los modelos de supervivencia relacionan el tiempo que pasa, antes de que ocurra algún evento, con una o más covariables que pueden estar asociadas con esa cantidad de tiempo. En un modelo de riesgos proporcionales, el efecto único de un aumento unitario en una covariable es multiplicativo con respecto a la tasa de riesgo . Por ejemplo, tomar un medicamento puede reducir a la mitad el riesgo de sufrir un derrame cerebral, o cambiar el material con el que está construido un componente fabricado puede duplicar su riesgo de falla. Otros tipos de modelos de supervivencia, como los modelos de tiempo de falla acelerado, no presentan riesgos proporcionales. El modelo de tiempo de falla acelerado describe una situación en la que la historia de vida biológica o mecánica de un evento se acelera (o desacelera).

Fondo

Se puede considerar que los modelos de supervivencia constan de dos partes: la función de riesgo de referencia subyacente , a menudo denominada , que describe cómo el riesgo de un evento por unidad de tiempo cambia con el tiempo en los niveles de covariables de referencia ; y los parámetros del efecto, que describen cómo varía el peligro en respuesta a covariables explicativas. Un ejemplo médico típico incluiría covariables como la asignación del tratamiento, así como características del paciente como la edad al inicio del estudio, el sexo y la presencia de otras enfermedades al inicio del estudio, con el fin de reducir la variabilidad y/o controlar los factores de confusión.

La condición de riesgos proporcionales [1] establece que las covariables están relacionadas multiplicativamente con el riesgo. En el caso más simple de coeficientes estacionarios, por ejemplo, un tratamiento con un fármaco puede, digamos, reducir a la mitad el riesgo de un sujeto en cualquier momento dado , mientras que el riesgo inicial puede variar. Sin embargo, tenga en cuenta que esto no duplica la vida útil del sujeto; El efecto preciso de las covariables sobre la vida depende del tipo de . La covariable no se limita a predictores binarios; en el caso de una covariable continua , normalmente se supone que el peligro responde exponencialmente; cada unidad de aumento da como resultado una escala proporcional del peligro.

El modelo de Cox.

Introducción

Sir David Cox observó que si el supuesto de riesgos proporcionales se cumple (o se supone que se cumple), entonces es posible estimar los parámetros del efecto, indicados a continuación, sin ninguna consideración de la función de riesgo completa. Este enfoque de los datos de supervivencia se denomina aplicación del modelo de riesgos proporcionales de Cox , [2] a veces abreviado como modelo de Cox o modelo de riesgos proporcionales . [3] Sin embargo, Cox también señaló que la interpretación biológica del supuesto de riesgos proporcionales puede ser bastante complicada. [4] [5]

Sean X i = ( X i 1 , … , X ip ) los valores realizados de las p covariables para el sujeto i . La función de riesgo para el modelo de riesgos proporcionales de Cox tiene la forma

Esta expresión da la función de riesgo en el momento t para el sujeto i con un vector covariable (variables explicativas) X i . Tenga en cuenta que entre sujetos, el riesgo inicial es idéntico (no depende de i ). La única diferencia entre los riesgos de los sujetos proviene del factor de escala inicial .

Por qué se llama "proporcional"

Para empezar, supongamos que solo tenemos una covariable única, y por lo tanto un único coeficiente . Considere el efecto de aumentar en 1:

Podemos ver que aumentar una covariable en 1 aumenta el riesgo original en la constante . Reordenando ligeramente las cosas, vemos que:

El lado derecho es constante en el tiempo (ningún término tiene a ). Esta relación, se llama relación proporcional .

De manera más general, considere dos sujetos, i y j , con covariables y respectivamente. Considere la proporción de sus peligros:

El lado derecho no depende del tiempo, ya que el único factor que depende del tiempo, , fue cancelado. Por tanto, la proporción de riesgos de dos sujetos es constante, es decir, los riesgos son proporcionales.

Ausencia de un término de intercepción

A menudo hay un término de intersección (también llamado término constante o término de sesgo) que se utiliza en los modelos de regresión. El modelo de Cox carece de uno porque el peligro de referencia, , lo reemplaza. Veamos qué pasaría si de todos modos incluyéramos un término de intersección, denotado :

donde lo hemos redefinido como un nuevo peligro de referencia . Por lo tanto, el riesgo de referencia incorpora todas las partes del riesgo que no dependen de las covariables de los sujetos, lo que incluye cualquier término de intersección (que es constante para todos los sujetos, por definición).

Probabilidad de tiempos únicos

La probabilidad parcial de Cox , que se muestra a continuación, se obtiene utilizando la estimación de Breslow de la función de riesgo de referencia, conectándola con la probabilidad total y luego observando que el resultado es un producto de dos factores. El primer factor es la probabilidad parcial que se muestra a continuación, en la que el peligro de referencia se ha "cancelado". El segundo factor está libre de coeficientes de regresión y depende de los datos sólo a través del patrón de censura . Por lo tanto, el efecto de las covariables estimadas mediante cualquier modelo de riesgos proporcionales se puede informar como índices de riesgo .

La probabilidad de que el evento a observar ocurra para el sujeto i en el momento Y i se puede escribir como:

donde θ j = exp( X jβ ) y la sumatoria se realiza sobre el conjunto de sujetos j donde el evento no ha ocurrido antes del tiempo Y i (incluido el propio sujeto i ). Obviamente 0 <  Li (β) ≤ 1. Se trata de una probabilidad parcial : el efecto de las covariables puede estimarse sin necesidad de modelar el cambio del peligro a lo largo del tiempo .

Al tratar a los sujetos como si fueran estadísticamente independientes entre sí, la probabilidad conjunta de todos los eventos realizados [6] es la siguiente probabilidad parcial, donde la ocurrencia del evento se indica mediante Ci =  1:

La probabilidad logarítmica parcial correspondiente es

Esta función se puede maximizar sobre β para producir estimaciones de máxima verosimilitud parcial de los parámetros del modelo.

La función de puntuación parcial es

y la matriz de Hesse de la probabilidad logarítmica parcial es

Utilizando esta función de puntuación y la matriz de Hesse, la probabilidad parcial se puede maximizar utilizando el algoritmo de Newton-Raphson . La inversa de la matriz de Hesse, evaluada en la estimación de β , puede usarse como una matriz de varianza-covarianza aproximada para la estimación y usarse para producir errores estándar aproximados para los coeficientes de regresión.

Probabilidad cuando existen tiempos empatados

Se han propuesto varios enfoques para manejar situaciones en las que existen vínculos en los datos de tiempo. El método de Breslow describe el enfoque en el que el procedimiento descrito anteriormente se utiliza sin modificaciones, incluso cuando existen vínculos. Un enfoque alternativo que se considera que da mejores resultados es el método de Efron . [7] Sea t j los tiempos únicos, sea H j el conjunto de índices i tales que Y i  =  t j ​​y C i  = 1, y sea m j  = | H j |. El enfoque de Efron maximiza la siguiente probabilidad parcial.

La probabilidad logarítmica parcial correspondiente es

la función de puntuación es

y la matriz de Hesse es

dónde

Tenga en cuenta que cuando H j está vacío (todas las observaciones con tiempo t j están censuradas), los sumandos en estas expresiones se tratan como cero.

Ejemplos

A continuación se muestran algunos ejemplos trabajados del modelo de Cox en la práctica.

Una única covariable binaria

Supongamos que el criterio de valoración que nos interesa es la supervivencia del paciente durante un período de observación de 5 años después de una cirugía. Los pacientes pueden morir dentro del período de 5 años y registramos cuándo murieron, o los pacientes pueden vivir más de 5 años y solo registramos que vivieron más de 5 años. La cirugía se realizó en uno de dos hospitales, A o B , y nos gustaría saber si la ubicación del hospital se asocia con la supervivencia a 5 años. Específicamente, nos gustaría saber el aumento (o disminución) relativo del riesgo de una cirugía realizada en el hospital A en comparación con el hospital B. Se proporcionan algunos datos (falsos), donde cada fila representa a un paciente: T es cuánto tiempo estuvo el paciente observado antes de la muerte o 5 años (medido en meses), y C indica si el paciente murió en el período de 5 años. Hemos codificado el hospital como una variable binaria denotada con X : 1 si es del hospital A , 0 si es del hospital B.

Nuestro modelo proporcional de Cox de covariable única se parece al siguiente, representando el efecto del hospital e indexando a cada paciente:

Usando software estadístico, podemos estimar que es 2,12. El índice de riesgo es el exponencial de este valor, . Para ver por qué, considere la proporción de peligros, específicamente:

Por lo tanto, la razón de riesgo del hospital A respecto del hospital B es . Dejando de lado la significación estadística por un momento, podemos hacer una afirmación diciendo que los pacientes en el hospital A se asocian con un riesgo 8,3 veces mayor de muerte en cualquier período corto de tiempo en comparación con el hospital B.

Hay advertencias importantes que mencionar sobre la interpretación:

  1. un riesgo de muerte 8,3 veces mayor no significa que morirán 8,3 veces más pacientes en el hospital B: el análisis de supervivencia examina la rapidez con la que ocurren los eventos, no simplemente si ocurren.
  2. Más específicamente, el "riesgo de muerte" es una medida de una tasa. Una tasa tiene unidades, como metros por segundo. Sin embargo, una tasa relativa no: una bicicleta puede ir dos veces más rápido que otra bicicleta (la bicicleta de referencia), sin especificar unidades. Asimismo, el riesgo de muerte (tasa de muerte) en el hospital A es 8,3 veces mayor (más rápido) que el riesgo de muerte en el hospital B (el grupo de referencia).
  3. la cantidad inversa es el índice de riesgo del hospital B en relación con el hospital A.
  4. No hemos hecho ninguna inferencia sobre las probabilidades de supervivencia entre los hospitales. Esto se debe a que necesitaríamos una estimación de la tasa de riesgo de referencia, además de nuestra estimación. Sin embargo, la estimación estándar del modelo de riesgo proporcional de Cox no estima directamente la tasa de riesgo inicial.
  5. Debido a que hemos ignorado el único componente del modelo que varía en el tiempo, la tasa de riesgo de referencia, nuestra estimación es invariante en la escala de tiempo. Por ejemplo, si hubiéramos medido el tiempo en años en lugar de meses, obtendríamos la misma estimación.
  6. Es tentador decir que el hospital causó la diferencia en los riesgos entre los dos grupos, pero como nuestro estudio no es causal (es decir, no sabemos cómo se generaron los datos), nos atenemos a terminología como "asociado".

Una única covariable continua

Para demostrar un caso de uso menos tradicional del análisis de supervivencia, el siguiente ejemplo será una pregunta económica: ¿cuál es la relación entre la relación precio-beneficio (P/E) de una empresa en su primer aniversario de salida a bolsa y su supervivencia futura? Más específicamente, si consideramos el "evento de nacimiento" de una empresa como su primer aniversario de salida a bolsa, y cualquier quiebra, venta, privatización, etc. como un evento de "muerte" de la empresa, nos gustaría saber la influencia de las empresas. ' Relación P/E en su "nacimiento" (primer aniversario de IPO) en su supervivencia.

Se proporciona un conjunto de datos (falso) con datos de supervivencia de 12 empresas: T representa el número de días entre el primer aniversario de la IPO y la muerte (o una fecha de finalización del 2022-01-01, si no murió). C representa si la empresa falleció antes del 01/01/2022 o no. P/E representa la relación precio-beneficio de la empresa en su primer aniversario de IPO.

A diferencia del ejemplo anterior donde había una variable binaria, este conjunto de datos tiene una variable continua, P/E; sin embargo, el modelo parece similar:

donde representa la relación P/E de una empresa. Al ejecutar este conjunto de datos a través de un modelo de Cox se produce una estimación del valor de la incógnita , que es -0,34. Por lo tanto, una estimación del peligro total es:

Dado que no se estimó el peligro de referencia , , no se puede calcular el peligro completo. Sin embargo, considere la proporción de los riesgos de las empresas i y j :

Se conocen todos los términos de la derecha, por lo que es posible calcular la proporción de riesgos entre empresas. Como no hay ningún término dependiente del tiempo a la derecha (todos los términos son constantes), los riesgos son proporcionales entre sí. Por ejemplo, el índice de riesgo de la empresa 5 respecto de la empresa 2 es . Esto significa que, dentro del intervalo de estudio, el riesgo de "muerte" de la empresa 5 es 0,33 ≈ 1/3 del riesgo de muerte de la empresa 2.

Hay advertencias importantes que mencionar sobre la interpretación:

  1. El índice de riesgo es la cantidad , que se encuentra en el ejemplo anterior. A partir del último cálculo anterior, una interpretación de esto es como la proporción de riesgos entre dos "sujetos" cuyas variables difieren en una unidad: si , entonces . La elección de "difieren en una unidad" es conveniente, ya que comunica con precisión el valor de .
  2. El riesgo de referencia se puede representar cuando el factor de escala es 1, es decir .

¿Podemos interpretar el riesgo de referencia como el riesgo de una empresa "de referencia" cuyo P/E resulta ser 0? Esta interpretación del riesgo de referencia como "peligro de un sujeto de referencia" es imperfecta, ya que es posible que la covariable sea 0 y sea imposible. En esta aplicación, un P/E de 0 no tiene sentido (significa que el precio de las acciones de la empresa es 0, es decir, están "muertas"). Una interpretación más apropiada sería "el peligro cuando todas las variables son nulas".

  1. Es tentador querer entender e interpretar un valor como si representara el riesgo de una empresa. Sin embargo, considere lo que esto realmente representa: . Aquí hay implícitamente una relación de riesgos, al comparar el riesgo de la empresa i con una empresa de referencia imaginaria con 0 P/E. Sin embargo, como se explicó anteriormente, un P/E de 0 es imposible en esta aplicación, por lo que no tiene sentido en este ejemplo. Sin embargo, las proporciones entre peligros plausibles son significativas.

Predictores y coeficientes que varían en el tiempo.

Se pueden incorporar extensiones a las variables dependientes del tiempo, estratos dependientes del tiempo y eventos múltiples por sujeto mediante la formulación del proceso de conteo de Andersen y Gill. [8] Un ejemplo del uso de modelos de riesgo con regresores variables en el tiempo es la estimación del efecto del seguro de desempleo sobre los períodos de desempleo. [9] [10]

Además de permitir covariables que varían en el tiempo (es decir, predictores), el modelo de Cox también puede generalizarse a coeficientes que varían en el tiempo. Es decir, el efecto proporcional de un tratamiento puede variar con el tiempo; por ejemplo, un fármaco puede ser muy eficaz si se administra dentro del mes siguiente a la morbilidad y volverse menos eficaz a medida que pasa el tiempo. Entonces se puede probar la hipótesis de que el coeficiente no cambia con el tiempo (estacionariedad). Los detalles y el software ( paquete R ) están disponibles en Martinussen y Scheike (2006). [11] [12]

En este contexto, también podría mencionarse que es teóricamente posible especificar el efecto de las covariables mediante el uso de riesgos aditivos, [13] es decir, especificando

Si tales modelos de riesgos aditivos se utilizan en situaciones donde el objetivo es la maximización de la probabilidad (logarítmica), se debe tener cuidado de restringirlos a valores no negativos. Tal vez como resultado de esta complicación, estos modelos rara vez se ven. Si, por el contrario, el objetivo son los mínimos cuadrados, la restricción de no negatividad no es estrictamente necesaria.

Especificación de la función de riesgo de referencia

El modelo de Cox puede ser especializado si existe una razón para suponer que el riesgo de referencia sigue una forma particular. En este caso, el riesgo de referencia se reemplaza por una función determinada. Por ejemplo, suponiendo que la función de riesgo es la función de riesgo de Weibull , se obtiene el modelo de riesgos proporcionales de Weibull .

Por cierto, el uso del riesgo de referencia de Weibull es la única circunstancia bajo la cual el modelo satisface tanto los modelos de riesgos proporcionales como los de tiempo de falla acelerado .

El término genérico modelos paramétricos de riesgos proporcionales se puede utilizar para describir modelos de riesgos proporcionales en los que se especifica la función de riesgo. Por el contrario , el modelo de riesgos proporcionales de Cox a veces se denomina modelo semiparamétrico .

Algunos autores utilizan el término modelo de riesgos proporcionales de Cox incluso cuando especifican la función de riesgo subyacente, [14] para reconocer la deuda de todo el campo con David Cox.

El término modelo de regresión de Cox (omitiendo riesgos proporcionales ) se utiliza a veces para describir la extensión del modelo de Cox para incluir factores dependientes del tiempo. Sin embargo, este uso es potencialmente ambiguo ya que el modelo de riesgos proporcionales de Cox puede describirse en sí mismo como un modelo de regresión.

Relación con los modelos de Poisson

Existe una relación entre los modelos de riesgos proporcionales y los modelos de regresión de Poisson que a veces se utiliza para ajustar modelos de riesgos proporcionales aproximados en el software para la regresión de Poisson. La razón habitual para hacer esto es que el cálculo es mucho más rápido. Esto era más importante en la época de las computadoras más lentas, pero aún puede ser útil para conjuntos de datos particularmente grandes o problemas complejos. Laird y Olivier (1981) [15] proporcionan los detalles matemáticos. Señalan que "no asumimos que [el modelo de Poisson] sea cierto, sino que simplemente lo utilizamos como un dispositivo para derivar la probabilidad". El libro de McCullagh y Nelder [16] sobre modelos lineales generalizados tiene un capítulo sobre la conversión de modelos de riesgos proporcionales a modelos lineales generalizados .

Bajo configuración de alta dimensión

En alta dimensión, cuando el número de covariables p es grande en comparación con el tamaño de muestra n, el método LASSO es una de las estrategias clásicas de selección de modelos. Tibshirani (1997) ha propuesto un procedimiento de Lasso para el parámetro de regresión de riesgos proporcionales. [17] El estimador de Lasso del parámetro de regresión β se define como el minimizador del opuesto de la probabilidad logarítmica parcial de Cox bajo una restricción de tipo norma L 1 .

Ha habido avances teóricos sobre este tema recientemente. [18] [19] [20] [21]

Implementaciones de software

Ver también

Notas

  1. ^ Breslow, NE (1975). "Análisis de datos de supervivencia bajo el modelo de riesgos proporcionales". Revista estadística internacional/Revue Internationale de Statistique . 43 (1): 45–57. doi :10.2307/1402659. JSTOR  1402659.
  2. ^ Cox, David R (1972). "Modelos de regresión y tablas de vida". Revista de la Royal Statistical Society, Serie B. 34 (2): 187–220. JSTOR  2985181. SEÑOR  0341758.
  3. ^ Kalbfleisch, John D.; Schaubel, Douglas E. (10 de marzo de 2023). "Cincuenta años del modelo Cox". Revisión Anual de las Estadísticas y su Aplicación . 10 (1): 1–23. Código Bib : 2023AnRSA..10....1K. doi : 10.1146/annurev-statistics-033021-014043 . ISSN  2326-8298.
  4. ^ Reid, N. (1994). "Una conversación con Sir David Cox". Ciencia estadística . 9 (3): 439–455. doi : 10.1214/ss/1177010394 .
  5. ^ Cox, DR (1997). Algunas observaciones sobre el análisis de los datos de supervivencia . el Primer Simposio de Bioestadística de Seattle: Análisis de Supervivencia.
  6. ^ "Cada fracaso contribuye a la función de probabilidad", Cox (1972), página 191.
  7. ^ Efron, Bradley (1974). "La eficiencia de la función de probabilidad de Cox para datos censurados". Revista de la Asociación Estadounidense de Estadística . 72 (359): 557–565. doi :10.1080/01621459.1977.10480613. JSTOR  2286217.
  8. ^ Andersen, P.; Gill, R. (1982). "Modelo de regresión de Cox para procesos de conteo, un estudio de muestra grande". Anales de Estadística . 10 (4): 1100-1120. doi : 10.1214/aos/1176345976 . JSTOR  2240714.
  9. ^ Meyer, BD (1990). «Seguro de desempleo y períodos de desempleo» (PDF) . Econométrica . 58 (4): 757–782. doi :10.2307/2938349. JSTOR  2938349.
  10. ^ Bover, O.; Arellano, M .; Bentolila, S. (2002). "Duración del desempleo, duración de las prestaciones y ciclo económico" (PDF) . La Revista Económica . 112 (479): 223–265. doi :10.1111/1468-0297.00034. S2CID  15575103.
  11. ^ Martinussen; Scheike (2006). Modelos de regresión dinámica para datos de supervivencia . Saltador. doi :10.1007/0-387-33960-4. ISBN 978-0-387-20274-7.
  12. ^ "timereg: modelos de regresión flexibles para datos de supervivencia". GRÚA .
  13. ^ Cox, DR (1997). Algunas observaciones sobre el análisis de los datos de supervivencia . el Primer Simposio de Bioestadística de Seattle: Análisis de Supervivencia.
  14. ^ Bender, R.; Agustín, T.; Blettner, M. (2006). "Generación de tiempos de supervivencia para simular modelos de riesgos proporcionales de Cox". Estadística en Medicina . 24 (11): 1713-1723. doi : 10.1002/sim.2369 . PMID  16680804. S2CID  43875995.
  15. ^ Nan Laird y Donald Olivier (1981). "Análisis de covarianza de datos de supervivencia censurados utilizando técnicas de análisis log-lineal". Revista de la Asociación Estadounidense de Estadística . 76 (374): 231–240. doi :10.2307/2287816. JSTOR  2287816.
  16. ^ P. McCullagh y JA Nelder (2000). "Capítulo 13: Modelos de datos de supervivencia". Modelos lineales generalizados (Segunda ed.). Boca Ratón, Florida: Chapman & Hall/CRC. ISBN 978-0-412-31760-6.(Segunda edición, 1989; primera reimpresión del CRC, 1999).
  17. ^ Tibshirani, R. (1997). "El método Lasso para la selección de variables en el modelo de Cox". Estadística en Medicina . 16 (4): 385–395. CiteSeerX 10.1.1.411.8024 . doi :10.1002/(SICI)1097-0258(19970228)16:4<385::AID-SIM380>3.0.CO;2-3. PMID  9044528. 
  18. ^ Bradić, J.; Fan, J.; Jiang, J. (2011). "Regularización del modelo de riesgos proporcionales de Cox con NP-dimensionalidad". Anales de Estadística . 39 (6): 3092–3120. arXiv : 1010.5233 . doi :10.1214/11-AOS911. PMC 3468162 . PMID  23066171. 
  19. ^ Bradić, J.; Canción, R. (2015). "Estimación estructurada en modelo de Cox no paramétrico". Revista Electrónica de Estadística . 9 (1): 492–534. arXiv : 1207.4510 . doi :10.1214/15-EJS1004. S2CID  88519017.
  20. ^ Kong, S.; Nan, B. (2014). "Desigualdades de oráculo no asintóticas para la regresión de Cox de alta dimensión vía Lasso". Estadística Sínica . 24 (1): 25–42. arXiv : 1204.1992 . doi :10.5705/ss.2012.240. PMC 3916829 . PMID  24516328. 
  21. ^ Huang, J.; Sol, T.; Ying, Z.; Yu, Y.; Zhang, CH (2011). "Desigualdades de Oracle para el lazo en el modelo de Cox". Los anales de la estadística . 41 (3): 1142-1165. arXiv : 1306.4847 . doi :10.1214/13-AOS1098. PMC 3786146 . PMID  24086091. 
  22. ^ "CoxModelFit". Centro de documentación de sistemas y lenguaje Wolfram .

Referencias