Los modelos de supervivencia hipertabasticos fueron introducidos en 2007 por Mohammad Tabatabai, Zoran Bursac, David Williams y Karan Singh. Esta distribución se puede utilizar para analizar datos de tiempo hasta el evento en áreas biomédicas y de salud pública y normalmente se denomina análisis de supervivencia . En ingeniería, el análisis de tiempo hasta el evento se conoce como teoría de la confiabilidad y en negocios y economía se llama análisis de duración . Otros campos pueden usar nombres diferentes para el mismo análisis. Estos modelos de supervivencia son aplicables en muchos campos, como biomedicina, ciencia del comportamiento, ciencias sociales, estadística, medicina, bioinformática, informática médica, ciencia de datos, especialmente en aprendizaje automático, biología computacional , economía empresarial, ingeniería y entidades comerciales. No solo miran el tiempo hasta el evento, sino si el evento ocurrió o no. Estos modelos de tiempo hasta el evento se pueden aplicar en una variedad de aplicaciones, por ejemplo, el tiempo después del diagnóstico de cáncer hasta la muerte, la comparación del tratamiento individualizado con la atención estándar en la investigación del cáncer, el tiempo hasta que un individuo deja de pagar los préstamos, el tiempo de recaída para dejar de fumar y consumir drogas, el tiempo hasta que se vende una propiedad después de ponerla en el mercado, el tiempo hasta que un individuo cambia de teléfono, el tiempo hasta la reubicación laboral, el tiempo hasta que los huesos sufren fracturas microscópicas al someterse a diferentes niveles de estrés, el tiempo desde el matrimonio hasta el divorcio, el tiempo hasta la infección debido a un catéter y el tiempo desde la finalización del puente hasta la primera reparación. [1] [2] [3] [4] [5]
La función de distribución acumulativa hipertabastica o simplemente función de distribución hipertabastica se define como la probabilidad de que una variable aleatoria tome un valor menor o igual a . La función de distribución hipertabastica se define como
donde representa la función secante hiperbólica y , son parámetros.
Los parámetros y son ambos positivos con y como secante hiperbólica y cotangente hiperbólica respectivamente. La función de densidad de probabilidad hiperbólica es
donde y son la cosecante hiperbólica y la tangente hiperbólica respectivamente y
La función de supervivencia hipertástica se define como
¿Dónde está la probabilidad de que el tiempo de espera exceda ?
Para , el tiempo de supervivencia esperado (medio) restringido de la variable aleatoria se denota por , y se define como
Para la variable aleatoria continua que representa el tiempo hasta el evento, la función de riesgo hipertástico , que representa la tasa de falla instantánea en el momento dada la supervivencia hasta el momento , se define como
La función de riesgo hipertabastico tiene la flexibilidad de modelar variedades de formas de riesgo. Spirko, L. (2017). Selección de variables y reducción de dimensión supervisada para datos genómicos a gran escala con resultados de supervivencia censurados (PDF) (tesis doctoral). Universidad de Temple.Estas diferentes formas de riesgo podrían aplicarse a diferentes mecanismos para los cuales las funciones de riesgo pueden no estar de acuerdo con los modelos convencionales. La siguiente es una lista de posibles formas para la función de riesgo hipertabastico: Para , la función de riesgo hipertabastico disminuye monótonamente, lo que indica una mayor probabilidad de falla en los primeros tiempos. Para , la curva de riesgo hipertabastico primero aumenta con el tiempo hasta que alcanza su tasa de falla máxima y luego la falla disminuye con el tiempo ( unimodal ). Para , la función de riesgo hipertabastico inicialmente aumenta con el tiempo, luego alcanza su asíntota horizontal . Para , la función de riesgo hipertabastico primero aumenta con el tiempo con una concavidad ascendente hasta que alcanza su punto de inflexión y posteriormente continúa aumentando con una concavidad descendente. Para , la función de riesgo hipertabastico inicialmente aumenta con una concavidad ascendente hasta que alcanza su punto de inflexión, luego se convierte en una asíntota lineal con pendiente . Para , la función de riesgo hipertabastico aumenta con una concavidad ascendente.
La función de riesgo acumulativo hipertabastico es
La función de riesgo del modelo de riesgos proporcionales hipertabasticos tiene la forma
donde es un vector p-dimensional de variables explicativas y es un vector de parámetros desconocidos . El efecto combinado de las variables explicativas es una función no negativa de con . La función de supervivencia hipertabastica para el modelo de riesgos proporcionales se define como:
y la función de densidad de probabilidad hipertástica para el modelo de riesgo proporcional está dada por
Dependiendo del tipo de censura , se puede utilizar la técnica de la función de máxima verosimilitud junto con una función de log-verosimilitud adecuada para estimar los parámetros del modelo. Si la muestra consta de datos censurados a la derecha y el modelo a utilizar es el modelo de riesgos proporcionales hipertabastico, entonces, la función de log-verosimilitud de riesgos proporcionales es
Cuando las covariables actúan de forma multiplicativa en la escala de tiempo, el modelo se denomina modelo de tiempo de falla acelerada . La función de supervivencia hipertástica para el modelo de tiempo de falla acelerada se da por
El modelo de tiempo de falla acelerada hipertabastica tiene una función de riesgo de la forma
La función de densidad de probabilidad hipertástica para el modelo de tiempo de falla acelerada es
Para los datos censurados a la derecha, la función de verosimilitud logarítmica para el modelo de tiempo de falla acelerada hipertabastica se da por
dónde .
Se utiliza una prueba de tipo chi-cuadrado modificada, conocida como estadística Nikulin-Rao-Robson, para probar la bondad de ajuste de los modelos de tiempo de falla acelerada hipertabastica y su comparación con funciones de tasa de riesgo unimodales. Los estudios de simulación han demostrado que la distribución hipertabastica se puede utilizar como una alternativa a la distribución log-logística y log-normal debido a su forma flexible de funciones de riesgo. La distribución hipertabastica es un competidor para el modelado estadístico cuando se compara con las distribuciones Birnbaum-Saunders y Gaussiana inversa [2] [6]
Consideremos una muestra de tiempos de supervivencia de n individuos con vectores de covariables p-dimensionales asociados y un vector de parámetros desconocido . Sean y representan la función de densidad de probabilidad, la función de distribución acumulativa, la función de supervivencia y la función de riesgo correspondientes, respectivamente. En ausencia de censura (la censura ocurre normalmente cuando no se puede observar el tiempo de falla de algunos individuos), la función de verosimilitud es
y la verosimilitud logarítmica es
Para los datos censurados correctos, la función de verosimilitud es
o equivalentemente,
y la función de log-verosimilitud es
o equivalentemente,
dónde
En presencia de datos censurados a la izquierda, la función de verosimilitud es
y la función de log-verosimilitud correspondiente es
dónde
En presencia de datos censurados por intervalo, la función de verosimilitud es
y la función de log-verosimilitud es
donde para todas las observaciones censuradas de intervalo y
Si la muestra prevista consta de todos los tipos de datos censurados (censurados a la derecha, censurados a la izquierda y censurados por intervalo), entonces su función de verosimilitud toma la siguiente forma
y su función de log-verosimilitud correspondiente está dada por
Se utilizó el modelo de tiempo de falla acelerada hipertástica para analizar un total de 27 532 pacientes en relación con el impacto de la histología en la supervivencia de los pacientes con melanoma cutáneo o mucoso. Comprender los subtipos histológicos de los pacientes y evaluar su tasa de falla permitiría a los médicos y proveedores de atención médica realizar un tratamiento individualizado, lo que se traduciría en un menor riesgo de complicaciones y una mayor supervivencia de los pacientes. [7]
Se examinaron las cantidades de 49 lugares de la misma área de un yacimiento petrolífero para identificar su distribución subyacente. Mediante el método de chi-cuadrado generalizado, la distribución de las cantidades del yacimiento petrolífero se representó mediante la distribución hiperbolástica y se comparó con las distribuciones lognormal (LN), log-logística (LL), Birnbaum-Saunders (BS) y gaussiana inversa (IG). [8]
Los tiempos de remisión del estudio de ensayos clínicos para leucemia aguda en niños se utilizaron para analizar la duración de la remisión de los datos de leucemia aguda para dos grupos de pacientes, controlando el logaritmo de los recuentos de glóbulos blancos. El modelo de tiempo de falla acelerada hipertástica se utilizó para analizar la duración de la remisión de los pacientes con leucemia aguda. [8]
Un ensayo clínico aleatorizado que compara dos regímenes de quimioterapia para 447 personas con glioma maligno. Un total de 293 pacientes murieron en un período de cinco años y el tiempo de supervivencia medio fue de unos 11 meses. El ajuste general del modelo, en comparación con otras distribuciones paramétricas, se realizó utilizando las estadísticas de prueba de chi-cuadrado generalizadas y el modelo de riesgos proporcionales. [8]
Se utilizó el modelo de riesgo proporcional hipertabastico para analizar numerosos datos sobre el cáncer de mama, incluida la supervivencia de pacientes con cáncer de mama, explorando el papel de una variable de metástasis en combinación con variables clínicas y de expresión genética. [9] [10]
En este estudio se incluyeron 105 pacientes nigerianos a los que se les diagnosticó hipertensión entre enero de 2013 y julio de 2018, donde la muerte fue el evento de interés. Se ajustaron a los datos seis modelos paramétricos como distribuciones exponencial , Weibull , lognormal , log-logística, Gompertz e hipertabastica utilizando pruebas de bondad de ajuste como SE, AIC y BIC para determinar el modelo de mejor ajuste. Se consideraron los modelos paramétricos porque todos son distribuciones de por vida. Se utilizaron medidas SE, AIC y BIC para comparar estos modelos paramétricos. [11]
Las fracturas por estrés en personas mayores son muy importantes debido al creciente número de ancianos. Se analizaron pruebas de fatiga en 23 muestras óseas de tres mujeres. Se desarrollaron funciones de supervivencia y riesgo hipertácticas del nivel de estrés normalizado y la edad utilizando datos de estrés por fatiga ósea publicados previamente. El evento de interés fue el número de ciclos hasta que el hueso sufre una fractura microscópica. Además, se utilizaron modelos de riesgo proporcional hipertáctico para investigar la fatiga por tracción y el ciclo hasta la fatiga para los datos del hueso cortical. [12]
Los modelos de supervivencia hipertabasticos se han utilizado en el análisis de datos de desempleo y su comparación con el modelo de regresión de Cox . [13]
Utilizando datos del Instituto Nacional del Cáncer de 1975 a 2016, se examinó el impacto de los subtipos histológicos en la probabilidad de supervivencia de 134.150 pacientes con carcinoma renal. Las variables de estudio fueron raza/etnia, edad, sexo, grado del tumor, tipo de cirugía, ubicación geográfica del paciente y estadio de la enfermedad. Se utilizó el modelo de riesgos proporcionales hipertástico para analizar el tiempo de supervivencia de los pacientes diagnosticados con carcinoma renal para explorar el efecto de los subtipos histológicos en su probabilidad de supervivencia y evaluar la relación entre los subtipos histológicos, el estadio del tumor, el grado del tumor y el tipo de cirugía. [14]
Código de muestra en SAS :
Proc nlp data=sasuser . KidneyCarcinoma tech=quanew cov= 2 vardef=n pcov phes maxiter= 250 ; /* Modelo de riesgos proporcionales hipertabasticos con tiempo logarítmico */ title1 'Carcinoma de riñón' ; logf máximo; /* Valores iniciales de los parámetros del modelo para las variables explicativas */ parms a= 0.01 ,b= 0.1 , c= 0,01 , /* Edad */ /* Continuo */ d=-. 01 , /* Masculino */ /* referencia: Femenino */ r1=. 071 , /* Hispano */ r2=. 044 , /* Asiático */ r3=. 134 , /* Negro */ /* referencia: Blanco */ h1=. 205 , /* Adeno Carcinoma con Subtipos Mixtos */ h2=. 505 , /* Adeno Carcinoma Papilar NOS */ h3=. 537 , /* Adeno Carcinoma de Células Claras */ h4=. 316 , /* Adeno Carcinoma de Células Renales */ h5= 1,15 , /* Carcinoma de Células Renales Cromófobo */ h6=-. 21 , /* Carcinoma de Células Renales Sarcomatoide */ h7=. 378 , /* Carcinoma de células granulares */ /* referencia: Otro */ g1=. 03 , /* Este */ g2=. 088 , /* Llanuras del norte */ g3=. 06 , /* Costa del Pacífico */ /* referencia: Suroeste */ s1= 1.2 , /* Localizado */ s2=- 1.3 , /* Distante */ /* referencia: Regional */ gr1= 1.169 , /* Bien diferenciado */ gr2=. 99 , /* Moderadamente diferenciado */ gr3=. 413 , /* Poco diferenciado */ /* referencia: Indiferenciado */ su1=-. 945 , /* Sin cirugía */ su2=. 84 , /* Criocirugía */ su3=. 56 , /* Ablación térmica */ su4=. 574 , /* Criocirugía */ su5= 1.173 , /* Nefrectomía parcial o ureterectomía parcial */ su6=. 25 , /* Nefrectomía completa */ su7=. 073 , /* Nefrectomía radical */ su8=-. 096 , /* Cualquier nefrectomía */ su9=. 028 ; /* Nefrectomía, urectomía */ /* referencia: Otra */ /* Función de log-verosimilitud */ in6= exp( -(c*Age+ d*Género+ r1*Carrera1+r2*Carrera2+r3*Carrera3+ h1*Hist1+h2*Hist2+h3*Hist3+h4*Hist4+h5*Hist5+h6*Hist6+h7*Hist7+ g1*Geo1+g2*Geo2+g3*Geo3+ s1*Etapa1+s2*Etapa2+ gr1*Grado 1+gr2*Grado 2+gr3*Grado 3+ su1*Cirugía1+su2*Cirugía2+su3*Cirugía3+su4*Cirugía4+su5*Cirugía5+su6*Cirugía6+su7*Cirugía7+su8*Cirugía8+su9*Cirugía9)); /* covariables */ s = log( 1 / cosh( a*( 1 -(tiempo**b)/ tanh( tiempo**b))/b))*in6+Status* log( ((a*tiempo**(- 1+2 *b)/ sinh( tiempo**b)** 2 - a*tiempo**(- 1 +b)/ tanh( tiempo**b))* tanh( a*( 1 -tiempo**b/ tanh( tiempo**b))/b))*in6); logf=s ; ejecutar;
Aunque las herramientas y técnicas de análisis de supervivencia se han utilizado ampliamente en aplicaciones médicas y biomédicas durante las últimas décadas, sus aplicaciones a problemas de ingeniería han sido más esporádicas y limitadas. La evaluación probabilística de la vida útil de una amplia variedad de sistemas de ingeniería, desde pequeños componentes mecánicos hasta grandes estructuras de puentes, [15] puede beneficiarse sustancialmente de las técnicas de análisis de supervivencia bien establecidas. El modelado de fenómenos de tiempo hasta el evento en aplicaciones de ingeniería se puede realizar bajo la influencia de covariables numéricas y categóricas utilizando datos de observación o de prueba. La "supervivencia" de un componente o sistema de ingeniería es sinónimo del término más comúnmente utilizado "fiabilidad". El término "tasa de riesgo" o "tasa de falla condicional" (definida como probabilidad de supervivencia por unidad de tiempo asumiendo la supervivencia hasta ese momento) es una medida importante del cambio en la tasa de falla a lo largo del tiempo. En este contexto, la falla se define como alcanzar el evento objetivo en el proceso de tiempo hasta el evento. Esto podría definirse como alcanzar un estado de condición de servicio particular, falla estructural localizada/parcial o falla global/catastrófica [16] aplicó el modelo de supervivencia de tiempo de falla acelerada paramétrica hipertabastica para desarrollar modelos probabilísticos de vida útil de los tableros de puentes para Wisconsin. Los tableros de puentes son típicamente losas de hormigón sobre las que circula el tráfico, como se ve en el puente Marquette Interchange. Los autores utilizaron el conjunto de datos del Inventario Nacional de Puentes (NBI) para obtener los datos necesarios para su estudio. Los registros del NBI incluyen calificaciones numéricas discretas para los tableros de puentes (y otros componentes del puente), así como otra información básica como el Tráfico Diario Promedio (ADT) y el área de superficie del tablero (obtenida al multiplicar la longitud del puente proporcionada por el ancho del tablero del puente). Las calificaciones numéricas varían de 0 a 9, donde 9 corresponde a una condición nueva y 0 es una falla completa. Se seleccionó una calificación de condición de tablero de 5 como el final efectivo de la vida útil del tablero del puente. Las covariables numéricas utilizadas fueron el ADT y el área de superficie de la cubierta, mientras que la covariable categórica fue el material de la superestructura (acero estructural u hormigón).
Los modelos hipertabasticos de riesgo proporcional y tiempo de falla acelerada son técnicas útiles para analizar estructuras relacionadas con puentes debido a la flexibilidad de sus curvas de riesgo, que pueden aumentar o disminuir de manera monótona con una concavidad hacia arriba o hacia abajo. También pueden adoptar la forma de una única curva de montículo. [16] [1] [17] Esta flexibilidad para modelar diversas formas de riesgo hace que el modelo sea adecuado para una amplia variedad de problemas de ingeniería. [16]
Tabatabai et al. extendieron los modelos de tableros de puentes hipertabasticos desarrollados para los puentes de Wisconsin a los puentes de seis estados del norte de EE. UU. Nabizadeh, A. (2015). Fiabilidad de las superestructuras de puentes en Wisconsin. Tesis de maestría (Tesis). UWM Digital Commons.y luego a los 50 estados de EE. UU. [18] El estudio de los tableros de los puentes en los 50 estados indicó diferencias importantes en la confiabilidad de los tableros de los puentes en diferentes estados y regiones. Stevens et al. [19] analizan la importancia de los análisis de supervivencia para identificar indicadores clave del rendimiento de los puentes y analizan el uso de modelos de supervivencia hipertábásticos para puentes. [20] y Nabizadeh et al. [21] extendieron aún más el uso de los modelos de supervivencia hipertábásticos a las superestructuras de los puentes. Las covariables utilizadas fueron ADT, longitud máxima del tramo del puente y tipo de superestructura. La función de supervivencia se puede utilizar para determinar la vida útil esperada utilizando la siguiente ecuación (área bajo la curva de supervivencia completa)
Es importante señalar que tanto la función de supervivencia como la vida esperada cambiarían a medida que transcurra el tiempo. La función de supervivencia condicional es una función del tiempo y del tiempo de supervivencia y se define como [22]
Nabizadeh et al. [22] utilizaron las funciones de supervivencia hipertabasticas desarrolladas para Wisconsin para analizar las funciones de supervivencia condicionales y las vidas útiles condicionales esperadas.
La expectativa de vida condicional seguiría aumentando a medida que aumenta el tiempo de supervivencia. Nabizadeh et al. denominan a esta expectativa de vida adicional "dividendo de supervivencia".
Un modo importante de falla en la ingeniería de puentes es la fatiga del metal, que puede resultar de aplicaciones repetitivas de ciclos de tensión a varios detalles y conexiones en la estructura. A medida que aumenta el número de ciclos, aumenta la probabilidad de falla por fatiga. Un factor importante en la vida útil por fatiga es el rango de tensión (Sr) (tensión máxima menos mínima en un ciclo). El problema de fatiga de ingeniería probabilística se puede tratar como un problema de análisis de supervivencia de "tiempo" hasta el evento si el número de ciclos se trata como una variable de tiempo ficticia [23]
Esto facilitaría la aplicación de técnicas de análisis de supervivencia bien establecidas a problemas de fatiga de ingeniería [23] y Tabatabai et al. [24] La función de supervivencia , la función de densidad de probabilidad , la tasa de riesgo y la probabilidad acumulada de falla se pueden definir como
Se utilizó el modelo de tiempo de falla acelerada hipertabastica para analizar la vida útil por fatiga probabilística para varias categorías detalladas en puentes de acero. [23]
{{cite conference}}
: CS1 maint: DOI inactive as of September 2024 (link)