Los modelos de supervivencia hipertabásticos fueron introducidos en 2007 por Mohammad Tabatabai, Zoran Bursac, David Williams y Karan Singh. Esta distribución se puede utilizar para analizar datos de tiempo transcurrido hasta el evento en áreas biomédicas y de salud pública y normalmente se denomina análisis de supervivencia . En ingeniería, el análisis del tiempo hasta el evento se conoce como teoría de la confiabilidad y en negocios y economía se llama análisis de la duración . Otros campos pueden utilizar nombres diferentes para el mismo análisis. Estos modelos de supervivencia son aplicables en muchos campos, como la biomédica, las ciencias del comportamiento, las ciencias sociales, la estadística, la medicina, la bioinformática, la informática médica, la ciencia de datos, especialmente en el aprendizaje automático, la biología computacional , la economía empresarial, la ingeniería y las entidades comerciales. No sólo analizan el momento en que ocurrió el evento, sino también si el evento ocurrió o no. Estos modelos de tiempo hasta el evento se pueden aplicar en una variedad de aplicaciones, por ejemplo, tiempo después del diagnóstico de cáncer hasta la muerte, comparación del tratamiento individualizado con la atención estándar en la investigación del cáncer, tiempo hasta que un individuo incumple sus pagos, tiempo de recaída para medicamentos y dejar de fumar, tiempo hasta que la propiedad se vende después de ser puesta en el mercado, tiempo hasta que un individuo actualiza a un teléfono nuevo, tiempo hasta la reubicación laboral, tiempo hasta que los huesos reciben fracturas microscópicas al someterse a diferentes niveles de estrés, tiempo desde el matrimonio hasta el divorcio, tiempo hasta la infección debido al catéter y tiempo desde la finalización del puente hasta la primera reparación. [1] [2] [3] [4] [5]
La función de distribución acumulativa hipertabastica o simplemente la función de distribución hipertabastica se define como la probabilidad de que una variable aleatoria tome un valor menor o igual a . La función de distribución hipertabastica se define como
donde representa la función secante hiperbólica y , son parámetros.
Los parámetros y son positivos con y como secante hiperbólica y cotangente hiperbólica respectivamente. La función de densidad de probabilidad hipertabastica es
donde y son cosecante hiperbólica y tangente hiperbólica respectivamente y
La función de supervivencia hipertabástica se define como
¿Dónde está la probabilidad de que el tiempo de espera exceda ?
Para , el tiempo de supervivencia esperado restringido (medio) de la variable aleatoria se denota por y se define como
Para la variable aleatoria continua que representa el tiempo hasta el evento, la función de riesgo hipertabastica , que representa la tasa de falla instantánea en el momento dada la supervivencia hasta el momento , se define como
La función de peligro hipertabastica tiene la flexibilidad de modelar variedades de formas de peligro. Spirko, L. (2017). Selección de variables y reducción de dimensiones supervisada para datos genómicos a gran escala con resultados de supervivencia censurados (PDF) (tesis doctoral). Universidad del templo.Estas diferentes formas de peligro podrían aplicarse a diferentes mecanismos cuyas funciones de peligro pueden no coincidir con los modelos convencionales. La siguiente es una lista de posibles formas para la función de riesgo hipertabastica: Para , la función de riesgo hipertabastica disminuye monótonamente, lo que indica una mayor probabilidad de falla en los primeros momentos. Para , la curva de riesgo hipertabastica primero aumenta con el tiempo hasta alcanzar su tasa máxima de falla y luego la falla disminuye con el tiempo ( unimodal ). Para , la función de riesgo hipertabastica inicialmente aumenta con el tiempo, luego alcanza su asíntota horizontal . Para , la función de riesgo hipertabastica primero aumenta con el tiempo con una concavidad ascendente hasta que alcanza su punto de inflexión y posteriormente continúa aumentando con una concavidad descendente. Para , la función de riesgo hipertabastica aumenta inicialmente con una concavidad ascendente hasta que alcanza su punto de inflexión, convirtiéndose luego en una asíntota lineal con pendiente . Para , la función de riesgo hipertabastica aumenta con una concavidad ascendente.
La función de riesgo acumulativo hipertabastico es
La función de riesgo del modelo de riesgos proporcionales hipertabastico tiene la forma
donde es un vector p-dimensional de variables explicativas y es un vector de parámetros desconocidos . El efecto combinado de las variables explicativas es una función no negativa de con . La función de supervivencia hipertabastica para el modelo de riesgos proporcionales se define como:
y la función de densidad de probabilidad hipertabastica para el modelo de riesgo proporcional está dada por
Dependiendo del tipo de censura , se puede utilizar la técnica de la función de máxima verosimilitud junto con una función logarítmica de verosimilitud adecuada para estimar los parámetros del modelo. Si la muestra consta de datos censurados correctamente y el modelo a utilizar es el modelo de riesgos proporcionales hipertabastico, entonces, la función de probabilidad logarítmica de riesgos proporcionales es
Cuando las covariables actúan multiplicativamente en la escala de tiempo, el modelo se denomina modelo de tiempo de falla acelerado . La función de supervivencia hipertabastica para el modelo de tiempo de falla acelerado viene dada por
El modelo de tiempo de falla acelerado hipertabastico tiene una función de riesgo de la forma
La función de densidad de probabilidad hipertabastica para el modelo de tiempo de falla acelerado es
Para los datos censurados correctos, la función de probabilidad logarítmica para el modelo de tiempo de falla acelerado Hypertabastic viene dada por
dónde .
Se utiliza una prueba de tipo chi-cuadrado modificada, conocida como estadística de Nikulin-Rao-Robson, para probar la bondad de ajuste de los modelos de tiempo de falla acelerados hipertabasticos y su comparación con funciones de tasa de riesgo unimodales. Los estudios de simulación han demostrado que la distribución hipertabastica se puede utilizar como una alternativa a la distribución log-logística y log-normal debido a su forma flexible de funciones de riesgo. La distribución hipertabastica compite con el modelado estadístico en comparación con Birnbaum-Saunders y las distribuciones gaussianas inversas [2] [6]
Considere una muestra de tiempos de supervivencia de n individuos con vectores covariables p-dimensionales asociados y un vector de parámetros desconocido . Sean y representen la correspondiente función de densidad de probabilidad, función de distribución acumulativa, función de supervivencia y función de riesgo, respectivamente. En ausencia de censura (la censura normalmente ocurre cuando no se puede observar el tiempo de falla de algunos individuos), la función de probabilidad es
y la probabilidad logarítmica es
Para los datos censurados correctos, la función de probabilidad es
o equivalente,
y la función de probabilidad logarítmica es
o equivalente,
dónde
En presencia de datos censurados a la izquierda, la función de probabilidad es
y la función logarítmica de verosimilitud correspondiente es
dónde
En presencia de datos censurados por intervalos, la función de probabilidad es
y la función de probabilidad logarítmica es
donde para todas las observaciones censuradas de intervalo y
Si la muestra prevista consta de todos los tipos de datos censurados (censurados por la derecha, censurados por la izquierda y censurados por intervalo), entonces su función de probabilidad toma la siguiente forma
y su correspondiente función de probabilidad logarítmica está dada por
Se utilizó el modelo de tiempo de falla acelerada hipertabastica para analizar un total de 27.532 pacientes con respecto al impacto de la histología en la supervivencia de pacientes con melanoma cutáneo o mucoso. Comprender los subtipos histológicos de los pacientes y la evaluación de su tasa de fracaso permitiría a los médicos y proveedores de atención médica realizar un tratamiento individualizado, lo que resultaría en un menor riesgo de complicaciones y una mayor supervivencia de los pacientes. [7]
Se examinaron las cantidades de 49 ubicaciones de la misma área de un campo petrolero para identificar su distribución subyacente. Utilizando chi-cuadrado generalizado, la distribución de las cantidades de los yacimientos petrolíferos se representó mediante la distribución hiperbólica y se comparó con las distribuciones lognormal (LN), log-logística (LL), Birnbaum-Saunders (BS) y gaussiana inversa (IG). [8]
Los tiempos de remisión del ensayo clínico para el estudio de leucemia aguda en niños se utilizaron para analizar la duración de la remisión de los datos de leucemia aguda para dos grupos de pacientes controlando el registro de recuentos de glóbulos blancos. Se utilizó el modelo de tiempo de falla acelerado hipertabastico para analizar la duración de la remisión del paciente con leucemia aguda. [8]
Un ensayo clínico aleatorizado que compara dos regímenes de quimioterapia para 447 personas con glioma maligno. Un total de 293 pacientes murieron en un período de cinco años y la mediana de supervivencia fue de aproximadamente 11 meses. El ajuste general del modelo, en comparación con otras distribuciones paramétricas, se realizó utilizando la estadística de prueba de chi-cuadrado generalizada y el modelo de riesgos proporcionales. [8]
El modelo de riesgo proporcional hipertabastico se utilizó para analizar numerosos datos sobre el cáncer de mama, incluida la supervivencia de pacientes con cáncer de mama, mediante la exploración del papel de una variable de metástasis en combinación con variables clínicas y de expresión genética. [9] [10]
En este estudio se incluyeron ciento cinco pacientes nigerianos a los que se les diagnosticó hipertensión entre enero de 2013 y julio de 2018, donde la muerte fue el evento de interés. Seis modelos paramétricos como; Se ajustaron distribuciones exponencial , Weibull , lognormal , log-logística, Gompertz e hipertabastica a los datos utilizando pruebas de bondad de ajuste como SE, AIC y BIC para determinar el modelo de mejor ajuste. Se consideraron los modelos paramétricos porque todos son distribuciones de vida. Se utilizaron medidas SE, AIC y BIC para comparar estos modelos paramétricos. [11]
Las fracturas por sobrecarga en personas mayores son muy importantes debido al creciente número de personas mayores. Se analizaron pruebas de fatiga en 23 muestras óseas femeninas de tres individuos. Las funciones de supervivencia y riesgo hipertabásticas del nivel de estrés normalizado y la edad se desarrollaron utilizando datos de estrés por fatiga ósea publicados previamente. El evento de interés fue el número de ciclos hasta que el hueso sufre una fractura microscópica. Además, se utilizaron modelos de riesgo proporcional hipertabastico para investigar la fatiga por tracción y el ciclo hasta la fatiga para obtener datos del hueso cortical. [12]
Se han utilizado modelos de supervivencia hipertabásticos en el análisis de datos de desempleo y su comparación con el modelo de regresión de Cox . [13]
Utilizando datos del Instituto Nacional del Cáncer de 1975 a 2016, se examinó el impacto de los subtipos histológicos en la probabilidad de supervivencia de 134.150 pacientes con carcinoma de riñón. Las variables del estudio fueron raza/etnia, edad, sexo, grado del tumor, tipo de cirugía, ubicación geográfica del paciente y estadio de la enfermedad. Se utilizó el modelo de riesgos proporcionales hipertabastico para analizar el tiempo de supervivencia de pacientes diagnosticados con carcinoma de riñón para explorar el efecto de los subtipos histológicos en su probabilidad de supervivencia y evaluar la relación entre los subtipos histológicos, el estadio del tumor, el grado del tumor y el tipo de cirugía. [14]
Código de muestra en SAS :
Proc datos pnl=sasuser . RiñónCarcinoma tech=quanew cov= 2 vardef=n pcov phes maxiter= 250 ; /* Modelo de riesgos proporcionales hipertabasticos con tiempo de registro */ title1 'Carcinoma de riñón' ; registro máximo; /* Valores iniciales de los parámetros del modelo para variables explicativas */ parms a= 0.01 ,b= 0.1 , c= 0.01 , /* Edad */ /* Continuo */ d=-. 01 , /* Masculino */ /* referencia: Femenino */ r1=. 071 , /* Hispano */ r2=. 044 , /* Asiático */ r3=. 134 , /* Negro */ /* referencia: Blanco */ h1=. 205 , /* Adenocarcinoma con subtipos mixtos */ h2=. 505 , /* Adenocarcinoma papilar SAI */ h3=. 537 , /* Adenocarcinoma de células claras */ h4=. 316 , /* Adenocarcinoma de células renales */ h5= 1,15 , /* Carcinoma de células renales cromófobo */ h6=-. 21 , /* Carcinoma sarcomatoide de células renales */ h7=. 378 , /* Carcinoma de células granulares */ /* referencia: Otros */ g1=. 03 , /* Este */ g2=. 088 , /* Llanuras del Norte */ g3=. 06 , /* Costa Pacífica */ /* referencia: Suroeste */ s1= 1.2 , /* Localizada */ s2=- 1.3 , /* Lejana */ /* referencia: Regional */ gr1= 1.169 , /* Bien Diferenciada * / gr2=. 99 , /* Moderadamente Diferenciado */ gr3=. 413 , /* Mal diferenciado */ /* referencia: Indiferenciado */ su1=-. 945 , /* Sin cirugía */ su2=. 84 , /*Criocergia */ su3=. 56 , /* Ablación Térmica */ su4=. 574 , /* Criocirugía */ su5= 1.173 , /* Nefrectomía Parcial o Ureterectomía Parcial */ su6=. 25 , /* Nefrectomía completa */ su7=. 073 , /* Nefrectomía radical */ su8=-. 096 , /* Cualquier Nefrectomía */ su9=. 028 ; /* Nefrectomía, Urectomía */ /* referencia: Otro */ /* Función de probabilidad logarítmica */ in6= exp( -(c*Edad+ d*Género+ r1*Carrera1+r2*Carrera2+r3*Carrera3+ h1*Hist1+h2*Hist2+h3*Hist3+h4*Hist4+h5*Hist5+h6*Hist6+h7*Hist7+ g1*Geo1+g2*Geo2+g3*Geo3+ s1*Etapa1+s2*Etapa2+ gr1*Grado1+gr2*Grado2+gr3*Grado3+ su1*Cirugía1+su2*Cirugía2+su3*Cirugía3+su4*Cirugía4+su5*Cirugía5+su6*Cirugía6+su7*Cirugía7+su8*Cirugía8+su9*Cirugía9)); /* covariables */ s = log( 1 / cosh( a*( 1 -(tiempo**b)/ tanh( tiempo**b))/b))*in6+Estado* log( ((a*tiempo**(- 1+ 2 *b)/ sinh( tiempo**b)** 2 - a*tiempo**(- 1 +b)/ tanh( tiempo**b))* tanh( a*( 1 -tiempo**b/ tanh( tiempo**b))/b))*in6); logf=s ; correr;
Aunque las herramientas y técnicas de análisis de supervivencia se han utilizado ampliamente en aplicaciones médicas y biomédicas durante las últimas décadas, sus aplicaciones a problemas de ingeniería han sido más esporádicas y limitadas. La evaluación probabilística de la vida útil de una amplia variedad de sistemas de ingeniería, desde pequeños componentes mecánicos hasta grandes estructuras de puentes, [15] puede beneficiarse sustancialmente de las técnicas de análisis de supervivencia bien establecidas. El modelado de fenómenos de tiempo hasta el evento en aplicaciones de ingeniería se puede realizar bajo la influencia de covariables numéricas y categóricas utilizando datos de observación o de prueba. La "supervivencia" de un componente o sistema de ingeniería es sinónimo del término más comúnmente utilizado "fiabilidad". El término "tasa de riesgo" o "tasa de fracaso condicional" (definida como probabilidad de supervivencia por unidad de tiempo suponiendo supervivencia hasta ese momento) es una medida importante del cambio en la tasa de fracaso a lo largo del tiempo. En este contexto, el fracaso se define como alcanzar el evento objetivo en el proceso de tiempo hasta el evento. Esto podría definirse como alcanzar un estado de condición de servicio particular, falla estructural localizada/parcial o falla global/catastrófica [16] aplicó el modelo de supervivencia de tiempo de falla acelerado paramétrico hipertabastico para desarrollar modelos probabilísticos de la vida útil de la plataforma del puente para Wisconsin. Las plataformas de los puentes suelen ser losas de hormigón sobre las que circula el tráfico, como se ve en el puente Marquette Interchange. Los autores utilizaron el conjunto de datos del National Bridge Inventory (NBI) para obtener los datos necesarios para su estudio. Los registros del NBI incluyen clasificaciones numéricas discretas para los tableros de los puentes (y otros componentes del puente), así como otra información básica como el tráfico diario promedio (ADT) y el área de superficie del tablero (que se obtiene multiplicando la longitud del puente proporcionada por el ancho del tablero del puente). Las calificaciones numéricas van del 0 al 9, donde 9 corresponde a una condición nueva y 0 es una falla total. Se seleccionó una calificación de condición de la plataforma de 5 como el final efectivo de la vida útil de la plataforma del puente. Las covariables numéricas utilizadas fueron el ADT y el área de superficie de la plataforma, mientras que la covariable categórica fue el material de la superestructura (acero estructural u hormigón).
Los modelos hipertabásticos de riesgos proporcionales y de tiempo de falla acelerado son técnicas útiles para analizar estructuras relacionadas con puentes debido a la flexibilidad de las curvas de riesgo, que pueden aumentar o disminuir monótonamente con la concavidad hacia arriba o hacia abajo. También puede tomar la forma de una única curva de montículo. [16] [1] [17] Esta flexibilidad en el modelado de diversas formas de peligro hace que el modelo sea adecuado para una amplia variedad de problemas de ingeniería. [dieciséis]
Tabatabai et al. amplió los modelos de tableros de puentes hipertabasticos desarrollados para puentes de Wisconsin a puentes en seis estados del norte de EE. UU. Nabizadeh, A. (2015). Fiabilidad de las superestructuras de puentes en Wisconsin. Trabajo de Fin de Máster (Tesis). Bienes comunes digitales de la UWM.y luego a los 50 estados de EE. UU. [18] El estudio de los tableros de puentes en los 50 estados indicó diferencias importantes en la confiabilidad de los tableros de puentes en diferentes estados y regiones. Stevens y cols. [19] analizan la importancia de los análisis de supervivencia para identificar indicadores clave de rendimiento de puentes y analizan el uso de modelos de supervivencia hipertabasticos para puentes. [20] y Nabizadeh et al. [21] ampliaron aún más el uso de modelos de supervivencia hipertabasticos para unir superestructuras. Las covariables utilizadas fueron ADT, longitud máxima de luz del puente y tipo de superestructura. La función de supervivencia se puede utilizar para determinar la vida esperada utilizando la siguiente ecuación (área bajo toda la curva de supervivencia)
Es importante señalar que tanto la función de supervivencia como la vida esperada cambiarían con el paso del tiempo. La función de supervivencia condicional es una función del tiempo y del tiempo de supervivencia y se define como [22]
Nabizadeh et al. [22] utilizaron las funciones de supervivencia hipertabasticas desarrolladas para Wisconsin para analizar las funciones de supervivencia condicional y la vida útil esperada condicional.
La vida esperada condicional continuaría aumentando a medida que aumenta el tiempo de supervivencia. Nabizadeh et al. Esta vida esperada adicional se denomina "dividendo de supervivencia".
Un modo importante de falla en la ingeniería de puentes es la fatiga del metal, que puede resultar de aplicaciones repetitivas de ciclos de tensión a diversos detalles y conexiones en la estructura. A medida que aumenta el número de ciclos , aumenta la probabilidad de falla por fatiga. Un factor importante en la vida a fatiga es el rango de tensión (Sr) (esfuerzo máximo menos mínimo en un ciclo). El problema probabilístico de fatiga de ingeniería puede tratarse como un problema de análisis de supervivencia del "tiempo" hasta el evento si el número de ciclos se trata como una variable de tiempo ficticia [23]
Esto facilitaría la aplicación de técnicas de análisis de supervivencia bien establecidas a problemas de fatiga de ingeniería [23] y Tabatabai et al. [24] La función de supervivencia , la función de densidad de probabilidad , la tasa de riesgo y la probabilidad acumulada de falla se pueden definir como
Se utilizó el modelo de tiempo de falla acelerado hipertabastico para analizar la vida de fatiga probabilística para varias categorías detalladas en puentes de acero. [23]
{{cite conference}}
: CS1 maint: DOI inactive as of January 2024 (link)