stringtranslate.com

Función de supervivencia

La función de supervivencia es una función que da la probabilidad de que un paciente, dispositivo u otro objeto de interés sobreviva más allá de un tiempo determinado. [1] La función de supervivencia también se conoce como función de supervivencia [2] o función de confiabilidad . [3] El término función de confiabilidad es común en ingeniería , mientras que el término función de supervivencia se usa en una gama más amplia de aplicaciones, incluida la mortalidad humana. La función de supervivencia es la función de distribución acumulativa complementaria de la vida. A veces, las funciones de distribución acumulativa complementarias se denominan funciones de supervivencia en general.

Definición

Sea la vida útil T una variable aleatoria continua con función de riesgo acumulativa F ( t ) y función de riesgo f( t ) en el intervalo [0,∞). Su función de supervivencia o función de confiabilidad es:

Ejemplos de funciones de supervivencia.

Los siguientes gráficos muestran ejemplos de funciones de supervivencia hipotéticas. El eje x es el tiempo. El eje y es la proporción de sujetos que sobrevivieron. Las gráficas muestran la probabilidad de que un sujeto sobreviva más allá del tiempo t.

Cuatro funciones de supervivencia

Por ejemplo, para la función de supervivencia 1, la probabilidad de sobrevivir más de t = 2 meses es 0,37. Es decir, el 37% de los sujetos sobrevive más de 2 meses.

Función de supervivencia 1

Para la función de supervivencia 2, la probabilidad de sobrevivir más de t = 2 meses es 0,97. Es decir, el 97% de los sujetos sobrevive más de 2 meses.

Función de supervivencia 2

La mediana de supervivencia se puede determinar a partir de la función de supervivencia: la mediana de supervivencia es el punto donde la función de supervivencia se cruza con el valor 0,5. [4] Por ejemplo, para la función de supervivencia 2, el 50% de los sujetos sobreviven 3,72 meses. Por tanto, la mediana de supervivencia es de 3,72 meses.

Función de supervivencia con mediana de supervivencia indicada.

En algunos casos, la mediana de supervivencia no se puede determinar a partir del gráfico. Por ejemplo, para la función de supervivencia 4, más del 50% de los sujetos sobreviven más que el período de observación de 10 meses.

Mediana de supervivencia superior a 10 meses.

La función de supervivencia es una de varias formas de describir y mostrar datos de supervivencia. Otra forma útil de mostrar datos es un gráfico que muestre la distribución de los tiempos de supervivencia de los sujetos. Olkin, [5] página 426, da el siguiente ejemplo de datos de supervivencia. Se registró el número de horas entre fallos sucesivos de un sistema de aire acondicionado. El tiempo entre fallos sucesivos es 1, 3, 5, 7, 11, 11, 11, 12, 14, 14, 14, 16, 16, 20, 21, 23, 42, 47, 52, 62, 71, 71, 87, 90, 95, 120, 120, 225, 246 y 261 horas. El tiempo medio entre fallos es 59,6. Este valor medio se utilizará en breve para ajustar una curva teórica a los datos. La siguiente figura muestra la distribución del tiempo entre fallas. Las marcas azules debajo del gráfico son las horas reales entre fallas sucesivas.

Distribución de los tiempos de falla de CA

La distribución de los tiempos de falla está superpuesta con una curva que representa una distribución exponencial. Para este ejemplo, la distribución exponencial se aproxima a la distribución de tiempos de falla. La curva exponencial es una distribución teórica ajustada a los tiempos de falla reales. Esta curva exponencial particular está especificada por el parámetro lambda, λ= 1/(tiempo medio entre fallas) = ​​1/59,6 = 0,0168. La distribución de los tiempos de falla se llama función de densidad de probabilidad (pdf), si el tiempo puede tomar cualquier valor positivo. En las ecuaciones, la función de probabilidad se especifica como f(t). Si el tiempo sólo puede tomar valores discretos (como 1 día, 2 días, etc.), la distribución de los tiempos de falla se denomina función de masa de probabilidad (pmf). La mayoría de los métodos de análisis de supervivencia suponen que el tiempo puede tomar cualquier valor positivo y f(t) es la función de probabilidad. Si el tiempo entre fallas observadas del aire acondicionado se aproxima usando la función exponencial, entonces la curva exponencial da la función de densidad de probabilidad, f(t), para los tiempos de falla del aire acondicionado.

Otra forma útil de mostrar los datos de supervivencia es un gráfico que muestra los fallos acumulados hasta cada momento. Estos datos pueden mostrarse como el número acumulado o la proporción acumulada de fallas hasta cada momento. El siguiente gráfico muestra la probabilidad acumulada (o proporción) de fallas en cada momento del sistema de aire acondicionado. La línea de escalón en negro muestra la proporción acumulada de fracasos. Para cada paso hay una marca azul en la parte inferior del gráfico que indica el tiempo de falla observado. La línea roja suave representa la curva exponencial ajustada a los datos observados.

CDF para fallas de CA

Un gráfico de la probabilidad acumulada de fallas hasta cada punto temporal se llama función de distribución acumulativa o CDF. En el análisis de supervivencia, la función de distribución acumulativa da la probabilidad de que el tiempo de supervivencia sea menor o igual a un tiempo específico, t.

Sea T el tiempo de supervivencia, que es cualquier número positivo. Un momento particular se designa con la letra t minúscula. La función de distribución acumulativa de T es la función

donde el lado derecho representa la probabilidad de que la variable aleatoria T sea menor o igual a t . Si el tiempo puede tomar cualquier valor positivo, entonces la función de distribución acumulativa F(t) es la integral de la función de densidad de probabilidad f(t).

Para el ejemplo del aire acondicionado, el gráfico de la CDF a continuación ilustra que la probabilidad de que el tiempo hasta la falla sea menor o igual a 100 horas es 0,81, según se estima utilizando la curva exponencial ajustada a los datos.

AC Tiempo hasta fallo LT 100 horas

Una alternativa a graficar la probabilidad de que el tiempo de falla sea menor o igual a 100 horas es graficar la probabilidad de que el tiempo de falla sea mayor que 100 horas. La probabilidad de que el tiempo de falla sea mayor que 100 horas debe ser 1 menos la probabilidad de que el tiempo de falla sea menor o igual a 100 horas, porque la probabilidad total debe sumar 1.

Esto da

P(tiempo de falla > 100 horas) = ​​1 - P(tiempo de falla < 100 horas) = ​​1 – 0,81 = 0,19.

Esta relación se generaliza a todos los tiempos de falla:

P(T > t) = 1 - P(T < t) = 1 – función de distribución acumulativa.

Esta relación se muestra en los gráficos siguientes. La gráfica de la izquierda es la función de distribución acumulativa, que es P(T < t). La gráfica de la derecha es P(T > t) = 1 - P(T < t). La gráfica de la derecha es la función de supervivencia, S(t). El hecho de que S(t) = 1 – CDF es la razón por la que otro nombre para la función de supervivencia es función de distribución acumulativa complementaria.

La función de supervivencia es 1 - CDF

Funciones de supervivencia paramétricas

En algunos casos, como en el ejemplo del aire acondicionado, la distribución de los tiempos de supervivencia se puede aproximar bien mediante una función como la distribución exponencial. En el análisis de supervivencia se utilizan habitualmente varias distribuciones, incluidas la exponencial, Weibull, gamma, normal, log-normal y log-logística. [3] [6] Estas distribuciones están definidas por parámetros. La distribución normal (gaussiana), por ejemplo, está definida por los dos parámetros media y desviación estándar. Las funciones de supervivencia definidas por parámetros se denominan paramétricas.

En los cuatro gráficos de funciones de supervivencia que se muestran arriba, la forma de la función de supervivencia está definida por una distribución de probabilidad particular: la función de supervivencia 1 está definida por una distribución exponencial, 2 está definida por una distribución de Weibull, 3 está definida por una distribución log-logística , y 4 está definido por otra distribución de Weibull.

Función de supervivencia exponencial

Para una distribución de supervivencia exponencial, la probabilidad de falla es la misma en cada intervalo de tiempo, sin importar la edad del individuo o del dispositivo. Este hecho conduce a la propiedad "sin memoria" de la distribución de supervivencia exponencial: la edad de un sujeto no tiene ningún efecto sobre la probabilidad de fracaso en el siguiente intervalo de tiempo. El exponencial puede ser un buen modelo para la vida útil de un sistema en el que las piezas se reemplazan cuando fallan. [7] También puede ser útil para modelar la supervivencia de organismos vivos en intervalos cortos. No es probable que sea un buen modelo de la vida completa de un organismo vivo. [8] Como señalan Efron y Hastie [9] (p. 134), "Si la vida humana fuera exponencial, no habría viejos ni jóvenes, sólo afortunados o desafortunados".

Función de supervivencia de Weibull

Un supuesto clave de la función de supervivencia exponencial es que la tasa de riesgo es constante. En el ejemplo anterior, la proporción de hombres que mueren cada año fue constante en 10%, lo que significa que la tasa de riesgo fue constante. La suposición de un peligro constante puede no ser apropiada. Por ejemplo, entre la mayoría de los organismos vivos, el riesgo de muerte es mayor en la vejez que en la mediana edad, es decir, la tasa de riesgo aumenta con el tiempo. Para algunas enfermedades, como el cáncer de mama, el riesgo de recurrencia es menor después de 5 años, es decir, la tasa de riesgo disminuye con el tiempo. La distribución de Weibull extiende la distribución exponencial para permitir tasas de riesgo constantes, crecientes o decrecientes.

Otras funciones de supervivencia paramétricas

Existen otras funciones de supervivencia paramétricas que pueden proporcionar un mejor ajuste a un conjunto de datos en particular, incluidas las normales, lognormales, loglogísticas y gamma. La elección de la distribución paramétrica para una aplicación particular se puede realizar utilizando métodos gráficos o pruebas de ajuste formales. Estas distribuciones y pruebas se describen en libros de texto sobre análisis de supervivencia. [1] [3] Lawless [10] tiene una amplia cobertura de modelos paramétricos.

Las funciones de supervivencia paramétricas se utilizan comúnmente en aplicaciones de fabricación, en parte porque permiten estimar la función de supervivencia más allá del período de observación. Sin embargo, el uso apropiado de funciones paramétricas requiere que los datos estén bien modelados por la distribución elegida. Si no se dispone de una distribución adecuada, o no se puede especificar antes de un ensayo o experimento clínico, las funciones de supervivencia no paramétricas ofrecen una alternativa útil.

Funciones de supervivencia no paramétricas

Un modelo paramétrico de supervivencia puede no ser posible o deseable. En estas situaciones, el método más común para modelar la función de supervivencia es el estimador no paramétrico de Kaplan-Meier . Este estimador requiere datos de por vida. Los recuentos periódicos de casos (cohorte) y muertes (y recuperación) son estadísticamente suficientes para realizar estimaciones no paramétricas de máxima verosimilitud y mínimos cuadrados de las funciones de supervivencia, sin datos de vida.

Propiedades

De modo que

Ver también

Referencias

  1. ^ ab Kleinbaum, David G.; Klein, Mitchel (2012), Análisis de supervivencia: un texto de autoaprendizaje (tercera ed.), Springer, ISBN 978-1441966452
  2. ^ Hombre de mesa, Mara; Kim, Jong Sung (2003), Análisis de supervivencia utilizando S (Primera ed.), Chapman y Hall/CRC, ISBN 978-1584884088
  3. ^ abc Ebeling, Charles (2010), Introducción a la ingeniería de confiabilidad y mantenimiento (Segunda ed.), Waveland Press, ISBN 978-1577666257
  4. ^ Machin, D., Cheung, YB, Parmar, M. (2006). Análisis de supervivencia: un enfoque práctico. Alemania: Wiley. Página 36 y siguientes de Google Books
  5. ^ Olkin, Ingram; Gleser, León; Derman, Cyrus (1994), Modelos y aplicaciones de probabilidad (Segunda ed.), Macmillan, ISBN 0-02-389220-X
  6. ^ Klein, Juan; Moeschberger, Melvin (2005), Análisis de supervivencia: técnicas para datos censurados y truncados (Segunda ed.), Springer, ISBN 978-0387953991
  7. ^ Mendenhall, William; Terry, Sincich (2007), Estadística para la ingeniería y las ciencias (Quinta ed.), Pearson / Prentice Hall, ISBN 978-0131877061
  8. ^ Brostrom, Göran (2012), Análisis del historial de eventos con R (Primera ed.), Chapman & Hall/CRC, ISBN 978-1439831649
  9. ^ Efrón, Bradley; Hastie, Trevor (2016), Inferencia estadística de la era de la informática: algoritmos, evidencia y ciencia de datos (Primera ed.), Cambridge University Press, ISBN 978-1107149892
  10. ^ Lawless, Jerald (2002), Modelos y métodos estadísticos para datos de por vida (Segunda ed.), Wiley, ISBN 978-0471372158