stringtranslate.com

Distribución Weibull

En teoría de probabilidad y estadística , la distribución de Weibull / ˈw b ʊ l / es una distribución de probabilidad continua . Modela una amplia gama de variables aleatorias, en gran medida en forma de tiempo hasta la falla o tiempo entre eventos. Algunos ejemplos son las precipitaciones máximas de un día y el tiempo que un usuario pasa en una página web.

La distribución lleva el nombre del matemático sueco Waloddi Weibull , quien la describió en detalle en 1939, [1] aunque fue identificada por primera vez por René Maurice Fréchet y aplicada por primera vez por Rosin y Rammler (1933) para describir una distribución de tamaño de partículas .

Definición

Parametrización estándar

La función de densidad de probabilidad de una variable aleatoria de Weibull es [2] [3]

donde k > 0 es el parámetro de forma y λ > 0 es el parámetro de escala de la distribución. Su función de distribución acumulativa complementaria es una función exponencial extendida . La distribución de Weibull está relacionada con otras distribuciones de probabilidad; en particular, interpola entre la distribución exponencial ( k = 1) y la distribución de Rayleigh ( k = 2 y [4] ).

Si la cantidad X es un "tiempo hasta el fallo", la distribución de Weibull da una distribución para la cual la tasa de fallo es proporcional a una potencia de tiempo. El parámetro de forma , k , es esa potencia más uno, por lo que este parámetro se puede interpretar directamente de la siguiente manera: [5]

En el campo de la ciencia de los materiales , el parámetro de forma k de una distribución de resistencias se conoce como módulo de Weibull . En el contexto de la difusión de innovaciones , la distribución de Weibull es un modelo "puro" de imitación/rechazo.

Parametrizaciones alternativas

Primera alternativa

Las aplicaciones en estadística médica y econometría suelen adoptar una parametrización diferente. [7] [8] El parámetro de forma k es el mismo que el anterior, mientras que el parámetro de escala es . En este caso, para x ≥ 0, la función de densidad de probabilidad es

la función de distribución acumulativa es

la función de riesgo es

y la media es

Segunda alternativa

También se puede encontrar una segunda parametrización alternativa. [9] [10] El parámetro de forma k es el mismo que en el caso estándar, mientras que el parámetro de escala λ se reemplaza con un parámetro de velocidad β = 1/ λ . Entonces, para x ≥ 0, la función de densidad de probabilidad es

la función de distribución acumulativa es

y la función de riesgo es

En las tres parametrizaciones, el peligro disminuye para k < 1, aumenta para k > 1 y es constante para k = 1, en cuyo caso la distribución de Weibull se reduce a una distribución exponencial.

Propiedades

Función de densidad

La forma de la función de densidad de la distribución de Weibull cambia drásticamente con el valor de k . Para 0 < k < 1, la función de densidad tiende a ∞ cuando x se aproxima a cero desde arriba y es estrictamente decreciente. Para k = 1, la función de densidad tiende a 1/ λ cuando x tiende a cero desde arriba y es estrictamente decreciente. Para k > 1, la función de densidad tiende a cero cuando x se aproxima a cero desde arriba, aumenta hasta su moda y disminuye después. La función de densidad tiene pendiente negativa infinita en x = 0 si 0 < k < 1, pendiente positiva infinita en x = 0 si 1 < k < 2 y pendiente nula en x = 0 si k > 2. Para k = 1 la densidad tiene una pendiente negativa finita en x = 0. Para k = 2 la densidad tiene una pendiente positiva finita en x = 0. Cuando k tiende al infinito, la distribución de Weibull converge a una distribución delta de Dirac centrada en x = λ. Además, la asimetría y el coeficiente de variación dependen únicamente del parámetro de forma. Una generalización de la distribución de Weibull es la distribución hiperbólica de tipo III .

Función de distribución acumulativa

La función de distribución acumulada para la distribución de Weibull es

para x ≥ 0, y F ( x ; k ; λ) = 0 para x < 0.

Si x = λ entonces F ( x ; k ; λ) = 1 −  e −1 ≈ 0,632 para todos los valores de  k . Viceversa: en F ( x ; k ; λ ) = 0,632 el valor de  x  ≈  λ .

La función cuantil (distribución acumulativa inversa) para la distribución de Weibull es

para 0 ≤ p < 1.

La tasa de falla h (o función de riesgo) está dada por

El tiempo medio entre fallos MTBF es

Momentos

La función generadora de momentos del logaritmo de una variable aleatoria distribuida de Weibull viene dada por [11]

donde Γ es la función gamma . De manera similar, la función característica de log X viene dada por

En particular, el n ésimo momento crudo de X viene dado por

La media y la varianza de una variable aleatoria de Weibull se pueden expresar como

y

La asimetría está dada por

donde , que también puede escribirse como

donde la media se denota por μ y la desviación estándar se denota por σ .

El exceso de curtosis está dado por

dónde . El exceso de curtosis también se puede escribir como:

Función generadora de momento

Por el momento están disponibles una variedad de expresiones que generan la función del propio X. Como serie de potencias , dado que los momentos brutos ya se conocen, se tiene

Alternativamente, se puede intentar tratar directamente con la integral

Si se supone que el parámetro k es un número racional, expresado como k = p / q donde p y q son números enteros, entonces esta integral se puede evaluar analíticamente. [12] Con t reemplazado por − t , se encuentra

donde G es la función G de Meijer .

La función característica también ha sido obtenida por Muraleedharan et al. (2007). Muraleedharan & Soares (2014) también derivaron la función característica y la función generadora de momentos de la distribución de Weibull de 3 parámetros mediante un enfoque directo.

Mínimos

Sean variables aleatorias de Weibull independientes e idénticamente distribuidas con parámetro de escala y parámetro de forma . Si el mínimo de estas variables aleatorias es , entonces la distribución de probabilidad acumulada de dada por

Es decir, también se distribuirá Weibull con parámetro de escala y con parámetro de forma .

Trucos de reparametrización

Arreglar algunos . Sean no negativos, y no todos cero, y sean muestras independientes de , entonces [13]

Entropía de Shannon

La entropía de la información está dada por

¿ Dónde está la constante de Euler-Mascheroni ? La distribución de Weibull es la distribución de entropía máxima para una variable aleatoria real no negativa con un valor esperado fijo de x k igual a λ k y un valor esperado fijo de ln( x k ) igual a ln( λ k ) −  .

Divergencia Kullback-Leibler

La divergencia Kullback-Leibler entre dos distribuciones de Weibull viene dada por [14]

Estimación de parámetros

Mínimos cuadrados ordinarios usando el diagrama de Weibull

Trama de Weibull

El ajuste de una distribución de Weibull a los datos se puede evaluar visualmente mediante un gráfico de Weibull. [15] El gráfico de Weibull es un gráfico de la función de distribución acumulativa empírica de datos en ejes especiales en un tipo de gráfico Q-Q . Los ejes son versus . La razón de este cambio de variables es que la función de distribución acumulativa se puede linealizar:

que se puede ver en la forma estándar de una línea recta. Por lo tanto, si los datos provienen de una distribución de Weibull, entonces se espera una línea recta en un gráfico de Weibull.

Existen varios enfoques para obtener la función de distribución empírica a partir de datos: un método es obtener la coordenada vertical para cada punto usando donde está el rango del punto de datos y es el número de puntos de datos. [dieciséis]

La regresión lineal también se puede utilizar para evaluar numéricamente la bondad del ajuste y estimar los parámetros de la distribución de Weibull. El gradiente informa directamente sobre el parámetro de forma y también se puede inferir el parámetro de escala.

Método de momentos

El coeficiente de variación de la distribución de Weibull depende únicamente del parámetro de forma: [17]

Al equiparar las cantidades de la muestra con , la estimación del momento del parámetro de forma se puede leer en una tabla de consulta o en una gráfica de versus . Se puede encontrar una estimación más precisa utilizando el algoritmo de búsqueda de raíces que resuelve

La estimación del momento del parámetro de escala se puede encontrar usando la primera ecuación de momento como

Máxima verosimilitud

El estimador de máxima verosimilitud para el parámetro dado es [17]

El estimador de máxima verosimilitud para es la solución para k de la siguiente ecuación [18]

Esta ecuación se define sólo implícitamente; generalmente se debe resolver por medios numéricos.

Cuando las muestras observadas más grandes son de un conjunto de datos de más de muestras, entonces el estimador de máxima verosimilitud para el parámetro dado es [18]

Además, dada esa condición, el estimador de máxima verosimilitud es [ cita necesaria ]

Nuevamente, al tratarse de una función implícita, generalmente se debe resolver por medios numéricos.

Aplicaciones

Se utiliza la distribución de Weibull [ cita necesaria ]

Distribución Weibull acumulativa ajustada a las precipitaciones máximas de un día utilizando CumFreq , ver también ajuste de distribución [19]
Curvas ajustadas para datos de series temporales de producción de petróleo [20]

Distribuciones relacionadas

Ver también

Referencias

  1. ^ Bowers, et. Alabama. (1997) Matemáticas actuariales, 2ª ed. Sociedad de Actuarios.
  2. ^ Papoulis, Athanasios Papoulis; Pillai, S. Unnikrishna (2002). Probabilidad, variables aleatorias y procesos estocásticos (4ª ed.). Boston: McGraw-Hill. ISBN 0-07-366011-6.
  3. ^ Kizilersu, Ayse; Kreer, Markus; Thomas, Anthony W. (2018). "La distribución de Weibull". Significado . 15 (2): 10–11. doi : 10.1111/j.1740-9713.2018.01123.x .
  4. ^ "Distribución Rayleigh - MATLAB y Simulink - MathWorks Australia". www.mathworks.com.au .
  5. ^ Jiang, R.; Murthy, DNP (2011). "Un estudio del parámetro de forma de Weibull: propiedades y significado". Ingeniería de confiabilidad y seguridad de sistemas . 96 (12): 1619–26. doi :10.1016/j.ress.2011.09.003.
  6. ^ Eliazar, Iddo (noviembre de 2017). "Ley de Lindy". Physica A: Mecánica estadística y sus aplicaciones . 486 : 797–805. Código Bib : 2017PhyA..486..797E. doi :10.1016/j.physa.2017.05.077. S2CID  125349686.
  7. ^ Collett, David (2015). Modelado de datos de supervivencia en la investigación médica (3ª ed.). Boca Ratón: Chapman y Hall / CRC. ISBN 978-1439856789.
  8. ^ Cameron, CA; Trivedi, PK (2005). Microeconometría: métodos y aplicaciones . pag. 584.ISBN 978-0-521-84805-3.
  9. ^ Kalbfleisch, JD; Prentice, RL (2002). El análisis estadístico de los datos del tiempo de falla (2ª ed.). Hoboken, Nueva Jersey: J. Wiley. ISBN 978-0-471-36357-6. OCLC  50124320.
  10. ^ Therneau, T. (2020). "Un paquete para análisis de supervivencia en R." Paquete R versión 3.1.
  11. ^ abc Johnson, Kotz y Balakrishnan 1994
  12. ^ Véase (Cheng, Tellambura y Beaulieu 2004) para el caso en que k es un número entero y (Sagias y Karagiannidis 2005) para el caso racional.
  13. ^ Balog, Matej; Tripuraneni, Nilesh; Ghahramani, Zoubin; Weller, Adrián (17 de julio de 2017). "Parientes perdidos del truco de Gumbel". Congreso Internacional sobre Aprendizaje Automático . PMLR: 371–379.
  14. ^ Bauckhage, cristiano (2013). "Cálculo de la divergencia de Kullback-Leibler entre dos distribuciones de Weibull". arXiv : 1310.3713 [cs.IT].
  15. ^ "1.3.3.30. Trama de Weibull". www.itl.nist.gov .
  16. ^ Wayne Nelson (2004) Análisis de datos de vida aplicados . Wiley-Blackwell ISBN 0-471-64462-5 
  17. ^ ab Cohen, A. Clifford (noviembre de 1965). "Estimación de máxima verosimilitud en la distribución de Weibull basada en muestras completas y censuradas" (PDF) . Tecnometría . 7 (4): 579–588.
  18. ^ ab Sornette, D. (2004). Fenómenos críticos en las ciencias naturales: caos, fractales, autoorganización y desorden ..
  19. ^ "CumFreq, Ajuste de distribución de probabilidad, software libre, frecuencia acumulada".
  20. ^ ab Lee, Se Yoon; Mallick, Bani (2021). "Modelado jerárquico bayesiano: aplicación a resultados de producción en Eagle Ford Shale del sur de Texas". Sankhya B. 84 : 1–43. doi : 10.1007/s13571-020-00245-8 .
  21. ^ "Distribución de la velocidad del viento Weibull - REUK.co.uk". www.reuk.co.uk.
  22. ^ Liu, Chao; Blanco, Ryen W.; Dumais, Susan (19 de julio de 2010). Comprender los comportamientos de navegación web a través del análisis Weibull del tiempo de permanencia . ACM. págs. 379–386. doi :10.1145/1835449.1835513. ISBN 9781450301534. S2CID  12186028.
  23. ^ Sharif, M. Nawaz; Islam, M. Nazrul (1980). "La distribución de Weibull como modelo general para pronosticar el cambio tecnológico". Previsión Tecnológica y Cambio Social . 18 (3): 247–56. doi :10.1016/0040-1625(80)90026-8.
  24. ^ Optimización computacional del motor de combustión interna página 49
  25. ^ Austin, LG; Klimpel, RR; Suerte, PT (1984). Ingeniería de Procesos de Reducción de Tamaño . Hoboken, Nueva Jersey: Guinn Printing Inc. ISBN 0-89520-421-5.
  26. ^ Chandrashekar, S. (1943). "Problemas estocásticos en Física y Astronomía". Reseñas de Física Moderna . 15 (1): 86.
  27. ^ ECSS-E-ST-10-12C - Métodos para el cálculo de la radiación recibida y sus efectos, y política para los márgenes de diseño (Reporte). Cooperación europea para la normalización espacial. 15 de noviembre de 2008.
  28. ^ LD Edmonds; CE Barnes; LZ Scheick (mayo de 2000). "8.3 Ajuste de curvas". Introducción a los efectos de la radiación espacial en la microelectrónica (PDF) (Reporte). Laboratorio de Propulsión a Chorro de la NASA, Instituto de Tecnología de California. págs. 75–76.
  29. ^ "Evolución del sistema y confiabilidad de los sistemas". Sysev (Bélgica). 2010-01-01.
  30. ^ Montgomery, Douglas (19 de junio de 2012). Introducción al control estadístico de calidad . [SL]: John Wiley. pag. 95.ISBN 9781118146811.
  31. ^ Chatfield, C.; Goodhardt, GJ (1973). "Un modelo de compra del consumidor con Erlang Interpurchase Times". Revista de la Asociación Estadounidense de Estadística . 68 (344): 828–835. doi :10.1080/01621459.1973.10481432.

Bibliografía

enlaces externos