stringtranslate.com

Distribución de Weibull

En teoría de probabilidad y estadística , la distribución de Weibull / ˈ w b ʊ l / es una distribución de probabilidad continua . Modela una amplia gama de variables aleatorias, en gran medida de la naturaleza del tiempo hasta el fallo o el tiempo entre eventos. Algunos ejemplos son las precipitaciones máximas de un día y el tiempo que un usuario pasa en una página web.

La distribución recibe su nombre del matemático sueco Waloddi Weibull , quien la describió en detalle en 1939, [1] [2] aunque fue identificada por primera vez por René Maurice Fréchet y aplicada por primera vez por Rosin y Rammler (1933) para describir una distribución de tamaño de partícula .

Definición

Parametrización estándar

La función de densidad de probabilidad de una variable aleatoria de Weibull es [3] [4]

donde k > 0 es el parámetro de forma y λ > 0 es el parámetro de escala de la distribución. Su función de distribución acumulativa complementaria es una función exponencial estirada . La distribución de Weibull está relacionada con varias otras distribuciones de probabilidad; en particular, interpola entre la distribución exponencial ( k = 1) y la distribución de Rayleigh ( k = 2 y [5] ).

Si la cantidad, x, es un "tiempo hasta el fallo", la distribución de Weibull da una distribución para la que la tasa de fallos es proporcional a una potencia del tiempo. El parámetro de forma , k , es esa potencia más uno, por lo que este parámetro puede interpretarse directamente de la siguiente manera: [6]

En el campo de la ciencia de los materiales , el parámetro de forma k de una distribución de resistencias se conoce como módulo de Weibull . En el contexto de la difusión de innovaciones , la distribución de Weibull es un modelo de imitación/rechazo "puro".

Parametrizaciones alternativas

Primera alternativa

Las aplicaciones en estadística médica y econometría a menudo adoptan una parametrización diferente. [8] [9] El parámetro de forma k es el mismo que el anterior, mientras que el parámetro de escala es . En este caso, para x ≥ 0, la función de densidad de probabilidad es

La función de distribución acumulativa es

La función cuantil es

La función de riesgo es

y la media es

Segunda alternativa

También se puede encontrar una segunda parametrización alternativa. [10] [11] El parámetro de forma k es el mismo que en el caso estándar, mientras que el parámetro de escala λ se reemplaza por un parámetro de tasa β = 1/ λ . Entonces, para x ≥ 0, la función de densidad de probabilidad es

La función de distribución acumulativa es

La función cuantil es

y la función de riesgo es

En las tres parametrizaciones, el riesgo es decreciente para k < 1, creciente para k > 1 y constante para k = 1, en cuyo caso la distribución de Weibull se reduce a una distribución exponencial.

Propiedades

Función de densidad

La forma de la función de densidad de la distribución de Weibull cambia drásticamente con el valor de k . Para 0 < k < 1, la función de densidad tiende a ∞ cuando x se acerca a cero desde arriba y es estrictamente decreciente. Para k = 1, la función de densidad tiende a 1/ λ cuando x se acerca a cero desde arriba y es estrictamente decreciente. Para k > 1, la función de densidad tiende a cero cuando x se acerca a cero desde arriba, aumenta hasta su moda y decrece después de ella. La función de densidad tiene pendiente negativa infinita en x = 0 si 0 < k < 1, pendiente positiva infinita en x = 0 si 1 < k < 2 y pendiente nula en x = 0 si k > 2. Para k = 1 la densidad tiene una pendiente negativa finita en x = 0. Para k = 2 la densidad tiene una pendiente positiva finita en x = 0. Cuando k tiende a infinito, la distribución de Weibull converge a una distribución delta de Dirac centrada en x = λ. Además, la asimetría y el coeficiente de variación dependen únicamente del parámetro de forma. Una generalización de la distribución de Weibull es la distribución hiperbolástica de tipo III .

Función de distribución acumulativa

La función de distribución acumulativa para la distribución de Weibull es

para x ≥ 0, y F ( x ; k ; λ) = 0 para x < 0.

Si x = λ entonces F ( x ; k ; λ) = 1 −  e −1 ≈ 0,632 para todos los valores de  k . Viceversa: en F ( x ; k ; λ ) = 0,632 el valor de  x  ≈  λ .

La función cuantil (distribución acumulativa inversa) para la distribución de Weibull es

para 0 ≤ p < 1.

La tasa de fallo h (o función de riesgo) viene dada por

El tiempo medio entre fallos MTBF es

Momentos

La función generadora de momentos del logaritmo de una variable aleatoria distribuida según Weibull se da mediante [12]

donde Γ es la función gamma . De manera similar, la función característica de log X está dada por

En particular, el n- ésimo momento bruto de X está dado por

La media y la varianza de una variable aleatoria de Weibull se pueden expresar como

y

La asimetría viene dada por

donde , que también puede escribirse como

donde la media se denota por μ y la desviación estándar se denota por σ .

El exceso de curtosis viene dado por

donde . El exceso de curtosis también puede escribirse como:

Función generadora de momentos

Hay una variedad de expresiones disponibles para la función generadora de momentos de X en sí. Como una serie de potencias , dado que los momentos en bruto ya se conocen, se tiene

Alternativamente, se puede intentar tratar directamente con la integral.

Si se supone que el parámetro k es un número racional, expresado como k = p / q donde p y q son números enteros, entonces esta integral se puede evaluar analíticamente. [13] Con t reemplazado por − t , se encuentra

donde G es la función G de Meijer .

Muraleedharan et al. (2007) también obtuvieron la función característica . Muraleedharan y Soares (2014) también obtuvieron la función característica y la función generadora de momentos de la distribución Weibull de 3 parámetros mediante un enfoque directo.

Mínimos

Sean variables aleatorias de Weibull independientes e idénticamente distribuidas con parámetro de escala y parámetro de forma . Si el mínimo de estas variables aleatorias es , entonces la distribución de probabilidad acumulada de está dada por

Es decir, también se distribuirá Weibull con el parámetro de escala y con el parámetro de forma .

Trucos de reparametrización

Fijemos algunos . Sea no negativo, y no todos cero, y sean muestras independientes de , entonces [14]

Entropía de Shannon

La entropía de la información está dada por [15]

donde es la constante de Euler–Mascheroni . La distribución de Weibull es la distribución de máxima entropía para una variable aleatoria real no negativa con un valor esperado fijo de x k igual a λ k y un valor esperado fijo de ln( x k ) igual a ln( λ k ) −  .

Divergencia de Kullback-Leibler

La divergencia de Kullback-Leibler entre dos distribuciones de Weibulll está dada por [16]

Estimación de parámetros

Mínimos cuadrados ordinarios utilizando el diagrama de Weibull

Diagrama de Weibull

El ajuste de una distribución de Weibull a los datos se puede evaluar visualmente utilizando un gráfico de Weibull. [17] El gráfico de Weibull es un gráfico de la función de distribución acumulativa empírica de los datos en ejes especiales en un tipo de gráfico Q-Q . Los ejes son versus . La razón de este cambio de variables es que la función de distribución acumulativa se puede linealizar:

que se puede ver que tiene la forma estándar de una línea recta. Por lo tanto, si los datos provienen de una distribución de Weibull, se espera que en un gráfico de Weibull aparezca una línea recta.

Existen varios enfoques para obtener la función de distribución empírica a partir de los datos. Un método consiste en obtener la coordenada vertical de cada punto utilizando

,

donde es el rango del punto de datos y es el número de puntos de datos. [18] [19] Otro estimador común [20] es

.

La regresión lineal también se puede utilizar para evaluar numéricamente la bondad del ajuste y estimar los parámetros de la distribución de Weibull. El gradiente informa directamente sobre el parámetro de forma y también se puede inferir el parámetro de escala.

Método de momentos

El coeficiente de variación de la distribución de Weibull depende únicamente del parámetro de forma: [21]

Al equiparar las cantidades de muestra a , la estimación del momento del parámetro de forma se puede leer a partir de una tabla de consulta o un gráfico de versus . Se puede encontrar una estimación más precisa de utilizando un algoritmo de búsqueda de raíces para resolver

La estimación del momento del parámetro de escala se puede encontrar entonces utilizando la primera ecuación de momento como

Máxima verosimilitud

El estimador de máxima verosimilitud para el parámetro dado es [21]

El estimador de máxima verosimilitud para es la solución para k de la siguiente ecuación [22]

Esta ecuación se define sólo implícitamente, por lo que generalmente se debe resolver por medios numéricos.

Cuando las muestras observadas son las más grandes de un conjunto de datos de más de muestras, entonces el estimador de máxima verosimilitud para el parámetro dado es [22]

Además, dada esa condición, el estimador de máxima verosimilitud para es [ cita requerida ]

Nuevamente, al ser una función implícita, generalmente se debe resolver por medios numéricos.

Aplicaciones

Se utiliza la distribución de Weibull [ cita requerida ]

Distribución Weibull acumulada ajustada a las precipitaciones máximas de un día utilizando CumFreq , véase también ajuste de distribución [23]
Curvas ajustadas para datos de series temporales de producción de petróleo [24]

Distribuciones relacionadas

Véase también

Referencias

  1. ^ W. Weibull (1939). "La teoría estadística de la resistencia de los materiales". Academia de Ingenieros Vetenskaps Handlingar (151). Estocolmo: Generalstabens Litografiska Anstalts Förlag: 1–45.
  2. ^ Bowers, et. al. (1997) Matemáticas actuariales, 2.ª ed. Sociedad de Actuarios.
  3. ^ Papoulis, Athanasios Papoulis; Pillai, S. Unnikrishna (2002). Probabilidad, variables aleatorias y procesos estocásticos (4.ª ed.). Boston: McGraw-Hill. ISBN 0-07-366011-6.
  4. ^ Kizilersu, Ayse; Kreer, Markus; Thomas, Anthony W. (2018). "La distribución de Weibull". Significancia . 15 (2): 10–11. doi : 10.1111/j.1740-9713.2018.01123.x .
  5. ^ "Distribución de Rayleigh – MATLAB y Simulink – MathWorks Australia". www.mathworks.com.au .
  6. ^ Jiang, R.; Murthy, DNP (2011). "Un estudio del parámetro de forma de Weibull: propiedades y significado". Ingeniería de confiabilidad y seguridad del sistema . 96 (12): 1619–26. doi :10.1016/j.ress.2011.09.003.
  7. ^ Eliazar, Iddo (noviembre de 2017). "Ley de Lindy". Physica A: Mecánica estadística y sus aplicaciones . 486 : 797–805. Bibcode :2017PhyA..486..797E. doi :10.1016/j.physa.2017.05.077. S2CID  125349686.
  8. ^ Collett, David (2015). Modelado de datos de supervivencia en la investigación médica (3.ª ed.). Boca Raton: Chapman and Hall / CRC. ISBN 978-1439856789.
  9. ^ Cameron, AC; Trivedi, PK (2005). Microeconometría: métodos y aplicaciones . Cambridge University Press. pág. 584. ISBN 978-0-521-84805-3.
  10. ^ Kalbfleisch, JD; Prentice, RL (2002). El análisis estadístico de los datos de tiempo de falla (2.ª ed.). Hoboken, NJ: J. Wiley. ISBN 978-0-471-36357-6.OCLC 50124320  .
  11. ^ Therneau, T. (2020). "Un paquete para el análisis de supervivencia en R". Versión 3.1 del paquete R.
  12. ^ abc Johnson, Kotz y Balakrishnan 1994
  13. ^ Véase (Cheng, Tellambura y Beaulieu 2004) para el caso cuando k es un entero, y (Sagias y Karagiannidis 2005) para el caso racional.
  14. ^ Balog, Matej; Tripuraneni, Nilesh; Ghahramani, Zoubin; Weller, Adrian (17 de julio de 2017). "Parientes perdidos del truco de Gumbel". Conferencia internacional sobre aprendizaje automático . PMLR: 371–379.
  15. ^ Cho, Youngseuk; Sun, Hokeun; Lee, Kyeongjun (5 de enero de 2015). "Estimación de la entropía de una distribución de Weibull bajo censura híbrida progresiva generalizada". Entropía . 17 (1): 102–122. doi : 10.3390/e17010102 . ISSN  1099-4300.
  16. ^ Bauckhage, Christian (2013). "Cálculo de la divergencia de Kullback-Leibler entre dos distribuciones de Weibull". arXiv : 1310.3713 [cs.IT].
  17. ^ "1.3.3.30. Diagrama de Weibull". www.itl.nist.gov .
  18. ^ Wayne Nelson (2004) Análisis de datos de vida aplicados . Wiley-Blackwell ISBN 0-471-64462-5 
  19. ^ Barnett, V. (1975). "Métodos de representación gráfica de probabilidad y estadísticas de orden". Revista de la Royal Statistical Society. Serie C (Estadística aplicada) . 24 (1): 95–108. doi :10.2307/2346708. ISSN  0035-9254. JSTOR  2346708.
  20. ^ ISO 20501:2019 – Cerámica fina (cerámica avanzada, cerámica técnica avanzada) – Estadísticas de Weibull para datos de resistencia.
  21. ^ ab Cohen, A. Clifford (noviembre de 1965). "Estimación de máxima verosimilitud en la distribución de Weibull basada en muestras completas y censuradas" (PDF) . Technometrics . 7 (4): 579–588. doi :10.1080/00401706.1965.10490300.
  22. ^ ab Sornette, D. (2004). Fenómenos críticos en las ciencias naturales: caos, fractales, autoorganización y desorden ..
  23. ^ "CumFreq, Ajuste de distribución de probabilidad, software libre, frecuencia acumulada".
  24. ^ ab Lee, Se Yoon; Mallick, Bani (2021). "Modelado jerárquico bayesiano: aplicación a los resultados de producción en Eagle Ford Shale del sur de Texas". Sankhya B . 84 : 1–43. doi : 10.1007/s13571-020-00245-8 .
  25. ^ "Distribución de la velocidad del viento Weibull – REUK.co.uk". www.reuk.co.uk .
  26. ^ Liu, Chao; White, Ryen W.; Dumais, Susan (19 de julio de 2010). Comprensión de los comportamientos de navegación web a través del análisis de Weibull del tiempo de permanencia . ACM. págs. 379–386. doi :10.1145/1835449.1835513. ISBN . 9781450301534.S2CID12186028  .​
  27. ^ Sharif, M. Nawaz; Islam, M. Nazrul (1980). "La distribución de Weibull como modelo general para pronosticar el cambio tecnológico". Pronóstico tecnológico y cambio social . 18 (3): 247–56. doi :10.1016/0040-1625(80)90026-8.
  28. ^ Optimización computacional del motor de combustión interna página 49
  29. ^ Austin, LG; Klimpel, RR; Luckie, PT (1984). Ingeniería de procesos de reducción de tamaño . Hoboken, NJ: Guinn Printing Inc. ISBN 0-89520-421-5.
  30. ^ Chandrashekar, S. (1943). "Problemas estocásticos en física y astronomía". Reseñas de física moderna . 15 (1): 86.
  31. ^ ECSS-E-ST-10-12C – Métodos para el cálculo de la radiación recibida y sus efectos, y una política para los márgenes de diseño (Informe). Cooperación Europea para la Normalización Espacial. 15 de noviembre de 2008.
  32. ^ LD Edmonds; CE Barnes; LZ Scheick (mayo de 2000). "8.3 Ajuste de curvas". Introducción a los efectos de la radiación espacial en la microelectrónica (PDF) (informe). Laboratorio de Propulsión a Chorro de la NASA, Instituto Tecnológico de California. págs. 75–76.
  33. ^ "Evolución de sistemas y fiabilidad de los mismos". Sysev (Bélgica). 1 de enero de 2010.
  34. ^ Montgomery, Douglas (19 de junio de 2012). Introducción al control estadístico de la calidad . [Sl]: John Wiley. p. 95. ISBN 9781118146811.
  35. ^ Chatfield, C.; Goodhardt, GJ (1973). "Un modelo de compra del consumidor con tiempos entre compras de Erlang". Revista de la Asociación Estadounidense de Estadística . 68 (344): 828–835. doi :10.1080/01621459.1973.10481432.

Bibliografía

Enlaces externos