En teoría de probabilidad y estadística , la distribución de Weibull / ˈ w aɪ b ʊ l / es una distribución de probabilidad continua . Modela una amplia gama de variables aleatorias, en gran medida de la naturaleza del tiempo hasta el fallo o el tiempo entre eventos. Algunos ejemplos son las precipitaciones máximas de un día y el tiempo que un usuario pasa en una página web.
La distribución recibe su nombre del matemático sueco Waloddi Weibull , quien la describió en detalle en 1939, [1] [2] aunque fue identificada por primera vez por René Maurice Fréchet y aplicada por primera vez por Rosin y Rammler (1933) para describir una distribución de tamaño de partícula .
Si la cantidad, x, es un "tiempo hasta el fallo", la distribución de Weibull da una distribución para la que la tasa de fallos es proporcional a una potencia del tiempo. El parámetro de forma , k , es esa potencia más uno, por lo que este parámetro puede interpretarse directamente de la siguiente manera: [6]
Un valor de indica que la tasa de fracaso disminuye con el tiempo (como en el caso del efecto Lindy , que sin embargo corresponde a distribuciones de Pareto [7] en lugar de distribuciones de Weibull). Esto sucede si hay una "mortalidad infantil" significativa, o artículos defectuosos que fallan temprano y la tasa de fracaso disminuye con el tiempo a medida que los artículos defectuosos se eliminan de la población. En el contexto de la difusión de innovaciones , esto significa boca a boca negativo: la función de riesgo es una función monótonamente decreciente de la proporción de adoptantes;
Un valor de indica que la tasa de fallas es constante a lo largo del tiempo. Esto podría sugerir que eventos externos aleatorios están causando la mortalidad o la falla. La distribución de Weibull se reduce a una distribución exponencial;
Un valor de indica que la tasa de fallos aumenta con el tiempo. Esto sucede si hay un proceso de "envejecimiento" o si hay piezas que tienen más probabilidades de fallar con el paso del tiempo. En el contexto de la difusión de innovaciones , esto significa una comunicación positiva de boca en boca: la función de riesgo es una función monótonamente creciente de la proporción de adoptantes. La función es primero convexa, luego cóncava con un punto de inflexión en .
Las aplicaciones en estadística médica y econometría a menudo adoptan una parametrización diferente. [8] [9] El parámetro de forma k es el mismo que el anterior, mientras que el parámetro de escala es . En este caso, para x ≥ 0, la función de densidad de probabilidad es
La función de distribución acumulativa es
La función cuantil es
La función de riesgo es
y la media es
Segunda alternativa
También se puede encontrar una segunda parametrización alternativa. [10] [11] El parámetro de forma k es el mismo que en el caso estándar, mientras que el parámetro de escala λ se reemplaza por un parámetro de tasa β = 1/ λ . Entonces, para x ≥ 0, la función de densidad de probabilidad es
La función de distribución acumulativa es
La función cuantil es
y la función de riesgo es
En las tres parametrizaciones, el riesgo es decreciente para k < 1, creciente para k > 1 y constante para k = 1, en cuyo caso la distribución de Weibull se reduce a una distribución exponencial.
Propiedades
Función de densidad
La forma de la función de densidad de la distribución de Weibull cambia drásticamente con el valor de k . Para 0 < k < 1, la función de densidad tiende a ∞ cuando x se acerca a cero desde arriba y es estrictamente decreciente. Para k = 1, la función de densidad tiende a 1/ λ cuando x se acerca a cero desde arriba y es estrictamente decreciente. Para k > 1, la función de densidad tiende a cero cuando x se acerca a cero desde arriba, aumenta hasta su moda y decrece después de ella. La función de densidad tiene pendiente negativa infinita en x = 0 si 0 < k < 1, pendiente positiva infinita en x = 0 si 1 < k < 2 y pendiente nula en x = 0 si k > 2. Para k = 1 la densidad tiene una pendiente negativa finita en x = 0. Para k = 2 la densidad tiene una pendiente positiva finita en x = 0. Cuando k tiende a infinito, la distribución de Weibull converge a una distribución delta de Dirac centrada en x = λ. Además, la asimetría y el coeficiente de variación dependen únicamente del parámetro de forma. Una generalización de la distribución de Weibull es la distribución hiperbolástica de tipo III .
donde . El exceso de curtosis también puede escribirse como:
Función generadora de momentos
Hay una variedad de expresiones disponibles para la función generadora de momentos de X en sí. Como una serie de potencias , dado que los momentos en bruto ya se conocen, se tiene
Alternativamente, se puede intentar tratar directamente con la integral.
Si se supone que el parámetro k es un número racional, expresado como k = p / q donde p y q son números enteros, entonces esta integral se puede evaluar analíticamente. [13] Con t reemplazado por − t , se encuentra
Muraleedharan et al. (2007) también obtuvieron la función característica . Muraleedharan y Soares (2014) también obtuvieron la función característica y la función generadora de momentos de la distribución Weibull de 3 parámetros mediante un enfoque directo. harvtxt error: no target: CITEREFMuraleedharanSoares2014 (help)
Mínimos
Sean variables aleatorias de Weibull independientes e idénticamente distribuidas con parámetro de escala y parámetro de forma . Si el mínimo de estas variables aleatorias es , entonces la distribución de probabilidad acumulada de está dada por
Es decir, también se distribuirá Weibull con el parámetro de escala y con el parámetro de forma .
Trucos de reparametrización
Fijemos algunos . Sea no negativo, y no todos cero, y sean muestras independientes de , entonces [14]
Mínimos cuadrados ordinarios utilizando el diagrama de Weibull
El ajuste de una distribución de Weibull a los datos se puede evaluar visualmente utilizando un gráfico de Weibull. [17] El gráfico de Weibull es un gráfico de la función de distribución acumulativa empírica de los datos en ejes especiales en un tipo de gráfico Q-Q . Los ejes son versus . La razón de este cambio de variables es que la función de distribución acumulativa se puede linealizar:
que se puede ver que tiene la forma estándar de una línea recta. Por lo tanto, si los datos provienen de una distribución de Weibull, se espera que en un gráfico de Weibull aparezca una línea recta.
Existen varios enfoques para obtener la función de distribución empírica a partir de los datos. Un método consiste en obtener la coordenada vertical de cada punto utilizando
,
donde es el rango del punto de datos y es el número de puntos de datos. [18] [19] Otro estimador común [20] es
.
La regresión lineal también se puede utilizar para evaluar numéricamente la bondad del ajuste y estimar los parámetros de la distribución de Weibull. El gradiente informa directamente sobre el parámetro de forma y también se puede inferir el parámetro de escala.
Método de momentos
El coeficiente de variación de la distribución de Weibull depende únicamente del parámetro de forma: [21]
Al equiparar las cantidades de muestra a , la estimación del momento del parámetro de forma se puede leer a partir de una tabla de consulta o un gráfico de versus . Se puede encontrar una estimación más precisa de utilizando un algoritmo de búsqueda de raíces para resolver
La estimación del momento del parámetro de escala se puede encontrar entonces utilizando la primera ecuación de momento como
El estimador de máxima verosimilitud para es la solución para k de la siguiente ecuación [22]
Esta ecuación se define sólo implícitamente, por lo que generalmente se debe resolver por medios numéricos.
Cuando las muestras observadas son las más grandes de un conjunto de datos de más de muestras, entonces el estimador de máxima verosimilitud para el parámetro dado es [22]
Además, dada esa condición, el estimador de máxima verosimilitud para es [ cita requerida ]
Nuevamente, al ser una función implícita, generalmente se debe resolver por medios numéricos.
Aplicaciones
Se utiliza la distribución de Weibull [ cita requerida ]
Para describir el tamaño de las partículas generadas por las operaciones de molienda, trituración y trituración , se utiliza la distribución Weibull de 2 parámetros, y en estas aplicaciones a veces se la conoce como distribución Rosin-Rammler. [28] En este contexto, predice menos partículas finas que la distribución log-normal y generalmente es más precisa para distribuciones de tamaño de partícula estrechas. [29] La interpretación de la función de distribución acumulativa es que es la fracción de masa de partículas con un diámetro menor que , donde es el tamaño medio de partícula y es una medida de la dispersión de tamaños de partícula.
Al describir nubes de puntos aleatorios (como las posiciones de partículas en un gas ideal): la probabilidad de encontrar la partícula vecina más cercana a una distancia de una partícula dada está dada por una distribución de Weibull con e igual a la densidad de las partículas. [30]
Para calcular la tasa de efectos de eventos únicos inducidos por radiación a bordo de naves espaciales, se utiliza una distribución Weibull de cuatro parámetros para ajustar los datos de probabilidad de la sección transversal del dispositivo medidos experimentalmente a un espectro de transferencia de energía lineal de partículas . [31] El ajuste Weibull se utilizó originalmente debido a la creencia de que los niveles de energía de las partículas se alinean con una distribución estadística, pero esta creencia luego se demostró que era falsa [ cita requerida ] y el ajuste Weibull continúa utilizándose debido a sus muchos parámetros ajustables, en lugar de una base física demostrada. [32]
Distribuciones relacionadas
Si , entonces la variable tiene una distribución Gumbel (mínima) con parámetro de ubicación y parámetro de escala . Es decir, .
La distribución Weibull traducida (o Weibull de 3 parámetros) contiene un parámetro adicional. [12] Tiene la función de densidad de probabilidad
para y para , donde es el parámetro de forma , es el parámetro de escala y es el parámetro de ubicación de la distribución. value establece un tiempo inicial sin fallas antes de que comience el proceso Weibull regular. Cuando , esto se reduce a la distribución de 2 parámetros.
La distribución de Weibull se puede caracterizar como la distribución de una variable aleatoria tal que la variable aleatoria
Esto implica que la distribución de Weibull también se puede caracterizar en términos de una distribución uniforme : si se distribuye uniformemente en , entonces la variable aleatoria se distribuye según el método de Weibull con parámetros y . Nótese que aquí es equivalente a lo anterior. Esto conduce a un esquema numérico de fácil implementación para simular una distribución de Weibull.
La distribución de Weibull interpola entre la distribución exponencial con intensidad cuando y una distribución de Rayleigh de moda cuando .
La distribución de Weibull es un caso especial de la distribución generalizada de valores extremos . Fue en este sentido que la distribución fue identificada por primera vez por Maurice Fréchet en 1927. [34] La distribución de Fréchet , estrechamente relacionada , llamada así por este trabajo, tiene la función de densidad de probabilidad
La distribución de una variable aleatoria que se define como el mínimo de varias variables aleatorias, cada una con una distribución de Weibull diferente, es una distribución poli-Weibull .
La distribución Weibull fue aplicada por primera vez por Rosin y Rammler (1933) para describir distribuciones de tamaño de partículas. Se utiliza ampliamente en el procesamiento de minerales para describir distribuciones de tamaño de partículas en procesos de conminución . En este contexto, la distribución acumulativa está dada por
dónde
¿Es el tamaño de partícula?
es el percentil 80 de la distribución del tamaño de partícula
es un parámetro que describe la dispersión de la distribución
Debido a su disponibilidad en hojas de cálculo , también se utiliza cuando el comportamiento subyacente se modela mejor mediante una distribución de Erlang . [35]
^ W. Weibull (1939). "La teoría estadística de la resistencia de los materiales". Academia de Ingenieros Vetenskaps Handlingar (151). Estocolmo: Generalstabens Litografiska Anstalts Förlag: 1–45.
^ Papoulis, Athanasios Papoulis; Pillai, S. Unnikrishna (2002). Probabilidad, variables aleatorias y procesos estocásticos (4.ª ed.). Boston: McGraw-Hill. ISBN0-07-366011-6.
^ Kizilersu, Ayse; Kreer, Markus; Thomas, Anthony W. (2018). "La distribución de Weibull". Significancia . 15 (2): 10–11. doi : 10.1111/j.1740-9713.2018.01123.x .
^ "Distribución de Rayleigh – MATLAB y Simulink – MathWorks Australia". www.mathworks.com.au .
^ Jiang, R.; Murthy, DNP (2011). "Un estudio del parámetro de forma de Weibull: propiedades y significado". Ingeniería de confiabilidad y seguridad del sistema . 96 (12): 1619–26. doi :10.1016/j.ress.2011.09.003.
^ Eliazar, Iddo (noviembre de 2017). "Ley de Lindy". Physica A: Mecánica estadística y sus aplicaciones . 486 : 797–805. Bibcode :2017PhyA..486..797E. doi :10.1016/j.physa.2017.05.077. S2CID 125349686.
^ Collett, David (2015). Modelado de datos de supervivencia en la investigación médica (3.ª ed.). Boca Raton: Chapman and Hall / CRC. ISBN978-1439856789.
^ Cameron, AC; Trivedi, PK (2005). Microeconometría: métodos y aplicaciones . Cambridge University Press. pág. 584. ISBN978-0-521-84805-3.
^ Kalbfleisch, JD; Prentice, RL (2002). El análisis estadístico de los datos de tiempo de falla (2.ª ed.). Hoboken, NJ: J. Wiley. ISBN978-0-471-36357-6.OCLC 50124320 .
^ Therneau, T. (2020). "Un paquete para el análisis de supervivencia en R". Versión 3.1 del paquete R.
^ abc Johnson, Kotz y Balakrishnan 1994
^ Véase (Cheng, Tellambura y Beaulieu 2004) para el caso cuando k es un entero, y (Sagias y Karagiannidis 2005) para el caso racional. harv error: no target: CITEREFChengTellamburaBeaulieu2004 (help)
^ Balog, Matej; Tripuraneni, Nilesh; Ghahramani, Zoubin; Weller, Adrian (17 de julio de 2017). "Parientes perdidos del truco de Gumbel". Conferencia internacional sobre aprendizaje automático . PMLR: 371–379.
^ Cho, Youngseuk; Sun, Hokeun; Lee, Kyeongjun (5 de enero de 2015). "Estimación de la entropía de una distribución de Weibull bajo censura híbrida progresiva generalizada". Entropía . 17 (1): 102–122. doi : 10.3390/e17010102 . ISSN 1099-4300.
^ Bauckhage, Christian (2013). "Cálculo de la divergencia de Kullback-Leibler entre dos distribuciones de Weibull". arXiv : 1310.3713 [cs.IT].
^ "1.3.3.30. Diagrama de Weibull". www.itl.nist.gov .
^ Wayne Nelson (2004) Análisis de datos de vida aplicados . Wiley-Blackwell ISBN 0-471-64462-5
^ Barnett, V. (1975). "Métodos de representación gráfica de probabilidad y estadísticas de orden". Revista de la Royal Statistical Society. Serie C (Estadística aplicada) . 24 (1): 95–108. doi :10.2307/2346708. ISSN 0035-9254. JSTOR 2346708.
^ ISO 20501:2019 – Cerámica fina (cerámica avanzada, cerámica técnica avanzada) – Estadísticas de Weibull para datos de resistencia.
^ ab Cohen, A. Clifford (noviembre de 1965). "Estimación de máxima verosimilitud en la distribución de Weibull basada en muestras completas y censuradas" (PDF) . Technometrics . 7 (4): 579–588. doi :10.1080/00401706.1965.10490300.
^ ab Sornette, D. (2004). Fenómenos críticos en las ciencias naturales: caos, fractales, autoorganización y desorden ..
^ "CumFreq, Ajuste de distribución de probabilidad, software libre, frecuencia acumulada".
^ ab Lee, Se Yoon; Mallick, Bani (2021). "Modelado jerárquico bayesiano: aplicación a los resultados de producción en Eagle Ford Shale del sur de Texas". Sankhya B . 84 : 1–43. doi : 10.1007/s13571-020-00245-8 .
^ "Distribución de la velocidad del viento Weibull – REUK.co.uk". www.reuk.co.uk .
^ Liu, Chao; White, Ryen W.; Dumais, Susan (19 de julio de 2010). Comprensión de los comportamientos de navegación web a través del análisis de Weibull del tiempo de permanencia . ACM. págs. 379–386. doi :10.1145/1835449.1835513. ISBN .9781450301534.S2CID12186028 .
^ Sharif, M. Nawaz; Islam, M. Nazrul (1980). "La distribución de Weibull como modelo general para pronosticar el cambio tecnológico". Pronóstico tecnológico y cambio social . 18 (3): 247–56. doi :10.1016/0040-1625(80)90026-8.
^ Optimización computacional del motor de combustión interna página 49
^ Austin, LG; Klimpel, RR; Luckie, PT (1984). Ingeniería de procesos de reducción de tamaño . Hoboken, NJ: Guinn Printing Inc. ISBN0-89520-421-5.
^ Chandrashekar, S. (1943). "Problemas estocásticos en física y astronomía". Reseñas de física moderna . 15 (1): 86.
^ ECSS-E-ST-10-12C – Métodos para el cálculo de la radiación recibida y sus efectos, y una política para los márgenes de diseño (Informe). Cooperación Europea para la Normalización Espacial. 15 de noviembre de 2008.
^ LD Edmonds; CE Barnes; LZ Scheick (mayo de 2000). "8.3 Ajuste de curvas". Introducción a los efectos de la radiación espacial en la microelectrónica (PDF) (informe). Laboratorio de Propulsión a Chorro de la NASA, Instituto Tecnológico de California. págs. 75–76.
^ "Evolución de sistemas y fiabilidad de los mismos". Sysev (Bélgica). 1 de enero de 2010.
^ Montgomery, Douglas (19 de junio de 2012). Introducción al control estadístico de la calidad . [Sl]: John Wiley. p. 95. ISBN9781118146811.
^ Chatfield, C.; Goodhardt, GJ (1973). "Un modelo de compra del consumidor con tiempos entre compras de Erlang". Revista de la Asociación Estadounidense de Estadística . 68 (344): 828–835. doi :10.1080/01621459.1973.10481432.
Bibliografía
Fréchet, Maurice (1927), "Sur la loi de probabilité de l'écart Maximum", Annales de la Société Polonaise de Mathématique, Cracovia , 6 : 93–116.
Johnson, Norman L.; Kotz, Samuel; Balakrishnan, N. (1994), Distribuciones univariadas continuas. Vol. 1 , Wiley Series in Probability and Mathematical Statistics: Applied Probability and Statistics (2.ª ed.), Nueva York: John Wiley & Sons, ISBN 978-0-471-58495-7, Sr. 1299979
Mann, Nancy R .; Schafer, Ray E.; Singpurwalla, Nozer D. (1974), Métodos para el análisis estadístico de datos de confiabilidad y vida , Wiley Series in Probability and Mathematical Statistics: Applied Probability and Statistics (1.ª ed.), Nueva York: John Wiley & Sons, ISBN 978-0-471-56737-0
Muraleedharan, G.; Rao, AD; Kurup, PG; Nair, N. Unnikrishnan; Sinha, Mourani (2007), "Distribución Weibull modificada para la simulación y predicción de alturas de ola máximas y significativas", Coastal Engineering , 54 (8): 630–638, doi :10.1016/j.coastaleng.2007.05.001
Rosin, P.; Rammler, E. (1933), "Las leyes que rigen la finura del carbón en polvo", Journal of the Institute of Fuel , 7 : 29–36.
Sagias, NC; Karagiannidis, GK (2005). "Distribuciones Weibull multivariadas de clase gaussiana: teoría y aplicaciones en canales de desvanecimiento". IEEE Transactions on Information Theory . 51 (10): 3608–19. doi :10.1109/TIT.2005.855598. MR 2237527. S2CID 14654176.
Weibull, W. (1951), "Una función de distribución estadística de amplia aplicabilidad" (PDF) , Journal of Applied Mechanics , 18 (3): 293–297, Bibcode :1951JAM....18..293W, doi :10.1115/1.4010337.
Nelson Jr, Ralph (5 de febrero de 2008). "Dispersión de polvos en líquidos, parte 1, capítulo 6: distribución del volumen de partículas" . Consultado el 5 de febrero de 2008 .