En teoría de probabilidad y estadística , la distribución de Weibull / ˈw aɪ b ʊ l / es una distribución de probabilidad continua . Modela una amplia gama de variables aleatorias, en gran medida en forma de tiempo hasta la falla o tiempo entre eventos. Algunos ejemplos son las precipitaciones máximas de un día y el tiempo que un usuario pasa en una página web.
La distribución lleva el nombre del matemático sueco Waloddi Weibull , quien la describió en detalle en 1939, [1] aunque fue identificada por primera vez por René Maurice Fréchet y aplicada por primera vez por Rosin y Rammler (1933) para describir una distribución de tamaño de partículas .
Si la cantidad X es un "tiempo hasta el fallo", la distribución de Weibull da una distribución para la cual la tasa de fallo es proporcional a una potencia de tiempo. El parámetro de forma , k , es esa potencia más uno, por lo que este parámetro se puede interpretar directamente de la siguiente manera: [5]
Un valor de indica que la tasa de fracaso disminuye con el tiempo (como en el caso del efecto Lindy , que sin embargo corresponde a distribuciones de Pareto [6] en lugar de distribuciones de Weibull). Esto sucede si hay una "mortalidad infantil" significativa, o si los artículos defectuosos fallan temprano y la tasa de fallas disminuye con el tiempo a medida que los artículos defectuosos se eliminan de la población. En el contexto de la difusión de innovaciones , esto significa un boca a boca negativo: la función de riesgo es una función monótonamente decreciente de la proporción de adoptantes;
Un valor de indica que la tasa de falla es constante en el tiempo. Esto podría sugerir que eventos externos aleatorios están causando mortalidad o fracaso. La distribución de Weibull se reduce a una distribución exponencial;
Un valor de indica que la tasa de falla aumenta con el tiempo. Esto sucede si hay un proceso de "envejecimiento" o piezas que tienen más probabilidades de fallar a medida que pasa el tiempo. En el contexto de la difusión de innovaciones , esto significa un boca a boca positivo: la función de riesgo es una función monótonamente creciente de la proporción de adoptantes. La función es primero convexa y luego cóncava con un punto de inflexión en .
Las aplicaciones en estadística médica y econometría suelen adoptar una parametrización diferente. [7] [8] El parámetro de forma k es el mismo que el anterior, mientras que el parámetro de escala es . En este caso, para x ≥ 0, la función de densidad de probabilidad es
la función de distribución acumulativa es
la función de riesgo es
y la media es
Segunda alternativa
También se puede encontrar una segunda parametrización alternativa. [9] [10] El parámetro de forma k es el mismo que en el caso estándar, mientras que el parámetro de escala λ se reemplaza con un parámetro de velocidad β = 1/ λ . Entonces, para x ≥ 0, la función de densidad de probabilidad es
la función de distribución acumulativa es
y la función de riesgo es
En las tres parametrizaciones, el peligro disminuye para k < 1, aumenta para k > 1 y es constante para k = 1, en cuyo caso la distribución de Weibull se reduce a una distribución exponencial.
Propiedades
Función de densidad
La forma de la función de densidad de la distribución de Weibull cambia drásticamente con el valor de k . Para 0 < k < 1, la función de densidad tiende a ∞ cuando x se aproxima a cero desde arriba y es estrictamente decreciente. Para k = 1, la función de densidad tiende a 1/ λ cuando x tiende a cero desde arriba y es estrictamente decreciente. Para k > 1, la función de densidad tiende a cero cuando x se aproxima a cero desde arriba, aumenta hasta su moda y disminuye después. La función de densidad tiene pendiente negativa infinita en x = 0 si 0 < k < 1, pendiente positiva infinita en x = 0 si 1 < k < 2 y pendiente nula en x = 0 si k > 2. Para k = 1 la densidad tiene una pendiente negativa finita en x = 0. Para k = 2 la densidad tiene una pendiente positiva finita en x = 0. Cuando k tiende al infinito, la distribución de Weibull converge a una distribución delta de Dirac centrada en x = λ. Además, la asimetría y el coeficiente de variación dependen únicamente del parámetro de forma. Una generalización de la distribución de Weibull es la distribución hiperbólica de tipo III .
dónde . El exceso de curtosis también se puede escribir como:
Función generadora de momento
Por el momento están disponibles una variedad de expresiones que generan la función del propio X. Como serie de potencias , dado que los momentos brutos ya se conocen, se tiene
Alternativamente, se puede intentar tratar directamente con la integral
Si se supone que el parámetro k es un número racional, expresado como k = p / q donde p y q son números enteros, entonces esta integral se puede evaluar analíticamente. [12] Con t reemplazado por − t , se encuentra
La función característica también ha sido obtenida por Muraleedharan et al. (2007). Muraleedharan & Soares (2014) también derivaron la función característica y la función generadora de momentos de la distribución de Weibull de 3 parámetros mediante un enfoque directo. harvtxt error: no target: CITEREFMuraleedharanSoares2014 (help)
Mínimos
Sean variables aleatorias de Weibull independientes e idénticamente distribuidas con parámetro de escala y parámetro de forma . Si el mínimo de estas variables aleatorias es , entonces la distribución de probabilidad acumulada de dada por
Es decir, también se distribuirá Weibull con parámetro de escala y con parámetro de forma .
Trucos de reparametrización
Arreglar algunos . Sean no negativos, y no todos cero, y sean muestras independientes de , entonces [13]
Mínimos cuadrados ordinarios usando el diagrama de Weibull
El ajuste de una distribución de Weibull a los datos se puede evaluar visualmente mediante un gráfico de Weibull. [15] El gráfico de Weibull es un gráfico de la función de distribución acumulativa empírica de datos en ejes especiales en un tipo de gráfico Q-Q . Los ejes son versus . La razón de este cambio de variables es que la función de distribución acumulativa se puede linealizar:
que se puede ver en la forma estándar de una línea recta. Por lo tanto, si los datos provienen de una distribución de Weibull, entonces se espera una línea recta en un gráfico de Weibull.
Existen varios enfoques para obtener la función de distribución empírica a partir de datos: un método es obtener la coordenada vertical para cada punto usando donde está el rango del punto de datos y es el número de puntos de datos. [dieciséis]
La regresión lineal también se puede utilizar para evaluar numéricamente la bondad del ajuste y estimar los parámetros de la distribución de Weibull. El gradiente informa directamente sobre el parámetro de forma y también se puede inferir el parámetro de escala.
Método de momentos
El coeficiente de variación de la distribución de Weibull depende únicamente del parámetro de forma: [17]
Al equiparar las cantidades de la muestra con , la estimación del momento del parámetro de forma se puede leer en una tabla de consulta o en una gráfica de versus . Se puede encontrar una estimación más precisa utilizando el algoritmo de búsqueda de raíces que resuelve
La estimación del momento del parámetro de escala se puede encontrar usando la primera ecuación de momento como
El estimador de máxima verosimilitud para es la solución para k de la siguiente ecuación [18]
Esta ecuación se define sólo implícitamente; generalmente se debe resolver por medios numéricos.
Cuando las muestras observadas más grandes son de un conjunto de datos de más de muestras, entonces el estimador de máxima verosimilitud para el parámetro dado es [18]
Además, dada esa condición, el estimador de máxima verosimilitud es [ cita necesaria ]
Nuevamente, al tratarse de una función implícita, generalmente se debe resolver por medios numéricos.
Aplicaciones
Se utiliza la distribución de Weibull [ cita necesaria ]
En la previsión del cambio tecnológico (también conocido como modelo Sharif-Islam) [23]
En hidrología , la distribución de Weibull se aplica a eventos extremos como las precipitaciones máximas anuales de un día y los caudales de los ríos.
En el análisis de la curva de declive para modelar la curva de tasa de producción de petróleo de los pozos de petróleo de esquisto. [20]
Para describir el tamaño de las partículas generadas por las operaciones de trituración, molienda y trituración , se utiliza la distribución de Weibull de 2 parámetros, y en estas aplicaciones a veces se la conoce como distribución de Rosin-Rammler. [24] En este contexto, predice menos partículas finas que la distribución log-normal y generalmente es más precisa para distribuciones estrechas de tamaño de partículas. [25] La interpretación de la función de distribución acumulativa es que es la fracción de masa de partículas con un diámetro menor que , donde es el tamaño medio de partícula y es una medida de la dispersión de los tamaños de partícula.
Al describir nubes de puntos aleatorias (como las posiciones de las partículas en un gas ideal): la probabilidad de encontrar la partícula vecina más cercana a una distancia de una partícula dada viene dada por una distribución de Weibull con e igual a la densidad de las partículas. [26]
Al calcular la tasa de efectos de eventos únicos inducidos por radiación a bordo de naves espaciales, se utiliza una distribución de Weibull de cuatro parámetros para ajustar los datos de probabilidad de sección transversal del dispositivo medidos experimentalmente a un espectro de transferencia de energía lineal de partículas . [27] El ajuste de Weibull se usó originalmente debido a la creencia de que los niveles de energía de las partículas se alinean con una distribución estadística, pero luego se demostró que esta creencia era falsa [ cita necesaria ] y el ajuste de Weibull continúa usándose debido a sus numerosos parámetros ajustables, en lugar de que una base física demostrada. [28]
Distribuciones relacionadas
Si es así , entonces la variable es Gumbel (mínima) distribuida con el parámetro de ubicación y el parámetro de escala . Eso es, .
La distribución Weibull traducida (o Weibull de 3 parámetros) contiene un parámetro adicional. [11] Tiene la función de densidad de probabilidad.
for y for , donde es el parámetro de forma , es el parámetro de escala y es el parámetro de ubicación de la distribución. El valor establece un tiempo inicial libre de fallas antes de que comience el proceso regular de Weibull. Cuando , esto se reduce a la distribución de 2 parámetros.
La distribución de Weibull se puede caracterizar como la distribución de una variable aleatoria tal que la variable aleatoria
Esto implica que la distribución de Weibull también se puede caracterizar en términos de una distribución uniforme : si se distribuye uniformemente en , entonces la variable aleatoria tiene una distribución de Weibull con parámetros y . Tenga en cuenta que aquí es equivalente a justo arriba. Esto conduce a un esquema numérico de fácil implementación para simular una distribución de Weibull.
La distribución de Weibull interpola entre la distribución exponencial con intensidad cuando y una distribución de Rayleigh de moda cuando .
La distribución de una variable aleatoria que se define como el mínimo de varias variables aleatorias, cada una con una distribución de Weibull diferente, es una distribución poli-Weibull .
La distribución de Weibull fue aplicada por primera vez por Rosin y Rammler (1933) para describir las distribuciones de tamaño de partículas. Se utiliza ampliamente en el procesamiento de minerales para describir distribuciones de tamaño de partículas en procesos de trituración . En este contexto, la distribución acumulativa viene dada por
dónde
es el tamaño de partícula
es el percentil 80 de la distribución del tamaño de partículas
es un parámetro que describe la extensión de la distribución
Debido a su disponibilidad en hojas de cálculo , también se utiliza cuando el comportamiento subyacente se modela mejor mediante una distribución Erlang . [31]
^ Bowers, et. Alabama. (1997) Matemáticas actuariales, 2ª ed. Sociedad de Actuarios.
^ Papoulis, Athanasios Papoulis; Pillai, S. Unnikrishna (2002). Probabilidad, variables aleatorias y procesos estocásticos (4ª ed.). Boston: McGraw-Hill. ISBN 0-07-366011-6.
^ Kizilersu, Ayse; Kreer, Markus; Thomas, Anthony W. (2018). "La distribución de Weibull". Significado . 15 (2): 10–11. doi : 10.1111/j.1740-9713.2018.01123.x .
^ Jiang, R.; Murthy, DNP (2011). "Un estudio del parámetro de forma de Weibull: propiedades y significado". Ingeniería de confiabilidad y seguridad de sistemas . 96 (12): 1619–26. doi :10.1016/j.ress.2011.09.003.
^ Eliazar, Iddo (noviembre de 2017). "Ley de Lindy". Physica A: Mecánica estadística y sus aplicaciones . 486 : 797–805. Código Bib : 2017PhyA..486..797E. doi :10.1016/j.physa.2017.05.077. S2CID 125349686.
^ Collett, David (2015). Modelado de datos de supervivencia en la investigación médica (3ª ed.). Boca Ratón: Chapman y Hall / CRC. ISBN978-1439856789.
^ Kalbfleisch, JD; Prentice, RL (2002). El análisis estadístico de los datos del tiempo de falla (2ª ed.). Hoboken, Nueva Jersey: J. Wiley. ISBN978-0-471-36357-6. OCLC 50124320.
^ Therneau, T. (2020). "Un paquete para análisis de supervivencia en R." Paquete R versión 3.1.
^ abc Johnson, Kotz y Balakrishnan 1994
^ Véase (Cheng, Tellambura y Beaulieu 2004) para el caso en que k es un número entero y (Sagias y Karagiannidis 2005) para el caso racional. harv error: no target: CITEREFChengTellamburaBeaulieu2004 (help)
^ Balog, Matej; Tripuraneni, Nilesh; Ghahramani, Zoubin; Weller, Adrián (17 de julio de 2017). "Parientes perdidos del truco de Gumbel". Congreso Internacional sobre Aprendizaje Automático . PMLR: 371–379.
^ Bauckhage, cristiano (2013). "Cálculo de la divergencia de Kullback-Leibler entre dos distribuciones de Weibull". arXiv : 1310.3713 [cs.IT].
^ "1.3.3.30. Trama de Weibull". www.itl.nist.gov .
^ Wayne Nelson (2004) Análisis de datos de vida aplicados . Wiley-Blackwell ISBN 0-471-64462-5
^ ab Cohen, A. Clifford (noviembre de 1965). "Estimación de máxima verosimilitud en la distribución de Weibull basada en muestras completas y censuradas" (PDF) . Tecnometría . 7 (4): 579–588.
^ ab Sornette, D. (2004). Fenómenos críticos en las ciencias naturales: caos, fractales, autoorganización y desorden ..
^ "CumFreq, Ajuste de distribución de probabilidad, software libre, frecuencia acumulada".
^ ab Lee, Se Yoon; Mallick, Bani (2021). "Modelado jerárquico bayesiano: aplicación a resultados de producción en Eagle Ford Shale del sur de Texas". Sankhya B. 84 : 1–43. doi : 10.1007/s13571-020-00245-8 .
^ "Distribución de la velocidad del viento Weibull - REUK.co.uk". www.reuk.co.uk.
^ Liu, Chao; Blanco, Ryen W.; Dumais, Susan (19 de julio de 2010). Comprender los comportamientos de navegación web a través del análisis Weibull del tiempo de permanencia . ACM. págs. 379–386. doi :10.1145/1835449.1835513. ISBN9781450301534. S2CID 12186028.
^ Sharif, M. Nawaz; Islam, M. Nazrul (1980). "La distribución de Weibull como modelo general para pronosticar el cambio tecnológico". Previsión Tecnológica y Cambio Social . 18 (3): 247–56. doi :10.1016/0040-1625(80)90026-8.
^ Optimización computacional del motor de combustión interna página 49
^ Austin, LG; Klimpel, RR; Suerte, PT (1984). Ingeniería de Procesos de Reducción de Tamaño . Hoboken, Nueva Jersey: Guinn Printing Inc. ISBN0-89520-421-5.
^ Chandrashekar, S. (1943). "Problemas estocásticos en Física y Astronomía". Reseñas de Física Moderna . 15 (1): 86.
^ ECSS-E-ST-10-12C - Métodos para el cálculo de la radiación recibida y sus efectos, y política para los márgenes de diseño (Reporte). Cooperación europea para la normalización espacial. 15 de noviembre de 2008.
^ LD Edmonds; CE Barnes; LZ Scheick (mayo de 2000). "8.3 Ajuste de curvas". Introducción a los efectos de la radiación espacial en la microelectrónica (PDF) (Reporte). Laboratorio de Propulsión a Chorro de la NASA, Instituto de Tecnología de California. págs. 75–76.
^ "Evolución del sistema y confiabilidad de los sistemas". Sysev (Bélgica). 2010-01-01.
^ Montgomery, Douglas (19 de junio de 2012). Introducción al control estadístico de calidad . [SL]: John Wiley. pag. 95.ISBN9781118146811.
^ Chatfield, C.; Goodhardt, GJ (1973). "Un modelo de compra del consumidor con Erlang Interpurchase Times". Revista de la Asociación Estadounidense de Estadística . 68 (344): 828–835. doi :10.1080/01621459.1973.10481432.
Bibliografía
Fréchet, Maurice (1927), "Sur la loi de probabilité de l'écart Maximum", Annales de la Société Polonaise de Mathématique, Cracovia , 6 : 93–116.
Johnson, Norman L.; Kotz, Samuel; Balakrishnan, N. (1994), Distribuciones univariadas continuas. vol. 1 , Serie Wiley en probabilidad y estadística matemática: probabilidad y estadística aplicadas (2ª ed.), Nueva York: John Wiley & Sons, ISBN 978-0-471-58495-7, señor 1299979
Mann, Nancy R .; Schafer, Ray E.; Singpurwalla, Nozer D. (1974), Methods for Statistical Analysis of Reliability and Life Data , Wiley Series in Probability and Mathematical Statistics: Applied Probability and Statistics (1ª ed.), Nueva York: John Wiley & Sons, ISBN 978-0-471-56737-0
Muraleedharan, G.; Rao, AD; Kurup, PG; Nair, N. Unnikrishnan; Sinha, Mourani (2007), "Distribución de Weibull modificada para simulación y predicción de la altura de ola máxima y significativa", Ingeniería costera , 54 (8): 630–638, doi :10.1016/j.coastaleng.2007.05.001
Colofonia, P.; Rammler, E. (1933), "Las leyes que rigen la finura del carbón en polvo", Revista del Instituto de Combustible , 7 : 29–36.
Sagias, Carolina del Norte; Karagiannidis, GK (2005). "Distribuciones Weibull multivariadas de clase gaussiana: teoría y aplicaciones en canales de desvanecimiento". Transacciones IEEE sobre teoría de la información . 51 (10): 3608-19. doi :10.1109/TIT.2005.855598. SEÑOR 2237527. S2CID 14654176.
Weibull, W. (1951), "Una función de distribución estadística de amplia aplicabilidad" (PDF) , Journal of Applied Mechanics , 18 (3): 293–297, Bibcode :1951JAM....18..293W, doi :10.1115 /1.4010337.
Nelson Jr, Ralph (5 de febrero de 2008). "Dispersión de polvos en líquidos, parte 1, capítulo 6: distribución del volumen de partículas" . Consultado el 5 de febrero de 2008 .