Esta distribución podría utilizarse para representar la distribución del nivel máximo de un río en un año determinado si existiera una lista de valores máximos para los últimos diez años. Es útil para predecir la probabilidad de que ocurra un terremoto extremo, una inundación u otro desastre natural. La posible aplicabilidad de la distribución de Gumbel para representar la distribución de máximos se relaciona con la teoría de valores extremos , que indica que es probable que sea útil si la distribución de los datos de muestra subyacentes es de tipo normal o exponencial. [a]
La distribución de Gumbel es un caso particular de la distribución generalizada de valores extremos (también conocida como distribución de Fisher-Tippett). También se la conoce como distribución log- Weibull y distribución exponencial doble (término que a veces se utiliza alternativamente para referirse a la distribución de Laplace ). Está relacionada con la distribución de Gompertz : cuando su densidad se refleja primero sobre el origen y luego se restringe a la semirrecta positiva, se obtiene una función de Gompertz.
La distribución de Gumbel recibe su nombre de Emil Julius Gumbel (1891-1966), basándose en sus artículos originales que describen la distribución. [1] [2]
En el modo, donde , el valor de se convierte en , independientemente del valor de
Si son variables aleatorias de Gumbel iid con parámetros entonces también es una variable aleatoria de Gumbel con parámetros .
Si son variables aleatorias iid tales que tienen la misma distribución que todos los números naturales , entonces necesariamente Gumbel se distribuye con parámetro de escala (en realidad, basta con considerar sólo dos valores distintos de k>1 que sean coprimos).
Distribuciones relacionadas
Si tiene una distribución de Gumbel, entonces la distribución condicional de Y = − X dado que Y es positivo, o equivalentemente dado que X es negativo, tiene una distribución de Gompertz . La función de distribución acumulada G de Y está relacionada con F , la función de distribución acumulada de X , por la fórmula para y > 0. En consecuencia, las densidades están relacionadas por : la densidad de Gompertz es proporcional a una densidad de Gumbel reflejada, restringida a la semirrecta positiva. [4]
Si X es una variable distribuida exponencialmente con media 1, entonces −log( X ) tiene una distribución de Gumbel estándar.
A pesar de esto, si son independientes, entonces . Esto se puede ver fácilmente al notar que (donde es la constante de Euler-Mascheroni). En cambio, la distribución de combinaciones lineales de variables aleatorias de Gumbel independientes se puede aproximar mediante las distribuciones GNIG y GIG. [5]
Gumbel ha demostrado que el valor máximo (o estadística de último orden ) en una muestra de variables aleatorias que sigue una distribución exponencial menos el logaritmo natural del tamaño de la muestra [7] se aproxima a la distribución de Gumbel a medida que aumenta el tamaño de la muestra. [8]
Concretamente, sea la distribución de probabilidad de y su distribución acumulativa. Entonces, el valor máximo de las realizaciones de es menor que si y solo si todas las realizaciones son menores que . Por lo tanto, la distribución acumulativa del valor máximo satisface
Gumbel también ha demostrado que el estimador r ⁄ ( n +1) para la probabilidad de un evento —donde r es el número de rango del valor observado en la serie de datos y n es el número total de observaciones— es un estimador insesgado de la probabilidad acumulada en torno a la moda de la distribución. Por lo tanto, este estimador se utiliza a menudo como una posición de representación gráfica .
La variable tiene una distribución de Gumbel con parámetros y cuando la variable aleatoria se extrae de la distribución uniforme en el intervalo .
Documento de probabilidad
En la época anterior al software, se utilizaba el papel de probabilidad para representar la distribución de Gumbel (véase la ilustración). El papel se basa en la linealización de la función de distribución acumulativa :
En el artículo, el eje horizontal se construye a una escala logarítmica doble. El eje vertical es lineal. Al trazar en el eje horizontal del artículo y la variable en el eje vertical, la distribución se representa mediante una línea recta con una pendiente de 1. Cuando se puso a disposición un software de ajuste de distribuciones como CumFreq , la tarea de trazar la distribución se hizo más sencilla.
^ Este artículo utiliza la distribución de Gumbel para modelar la distribución del valor máximo . Para modelar el valor mínimo, se utiliza el negativo de los valores originales.
Referencias
^ Gumbel, EJ (1935), "Les valeurs extrêmes des Distributions Statistiques" (PDF) , Annales de l'Institut Henri Poincaré , 5 (2): 115-158
^ Gumbel EJ (1941). "El período de retorno de los flujos de inundación". Anales de estadística matemática, 12, 163-190.
^ ab Oosterbaan, RJ (1994). "Capítulo 6 Análisis de frecuencia y regresión" (PDF) . En Ritzema, HP (ed.). Principios y aplicaciones del drenaje, publicación 16. Wageningen, Países Bajos: Instituto Internacional para la Recuperación y Mejora de Tierras (ILRI). pp. 175–224. ISBN90-70754-33-9.
^ Willemse, WJ; Kaas, R. (2007). "Reconstrucción racional de modelos de mortalidad basados en la fragilidad mediante una generalización de la ley de mortalidad de Gompertz" (PDF) . Seguros: Matemáticas y Economía . 40 (3): 468. doi :10.1016/j.insmatheco.2006.07.003. Archivado desde el original (PDF) el 2017-08-09 . Consultado el 2019-09-24 .
^ Marques, F.; Coelho, C.; de Carvalho, M. (2015). "Sobre la distribución de combinaciones lineales de variables aleatorias independientes de Gumbel" (PDF) . Estadística y Computación . 25 (3): 683‒701. doi :10.1007/s11222-014-9453-5. S2CID 255067312.
^ "CumFreq, ajuste de distribución de probabilidad, calculadora gratuita". www.waterlog.info .
^ "Distribución de Gumbel y distribución exponencial". Mathematics Stack Exchange .
^ Gumbel, EJ (1954). Teoría estadística de valores extremos y algunas aplicaciones prácticas. Serie de Matemáticas Aplicadas. Vol. 33 (1.ª ed.). Departamento de Comercio de los Estados Unidos, Oficina Nacional de Normas. ASIN B0007DSHG4.
^ Burke, Eleanor J.; Perry, Richard HJ; Brown, Simon J. (2010). "Análisis de valor extremo de la sequía en el Reino Unido y proyecciones de cambio en el futuro". Journal of Hydrology . 388 (1–2): 131–143. Bibcode :2010JHyd..388..131B. doi :10.1016/j.jhydrol.2010.04.035.
^ Erdös, Paul; Lehner, Joseph (1941). "La distribución del número de sumandos en las particiones de un entero positivo". Duke Mathematical Journal . 8 (2): 335. doi :10.1215/S0012-7094-41-00826-8.
^ Kourbatov, A. (2013). "Brechas máximas entre k -tuplas primos: un enfoque estadístico". Journal of Integer Sequences . 16 . arXiv : 1301.2242 . Código Bibliográfico :2013arXiv1301.2242K.Artículo 13.5.2.
^ Jang, Eric; Gu, Shixiang; Poole, Ben (abril de 2017). Reparametrización categórica con Gumble-Softmax. Conferencia internacional sobre representaciones de aprendizaje (ICLR) 2017.
^ Balog, Matej; Tripuraneni, Nilesh; Ghahramani, Zoubin; Weller, Adrian (17 de julio de 2017). "Parientes perdidos del truco de Gumbel". Conferencia internacional sobre aprendizaje automático . PMLR: 371–379. arXiv : 1706.04161 .
Enlaces externos
Wikimedia Commons tiene medios relacionados con: Distribución de Gumbel