stringtranslate.com

Distribución de Gumbel

En teoría de probabilidad y estadística , la distribución de Gumbel (también conocida como distribución de valores extremos generalizados tipo I ) se utiliza para modelar la distribución del máximo (o el mínimo) de un número de muestras de varias distribuciones.

Esta distribución podría utilizarse para representar la distribución del nivel máximo de un río en un año determinado si existiera una lista de valores máximos para los últimos diez años. Es útil para predecir la probabilidad de que ocurra un terremoto extremo, una inundación u otro desastre natural. La posible aplicabilidad de la distribución de Gumbel para representar la distribución de máximos se relaciona con la teoría de valores extremos , que indica que es probable que sea útil si la distribución de los datos de muestra subyacentes es de tipo normal o exponencial. [a]

La distribución de Gumbel es un caso particular de la distribución generalizada de valores extremos (también conocida como distribución de Fisher-Tippett). También se la conoce como distribución log- Weibull y distribución exponencial doble (término que a veces se utiliza alternativamente para referirse a la distribución de Laplace ). Está relacionada con la distribución de Gompertz : cuando su densidad se refleja primero sobre el origen y luego se restringe a la semirrecta positiva, se obtiene una función de Gompertz.

En la formulación de variable latente del modelo logit multinomial —común en la teoría de elección discreta— los errores de las variables latentes siguen una distribución de Gumbel. Esto es útil porque la diferencia de dos variables aleatorias distribuidas según Gumbel tiene una distribución logística .

La distribución de Gumbel recibe su nombre de Emil Julius Gumbel (1891-1966), basándose en sus artículos originales que describen la distribución. [1] [2]

Definiciones

La función de distribución acumulativa de la distribución de Gumbel es

Distribución estándar de Gumbel

La distribución estándar de Gumbel es el caso donde y con función de distribución acumulativa

y función de densidad de probabilidad

En este caso, la moda es 0, la mediana es , la media es (la constante de Euler-Mascheroni ) y la desviación estándar es

Los cumulantes , para n  > 1, están dados por

Propiedades

La moda es μ, mientras que la mediana es y la media está dada por

,

¿Dónde está la constante de Euler-Mascheroni ?

La desviación estándar es por lo tanto [3]

En el modo, donde , el valor de se convierte en , independientemente del valor de

Si son variables aleatorias de Gumbel iid con parámetros entonces también es una variable aleatoria de Gumbel con parámetros .

Si son variables aleatorias iid tales que tienen la misma distribución que todos los números naturales , entonces necesariamente Gumbel se distribuye con parámetro de escala (en realidad, basta con considerar sólo dos valores distintos de k>1 que sean coprimos).

Distribuciones relacionadas

La teoría relacionada con la distribución log-gamma multivariada generalizada proporciona una versión multivariada de la distribución de Gumbel.

Ocurrencia y aplicaciones

Ajuste de la distribución con banda de confianza de una distribución Gumbel acumulada a las precipitaciones máximas de un día en octubre. [6]

Gumbel ha demostrado que el valor máximo (o estadística de último orden ) en una muestra de variables aleatorias que sigue una distribución exponencial menos el logaritmo natural del tamaño de la muestra [7] se aproxima a la distribución de Gumbel a medida que aumenta el tamaño de la muestra. [8]

Concretamente, sea la distribución de probabilidad de y su distribución acumulativa. Entonces, el valor máximo de las realizaciones de es menor que si y solo si todas las realizaciones son menores que . Por lo tanto, la distribución acumulativa del valor máximo satisface

y, para , el lado derecho converge a

Por lo tanto, en hidrología , la distribución de Gumbel se utiliza para analizar variables como los valores máximos mensuales y anuales de las precipitaciones diarias y los volúmenes de descarga de los ríos, [3] y también para describir sequías. [9]

Gumbel también ha demostrado que el estimador r( n +1) para la probabilidad de un evento —donde r es el número de rango del valor observado en la serie de datos y n es el número total de observaciones— es un estimador insesgado de la probabilidad acumulada en torno a la moda de la distribución. Por lo tanto, este estimador se utiliza a menudo como una posición de representación gráfica .

En teoría de números , la distribución de Gumbel aproxima el número de términos en una partición aleatoria de un entero [10] así como los tamaños ajustados por tendencia de los espacios máximos entre primos y los espacios máximos entre constelaciones de primos . [11]

Aparece en el problema del coleccionista de cupones .

Trucos de reparametrización de Gumbel

En el aprendizaje automático , a veces se emplea la distribución de Gumbel para generar muestras a partir de la distribución categórica . Esta técnica se denomina "truco de Gumbel-max" y es un ejemplo especial de " trucos de reparametrización ". [12]

En detalle, sea no negativo, y no todo cero, y sean muestras independientes de Gumbel(0, 1), entonces por integración de rutina, Es decir,

De manera equivalente, dado cualquier , podemos tomar una muestra de su distribución de Boltzmann mediante

Las ecuaciones relacionadas incluyen: [13]

Generación de variables aleatorias

Dado que la función cuantil ( función de distribución acumulativa inversa ), , de una distribución de Gumbel está dada por

La variable tiene una distribución de Gumbel con parámetros y cuando la variable aleatoria se extrae de la distribución uniforme en el intervalo .

Documento de probabilidad

Un trozo de papel cuadriculado que incorpora la distribución de Gumbel.

En la época anterior al software, se utilizaba el papel de probabilidad para representar la distribución de Gumbel (véase la ilustración). El papel se basa en la linealización de la función de distribución acumulativa  :

En el artículo, el eje horizontal se construye a una escala logarítmica doble. El eje vertical es lineal. Al trazar en el eje horizontal del artículo y la variable en el eje vertical, la distribución se representa mediante una línea recta con una pendiente de 1. Cuando se puso a disposición un software de ajuste de distribuciones como CumFreq , la tarea de trazar la distribución se hizo más sencilla.

Véase también

Notas

  1. ^ Este artículo utiliza la distribución de Gumbel para modelar la distribución del valor máximo . Para modelar el valor mínimo, se utiliza el negativo de los valores originales.

Referencias

  1. ^ Gumbel, EJ (1935), "Les valeurs extrêmes des Distributions Statistiques" (PDF) , Annales de l'Institut Henri Poincaré , 5 (2): 115-158
  2. ^ Gumbel EJ (1941). "El período de retorno de los flujos de inundación". Anales de estadística matemática, 12, 163-190.
  3. ^ ab Oosterbaan, RJ (1994). "Capítulo 6 Análisis de frecuencia y regresión" (PDF) . En Ritzema, HP (ed.). Principios y aplicaciones del drenaje, publicación 16. Wageningen, Países Bajos: Instituto Internacional para la Recuperación y Mejora de Tierras (ILRI). pp. 175–224. ISBN 90-70754-33-9.
  4. ^ Willemse, WJ; Kaas, R. (2007). "Reconstrucción racional de modelos de mortalidad basados ​​en la fragilidad mediante una generalización de la ley de mortalidad de Gompertz" (PDF) . Seguros: Matemáticas y Economía . 40 (3): 468. doi :10.1016/j.insmatheco.2006.07.003. Archivado desde el original (PDF) el 2017-08-09 . Consultado el 2019-09-24 .
  5. ^ Marques, F.; Coelho, C.; de Carvalho, M. (2015). "Sobre la distribución de combinaciones lineales de variables aleatorias independientes de Gumbel" (PDF) . Estadística y Computación . 25 (3): 683‒701. doi :10.1007/s11222-014-9453-5. S2CID  255067312.
  6. ^ "CumFreq, ajuste de distribución de probabilidad, calculadora gratuita". www.waterlog.info .
  7. ^ "Distribución de Gumbel y distribución exponencial". Mathematics Stack Exchange .
  8. ^ Gumbel, EJ (1954). Teoría estadística de valores extremos y algunas aplicaciones prácticas. Serie de Matemáticas Aplicadas. Vol. 33 (1.ª ed.). Departamento de Comercio de los Estados Unidos, Oficina Nacional de Normas. ASIN  B0007DSHG4.
  9. ^ Burke, Eleanor J.; Perry, Richard HJ; Brown, Simon J. (2010). "Análisis de valor extremo de la sequía en el Reino Unido y proyecciones de cambio en el futuro". Journal of Hydrology . 388 (1–2): 131–143. Bibcode :2010JHyd..388..131B. doi :10.1016/j.jhydrol.2010.04.035.
  10. ^ Erdös, Paul; Lehner, Joseph (1941). "La distribución del número de sumandos en las particiones de un entero positivo". Duke Mathematical Journal . 8 (2): 335. doi :10.1215/S0012-7094-41-00826-8.
  11. ^ Kourbatov, A. (2013). "Brechas máximas entre k -tuplas primos: un enfoque estadístico". Journal of Integer Sequences . 16 . arXiv : 1301.2242 . Código Bibliográfico :2013arXiv1301.2242K.Artículo 13.5.2.
  12. ^ Jang, Eric; Gu, Shixiang; Poole, Ben (abril de 2017). Reparametrización categórica con Gumble-Softmax. Conferencia internacional sobre representaciones de aprendizaje (ICLR) 2017.
  13. ^ Balog, Matej; Tripuraneni, Nilesh; Ghahramani, Zoubin; Weller, Adrian (17 de julio de 2017). "Parientes perdidos del truco de Gumbel". Conferencia internacional sobre aprendizaje automático . PMLR: 371–379. arXiv : 1706.04161 .

Enlaces externos