stringtranslate.com

Distribución generalizada de valores extremos

En teoría de probabilidad y estadística , la distribución de valores extremos generalizados ( GEV ) [2] es una familia de distribuciones de probabilidad continua desarrollada dentro de la teoría de valores extremos para combinar las familias Gumbel , Fréchet y Weibull también conocidas como distribuciones de valores extremos de tipo I, II y III. Por el teorema del valor extremo, la distribución GEV es la única distribución límite posible de máximos correctamente normalizados de una secuencia de variables aleatorias independientes e idénticamente distribuidas. [3] Nótese que debe existir una distribución límite, lo que requiere condiciones de regularidad en la cola de la distribución. A pesar de esto, la distribución GEV se usa a menudo como una aproximación para modelar los máximos de secuencias largas (finitas) de variables aleatorias.

En algunos campos de aplicación, la distribución generalizada de valores extremos se conoce como distribución Fisher-Tippett , llamada así por Ronald Fisher y LHC Tippett, quienes reconocieron tres formas diferentes que se describen a continuación. Sin embargo, el uso de este nombre a veces se limita a referirse al caso especial de la distribución de Gumbel . El origen de la forma funcional común para las tres distribuciones se remonta al menos a Jenkinson, AF (1955), [4] aunque supuestamente [5] también podría haber sido dada por von Mises, R. (1936). [6]

Especificación

Utilizando la variable estandarizada , donde , el parámetro de ubicación, puede ser cualquier número real, y es el parámetro de escala; la función de distribución acumulativa de la distribución GEV es entonces

donde , el parámetro de forma, puede ser cualquier número real. Por lo tanto, para , la expresión es válida para , mientras que para es válida para . En el primer caso, es el extremo inferior negativo, donde es 0 ; en el segundo caso, es el extremo superior positivo, donde es 1. Para , la segunda expresión no está definida formalmente y se reemplaza por la primera expresión, que es el resultado de tomar el límite de la segunda, como en cuyo caso puede ser cualquier número real.

En el caso especial de , tenemos , por lo que independientemente de los valores de y .

La función de densidad de probabilidad de la distribución estandarizada es

nuevamente válido para en el caso , y para en el caso . La densidad es cero fuera del rango relevante. En el caso , la densidad es positiva en toda la línea real.

Dado que la función de distribución acumulativa es invertible, la función cuantil para la distribución GEV tiene una expresión explícita, a saber:

y por lo tanto la función de densidad cuantil es

válido para y para cualquier real .

Ejemplo de funciones de densidad de probabilidad para distribuciones de la familia GEV.[7]

Resumen de estadísticas

Algunas estadísticas simples de la distribución son: [ cita requerida ]

para

La asimetría es para ξ>0

Para ξ < 0, el signo del numerador se invierte.

El exceso de curtosis es:

donde y es la función gamma .

Enlace a las familias Fréchet, Weibull y Gumbel

El parámetro de forma regula el comportamiento de la cola de la distribución. Las subfamilias definidas por tres casos: y corresponden, respectivamente, a las familias Gumbel , Fréchet y Weibull , cuyas funciones de distribución acumuladas se muestran a continuación.

Dejar y
Dejar y

Las subsecciones siguientes comentan las propiedades de estas distribuciones.

Modificación para mínimos en lugar de máximos

La teoría aquí se relaciona con los máximos de datos y la distribución que se analiza es una distribución de valores extremos para los máximos. Se puede obtener una distribución generalizada de valores extremos para los mínimos de datos, por ejemplo, sustituyendo en la función de distribución y restando la distribución acumulativa de uno: Es decir, reemplazando por . Al hacerlo, se obtiene otra familia de distribuciones.

Convención alternativa para la distribución de Weibull

La distribución Weibull ordinaria surge en aplicaciones de confiabilidad y se obtiene a partir de la distribución aquí utilizando la variable que proporciona un soporte estrictamente positivo, en contraste con el uso en la formulación de la teoría de valores extremos aquí. Esto surge porque la distribución Weibull ordinaria se utiliza para casos que tratan con mínimos de datos en lugar de máximos de datos. La distribución aquí tiene un parámetro de adición en comparación con la forma habitual de la distribución Weibull y, además, se invierte de modo que la distribución tiene un límite superior en lugar de un límite inferior. Es importante destacar que, en aplicaciones de la GEV, el límite superior es desconocido y, por lo tanto, debe estimarse, mientras que cuando se aplica la distribución Weibull ordinaria en aplicaciones de confiabilidad, generalmente se sabe que el límite inferior es cero.

Rangos de las distribuciones

Obsérvense las diferencias en los rangos de interés para las tres distribuciones de valores extremos: Gumbel es ilimitada, Fréchet tiene un límite inferior, mientras que la distribución de Weibull invertida tiene un límite superior. Más precisamente, la teoría de valores extremos (teoría univariante) describe cuál de las tres es la ley límite según la ley inicial X y, en particular, dependiendo de su cola.

Distribución de variables logarítmicas

Se puede relacionar el tipo I con los tipos II y III de la siguiente manera: Si la función de distribución acumulada de alguna variable aleatoria es de tipo II, y con los números positivos como soporte, es decir entonces la función de distribución acumulada de es de tipo I, es decir De manera similar, si la función de distribución acumulada de es de tipo III, y con los números negativos como soporte, es decir entonces la función de distribución acumulada de es de tipo I, es decir


Enlace a modelos logit (regresión logística)

Los modelos logit multinomiales , y algunos otros tipos de regresión logística , pueden expresarse como modelos de variable latente con variables de error distribuidas como distribuciones de Gumbel (distribuciones de valor extremo generalizadas de tipo I). Esta formulación es común en la teoría de los modelos de elección discreta , que incluyen modelos logit , modelos probit y varias extensiones de ellos, y deriva del hecho de que la diferencia de dos variables distribuidas GEV de tipo I sigue una distribución logística , de la cual la función logit es la función cuantil . La distribución GEV de tipo I desempeña, por tanto, el mismo papel en estos modelos logit que la distribución normal en los modelos probit correspondientes.

Propiedades

La función de distribución acumulativa de la distribución de valores extremos generalizada resuelve la ecuación del postulado de estabilidad . [ cita requerida ] La distribución de valores extremos generalizada es un caso especial de una distribución máximamente estable y es una transformación de una distribución mínimamente estable.

Aplicaciones

Distribución de probabilidad GEV ajustada a las precipitaciones máximas diarias mensuales en octubre, Surinam [10]

Ejemplo de variables distribuidas normalmente

Sean variables aleatorias distribuidas normalmente con media 0 y varianza 1. El teorema de Fisher- Tippett -Gnedenko [13] nos dice que donde

Esto nos permite estimar, por ejemplo, la media a partir de la media de la distribución GEV:

¿Dónde está la constante de Euler-Mascheroni ?

Distribuciones relacionadas

  1. Si entonces
  2. Si ( distribución de Gumbel ) entonces
  3. Si ( distribución de Weibull ) entonces
  4. Si entonces ( distribución de Weibull )
  5. Si ( distribución exponencial ) entonces
  6. Si y entonces (ver Distribución logística ).
  7. Si y entonces (La suma no es una distribución logística).
Tenga en cuenta que

Pruebas

4. Sea entonces la distribución acumulada de :

¿Cuál es la CDF para?

5. Sea entonces la distribución acumulada de :

cual es la distribución acumulada de

Véase también

Referencias

  1. ^ ab Muraleedharan, G; Guedes Soares, C.; Lucas, Cláudia (2011). "Funciones generadoras de características y momentos de la distribución generalizada de valores extremos (GEV)". En Wright, Linda L. (ed.). Aumento del nivel del mar, ingeniería costera, costas y mareas . Nova Science Publishers. Capítulo 14, págs. 269–276. ISBN 978-1-61728-655-1.
  2. ^ Weisstein, Eric W. "Distribución de valores extremos". mathworld.wolfram.com . Consultado el 6 de agosto de 2021 .
  3. ^ Haan, Laurens; Ferreira, Ana (2007). Teoría del valor extremo: una introducción . Springer.
  4. ^ Jenkinson, Arthur F (1955). "La distribución de frecuencias de los valores máximos (o mínimos) anuales de los elementos meteorológicos". Quarterly Journal of the Royal Meteorological Society . 81 (348): 158–171. Código Bibliográfico :1955QJRMS..81..158J. doi :10.1002/qj.49708134804.
  5. ^ Haan, Laurens; Ferreira, Ana (2007). Teoría del valor extremo: una introducción . Springer.
  6. ^ von Mises, R. (1936). "La distribución de la plus grande de n valores". Rev. Matemáticas. Unión Interbalcánica 1 : 141–160.
  7. ^ Norton, Matthew; Khokhlov, Valentyn; Uryasev, Stan (2019). "Cálculo de CVaR y bPOE para distribuciones de probabilidad comunes con aplicación a la optimización de carteras y estimación de densidad" (PDF) . Anales de investigación de operaciones . 299 (1–2). Springer: 1281–1315. arXiv : 1811.11301 . doi :10.1007/s10479-019-03373-1. S2CID  254231768. Archivado desde el original (PDF) el 2023-03-31 . Consultado el 2023-02-27 .
  8. ^ Moscadelli, Marco. "La modelización del riesgo operacional: experiencia con el análisis de los datos recopilados por el Comité de Basilea". Disponible en SSRN 557214 (2004).
  9. ^ Guégan, D.; Hassani, BK (2014), "Un resurgimiento matemático de la gestión de riesgos: un modelo extremo de opiniones de expertos", Frontiers in Finance and Economics , 11 (1): 25–45, SSRN  2558747
  10. ^ CumFreq para ajuste de distribución de probabilidad [1]
  11. ^ Kjersti Aas, conferencia, NTNU, Trondheim, 23 de enero de 2008
  12. ^ Liu, Xin; Wang, Yu (2022). "Cuantificación de la probabilidad de ocurrencia anual de deslizamientos de tierra inducidos por lluvia en una pendiente específica". Computers and Geotechnics . 149 : 104877. Bibcode :2022CGeot.14904877L. doi :10.1016/j.compgeo.2022.104877. S2CID  250232752.
  13. ^ David, Herbert A.; Nagaraja, Haikady N. (2004). Estadísticas de pedidos . John Wiley & Sons. pág. 299.

Lectura adicional