En teoría de probabilidad y estadística , la distribución de valores extremos generalizados ( GEV ) [2] es una familia de distribuciones de probabilidad continua desarrollada dentro de la teoría de valores extremos para combinar las familias Gumbel , Fréchet y Weibull también conocidas como distribuciones de valores extremos de tipo I, II y III. Por el teorema del valor extremo, la distribución GEV es la única distribución límite posible de máximos correctamente normalizados de una secuencia de variables aleatorias independientes e idénticamente distribuidas. [3] Nótese que debe existir una distribución límite, lo que requiere condiciones de regularidad en la cola de la distribución. A pesar de esto, la distribución GEV se usa a menudo como una aproximación para modelar los máximos de secuencias largas (finitas) de variables aleatorias.
En algunos campos de aplicación, la distribución generalizada de valores extremos se conoce como distribución Fisher-Tippett , llamada así por Ronald Fisher y LHC Tippett, quienes reconocieron tres formas diferentes que se describen a continuación. Sin embargo, el uso de este nombre a veces se limita a referirse al caso especial de la distribución de Gumbel . El origen de la forma funcional común para las tres distribuciones se remonta al menos a Jenkinson, AF (1955), [4] aunque supuestamente [5] también podría haber sido dada por von Mises, R. (1936). [6]
Especificación
Utilizando la variable estandarizada , donde , el parámetro de ubicación, puede ser cualquier número real, y es el parámetro de escala; la función de distribución acumulativa de la distribución GEV es entonces
donde , el parámetro de forma, puede ser cualquier número real. Por lo tanto, para , la expresión es válida para , mientras que para es válida para . En el primer caso, es el extremo inferior negativo, donde es 0 ; en el segundo caso, es el extremo superior positivo, donde es 1. Para , la segunda expresión no está definida formalmente y se reemplaza por la primera expresión, que es el resultado de tomar el límite de la segunda, como en cuyo caso puede ser cualquier número real.
En el caso especial de , tenemos , por lo que independientemente de los valores de y .
La función de densidad de probabilidad de la distribución estandarizada es
nuevamente válido para en el caso , y para en el caso . La densidad es cero fuera del rango relevante. En el caso , la densidad es positiva en toda la línea real.
Dado que la función de distribución acumulativa es invertible, la función cuantil para la distribución GEV tiene una expresión explícita, a saber:
y por lo tanto la función de densidad cuantil es
válido para y para cualquier real .
[7]
Resumen de estadísticas
Algunas estadísticas simples de la distribución son: [ cita requerida ]
El parámetro de forma regula el comportamiento de la cola de la distribución. Las subfamilias definidas por tres casos: y corresponden, respectivamente, a las familias Gumbel , Fréchet y Weibull , cuyas funciones de distribución acumuladas se muestran a continuación.
Distribución de valores extremos tipo I o Gumbel , caso para todos
Distribución de valores extremos de tipo II o de Fréchet , caso para todos
Las subsecciones siguientes comentan las propiedades de estas distribuciones.
Modificación para mínimos en lugar de máximos
La teoría aquí se relaciona con los máximos de datos y la distribución que se analiza es una distribución de valores extremos para los máximos. Se puede obtener una distribución generalizada de valores extremos para los mínimos de datos, por ejemplo, sustituyendo en la función de distribución y restando la distribución acumulativa de uno: Es decir, reemplazando por . Al hacerlo, se obtiene otra familia de distribuciones.
Convención alternativa para la distribución de Weibull
La distribución Weibull ordinaria surge en aplicaciones de confiabilidad y se obtiene a partir de la distribución aquí utilizando la variable que proporciona un soporte estrictamente positivo, en contraste con el uso en la formulación de la teoría de valores extremos aquí. Esto surge porque la distribución Weibull ordinaria se utiliza para casos que tratan con mínimos de datos en lugar de máximos de datos. La distribución aquí tiene un parámetro de adición en comparación con la forma habitual de la distribución Weibull y, además, se invierte de modo que la distribución tiene un límite superior en lugar de un límite inferior. Es importante destacar que, en aplicaciones de la GEV, el límite superior es desconocido y, por lo tanto, debe estimarse, mientras que cuando se aplica la distribución Weibull ordinaria en aplicaciones de confiabilidad, generalmente se sabe que el límite inferior es cero.
Rangos de las distribuciones
Obsérvense las diferencias en los rangos de interés para las tres distribuciones de valores extremos: Gumbel es ilimitada, Fréchet tiene un límite inferior, mientras que la distribución de Weibull invertida tiene un límite superior. Más precisamente, la teoría de valores extremos (teoría univariante) describe cuál de las tres es la ley límite según la ley inicial X y, en particular, dependiendo de su cola.
Distribución de variables logarítmicas
Se puede relacionar el tipo I con los tipos II y III de la siguiente manera: Si la función de distribución acumulada de alguna variable aleatoria es de tipo II, y con los números positivos como soporte, es decir entonces la función de distribución acumulada de es de tipo I, es decir De manera similar, si la función de distribución acumulada de es de tipo III, y con los números negativos como soporte, es decir entonces la función de distribución acumulada de es de tipo I, es decir
La función de distribución acumulativa de la distribución de valores extremos generalizada resuelve la ecuación del postulado de estabilidad . [ cita requerida ] La distribución de valores extremos generalizada es un caso especial de una distribución máximamente estable y es una transformación de una distribución mínimamente estable.
Aplicaciones
La distribución GEV se utiliza ampliamente en el tratamiento de los "riesgos de cola" en ámbitos que van desde los seguros hasta las finanzas. En este último caso, se ha considerado como un medio para evaluar diversos riesgos financieros a través de métricas como el valor en riesgo . [8] [9]
Sin embargo, se ha descubierto que los parámetros de forma resultantes se encuentran en un rango que conduce a medias y varianzas indefinidas, lo que subraya el hecho de que a menudo es imposible realizar un análisis de datos confiable. [11]
En hidrología, la distribución GEV se aplica a eventos extremos, como las precipitaciones máximas anuales de un día y las descargas de los ríos. [12] La imagen azul, realizada con CumFreq , ilustra un ejemplo de ajuste de la distribución GEV a las precipitaciones máximas anuales de un día clasificadas, mostrando también el cinturón de confianza del 90 % basado en la distribución binomial . Los datos de precipitaciones se representan trazando posiciones como parte del análisis de frecuencia acumulada .
^ ab Muraleedharan, G; Guedes Soares, C.; Lucas, Cláudia (2011). "Funciones generadoras de características y momentos de la distribución generalizada de valores extremos (GEV)". En Wright, Linda L. (ed.). Aumento del nivel del mar, ingeniería costera, costas y mareas . Nova Science Publishers. Capítulo 14, págs. 269–276. ISBN978-1-61728-655-1.
^ Weisstein, Eric W. "Distribución de valores extremos". mathworld.wolfram.com . Consultado el 6 de agosto de 2021 .
^ Haan, Laurens; Ferreira, Ana (2007). Teoría del valor extremo: una introducción . Springer.
^ Jenkinson, Arthur F (1955). "La distribución de frecuencias de los valores máximos (o mínimos) anuales de los elementos meteorológicos". Quarterly Journal of the Royal Meteorological Society . 81 (348): 158–171. Código Bibliográfico :1955QJRMS..81..158J. doi :10.1002/qj.49708134804.
^ Haan, Laurens; Ferreira, Ana (2007). Teoría del valor extremo: una introducción . Springer.
^ von Mises, R. (1936). "La distribución de la plus grande de n valores". Rev. Matemáticas. Unión Interbalcánica 1 : 141–160.
^ Norton, Matthew; Khokhlov, Valentyn; Uryasev, Stan (2019). "Cálculo de CVaR y bPOE para distribuciones de probabilidad comunes con aplicación a la optimización de carteras y estimación de densidad" (PDF) . Anales de investigación de operaciones . 299 (1–2). Springer: 1281–1315. arXiv : 1811.11301 . doi :10.1007/s10479-019-03373-1. S2CID 254231768. Archivado desde el original (PDF) el 2023-03-31 . Consultado el 2023-02-27 .
^ Moscadelli, Marco. "La modelización del riesgo operacional: experiencia con el análisis de los datos recopilados por el Comité de Basilea". Disponible en SSRN 557214 (2004).
^ Guégan, D.; Hassani, BK (2014), "Un resurgimiento matemático de la gestión de riesgos: un modelo extremo de opiniones de expertos", Frontiers in Finance and Economics , 11 (1): 25–45, SSRN 2558747
^ CumFreq para ajuste de distribución de probabilidad [1]
^ Kjersti Aas, conferencia, NTNU, Trondheim, 23 de enero de 2008
^ Liu, Xin; Wang, Yu (2022). "Cuantificación de la probabilidad de ocurrencia anual de deslizamientos de tierra inducidos por lluvia en una pendiente específica". Computers and Geotechnics . 149 : 104877. Bibcode :2022CGeot.14904877L. doi :10.1016/j.compgeo.2022.104877. S2CID 250232752.
^ David, Herbert A.; Nagaraja, Haikady N. (2004). Estadísticas de pedidos . John Wiley & Sons. pág. 299.
Lectura adicional
Embrechts, Paul; Klüppelberg, Claudia ; Mikosch, Thomas (1997). Modelado de eventos extremos para seguros y finanzas. Berlín: Springer Verlag. ISBN 9783540609315.
Leadbetter, MR, Lindgren, G. y Rootzén, H. (1983). Extremos y propiedades relacionadas de secuencias y procesos aleatorios . Springer-Verlag. ISBN 0-387-90731-9.{{cite book}}: CS1 maint: multiple names: authors list (link)
Resnick, SI (1987). Valores extremos, variación regular y procesos puntuales . Springer-Verlag. ISBN 0-387-96481-9.
Coles, Stuart (2001). Introducción al modelado estadístico de valores extremos. Springer-Verlag. ISBN 1-85233-459-2.