stringtranslate.com

Teoría del valor extremo

La teoría del valor extremo se utiliza para modelar el riesgo de eventos extremos y raros, como el terremoto de Lisboa de 1755 .

La teoría del valor extremo o análisis de valor extremo ( EVA ) es una rama de la estadística que se ocupa de las desviaciones extremas de la mediana de las distribuciones de probabilidad . Busca evaluar, a partir de una muestra ordenada dada de una variable aleatoria dada, la probabilidad de eventos que sean más extremos que cualquier observado previamente. El análisis de valores extremos se utiliza ampliamente en muchas disciplinas, como la ingeniería estructural , las finanzas , la economía , las ciencias de la tierra , la predicción del tráfico y la ingeniería geológica . Por ejemplo, el EVA podría utilizarse en el campo de la hidrología para estimar la probabilidad de una inundación inusualmente grande, como la inundación de 100 años . De manera similar, para el diseño de un rompeolas , un ingeniero costero buscaría estimar la ola de 50 años y diseñar la estructura en consecuencia.

Análisis de los datos

Existen dos enfoques principales para el análisis práctico de valores extremos.

El primer método se basa en derivar series de máximos (mínimos) de bloques como paso preliminar. En muchas situaciones es habitual y conveniente extraer los máximos anuales (mínimos), generando una serie de máximos anuales (AMS).

El segundo método se basa en extraer, de un registro continuo, los valores máximos alcanzados durante cualquier período durante el cual los valores superan un determinado umbral (caen por debajo de un determinado umbral). Este método generalmente se conoce como método de pico sobre umbral (POT). [1]

Para los datos de AMS, el análisis puede depender en parte de los resultados del teorema de Fisher-Tippett-Gnedenko , lo que lleva a que se seleccione la distribución generalizada de valores extremos para el ajuste. [2] [3] Sin embargo, en la práctica, se aplican varios procedimientos para seleccionar entre una gama más amplia de distribuciones. El teorema aquí se relaciona con las distribuciones límite para el mínimo o el máximo de una colección muy grande de variables aleatorias independientes de la misma distribución. Dado que el número de eventos aleatorios relevantes dentro de un año puede ser bastante limitado, no es sorprendente que los análisis de los datos de AMS observados a menudo conduzcan a la selección de distribuciones distintas a la distribución de valores extremos generalizados (GEVD). [4]

Para los datos POT, el análisis puede implicar ajustar dos distribuciones: una para el número de eventos en un período de tiempo considerado y una segunda para el tamaño de las excedencias.

Un supuesto común para el primero es la distribución de Poisson , utilizándose la distribución de Pareto generalizada para las superaciones. Un ajuste de cola puede basarse en el teorema de Pickands-Balkema-de Haan . [5] [6]

Novak (2011) reserva el término "método POT" para el caso en el que el umbral no es aleatorio y lo distingue del caso en el que se trata de superaciones de un umbral aleatorio. [7]

Aplicaciones

Las aplicaciones de la teoría de valores extremos incluyen predecir la distribución de probabilidad de:

Historia

El campo de la teoría del valor extremo fue iniciado por L. Tippett (1902-1985). Tippett fue empleado de la Asociación Británica de Investigación de la Industria del Algodón , donde trabajó para fortalecer el hilo de algodón. En sus estudios, se dio cuenta de que la fuerza de un hilo estaba controlada por la fuerza de sus fibras más débiles. Con la ayuda de RA Fisher , Tippet obtuvo tres límites asintóticos que describen las distribuciones de los extremos suponiendo variables independientes. EJ Gumbel (1958) [22] codificó esta teoría. Estos resultados pueden ampliarse para permitir correlaciones leves entre variables, pero la teoría clásica no se extiende a correlaciones fuertes del orden de la varianza. Una clase de universalidad de particular interés es la de los campos logarítmicamente correlacionados , donde las correlaciones decaen logarítmicamente con la distancia.

Teoría univariada

La teoría de los valores extremos de una sola variable se rige por el teorema del valor extremo , también llamado teorema de Fisher-Tippett-Gnedenko , que describe cuál de las tres distribuciones posibles para valores extremos se aplica a una variable estadística particular que se resume en esta sección. .

Sea una muestra de variables aleatorias independientes e idénticamente distribuidas con función de distribución acumulativa y denotemos el máximo de la muestra.

En teoría, se puede derivar la distribución exacta del máximo:

El valor de la función indicadora asociada es un proceso de Bernoulli con una probabilidad de éxito que depende de la magnitud del evento extremo. Por lo tanto , el número de eventos extremos dentro de las pruebas sigue una distribución binomial y el número de pruebas hasta que ocurre un evento sigue una distribución geométrica con valor esperado y desviación estándar del mismo orden.

En la práctica, es posible que no tengamos la función de distribución , pero el teorema de Fisher-Tippett-Gnedenko proporciona un resultado asintótico. Si existen secuencias de constantes emparejadas con y tales que

como entonces

donde el parámetro depende de qué tan pronunciado disminuyen las colas de la distribución (llamadas colas "ordinarias" , colas "delgadas" y colas "gordas" , con la distribución normal colocada en el " grupo de cola "delgada" en lugar de "ordinario" para este contexto, al menos). Cuando está normalizado, pertenece a una de las siguientes familias de distribución no degeneradas :

Tipo 1: Distribución Gumbel , para
cuando la distribución de tiene una cola "ordinaria" que disminuye exponencialmente.


Tipo 2: Distribución Fréchet , para
cuando la distribución de tiene una cola pesada (incluida la desintegración polinomial).


Tipo 3: distribución Weibull ,
para
cuando la distribución de tiene una cola delgada con límite superior finito.

Teoría multivariada

La teoría del valor extremo en más de una variable introduce cuestiones adicionales que deben abordarse. Un problema que surge es que hay que especificar qué constituye un evento extremo. [23] Aunque esto es sencillo en el caso univariado, no existe una forma inequívoca de hacerlo en el caso multivariado. El problema fundamental es que, aunque es posible ordenar un conjunto de números con valores reales, no existe una forma natural de ordenar un conjunto de vectores.

Como ejemplo, en el caso univariado, dado un conjunto de observaciones, es sencillo encontrar el evento más extremo simplemente tomando el máximo (o mínimo) de las observaciones. Sin embargo, en el caso bivariado, dado un conjunto de observaciones , no queda inmediatamente claro cómo encontrar el evento más extremo. Supongamos que se han medido los valores en un momento específico y los valores en un momento posterior. ¿Cuál de estos eventos se consideraría más extremo? No existe una respuesta universal a esta pregunta.

Otro problema en el caso multivariado es que el modelo limitante no está tan completamente prescrito como en el caso univariado. En el caso univariado, el modelo ( distribución GEV ) contiene tres parámetros cuyos valores no son predichos por la teoría y deben obtenerse ajustando la distribución a los datos. En el caso multivariado, el modelo no sólo contiene parámetros desconocidos, sino también una función cuya forma exacta no está prescrita por la teoría. Sin embargo, esta función debe obedecer a ciertas restricciones. [24] [25] No es sencillo diseñar estimadores que obedezcan tales restricciones, aunque algunos se han construido recientemente. [26] [27] [28]

Como ejemplo de aplicación, la teoría bivariada de valores extremos se ha aplicado a la investigación oceánica. [23] [29]

Extremos no estacionarios

En la década de 1990 se desarrollaron modelos estadísticos para series temporales no estacionarias. [30] Más recientemente se han introducido métodos para extremos multivariados no estacionarios. [31] Este último se puede utilizar para rastrear cómo la dependencia entre valores extremos cambia con el tiempo o con otra covariable. [32] [33] [34]

Ver también

Distribuciones de valor extremo


Referencias

  1. ^ Leadbetter, señor (1991). "Sobre una base para el modelado de 'picos por encima del umbral'". Cartas de Estadística y Probabilidad . 12 (4): 357–362. doi :10.1016/0167-7152(91)90107-3.
  2. ^ Pescador y Tippett (1928)
  3. ^ Gnedenko (1943)
  4. ^ Embrechts, Klüppelberg y Mikosch (1997)
  5. ^ Pickands (1975)
  6. ^ Balkema y de Haan (1974)
  7. ^ Novak (2011)
  8. ^ Tippett, Lepore y Cohen (2016)
  9. ^ Batt, Ryan D.; Carpintero, Stephen R.; Ives, Anthony R. (marzo de 2017). "Eventos extremos en series temporales de ecosistemas lacustres". Letras de Limnología y Oceanografía . 2 (3): 63. Código bibliográfico : 2017LimOL...2...63B. doi : 10.1002/lol2.10037 .
  10. ^ Alvarado, Sandberg y Pickford (1998), pág. 68
  11. ^ Makkonen (2008)
  12. ^ Einmahl, JHJ; Smeets, SGWR (2009). Últimos récords mundiales de 100 metros a través de la teoría del valor extremo (PDF) (Reporte). Documento de debate del Centro. vol. 57. Universidad de Tilburg. Archivado desde el original (PDF) el 12 de marzo de 2016 . Consultado el 12 de agosto de 2009 .
  13. ^ Gembris, D.; Taylor, J.; Suter, D. (2002). "Tendencias y fluctuaciones aleatorias en el atletismo". Naturaleza . 417 (6888): 506. Bibcode :2002Natur.417..506G. doi : 10.1038/417506a . hdl : 2003/25362. PMID  12037557. S2CID  13469470.
  14. ^ Gembris, D.; Taylor, J.; Suter, D. (2007). "Evolución de los récords deportivos: efectos estadísticos versus mejoras reales". Revista de Estadística Aplicada . 34 (5): 529–545. Código Bib : 2007JApSt..34..529G. doi :10.1080/02664760701234850. hdl : 2003/25404. S2CID  55378036.
  15. ^ Lanza, H.; Tawn, J.; Hierros, D.; Paulden, T.; Bennett, G. (2021). "Clasificación y otras propiedades de nadadores de élite utilizando la teoría del valor extremo". Revista de la Real Sociedad de Estadística . Serie A (La Estadística en la Sociedad). 184 (1): 368–395. arXiv : 1910.10070 . doi : 10.1111/rssa.12628 . S2CID  204823947.
  16. ^ Songchitruksa, P.; Tarko, AP (2006). "El enfoque de la teoría del valor extremo para la estimación de seguridad". Análisis y Prevención de Accidentes . 38 (4): 811–822. doi :10.1016/j.aap.2006.02.003. PMID  16546103.
  17. ^ Orsini, F.; Gecchele, G.; Gastaldi, M.; Rossi, R. (2019). "Predicción de colisiones en rotondas: un estudio comparativo de enfoques de la teoría de valores extremos". Transportmétrica . Serie A: Ciencia del transporte. 15 (2): 556–572. doi :10.1080/23249935.2018.1515271. S2CID  158343873.
  18. ^ Tsinos, CG; Foukalas, F.; Khattab, T.; Lai, L. (febrero de 2018). "Sobre la selección de canales para sistemas de agregación de operadores". Transacciones IEEE sobre Comunicaciones . 66 (2): 808–818. doi :10.1109/TCOMM.2017.2757478. S2CID  3405114.
  19. ^ Wong, Félix; Collins, James J. (2 de noviembre de 2020). "La evidencia de que la superpropagación del coronavirus tiene cola gruesa". Actas de la Academia Nacional de Ciencias de EE. UU . 117 (47): 29416–29418. Código Bib : 2020PNAS..11729416W. doi : 10.1073/pnas.2018490117 . ISSN  0027-8424. PMC 7703634 . PMID  33139561. 
  20. ^ Basnayake, Kanishka; Mazaud, David; Bemelmans, Alexis; Rouach, Nathalie; Korkotian, Eduard; Holcman, David (4 de junio de 2019). "Transitorios rápidos de calcio en espinas dendríticas impulsados ​​por estadísticas extremas". Más biología . 17 (6): e2006202. doi : 10.1371/journal.pbio.2006202 . ISSN  1545-7885. PMC 6548358 . PMID  31163024. 
  21. ^ Younis, Abubaker; Abdeljalil, Anwar; Omer, Ali (1 de enero de 2023). "Determinación del factor de generación de paneles utilizando el método de picos por encima del umbral y datos a corto plazo para un sistema fotovoltaico fuera de la red en Sudán: un caso de la ciudad de Jartum". Energía solar . 249 : 242–249. Código Bib :2023SoEn..249..242Y. doi :10.1016/j.solener.2022.11.039. ISSN  0038-092X. S2CID  254207549.
  22. ^ Gumbel (2004)
  23. ^ ab Morton, identificación; Bowers, J. (diciembre de 1996). "Análisis de valor extremo en un entorno offshore multivariado". Investigación oceánica aplicada . 18 (6): 303–317. Código Bib : 1996AppOR..18..303M. doi :10.1016/s0141-1187(97)00007-2. ISSN  0141-1187.
  24. ^ Beirlant, enero; Goegebeur, Yuri; Teugels, Józef; Segers, Johan (27 de agosto de 2004). Estadística de Extremos: Teoría y aplicaciones . Serie Wiley en probabilidad y estadística. Chichester, Reino Unido: John Wiley & Sons, Ltd. doi :10.1002/0470012382. ISBN 978-0-470-01238-3.
  25. ^ Coles, Estuardo (2001). Introducción al modelado estadístico de valores extremos . Serie Springer en Estadística. doi :10.1007/978-1-4471-3675-0. ISBN 978-1-84996-874-4. ISSN  0172-7397.
  26. ^ de Carvalho, M.; Davison, AC (2014). "Modelos de relación de densidad espectral para extremos multivariados" (PDF) . Revista de la Asociación Estadounidense de Estadística . 109 : 764‒776. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID  53338058.
  27. ^ Hanson, T.; de Carvalho, M.; Chen, Yuhui (2017). "Densidades angulares polinómicas de Bernstein de distribuciones multivariadas de valores extremos" (PDF) . Cartas de Estadística y Probabilidad . 128 : 60–66. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID  53338058.
  28. ^ de Carvalho, M. (2013). "Un estimador de probabilidad euclidiana para la dependencia bivariada de la cola" (PDF) . Comunicaciones en estadística: teoría y métodos . 42 (7): 1176-1192. arXiv : 1204.3524 . doi :10.1080/03610926.2012.709905. S2CID  42652601.
  29. ^ Zacarías, S.; Feld, G.; Ward, G.; Wolfram, J. (octubre de 1998). "Extrapolación multivariante en el entorno offshore". Investigación oceánica aplicada . 20 (5): 273–295. Código Bib : 1998AppOR..20..273Z. doi :10.1016/s0141-1187(98)00027-3. ISSN  0141-1187.
  30. ^ Davison, CA; Smith, Richard (1990). "Modelos de superación de umbrales elevados". Revista de la Real Sociedad de Estadística . Serie B (Metodológica). 52 (3): 393–425. doi :10.1111/j.2517-6161.1990.tb01796.x.
  31. ^ de Carvalho, M. (2016). "Estadísticas de extremos: Retos y oportunidades". Manual de EVT y sus aplicaciones a las finanzas y los seguros (PDF) . Hoboken, Nueva Jersey: Hijos de John Wiley. págs. 195-214. ISBN 978-1-118-65019-6.
  32. ^ Castro, D.; de Carvalho, M.; Wadsworth, J. (2018). "Dependencia del valor extremo variable en el tiempo con aplicación a los principales mercados de valores europeos" (PDF) . Anales de Estadística Aplicada . 12 : 283–309. doi :10.1214/17-AOAS1089. S2CID  33350408.
  33. ^ Mhalla, L.; de Carvalho, M.; Chávez-Demoulin, V. (2019). «Modelos de tipo regresión para dependencia extrema» (PDF) . Revista escandinava de estadística . 46 (4): 1141-1167. doi :10.1111/sjos.12388. S2CID  53570822.
  34. ^ Mhalla, L.; de Carvalho, M.; Chávez-Demoulin, V. (2018). "Estimación local robusta de la función de dependencia de Pickands". Anales de Estadística . 46 (6A): 2806–2843. doi : 10.1214/17-AOS1640 . S2CID  59467614.

Fuentes

Software

enlaces externos