stringtranslate.com

Teoría del valor extremo

La teoría del valor extremo se utiliza para modelar el riesgo de eventos extremos y raros, como el terremoto de Lisboa de 1755 .

La teoría del valor extremo o análisis del valor extremo ( EVA ) es el estudio de los extremos en distribuciones estadísticas.

Se utiliza ampliamente en muchas disciplinas, como la ingeniería estructural , las finanzas , la economía , las ciencias de la tierra , la predicción del tráfico y la ingeniería geológica . Por ejemplo, el EVA se puede utilizar en el campo de la hidrología para estimar la probabilidad de un evento de inundación inusualmente grande, como la inundación de cada 100 años . De manera similar, para el diseño de un rompeolas , un ingeniero costero buscaría estimar la ola de 50 años y diseñar la estructura en consecuencia.

Análisis de datos

Existen dos enfoques principales para el análisis práctico del valor extremo.

El primer método se basa en la derivación de series de máximos (mínimos) de bloques como paso preliminar. En muchas situaciones, es habitual y conveniente extraer los máximos (mínimos) anuales, generando una serie de máximos (AMS) anuales.

El segundo método se basa en extraer, a partir de un registro continuo, los valores máximos alcanzados durante cualquier período durante el cual los valores superan un determinado umbral (caen por debajo de un determinado umbral). Este método se conoce generalmente como el método de pico sobre umbral (POT). [1]

En el caso de los datos de AMS, el análisis puede basarse en parte en los resultados del teorema de Fisher-Tippett-Gnedenko , lo que lleva a seleccionar la distribución generalizada de valores extremos para el ajuste. [2] [3] Sin embargo, en la práctica, se aplican varios procedimientos para seleccionar entre una gama más amplia de distribuciones. El teorema aquí se relaciona con las distribuciones limitantes para el mínimo o el máximo de una colección muy grande de variables aleatorias independientes de la misma distribución. Dado que el número de eventos aleatorios relevantes dentro de un año puede ser bastante limitado, no es sorprendente que los análisis de datos observados de AMS a menudo conduzcan a la selección de distribuciones distintas de la distribución generalizada de valores extremos (GEVD). [4]

En el caso de los datos POT, el análisis puede implicar el ajuste de dos distribuciones: una para el número de eventos en un período de tiempo considerado y una segunda para el tamaño de las excedencias.

Un supuesto común para el primero es la distribución de Poisson , y para las excedencias se utiliza la distribución generalizada de Pareto . Un ajuste de cola puede basarse en el teorema de Pickands–Balkema–de Haan . [5] [6]

Novak (2011) reserva el término "método POT" para el caso en que el umbral no es aleatorio, y lo distingue del caso en que se trata de superaciones de un umbral aleatorio. [7]

Aplicaciones

Las aplicaciones de la teoría del valor extremo incluyen la predicción de la distribución de probabilidad de:

Historia

El campo de la teoría de valores extremos fue iniciado por L. Tippett (1902-1985). Tippett fue empleado por la Asociación Británica de Investigación de la Industria Algodonera , donde trabajó para hacer que el hilo de algodón fuera más fuerte. En sus estudios, se dio cuenta de que la fuerza de un hilo estaba controlada por la fuerza de sus fibras más débiles. Con la ayuda de RA Fisher , Tippet obtuvo tres límites asintóticos que describen las distribuciones de extremos asumiendo variables independientes. EJ Gumbel (1958) [25] codificó esta teoría. Estos resultados se pueden extender para permitir correlaciones leves entre variables, pero la teoría clásica no se extiende a correlaciones fuertes del orden de la varianza. Una clase de universalidad de particular interés es la de los campos correlacionados logarítmicamente , donde las correlaciones decaen logarítmicamente con la distancia.

Teoría univariante

La teoría de los valores extremos de una sola variable está gobernada por el teorema del valor extremo , también llamado teorema de Fisher-Tippett-Gnedenko , que describe cuál de las tres distribuciones posibles para valores extremos se aplica a una variable estadística particular que se resume en esta sección.

Teoría multivariante

La teoría de los valores extremos en más de una variable introduce cuestiones adicionales que deben abordarse. Uno de los problemas que surge es que hay que especificar qué constituye un evento extremo. [26] Aunque esto es sencillo en el caso univariado, no hay una manera inequívoca de hacerlo en el caso multivariado. El problema fundamental es que, aunque es posible ordenar un conjunto de números de valor real, no hay una manera natural de ordenar un conjunto de vectores.

Por ejemplo, en el caso univariado, dado un conjunto de observaciones, es sencillo encontrar el evento más extremo simplemente tomando el máximo (o mínimo) de las observaciones. Sin embargo, en el caso bivariado, dado un conjunto de observaciones , no está inmediatamente claro cómo encontrar el evento más extremo. Supongamos que se han medido los valores en un momento específico y los valores en un momento posterior. ¿Cuál de estos eventos se consideraría más extremo? No hay una respuesta universal a esta pregunta.

Otro problema en el caso multivariado es que el modelo limitante no está tan completamente prescrito como en el caso univariado. En el caso univariado, el modelo ( distribución GEV ) contiene tres parámetros cuyos valores no son predichos por la teoría y deben obtenerse ajustando la distribución a los datos. En el caso multivariado, el modelo no sólo contiene parámetros desconocidos, sino también una función cuya forma exacta no está prescrita por la teoría. Sin embargo, esta función debe obedecer ciertas restricciones. [27] [28] No es sencillo diseñar estimadores que obedezcan tales restricciones, aunque algunos se han construido recientemente. [29] [30] [31]

Como ejemplo de aplicación, se ha aplicado la teoría del valor extremo bivariado a la investigación oceánica. [26] [32]

Extremos no estacionarios

El modelado estadístico para series temporales no estacionarias se desarrolló en la década de 1990. [33] Más recientemente se han introducido métodos para extremos multivariados no estacionarios. [34] Estos últimos se pueden utilizar para rastrear cómo cambia la dependencia entre valores extremos a lo largo del tiempo o con respecto a otra covariable. [35] [36] [37]

Véase también

Distribuciones de valores extremos


Referencias

  1. ^ Leadbetter, MR (1991). "Sobre una base para el modelado de 'picos sobre el umbral'". Statistics and Probability Letters . 12 (4): 357–362. doi :10.1016/0167-7152(91)90107-3.
  2. ^ Fisher y Tippett (1928)
  3. ^ Gnedenko (1943)
  4. ^ Embrechts, Klüppelberg y Mikosch (1997)
  5. ^ Los Pickands (1975)
  6. ^ Balkema y de Haan (1974)
  7. ^ Novak (2011)
  8. ^ Tippett, Lepore y Cohen (2016)
  9. ^ Batt, Ryan D.; Carpenter, Stephen R.; Ives, Anthony R. (marzo de 2017). "Eventos extremos en series temporales de ecosistemas lacustres". Limnology and Oceanography Letters . 2 (3): 63. Bibcode :2017LimOL...2...63B. doi : 10.1002/lol2.10037 .
  10. ^ Alvarado, Sandberg y Pickford (1998), pág. 68
  11. ^ Makonen (2008)
  12. ^ Einmahl, JHJ; Smeets, SGWR (2009). Ultimate 100m world records through extreme-value theory (PDF) (Informe). Documento de debate de CentER. Vol. 57. Universidad de Tilburg. Archivado desde el original (PDF) el 2016-03-12 . Consultado el 2009-08-12 .
  13. ^ Gembris, D.; Taylor, J.; Suter, D. (2002). "Tendencias y fluctuaciones aleatorias en el atletismo". Nature . 417 (6888): 506. Bibcode :2002Natur.417..506G. doi : 10.1038/417506a . hdl :2003/25362. PMID  12037557. S2CID  13469470.
  14. ^ Gembris, D.; Taylor, J.; Suter, D. (2007). "Evolución de los récords deportivos: efectos estadísticos frente a mejoras reales". Journal of Applied Statistics . 34 (5): 529–545. Bibcode :2007JApSt..34..529G. doi :10.1080/02664760701234850. hdl :2003/25404. PMC 11134017 . S2CID  55378036. 
  15. ^ Spearing, H.; Tawn, J.; Irons, D.; Paulden, T.; Bennett, G. (2021). "Ranking y otras propiedades de nadadores de élite utilizando la teoría del valor extremo". Revista de la Royal Statistical Society . Serie A (Estadísticas en la sociedad). 184 (1): 368–395. arXiv : 1910.10070 . doi : 10.1111/rssa.12628 . S2CID  204823947.
  16. ^ Songchitruksa, P.; Tarko, AP (2006). "El enfoque de la teoría del valor extremo para la estimación de la seguridad". Análisis y prevención de accidentes . 38 (4): 811–822. doi :10.1016/j.aap.2006.02.003. PMID  16546103.
  17. ^ Orsini, F.; Gecchele, G.; Gastaldi, M.; Rossi, R. (2019). "Predicción de colisiones en rotondas: un estudio comparativo de enfoques de teoría de valores extremos". Transportmetrica . Serie A: Ciencia del transporte. 15 (2): 556–572. doi :10.1080/23249935.2018.1515271. S2CID  158343873.
  18. ^ Tsinos, CG; Foukalas, F.; Khattab, T.; Lai, L. (febrero de 2018). "Sobre la selección de canales para sistemas de agregación de portadoras". IEEE Transactions on Communications . 66 (2): 808–818. doi :10.1109/TCOMM.2017.2757478. S2CID  3405114.
  19. ^ Wong, Felix; Collins, James J. (2 de noviembre de 2020). "Evidencia de que la superpropagación del coronavirus es de cola gruesa". Actas de la Academia Nacional de Ciencias de los Estados Unidos . 117 (47): 29416–29418. Bibcode :2020PNAS..11729416W. doi : 10.1073/pnas.2018490117 . ISSN  0027-8424. PMC 7703634 . PMID  33139561. 
  20. ^ Basnayake, Kanishka; Mazaud, David; Bemelmans, Alexis; Rouach, Nathalie; Korkotian, Eduard; Holcman, David (4 de junio de 2019). "Transitorios rápidos de calcio en espinas dendríticas impulsados ​​por estadísticas extremas". PLOS Biology . 17 (6): e2006202. doi : 10.1371/journal.pbio.2006202 . ISSN  1545-7885. PMC 6548358 . PMID  31163024. 
  21. ^ Younis, Abubaker; Abdeljalil, Anwar; Omer, Ali (1 de enero de 2023). "Determinación del factor de generación del panel utilizando el método de picos sobre el umbral y datos a corto plazo para un sistema fotovoltaico fuera de la red en Sudán: un caso de la ciudad de Jartum". Energía solar . 249 : 242–249. Código Bibliográfico :2023SoEn..249..242Y. doi :10.1016/j.solener.2022.11.039. ISSN  0038-092X. S2CID  254207549.
  22. ^ Fogg, Alexandra Ruth (2023). "Análisis de valores extremos de las observaciones del magnetómetro terrestre en el Observatorio Valentia, Irlanda". Meteorología espacial . 21 (e2023SW003565). doi :10.1029/2023SW003565.
  23. ^ Elvidge, Sean (2020). "Estimación de la ocurrencia de actividad geomagnética utilizando la transformada de Hilbert-Huang y la teoría de valores extremos". Clima espacial . 17 (e2020SW002513). doi :10.1029/2020SW002513.
  24. ^ Bergin, Aisling (2023). "Estadísticas de eventos extremos en los índices geomagnéticos Dst, SYM-H y SMR". Clima espacial . 21 (e2022SW003304). doi :10.1029/2022SW003304. hdl : 10037/30641 .
  25. ^ Gumbel (2004)
  26. ^ ab Morton, ID; Bowers, J. (diciembre de 1996). "Análisis de valor extremo en un entorno offshore multivariado". Applied Ocean Research . 18 (6): 303–317. Bibcode :1996AppOR..18..303M. doi :10.1016/s0141-1187(97)00007-2. ISSN  0141-1187.
  27. ^ Beirlant, Jan; Goegebeur, Yuri; Teugels, Jozef; Segers, Johan (27 de agosto de 2004). Estadística de extremos: teoría y aplicaciones . Serie de Wiley en probabilidad y estadística. Chichester, Reino Unido: John Wiley & Sons, Ltd. doi :10.1002/0470012382. ISBN 978-0-470-01238-3.
  28. ^ Coles, Stuart (2001). Introducción al modelado estadístico de valores extremos . Springer Series in Statistics. doi :10.1007/978-1-4471-3675-0. ISBN 978-1-84996-874-4. ISSN  0172-7397.
  29. ^ de Carvalho, M.; Davison, AC (2014). "Modelos de razón de densidad espectral para extremos multivariados" (PDF) . Revista de la Asociación Estadounidense de Estadística . 109 : 764‒776. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID  53338058.
  30. ^ Hanson, T.; de Carvalho, M.; Chen, Yuhui (2017). "Densidades angulares polinomiales de Bernstein de distribuciones multivariadas de valores extremos" (PDF) . Statistics and Probability Letters . 128 : 60–66. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID  53338058.
  31. ^ de Carvalho, M. (2013). "Un estimador de verosimilitud euclidiana para dependencia de cola bivariada" (PDF) . Comunicaciones en Estadística – Teoría y Métodos . 42 (7): 1176–1192. arXiv : 1204.3524 . doi :10.1080/03610926.2012.709905. S2CID  42652601.
  32. ^ Zachary, S.; Feld, G.; Ward, G.; Wolfram, J. (octubre de 1998). "Extrapolación multivariante en el entorno offshore". Applied Ocean Research . 20 (5): 273–295. Bibcode :1998AppOR..20..273Z. doi :10.1016/s0141-1187(98)00027-3. ISSN  0141-1187.
  33. ^ Davison, AC; Smith, Richard (1990). "Modelos para excedencias por encima de umbrales altos". Journal of the Royal Statistical Society . Serie B (Metodológica). 52 (3): 393–425. doi :10.1111/j.2517-6161.1990.tb01796.x.
  34. ^ de Carvalho, M. (2016). "Estadísticas de extremos: desafíos y oportunidades". Manual de EVT y sus aplicaciones a las finanzas y los seguros (PDF) . Hoboken, NJ: John Wiley's Sons. pp. 195–214. ISBN 978-1-118-65019-6.
  35. ^ Castro, D.; de Carvalho, M.; Wadsworth, J. (2018). "Dependencia del valor extremo variable en el tiempo con aplicación a los principales mercados bursátiles europeos" (PDF) . Anales de estadística aplicada . 12 : 283–309. doi :10.1214/17-AOAS1089. S2CID  33350408.
  36. ^ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2019). "Modelos de tipo regresión para dependencia extrema" (PDF) . Revista Escandinava de Estadística . 46 (4): 1141–1167. doi :10.1111/sjos.12388. S2CID  53570822.
  37. ^ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2018). "Estimación robusta local de la función de dependencia de Pickands". Anales de Estadística . 46 (6A): 2806–2843. doi : 10.1214/17-AOS1640 . S2CID  59467614.

Fuentes

Software

Enlaces externos