Teoría del valor extremo

La teoría del valor extremo o análisis del valor extremo ( EVA ) es el estudio de los extremos en distribuciones estadísticas.

Se utiliza ampliamente en muchas disciplinas, como la ingeniería estructural , las finanzas , la economía , las ciencias de la tierra , la predicción del tráfico y la ingeniería geológica . Por ejemplo, el EVA se puede utilizar en el campo de la hidrología para estimar la probabilidad de un evento de inundación inusualmente grande, como la inundación de cada 100 años . De manera similar, para el diseño de un rompeolas , un ingeniero costero buscaría estimar la ola de 50 años y diseñar la estructura en consecuencia.

Análisis de datos

Existen dos enfoques principales para el análisis práctico del valor extremo.

El primer método se basa en la derivación de series de máximos (mínimos) de bloques como paso preliminar. En muchas situaciones, es habitual y conveniente extraer los máximos (mínimos) anuales, generando una serie de máximos (AMS) anuales.

El segundo método se basa en extraer, a partir de un registro continuo, los valores máximos alcanzados durante cualquier período durante el cual los valores superan un determinado umbral (caen por debajo de un determinado umbral). Este método se conoce generalmente como el método de pico sobre umbral (POT). ^[1]

En el caso de los datos de AMS, el análisis puede basarse en parte en los resultados del teorema de Fisher-Tippett-Gnedenko , lo que lleva a seleccionar la distribución generalizada de valores extremos para el ajuste. ^[2]^[3] Sin embargo, en la práctica, se aplican varios procedimientos para seleccionar entre una gama más amplia de distribuciones. El teorema aquí se relaciona con las distribuciones limitantes para el mínimo o el máximo de una colección muy grande de variables aleatorias independientes de la misma distribución. Dado que el número de eventos aleatorios relevantes dentro de un año puede ser bastante limitado, no es sorprendente que los análisis de datos observados de AMS a menudo conduzcan a la selección de distribuciones distintas de la distribución generalizada de valores extremos (GEVD). ^[4]

En el caso de los datos POT, el análisis puede implicar el ajuste de dos distribuciones: una para el número de eventos en un período de tiempo considerado y una segunda para el tamaño de las excedencias.

Un supuesto común para el primero es la distribución de Poisson , y para las excedencias se utiliza la distribución generalizada de Pareto . Un ajuste de cola puede basarse en el teorema de Pickands–Balkema–de Haan . ^[5]^[6]

Novak (2011) reserva el término "método POT" para el caso en que el umbral no es aleatorio, y lo distingue del caso en que se trata de superaciones de un umbral aleatorio. ^[7]

Aplicaciones

Las aplicaciones de la teoría del valor extremo incluyen la predicción de la distribución de probabilidad de:

Inundaciones extremas ; del tamaño de olas gigantes
Brotes de tornados ^[8]
Tamaños máximos de las poblaciones ecológicas ^[9]
Efectos secundarios de los medicamentos (por ejemplo, ximelagatrán )
La magnitud de las grandes pérdidas de seguros
Riesgos de renta variable ; riesgo diario del mercado
Eventos de mutación durante la evolución
Grandes incendios forestales ^[10]
Cargas ambientales sobre las estructuras ^[11]
Tiempo en el que los humanos más rápidos pudieron correr los 100 metros lisos ^[12] y actuaciones en otras disciplinas atléticas ^[13]^[14]^[15]
Fallas en tuberías debido a corrosión por picaduras
Tráfico anómalo en la red de TI , evita que los atacantes accedan a datos importantes
Análisis de seguridad vial ^[16]^[17]
Comunicaciones inalámbricas ^[18]
Epidemias ^[19]
Neurobiología ^[20]
Energía solar ^[21]
Clima espacial extremo ^[22]^[23]^[24]

Historia

El campo de la teoría de valores extremos fue iniciado por L. Tippett (1902-1985). Tippett fue empleado por la Asociación Británica de Investigación de la Industria Algodonera , donde trabajó para hacer que el hilo de algodón fuera más fuerte. En sus estudios, se dio cuenta de que la fuerza de un hilo estaba controlada por la fuerza de sus fibras más débiles. Con la ayuda de RA Fisher , Tippet obtuvo tres límites asintóticos que describen las distribuciones de extremos asumiendo variables independientes. EJ Gumbel (1958) ^[25] codificó esta teoría. Estos resultados se pueden extender para permitir correlaciones leves entre variables, pero la teoría clásica no se extiende a correlaciones fuertes del orden de la varianza. Una clase de universalidad de particular interés es la de los campos correlacionados logarítmicamente , donde las correlaciones decaen logarítmicamente con la distancia.

Teoría univariante

La teoría de los valores extremos de una sola variable está gobernada por el teorema del valor extremo , también llamado teorema de Fisher-Tippett-Gnedenko , que describe cuál de las tres distribuciones posibles para valores extremos se aplica a una variable estadística particular que se resume en esta sección. ${\estilo de visualización \ X\ ,}$

Teoría multivariante

La teoría de los valores extremos en más de una variable introduce cuestiones adicionales que deben abordarse. Uno de los problemas que surge es que hay que especificar qué constituye un evento extremo. ^[26] Aunque esto es sencillo en el caso univariado, no hay una manera inequívoca de hacerlo en el caso multivariado. El problema fundamental es que, aunque es posible ordenar un conjunto de números de valor real, no hay una manera natural de ordenar un conjunto de vectores.

Por ejemplo, en el caso univariado, dado un conjunto de observaciones, es sencillo encontrar el evento más extremo simplemente tomando el máximo (o mínimo) de las observaciones. Sin embargo, en el caso bivariado, dado un conjunto de observaciones , no está inmediatamente claro cómo encontrar el evento más extremo. Supongamos que se han medido los valores en un momento específico y los valores en un momento posterior. ¿Cuál de estos eventos se consideraría más extremo? No hay una respuesta universal a esta pregunta. $\ x_{i}\$ $\ (x_{i},y_{i})\$ ${\estilo de visualización \ (3,4)\ }$ ${\estilo de visualización \ (5,2)\ }$

Otro problema en el caso multivariado es que el modelo limitante no está tan completamente prescrito como en el caso univariado. En el caso univariado, el modelo ( distribución GEV ) contiene tres parámetros cuyos valores no son predichos por la teoría y deben obtenerse ajustando la distribución a los datos. En el caso multivariado, el modelo no sólo contiene parámetros desconocidos, sino también una función cuya forma exacta no está prescrita por la teoría. Sin embargo, esta función debe obedecer ciertas restricciones. ^[27]^[28] No es sencillo diseñar estimadores que obedezcan tales restricciones, aunque algunos se han construido recientemente. ^[29]^[30]^[31]

Como ejemplo de aplicación, se ha aplicado la teoría del valor extremo bivariado a la investigación oceánica. ^[26]^[32]

Extremos no estacionarios

El modelado estadístico para series temporales no estacionarias se desarrolló en la década de 1990. ^[33] Más recientemente se han introducido métodos para extremos multivariados no estacionarios. ^[34] Estos últimos se pueden utilizar para rastrear cómo cambia la dependencia entre valores extremos a lo largo del tiempo o con respecto a otra covariable. ^[35]^[36]^[37]

Véase también

Distribuciones de valores extremos

Referencias

^ Leadbetter, MR (1991). "Sobre una base para el modelado de 'picos sobre el umbral'". Statistics and Probability Letters . 12 (4): 357–362. doi :10.1016/0167-7152(91)90107-3.
^ Fisher y Tippett (1928)
^ Gnedenko (1943)
^ Embrechts, Klüppelberg y Mikosch (1997)
^ Los Pickands (1975)
^ Balkema y de Haan (1974)
^ Novak (2011)
^ Tippett, Lepore y Cohen (2016)
^ Batt, Ryan D.; Carpenter, Stephen R.; Ives, Anthony R. (marzo de 2017). "Eventos extremos en series temporales de ecosistemas lacustres". Limnology and Oceanography Letters . 2 (3): 63. Bibcode :2017LimOL...2...63B. doi : 10.1002/lol2.10037 .
^ Alvarado, Sandberg y Pickford (1998), pág. 68
^ Makonen (2008)
^ Einmahl, JHJ; Smeets, SGWR (2009). Ultimate 100m world records through extreme-value theory (PDF) (Informe). Documento de debate de CentER. Vol. 57. Universidad de Tilburg. Archivado desde el original (PDF) el 2016-03-12 . Consultado el 2009-08-12 .
^ Gembris, D.; Taylor, J.; Suter, D. (2002). "Tendencias y fluctuaciones aleatorias en el atletismo". Nature . 417 (6888): 506. Bibcode :2002Natur.417..506G. doi : 10.1038/417506a . hdl :2003/25362. PMID 12037557. S2CID 13469470.
^ Gembris, D.; Taylor, J.; Suter, D. (2007). "Evolución de los récords deportivos: efectos estadísticos frente a mejoras reales". Journal of Applied Statistics . 34 (5): 529–545. Bibcode :2007JApSt..34..529G. doi :10.1080/02664760701234850. hdl :2003/25404. PMC 11134017 . S2CID 55378036.
^ Spearing, H.; Tawn, J.; Irons, D.; Paulden, T.; Bennett, G. (2021). "Ranking y otras propiedades de nadadores de élite utilizando la teoría del valor extremo". Revista de la Royal Statistical Society . Serie A (Estadísticas en la sociedad). 184 (1): 368–395. arXiv : 1910.10070 . doi : 10.1111/rssa.12628 . S2CID 204823947.
^ Songchitruksa, P.; Tarko, AP (2006). "El enfoque de la teoría del valor extremo para la estimación de la seguridad". Análisis y prevención de accidentes . 38 (4): 811–822. doi :10.1016/j.aap.2006.02.003. PMID 16546103.
^ Orsini, F.; Gecchele, G.; Gastaldi, M.; Rossi, R. (2019). "Predicción de colisiones en rotondas: un estudio comparativo de enfoques de teoría de valores extremos". Transportmetrica . Serie A: Ciencia del transporte. 15 (2): 556–572. doi :10.1080/23249935.2018.1515271. S2CID 158343873.
^ Tsinos, CG; Foukalas, F.; Khattab, T.; Lai, L. (febrero de 2018). "Sobre la selección de canales para sistemas de agregación de portadoras". IEEE Transactions on Communications . 66 (2): 808–818. doi :10.1109/TCOMM.2017.2757478. S2CID 3405114.
^ Wong, Felix; Collins, James J. (2 de noviembre de 2020). "Evidencia de que la superpropagación del coronavirus es de cola gruesa". Actas de la Academia Nacional de Ciencias de los Estados Unidos . 117 (47): 29416–29418. Bibcode :2020PNAS..11729416W. doi : 10.1073/pnas.2018490117 . ISSN 0027-8424. PMC 7703634 . PMID 33139561.
^ Basnayake, Kanishka; Mazaud, David; Bemelmans, Alexis; Rouach, Nathalie; Korkotian, Eduard; Holcman, David (4 de junio de 2019). "Transitorios rápidos de calcio en espinas dendríticas impulsados por estadísticas extremas". PLOS Biology . 17 (6): e2006202. doi : 10.1371/journal.pbio.2006202 . ISSN 1545-7885. PMC 6548358 . PMID 31163024.
^ Younis, Abubaker; Abdeljalil, Anwar; Omer, Ali (1 de enero de 2023). "Determinación del factor de generación del panel utilizando el método de picos sobre el umbral y datos a corto plazo para un sistema fotovoltaico fuera de la red en Sudán: un caso de la ciudad de Jartum". Energía solar . 249 : 242–249. Código Bibliográfico :2023SoEn..249..242Y. doi :10.1016/j.solener.2022.11.039. ISSN 0038-092X. S2CID 254207549.
^ Fogg, Alexandra Ruth (2023). "Análisis de valores extremos de las observaciones del magnetómetro terrestre en el Observatorio Valentia, Irlanda". Meteorología espacial . 21 (e2023SW003565). doi :10.1029/2023SW003565.
^ Elvidge, Sean (2020). "Estimación de la ocurrencia de actividad geomagnética utilizando la transformada de Hilbert-Huang y la teoría de valores extremos". Clima espacial . 17 (e2020SW002513). doi :10.1029/2020SW002513.
^ Bergin, Aisling (2023). "Estadísticas de eventos extremos en los índices geomagnéticos Dst, SYM-H y SMR". Clima espacial . 21 (e2022SW003304). doi :10.1029/2022SW003304. hdl : 10037/30641 .
^ Gumbel (2004)
^ ab Morton, ID; Bowers, J. (diciembre de 1996). "Análisis de valor extremo en un entorno offshore multivariado". Applied Ocean Research . 18 (6): 303–317. Bibcode :1996AppOR..18..303M. doi :10.1016/s0141-1187(97)00007-2. ISSN 0141-1187.
^ Beirlant, Jan; Goegebeur, Yuri; Teugels, Jozef; Segers, Johan (27 de agosto de 2004). Estadística de extremos: teoría y aplicaciones . Serie de Wiley en probabilidad y estadística. Chichester, Reino Unido: John Wiley & Sons, Ltd. doi :10.1002/0470012382. ISBN 978-0-470-01238-3.
^ Coles, Stuart (2001). Introducción al modelado estadístico de valores extremos . Springer Series in Statistics. doi :10.1007/978-1-4471-3675-0. ISBN 978-1-84996-874-4. ISSN 0172-7397.
^ de Carvalho, M.; Davison, AC (2014). "Modelos de razón de densidad espectral para extremos multivariados" (PDF) . Revista de la Asociación Estadounidense de Estadística . 109 : 764‒776. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID 53338058.
^ Hanson, T.; de Carvalho, M.; Chen, Yuhui (2017). "Densidades angulares polinomiales de Bernstein de distribuciones multivariadas de valores extremos" (PDF) . Statistics and Probability Letters . 128 : 60–66. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID 53338058.
^ de Carvalho, M. (2013). "Un estimador de verosimilitud euclidiana para dependencia de cola bivariada" (PDF) . Comunicaciones en Estadística – Teoría y Métodos . 42 (7): 1176–1192. arXiv : 1204.3524 . doi :10.1080/03610926.2012.709905. S2CID 42652601.
^ Zachary, S.; Feld, G.; Ward, G.; Wolfram, J. (octubre de 1998). "Extrapolación multivariante en el entorno offshore". Applied Ocean Research . 20 (5): 273–295. Bibcode :1998AppOR..20..273Z. doi :10.1016/s0141-1187(98)00027-3. ISSN 0141-1187.
^ Davison, AC; Smith, Richard (1990). "Modelos para excedencias por encima de umbrales altos". Journal of the Royal Statistical Society . Serie B (Metodológica). 52 (3): 393–425. doi :10.1111/j.2517-6161.1990.tb01796.x.
^ de Carvalho, M. (2016). "Estadísticas de extremos: desafíos y oportunidades". Manual de EVT y sus aplicaciones a las finanzas y los seguros (PDF) . Hoboken, NJ: John Wiley's Sons. pp. 195–214. ISBN 978-1-118-65019-6.
^ Castro, D.; de Carvalho, M.; Wadsworth, J. (2018). "Dependencia del valor extremo variable en el tiempo con aplicación a los principales mercados bursátiles europeos" (PDF) . Anales de estadística aplicada . 12 : 283–309. doi :10.1214/17-AOAS1089. S2CID 33350408.
^ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2019). "Modelos de tipo regresión para dependencia extrema" (PDF) . Revista Escandinava de Estadística . 46 (4): 1141–1167. doi :10.1111/sjos.12388. S2CID 53570822.
^ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2018). "Estimación robusta local de la función de dependencia de Pickands". Anales de Estadística . 46 (6A): 2806–2843. doi : 10.1214/17-AOS1640 . S2CID 59467614.

Fuentes

Abarbanel, H.; Koonin, S.; Levine, H.; MacDonald, G.; Rothaus, O. (enero de 1992). "Estadísticas de eventos extremos con aplicación al clima" (PDF) . JASON . JSR-90-30S . Consultado el 3 de marzo de 2015 .
Alvarado, Ernesto; Sandberg, David V.; Pickford, Stewart G. (1998). "Modeling Large Forest Fires as Extreme Events" (PDF) . Northwest Science . 72 : 66–75. Archivado desde el original (PDF) el 2009-02-26 . Consultado el 2009-02-06 .
Balkema, A.; de Haan, Laurens (1974). "Tiempo de vida residual a una edad avanzada". Anales de probabilidad . 2 (5): 792–804. doi : 10.1214/aop/1176996548 . JSTOR 2959306.
Burry, KV (1975). Métodos estadísticos en la ciencia aplicada . Hoboken, Nueva Jersey: John Wiley & Sons.
Castillo, E. (1988). Teoría del valor extremo en ingeniería . Nueva York, NY: Academic Press. ISBN 0-12-163475-2.
Castillo, E.; Hadi, AS; Balakrishnan, N.; Sarabia, JM (2005). Modelos de valor extremo y modelos relacionados con aplicaciones en ingeniería y ciencia . Serie Wiley en probabilidad y estadística. Hoboken, NJ: John Wiley's Sons. ISBN 0-471-67172-X.
Coles, S. (2001). Introducción al modelado estadístico de valores extremos . Londres, Reino Unido: Springer.
Embrechts, P.; Klüppelberg, C .; Mikosch, T. (1997). Modelado de eventos extremos para seguros y finanzas . Berlín, DE: Springer Verlag.
Fisher, RA ; Tippett, LHC (1928). "Formas limitantes de la distribución de frecuencias del miembro más grande y más pequeño de una muestra". Actas de la Sociedad Filosófica de Cambridge . 24 (2): 180–190. Bibcode :1928PCPS...24..180F. doi :10.1017/s0305004100015681. S2CID 123125823.
Gnedenko, BV (1943). "Sobre la distribución límite del valor máximo de una serie aleatoria". Anales de Matemáticas (en francés). 44 (3): 423–453. doi :10.2307/1968974. JSTOR 1968974.
Gumbel, EJ , ed. (1935) [1933-1934]. "Les valeurs extrêmes des Distributions statistiques" [Las distribuciones estadísticas de valores extremos] (pdf) . Annales de l'Institut Henri Poincaré (artículos de conferencias) (en francés). 5 (2). Francia: 115-158 . Consultado el 1 de abril de 2009 a través de numdam.org.
Gumbel, EJ (2004) [1958]. Estadísticas de extremos (edición reimpresa). Mineola, NY: Dover. ISBN 978-0-486-43604-3.
Makkonen, L. (2008). "Problemas en el análisis de valores extremos". Seguridad estructural . 30 (5): 405–419. doi :10.1016/j.strusafe.2006.12.001.
Leadbetter, MR (1991). "Sobre una base para el modelado de 'picos por encima del umbral'". Statistics & Probability Letters . 12 (4): 357–362. doi :10.1016/0167-7152(91)90107-3.
Leadbetter, MR; Lindgren, G.; Rootzen, H. (1982). Extremos y propiedades relacionadas de secuencias y procesos aleatorios . Nueva York, NY: Springer-Verlag.
Lindgren, G.; Rootzen, H. (1987). "Valores extremos: teoría y aplicaciones técnicas". Revista escandinava de estadística, teoría y aplicaciones . 14 : 241–279.
Novak, SY (2011). Métodos de valor extremo con aplicaciones a las finanzas . Londres, Reino Unido / Boca Raton, FL: Chapman & Hall / CRC Press. ISBN 978-1-4398-3574-6.
Pickands, J. (1975). "Inferencia estadística utilizando estadísticas de orden extremo". Anales de Estadística . 3 : 119–131. doi : 10.1214/aos/1176343003 .
Tippett, Michael K.; Lepore, Chiara; Cohen, Joel E. (16 de diciembre de 2016). "Más tornados en los brotes de tornados más extremos de Estados Unidos". Science . 354 (6318): 1419–1423. Bibcode :2016Sci...354.1419T. doi : 10.1126/science.aah7393 . PMID 27934705.

Software

Belzile, LR; Dutang, C.; Northrop, PJ; Opitz, T. (2023). "Guía de modelado para software de valor extremo". Extremos . 26 : 595–638. doi :10.1007/s10687-023-00475-9.
"Estadísticas de valores extremos en R". cran.r-project.org (software). 4 de noviembre de 2023.— Paquete para estadísticas de valores extremos en R.
"Extremes.jl". github.com (software).— Paquete para estadísticas de valores extremos en Julia .
"Código fuente para análisis de valores extremos estacionarios y no estacionarios". amir.eng.uci.edu (software). Irvine, CA: Universidad de California, Irvine .

Enlaces externos

Chavez-Demoulin, Valérie; Roehrl, Armin (8 de enero de 2004). La teoría del valor extremo puede salvarle el pescuezo (PDF) . risknet.de (Informe). Alemania.— Introducción fácil y no matemática.

Pasos para aplicar la teoría del valor extremo a las finanzas: una revisión (PDF) . bankofcanada.ca (Informe). Banco de Canadá (publicado en enero de 2010). c. 2010.

Gumbel, EJ , ed. (1935) [1933-1934]. "Les valeurs extrêmes des Distributions statistiques" [Las distribuciones estadísticas de valores extremos] (pdf) . Annales de l'Institut Henri Poincaré (artículos de conferencias) (en francés). 5 (2). Francia: 115-158 . Consultado el 1 de abril de 2009 a través de numdam.org.— Acceso al texto completo de las conferencias celebradas por EJ Gumbel en 1933-1934.