Existen dos enfoques principales para el análisis práctico de valores extremos.
El primer método se basa en derivar series de máximos (mínimos) de bloques como paso preliminar. En muchas situaciones es habitual y conveniente extraer los máximos anuales (mínimos), generando una serie de máximos anuales (AMS).
El segundo método se basa en extraer, de un registro continuo, los valores máximos alcanzados durante cualquier período durante el cual los valores superan un determinado umbral (caen por debajo de un determinado umbral). Este método generalmente se conoce como método de pico sobre umbral (POT). [1]
Para los datos de AMS, el análisis puede depender en parte de los resultados del teorema de Fisher-Tippett-Gnedenko , lo que lleva a que se seleccione la distribución generalizada de valores extremos para el ajuste. [2] [3] Sin embargo, en la práctica, se aplican varios procedimientos para seleccionar entre una gama más amplia de distribuciones. El teorema aquí se relaciona con las distribuciones límite para el mínimo o el máximo de una colección muy grande de variables aleatorias independientes de la misma distribución. Dado que el número de eventos aleatorios relevantes dentro de un año puede ser bastante limitado, no es sorprendente que los análisis de los datos de AMS observados a menudo conduzcan a la selección de distribuciones distintas a la distribución de valores extremos generalizados (GEVD). [4]
Para los datos POT, el análisis puede implicar ajustar dos distribuciones: una para el número de eventos en un período de tiempo considerado y una segunda para el tamaño de las excedencias.
Novak (2011) reserva el término "método POT" para el caso en el que el umbral no es aleatorio y lo distingue del caso en el que se trata de superaciones de un umbral aleatorio. [7]
Aplicaciones
Las aplicaciones de la teoría de valores extremos incluyen predecir la distribución de probabilidad de:
El campo de la teoría del valor extremo fue iniciado por L. Tippett (1902-1985). Tippett fue empleado de la Asociación Británica de Investigación de la Industria del Algodón , donde trabajó para fortalecer el hilo de algodón. En sus estudios, se dio cuenta de que la fuerza de un hilo estaba controlada por la fuerza de sus fibras más débiles. Con la ayuda de RA Fisher , Tippet obtuvo tres límites asintóticos que describen las distribuciones de los extremos suponiendo variables independientes. EJ Gumbel (1958) [22] codificó esta teoría. Estos resultados pueden ampliarse para permitir correlaciones leves entre variables, pero la teoría clásica no se extiende a correlaciones fuertes del orden de la varianza. Una clase de universalidad de particular interés es la de los campos logarítmicamente correlacionados , donde las correlaciones decaen logarítmicamente con la distancia.
Teoría univariada
La teoría de los valores extremos de una sola variable se rige por el teorema del valor extremo , también llamado teorema de Fisher-Tippett-Gnedenko , que describe cuál de las tres distribuciones posibles para valores extremos se aplica a una variable estadística particular que se resume en esta sección. .
En teoría, se puede derivar la distribución exacta del máximo:
El valor de la función indicadora asociada es un proceso de Bernoulli con una probabilidad de éxito que depende de la magnitud del evento extremo. Por lo tanto , el número de eventos extremos dentro de las pruebas sigue una distribución binomial y el número de pruebas hasta que ocurre un evento sigue una distribución geométrica con valor esperado y desviación estándar del mismo orden.
En la práctica, es posible que no tengamos la función de distribución , pero el teorema de Fisher-Tippett-Gnedenko proporciona un resultado asintótico. Si existen secuencias de constantes emparejadas con y tales que
como entonces
donde el parámetro depende de qué tan pronunciado disminuyen las colas de la distribución (llamadas colas "ordinarias" , colas "delgadas" y colas "gordas" , con la distribución normal colocada en el " grupo de cola "delgada" en lugar de "ordinario" para este contexto, al menos). Cuando está normalizado, pertenece a una de las siguientes familias de distribución no degeneradas :
cuando la distribución de tiene una cola delgada con límite superior finito.
Teoría multivariada
La teoría del valor extremo en más de una variable introduce cuestiones adicionales que deben abordarse. Un problema que surge es que hay que especificar qué constituye un evento extremo. [23]
Aunque esto es sencillo en el caso univariado, no existe una forma inequívoca de hacerlo en el caso multivariado. El problema fundamental es que, aunque es posible ordenar un conjunto de números con valores reales, no existe una forma natural de ordenar un conjunto de vectores.
Como ejemplo, en el caso univariado, dado un conjunto de observaciones, es sencillo encontrar el evento más extremo simplemente tomando el máximo (o mínimo) de las observaciones. Sin embargo, en el caso bivariado, dado un conjunto de observaciones , no queda inmediatamente claro cómo encontrar el evento más extremo. Supongamos que se han medido los valores en un momento específico y los valores en un momento posterior. ¿Cuál de estos eventos se consideraría más extremo? No existe una respuesta universal a esta pregunta.
Otro problema en el caso multivariado es que el modelo limitante no está tan completamente prescrito como en el caso univariado. En el caso univariado, el modelo ( distribución GEV ) contiene tres parámetros cuyos valores no son predichos por la teoría y deben obtenerse ajustando la distribución a los datos. En el caso multivariado, el modelo no sólo contiene parámetros desconocidos, sino también una función cuya forma exacta no está prescrita por la teoría. Sin embargo, esta función debe obedecer a ciertas restricciones. [24] [25]
No es sencillo diseñar estimadores que obedezcan tales restricciones, aunque algunos se han construido recientemente. [26] [27] [28]
Como ejemplo de aplicación, la teoría bivariada de valores extremos se ha aplicado a la investigación oceánica. [23] [29]
Extremos no estacionarios
En la década de 1990 se desarrollaron modelos estadísticos para series temporales no estacionarias. [30] Más recientemente se han introducido métodos para extremos multivariados no estacionarios. [31]
Este último se puede utilizar para rastrear cómo la dependencia entre valores extremos cambia con el tiempo o con otra covariable. [32] [33] [34]
^ Leadbetter, señor (1991). "Sobre una base para el modelado de 'picos por encima del umbral'". Cartas de Estadística y Probabilidad . 12 (4): 357–362. doi :10.1016/0167-7152(91)90107-3.
^ Pescador y Tippett (1928)
^ Gnedenko (1943)
^ Embrechts, Klüppelberg y Mikosch (1997)
^ Pickands (1975)
^ Balkema y de Haan (1974)
^ Novak (2011)
^ Tippett, Lepore y Cohen (2016)
^ Batt, Ryan D.; Carpintero, Stephen R.; Ives, Anthony R. (marzo de 2017). "Eventos extremos en series temporales de ecosistemas lacustres". Letras de Limnología y Oceanografía . 2 (3): 63. Código bibliográfico : 2017LimOL...2...63B. doi : 10.1002/lol2.10037 .
^ Alvarado, Sandberg y Pickford (1998), pág. 68
^ Makkonen (2008)
^ Einmahl, JHJ; Smeets, SGWR (2009). Últimos récords mundiales de 100 metros a través de la teoría del valor extremo (PDF) (Reporte). Documento de debate del Centro. vol. 57. Universidad de Tilburg. Archivado desde el original (PDF) el 12 de marzo de 2016 . Consultado el 12 de agosto de 2009 .
^ Gembris, D.; Taylor, J.; Suter, D. (2002). "Tendencias y fluctuaciones aleatorias en el atletismo". Naturaleza . 417 (6888): 506. Bibcode :2002Natur.417..506G. doi : 10.1038/417506a . hdl : 2003/25362. PMID 12037557. S2CID 13469470.
^ Gembris, D.; Taylor, J.; Suter, D. (2007). "Evolución de los récords deportivos: efectos estadísticos versus mejoras reales". Revista de Estadística Aplicada . 34 (5): 529–545. Código Bib : 2007JApSt..34..529G. doi :10.1080/02664760701234850. hdl : 2003/25404. S2CID 55378036.
^ Lanza, H.; Tawn, J.; Hierros, D.; Paulden, T.; Bennett, G. (2021). "Clasificación y otras propiedades de nadadores de élite utilizando la teoría del valor extremo". Revista de la Real Sociedad de Estadística . Serie A (La Estadística en la Sociedad). 184 (1): 368–395. arXiv : 1910.10070 . doi : 10.1111/rssa.12628 . S2CID 204823947.
^ Songchitruksa, P.; Tarko, AP (2006). "El enfoque de la teoría del valor extremo para la estimación de seguridad". Análisis y Prevención de Accidentes . 38 (4): 811–822. doi :10.1016/j.aap.2006.02.003. PMID 16546103.
^ Orsini, F.; Gecchele, G.; Gastaldi, M.; Rossi, R. (2019). "Predicción de colisiones en rotondas: un estudio comparativo de enfoques de la teoría de valores extremos". Transportmétrica . Serie A: Ciencia del transporte. 15 (2): 556–572. doi :10.1080/23249935.2018.1515271. S2CID 158343873.
^ Tsinos, CG; Foukalas, F.; Khattab, T.; Lai, L. (febrero de 2018). "Sobre la selección de canales para sistemas de agregación de operadores". Transacciones IEEE sobre Comunicaciones . 66 (2): 808–818. doi :10.1109/TCOMM.2017.2757478. S2CID 3405114.
^ Wong, Félix; Collins, James J. (2 de noviembre de 2020). "La evidencia de que la superpropagación del coronavirus tiene cola gruesa". Actas de la Academia Nacional de Ciencias de EE. UU . 117 (47): 29416–29418. Código Bib : 2020PNAS..11729416W. doi : 10.1073/pnas.2018490117 . ISSN 0027-8424. PMC 7703634 . PMID 33139561.
^ Basnayake, Kanishka; Mazaud, David; Bemelmans, Alexis; Rouach, Nathalie; Korkotian, Eduard; Holcman, David (4 de junio de 2019). "Transitorios rápidos de calcio en espinas dendríticas impulsados por estadísticas extremas". Más biología . 17 (6): e2006202. doi : 10.1371/journal.pbio.2006202 . ISSN 1545-7885. PMC 6548358 . PMID 31163024.
^ Younis, Abubaker; Abdeljalil, Anwar; Omer, Ali (1 de enero de 2023). "Determinación del factor de generación de paneles utilizando el método de picos por encima del umbral y datos a corto plazo para un sistema fotovoltaico fuera de la red en Sudán: un caso de la ciudad de Jartum". Energía solar . 249 : 242–249. Código Bib :2023SoEn..249..242Y. doi :10.1016/j.solener.2022.11.039. ISSN 0038-092X. S2CID 254207549.
^ Gumbel (2004)
^ ab Morton, identificación; Bowers, J. (diciembre de 1996). "Análisis de valor extremo en un entorno offshore multivariado". Investigación oceánica aplicada . 18 (6): 303–317. Código Bib : 1996AppOR..18..303M. doi :10.1016/s0141-1187(97)00007-2. ISSN 0141-1187.
^ Beirlant, enero; Goegebeur, Yuri; Teugels, Józef; Segers, Johan (27 de agosto de 2004). Estadística de Extremos: Teoría y aplicaciones . Serie Wiley en probabilidad y estadística. Chichester, Reino Unido: John Wiley & Sons, Ltd. doi :10.1002/0470012382. ISBN978-0-470-01238-3.
^ Coles, Estuardo (2001). Introducción al modelado estadístico de valores extremos . Serie Springer en Estadística. doi :10.1007/978-1-4471-3675-0. ISBN978-1-84996-874-4. ISSN 0172-7397.
^ de Carvalho, M.; Davison, AC (2014). "Modelos de relación de densidad espectral para extremos multivariados" (PDF) . Revista de la Asociación Estadounidense de Estadística . 109 : 764‒776. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID 53338058.
^ Hanson, T.; de Carvalho, M.; Chen, Yuhui (2017). "Densidades angulares polinómicas de Bernstein de distribuciones multivariadas de valores extremos" (PDF) . Cartas de Estadística y Probabilidad . 128 : 60–66. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID 53338058.
^ de Carvalho, M. (2013). "Un estimador de probabilidad euclidiana para la dependencia bivariada de la cola" (PDF) . Comunicaciones en estadística: teoría y métodos . 42 (7): 1176-1192. arXiv : 1204.3524 . doi :10.1080/03610926.2012.709905. S2CID 42652601.
^ Zacarías, S.; Feld, G.; Ward, G.; Wolfram, J. (octubre de 1998). "Extrapolación multivariante en el entorno offshore". Investigación oceánica aplicada . 20 (5): 273–295. Código Bib : 1998AppOR..20..273Z. doi :10.1016/s0141-1187(98)00027-3. ISSN 0141-1187.
^ Davison, CA; Smith, Richard (1990). "Modelos de superación de umbrales elevados". Revista de la Real Sociedad de Estadística . Serie B (Metodológica). 52 (3): 393–425. doi :10.1111/j.2517-6161.1990.tb01796.x.
^ de Carvalho, M. (2016). "Estadísticas de extremos: Retos y oportunidades". Manual de EVT y sus aplicaciones a las finanzas y los seguros (PDF) . Hoboken, Nueva Jersey: Hijos de John Wiley. págs. 195-214. ISBN978-1-118-65019-6.
^ Castro, D.; de Carvalho, M.; Wadsworth, J. (2018). "Dependencia del valor extremo variable en el tiempo con aplicación a los principales mercados de valores europeos" (PDF) . Anales de Estadística Aplicada . 12 : 283–309. doi :10.1214/17-AOAS1089. S2CID 33350408.
^ Mhalla, L.; de Carvalho, M.; Chávez-Demoulin, V. (2019). «Modelos de tipo regresión para dependencia extrema» (PDF) . Revista escandinava de estadística . 46 (4): 1141-1167. doi :10.1111/sjos.12388. S2CID 53570822.
^ Mhalla, L.; de Carvalho, M.; Chávez-Demoulin, V. (2018). "Estimación local robusta de la función de dependencia de Pickands". Anales de Estadística . 46 (6A): 2806–2843. doi : 10.1214/17-AOS1640 . S2CID 59467614.
Fuentes
Abarbanel, H.; Koonin, S.; Levine, H.; MacDonald, G.; Rothaus, O. (enero de 1992). «Estadísticas de eventos extremos con aplicación al clima» (PDF) . JASÓN . JSR-90-30S . Consultado el 3 de marzo de 2015 .
Alvarado, Ernesto; Sandberg, David V.; Pickford, Stewart G. (1998). "Modelado de grandes incendios forestales como eventos extremos" (PDF) . Ciencia del Noroeste . 72 : 66–75. Archivado desde el original (PDF) el 26 de febrero de 2009 . Consultado el 6 de febrero de 2009 .
Balkema, A.; de Haan, Laurens (1974). "Tiempo de vida residual a gran edad". Anales de probabilidad . 2 (5): 792–804. doi : 10.1214/aop/1176996548 . JSTOR 2959306.
Burry, KV (1975). Métodos estadísticos en ciencias aplicadas . Hoboken, Nueva Jersey: John Wiley & Sons.
Castillo, E. (1988). Teoría del valor extremo en ingeniería . Nueva York, Nueva York: Academic Press. ISBN 0-12-163475-2.
Castillo, E.; Hadi, AS; Balakrishnan, N.; Sarabia, JM (2005). Valor extremo y modelos relacionados con aplicaciones en ingeniería y ciencia . Serie Wiley en probabilidad y estadística. Hoboken, Nueva Jersey: Hijos de John Wiley. ISBN 0-471-67172-X.
Coles, S. (2001). Introducción al modelado estadístico de valores extremos . Londres, Reino Unido: Springer.
Embrechts, P.; Klüppelberg, C .; Mikosch, T. (1997). Modelado de eventos extremos para seguros y finanzas . Berlín, DE: Springer Verlag.
Gnedenko, BV (1943). "Sur la Distribution limite du terme maxime d'une serie aleatoire" [Sobre la(s) distribución(es) límite del valor máximo de una serie...]. Anales de Matemáticas (en francés). 44 (3): 423–453. doi :10.2307/1968974. JSTOR 1968974.
Gumbel, EJ , ed. (1935) [1933-1934]. "Les valeurs extrêmes des Distributions statistiques" [Las distribuciones estadísticas de valores extremos] (pdf) . Annales de l'institut Henri Poincaré (artículos de conferencias) (en francés). Francia. 5 (2): 115-158 . Consultado el 1 de abril de 2009 a través de numdam.org.
Gumbel, EJ (2004) [1958]. Estadísticas de extremos (reimpresión ed.). Mineola, Nueva York: Dover. ISBN 978-0-486-43604-3.
Makkonen, L. (2008). "Problemas en el análisis de valores extremos". Seguridad Estructural . 30 (5): 405–419. doi :10.1016/j.strusafe.2006.12.001.
Leadbetter, MR (1991). "Sobre una base para el modelado de 'picos por encima del umbral'". Cartas de estadística y probabilidad . 12 (4): 357–362. doi :10.1016/0167-7152(91)90107-3.
Leadbetter, señor; Lindgren, G.; Rootzen, H. (1982). Extremos y propiedades relacionadas de procesos y secuencias aleatorias . Nueva York, Nueva York: Springer-Verlag.
Lindgren, G.; Rootzen, H. (1987). "Valores extremos: Teoría y aplicaciones técnicas". Revista escandinava de estadística, teoría y aplicaciones . 14 : 241–279.
Novak, SY (2011). Métodos de valor extremo con aplicaciones a las finanzas . Londres, Reino Unido / Boca Raton, FL: Chapman & Hall / CRC Press. ISBN 978-1-4398-3574-6.
Pickands, J. (1975). "Inferencia estadística utilizando estadísticas de orden extremo". Anales de Estadística . 3 : 119-131. doi : 10.1214/aos/1176343003 .
Tippett, Michael K.; Lepore, Chiara; Cohen, Joel E. (16 de diciembre de 2016). "Más tornados en los brotes de tornados más extremos en Estados Unidos". Ciencia . 354 (6318): 1419-1423. Código Bib : 2016 Ciencia... 354.1419T. doi : 10.1126/ciencia.aah7393 . PMID 27934705.
Software
"Estadísticas de valores extremos en R". cran.r-project.org (software). 4 de noviembre de 2023.— Paquete para estadísticas de valores extremos en R.
"Extremos.jl". github.com (software).— Paquete para estadísticas de valores extremos en Julia .
"Código fuente para análisis de valores extremos estacionarios y no estacionarios". amir.eng.uci.edu (software). Irvine, CA: Universidad de California, Irvine .
enlaces externos
Chávez-Demoulin, Valérie; Roehrl, Armin (8 de enero de 2004). La teoría del valor extremo puede salvarle el cuello (PDF) . Risknet.de (Informe). Alemania.— Introducción sencilla y no matemática.
Pasos para aplicar la teoría del valor extremo a las finanzas: una revisión (PDF) . bankofcanada.ca (Reporte). Banco de Canadá (publicado en enero de 2010). C. 2010.
Gumbel, EJ , ed. (1935) [1933-1934]. "Les valeurs extrêmes des Distributions statistiques" [Las distribuciones estadísticas de valores extremos] (pdf) . Annales de l'institut Henri Poincaré (artículos de conferencias) (en francés). Francia. 5 (2): 115-158 . Consultado el 1 de abril de 2009 a través de numdam.org.— Acceso al texto completo de las conferencias celebradas por EJ Gumbel en 1933-1934.