De los cuatro parámetros que definen la familia, la mayor parte de la atención se ha centrado en el parámetro de estabilidad, (véase el panel). Las distribuciones estables tienen , con el límite superior correspondiente a la distribución normal , y a la distribución de Cauchy . Las distribuciones tienen varianza indefinida para , y media indefinida para . La importancia de las distribuciones de probabilidad estables es que son " atractores " para sumas correctamente normalizadas de variables aleatorias independientes e idénticamente distribuidas ( iid ). La distribución normal define una familia de distribuciones estables. Por el teorema clásico del límite central la suma correctamente normalizada de un conjunto de variables aleatorias, cada una con varianza finita, tenderá hacia una distribución normal a medida que aumenta el número de variables. Sin el supuesto de varianza finita, el límite puede ser una distribución estable que no es normal. Mandelbrot se refirió a tales distribuciones como "distribuciones paretianas estables", [3] [4] [5] después de Vilfredo Pareto . En particular, se refirió a aquellas distribuciones máximamente sesgadas en la dirección positiva como "distribuciones de Pareto-Lévy", [1] que consideraba como mejores descripciones de los precios de acciones y materias primas que las distribuciones normales. [6]
Sean X 1 y X 2 realizaciones independientes de una variable aleatoria X . Entonces se dice que X es estable si para cualquier constante a > 0 y b > 0 la variable aleatoria aX 1 + bX 2 tiene la misma distribución que cX + d para algunas constantes c > 0 y d . Se dice que la distribución es estrictamente estable si esto se cumple con d = 0 . [7]
Estas distribuciones forman una familia de cuatro parámetros de distribuciones de probabilidad continua parametrizada por los parámetros de ubicación y escala μ y c , respectivamente, y dos parámetros de forma y , que corresponden aproximadamente a medidas de asimetría y concentración, respectivamente (ver las figuras).
La función característica de cualquier distribución de probabilidad es la transformada de Fourier de su función de densidad de probabilidad . Por lo tanto, la función de densidad es la transformada de Fourier inversa de la función característica: [8]
Aunque la función de densidad de probabilidad para una distribución estable general no se puede escribir analíticamente, la función característica general sí se puede expresar analíticamente. Una variable aleatoria X se llama estable si su función característica se puede escribir como [7] [9]
donde sgn( t ) es solo el signo de t y μ ∈ R es un parámetro de desplazamiento, , llamado parámetro de asimetría , es una medida de asimetría. Nótese que en este contexto la asimetría usual no está bien definida, ya que la distribución no admite 2º momento o momentos superiores , y la definición usual de asimetría es el 3er momento central .
La razón por la que esto da una distribución estable es que la función característica de la suma de dos variables aleatorias independientes es igual al producto de las dos funciones características correspondientes. Sumar dos variables aleatorias de una distribución estable da como resultado algo con los mismos valores de y , pero posiblemente valores diferentes de μ y c .
No todas las funciones son funciones características de una distribución de probabilidad legítima (es decir, una cuya función de distribución acumulativa es real y va de 0 a 1 sin decrecer), pero las funciones características dadas anteriormente serán legítimas siempre que los parámetros estén dentro de sus rangos. El valor de la función característica en algún valor t es el conjugado complejo de su valor en − t como debería ser para que la función de distribución de probabilidad sea real.
En el caso más simple , la función característica es simplemente una función exponencial estirada ; la distribución es simétrica respecto de μ y se denomina distribución alfa-estable simétrica (de Lévy) , a menudo abreviada como SαS .
Cuando y , la distribución se apoya en [ μ , ∞).
El parámetro c > 0 es un factor de escala que es una medida del ancho de la distribución mientras que es el exponente o índice de la distribución y especifica el comportamiento asintótico de la distribución.
Parametrizaciones
La parametrización de distribuciones estables no es única. Nolan [10] tabula 11 parametrizaciones vistas en la literatura y proporciona fórmulas de conversión. Las dos parametrizaciones más utilizadas son la anterior (el "1" de Nolan) y la inmediatamente inferior (el "0" de Nolan).
La parametrización anterior es la más fácil de usar para el trabajo teórico, pero su densidad de probabilidad no es continua en los parámetros en . [11] Una parametrización continua, mejor para el trabajo numérico, es [7]
donde:
Los rangos de y son los mismos que antes, γ (como c ) debe ser positivo y δ (como μ ) debe ser real.
En cualquiera de las dos parametrizaciones se puede realizar una transformación lineal de la variable aleatoria para obtener una variable aleatoria cuya densidad sea . En la primera parametrización, esto se hace definiendo la nueva variable:
Para la segunda parametrización, simplemente use
independiente de . En la primera parametrización, si existe la media (es decir, ) entonces es igual a μ , mientras que en la segunda parametrización cuando existe la media es igual a
La distribución
Por lo tanto, una distribución estable se especifica mediante los cuatro parámetros anteriores. Se puede demostrar que cualquier distribución estable no degenerada tiene una función de densidad suave (infinitamente diferenciable). [7] Si denota la densidad de X e Y es la suma de copias independientes de X :
entonces Y tiene la densidad con
El comportamiento asintótico se describe, para , por: [7]
donde Γ es la función Gamma (excepto que cuando y , la cola no se desvanece hacia la izquierda o derecha, respectivamente, de μ , aunque la expresión anterior es 0). Este comportamiento de " cola pesada " hace que la varianza de las distribuciones estables sea infinita para todos los . Esta propiedad se ilustra en los gráficos log-log a continuación.
Cuando , la distribución es gaussiana (ver abajo), con colas asintóticas a exp(− x 2 /4 c 2 )/(2 c √ π ).
Distribución estable unilateral y distribución de conteo estable
Cuando y , la distribución se apoya en [ μ , ∞). Esta familia se denomina distribución estable unilateral . [12] Su distribución estándar ( μ = 0) se define como
, dónde
Sea , su función característica es . Por lo tanto, la forma integral de su PDF es (nota: )
La integral de doble seno es más efectiva para valores muy pequeños .
Considere la suma de Lévy donde , entonces Y tiene la densidad donde . Establezca para llegar a la distribución de recuento estable . [13] Su distribución estándar se define como
La distribución de recuento estable es la distribución previa conjugada de la distribución estable unilateral. Su familia de ubicación-escala se define como
,
También es una distribución unilateral compatible con . El parámetro de ubicación es la ubicación de corte, mientras que define su escala.
Su media es y su desviación estándar es . Se plantea la hipótesis de que el VIX se distribuye como y ( véase la sección 7 de [13] ). Por lo tanto, la distribución de recuento estable es la distribución marginal de primer orden de un proceso de volatilidad. En este contexto, se denomina "volatilidad de piso".
Otro enfoque para derivar la distribución de conteo estable es utilizar la transformada de Laplace de la distribución estable unilateral (Sección 2.4 de [13] ).
Esto se denomina "descomposición lambda" (consulte la Sección 4 de [13] ) ya que el lado derecho se denominó "distribución lambda simétrica" en los trabajos anteriores de Lihn. Sin embargo, tiene varios nombres más populares, como " distribución de potencia exponencial " o "distribución normal/de error generalizado", a la que a menudo se hace referencia cuando .
El n-ésimo momento de es el -ésimo momento de , y todos los momentos positivos son finitos.
Las distribuciones estables están cerradas bajo convolución .
Las distribuciones estables se cierran bajo convolución para un valor fijo de . Dado que la convolución es equivalente a la multiplicación de la función transformada de Fourier, se deduce que el producto de dos funciones características estables por la misma función dará como resultado otra función característica similar. El producto de dos funciones características estables viene dado por:
Dado que Φ no es una función de las variables μ , c o , se deduce que estos parámetros para la función convolucionada se dan por:
En cada caso, se puede demostrar que los parámetros resultantes se encuentran dentro de los intervalos requeridos para una distribución estable.
El teorema del límite central generalizado
El Teorema del Límite Central Generalizado (GCLT) fue un esfuerzo de varios matemáticos ( Berstein , Lindeberg , Lévy , Feller , Kolmogorov y otros) durante el período de 1920 a 1937. [14]
La primera prueba completa publicada (en francés) del GCLT fue en 1937 por Paul Lévy . [15]
Una versión en inglés de la prueba completa del GCLT está disponible en la traducción del libro de Gnedenko y Kolmogorov de 1954. [16]
La declaración del GLCT es la siguiente: [10]
Una variable aleatoria no degenerada Z es α-estable para algún 0 < α ≤ 2 si y solo si hay una secuencia independiente, idénticamente distribuida de variables aleatorias X 1 , X 2 , X 3 , ... y constantes a n > 0, b n ∈ ℝ con
a n ( X 1 + ... + X n ) − b n → Z.
Aquí → significa que la secuencia de sumas de variables aleatorias converge en distribución; es decir, las distribuciones correspondientes satisfacen F n ( y ) → F ( y ) en todos los puntos de continuidad de F.
En otras palabras, si las sumas de variables aleatorias independientes e idénticamente distribuidas convergen en una distribución hacia algún Z , entonces Z debe ser una distribución estable.
Casos especiales
No existe una solución analítica general para la forma f ( x ). Sin embargo, hay tres casos especiales que pueden expresarse en términos de funciones elementales , como se puede ver al examinar la función característica : [7] [9] [17]
Porque la distribución se reduce a una distribución gaussiana con varianza σ 2 = 2 c 2 y media μ ; el parámetro de asimetría no tiene efecto.
Para y la distribución se reduce a una distribución de Cauchy con parámetro de escala c y parámetro de desplazamiento μ .
Para y la distribución se reduce a una distribución de Lévy con parámetro de escala c y parámetro de desplazamiento μ .
Obsérvese que las tres distribuciones anteriores también están conectadas de la siguiente manera: una variable aleatoria estándar de Cauchy puede verse como una mezcla de variables aleatorias gaussianas (todas con media cero), con la varianza obtenida de una distribución estándar de Lévy. Y, de hecho, este es un caso especial de un teorema más general (véase la pág. 59 de [18] ) que permite que cualquier distribución alfa-estable simétrica se vea de esta manera (con el parámetro alfa de la distribución de mezcla igual al doble del parámetro alfa de la distribución de mezcla, y el parámetro beta de la distribución de mezcla siempre igual a uno).
Una expresión general en forma cerrada para las PDF estables con valores racionales de está disponible en términos de las funciones G de Meijer . [19] Las funciones H de Fox también se pueden utilizar para expresar las funciones de densidad de probabilidad estables. Para números racionales simples, la expresión en forma cerrada es a menudo en términos de funciones especiales menos complicadas . Hay disponibles varias expresiones en forma cerrada que tienen expresiones bastante simples en términos de funciones especiales. En la tabla siguiente, las PDF expresables por funciones elementales se indican con una E y las que se pueden expresar por funciones especiales se indican con una s . [18]
Algunos de los casos especiales se conocen con nombres particulares:
Para y , la distribución es una distribución de Landau ( L ) que tiene un uso específico en física bajo este nombre.
Para y la distribución se reduce a una distribución de Holtsmark con parámetro de escala c y parámetro de desplazamiento μ .
Además, en el límite, cuando c se acerca a cero o cuando α se acerca a cero, la distribución se aproximará a una función delta de Dirac δ ( x − μ ) .
Representación en serie
La distribución estable se puede reformular como la parte real de una integral más simple: [20]
Expresando la segunda exponencial como una serie de Taylor , esto conduce a:
donde . Invirtiendo el orden de integración y suma, y llevando a cabo la integración, se obtiene:
que será válido para x ≠ μ y convergerá para valores apropiados de los parámetros. (Tenga en cuenta que el término n = 0 que produce una función delta en x − μ se ha eliminado). Expresando la primera exponencial como una serie, se obtendrá otra serie en potencias positivas de x − μ que generalmente es menos útil.
Para una distribución estable unilateral, es necesario modificar la expansión en serie anterior, ya que y . No hay una parte real para sumar. En cambio, la integral de la función característica debe realizarse en el eje negativo, lo que da: [21] [12]
Estimación de parámetros
Además de las pruebas existentes para la normalidad y la posterior estimación de parámetros , McCulloch desarrolló un método general que se basa en los cuantiles y funciona tanto para distribuciones estables simétricas como asimétricas y para parámetros de estabilidad . [22]
Simulación de variables estables
No existen expresiones analíticas para la inversa ni para la propia CDF , por lo que el método de inversión no se puede utilizar para generar variables distribuidas de manera estable. [11] [13] Otros enfoques estándar, como el método de rechazo, requerirían cálculos tediosos. Chambers, Mallows y Stuck (CMS) propusieron una solución elegante y eficiente, [23] quienes observaron que una determinada fórmula integral [24] producía el siguiente algoritmo: [25]
generar una variable aleatoria uniformemente distribuida y una variable aleatoria exponencial independiente con media 1;
Para calcular:
para calcular: donde
Este algoritmo produce una variable aleatoria . Para una prueba detallada, véase [26] .
Para simular una variable aleatoria estable para todos los valores admisibles de los parámetros , , y use la siguiente propiedad: Si entonces
es . Para (y ) el método CMS se reduce a la conocida transformada de Box-Muller para generar variables aleatorias gaussianas . [27] Si bien se han propuesto otros enfoques en la literatura, incluida la aplicación de las expansiones de series de Bergström [28] y LePage [29] , el método CMS se considera el más rápido y el más preciso.
Aplicaciones
Las distribuciones estables deben su importancia, tanto en la teoría como en la práctica, a la generalización del teorema del límite central a variables aleatorias sin momentos de segundo (y posiblemente de primer) orden y la autosimilitud que lo acompaña de la familia estable. Fue la aparente desviación de la normalidad junto con la demanda de un modelo autosimilar para los datos financieros (es decir, la forma de la distribución para los cambios anuales de precios de los activos debería parecerse a la de los cambios de precios diarios o mensuales constituyentes) lo que llevó a Benoît Mandelbrot a proponer que los precios del algodón siguen una distribución alfa estable con un coeficiente de variación igual a 1,7. [6] Las distribuciones de Lévy se encuentran con frecuencia en el análisis de comportamientos críticos y datos financieros. [9] [30]
La distribución de Lévy de los eventos de tiempo de espera de erupciones solares (tiempo entre eventos de erupciones) se demostró para las erupciones solares de rayos X duros de CGRO BATSE en diciembre de 2001. El análisis de la firma estadística de Lévy reveló que eran evidentes dos firmas de memoria diferentes: una relacionada con el ciclo solar y la segunda cuyo origen parece estar asociado con efectos localizados o una combinación de efectos localizados de la región activa solar. [31]
Otros casos analíticos
Se conocen varios casos de distribuciones estables expresables analíticamente. Sea la distribución estable expresada por , entonces:
El programa STABLE para Windows está disponible en la página web estable de John Nolan: http://www.robustanalysis.com/public/stable.html. Calcula la densidad (pdf), la función de distribución acumulativa (cdf) y los cuantiles para una distribución estable general, y realiza una estimación de máxima verosimilitud de los parámetros estables y algunas técnicas de análisis exploratorio de datos para evaluar el ajuste de un conjunto de datos.
La biblioteca científica GNU , escrita en C, tiene un paquete randist que incluye, entre las distribuciones Gaussiana y Cauchy, también una implementación de la distribución alfa-estable de Levy, con y sin parámetro de asimetría.
libstable es una implementación en C para las funciones de distribución estable pdf, cdf, números aleatorios, cuantiles y de ajuste (junto con un paquete de replicación de referencia y un paquete R).
Paquete R 'stabledist' de Diethelm Wuertz, Martin Maechler y miembros del equipo central de Rmetrics. Calcula densidad estable, probabilidad, cuantiles y números aleatorios.
Julia ofrece el paquete StableDistributions.jl, que contiene métodos de generación, ajuste, densidad de probabilidad, función de distribución acumulativa, funciones características y generadoras de momentos, funciones cuantiles y relacionadas, convolución y transformaciones afines de distribuciones estables. Utiliza algoritmos modernizados y mejorados por John P. Nolan. [10]
Referencias
^ ab Mandelbrot, B. (1960). "La ley de Pareto-Lévy y la distribución del ingreso". Revista Económica Internacional . 1 (2): 79–106. doi :10.2307/2525289. JSTOR 2525289.
^ Levy, Paul (1925). Cálculo de probabilidades . París: Gauthier-Villars. OCLC 1417531.
^ Mandelbrot, B. (1961). "Funciones aleatorias paretianas estables y variación multiplicativa del ingreso". Econometrica . 29 (4): 517–543. doi :10.2307/1911802. JSTOR 1911802.
^ Mandelbrot, B. (1963). "La variación de ciertos precios especulativos". The Journal of Business . 36 (4): 394–419. doi :10.1086/294632. JSTOR 2350970.
^ Fama, Eugene F. (1963). "Mandelbrot y la hipótesis paretiana estable". The Journal of Business . 36 (4): 420–429. doi :10.1086/294633. JSTOR 2350971.
^ ab Mandelbrot, B. (1963). "Nuevos métodos en economía estadística". Revista de Economía Política . 71 (5): 421–440. doi :10.1086/258792. S2CID 53004476.
^ abcdef Nolan, John P. "Distribuciones estables: modelos para datos de cola pesada" (PDF) . Archivado desde el original (PDF) el 17 de julio de 2011. Consultado el 21 de febrero de 2009 .
^ Siegrist, Kyle. "Distribuciones estables". www.randomservices.org . Consultado el 18 de octubre de 2018 .
^ abc Voit, Johannes (2005). Balian, R; Beiglböck, W; Grosse, H; Thirring, W (eds.). La mecánica estadística de los mercados financieros – Springer . Textos y monografías de física. Springer. doi :10.1007/b137351. ISBN978-3-540-26285-5.
^ abc Nolan, John P. (2020). Distribuciones estables univariadas, modelos para datos de cola pesada. Springer Series en investigación de operaciones e ingeniería financiera. Suiza: Springer. doi :10.1007/978-3-030-52915-4. ISBN978-3-030-52914-7.S2CID226648987 .
^ ab Nolan, John P. (1997). "Cálculo numérico de densidades estables y funciones de distribución". Comunicaciones en Estadística. Modelos Estocásticos . 13 (4): 759–774. doi :10.1080/15326349708807450. ISSN 0882-0287.
^ ab Penson, KA; Górska, K. (17 de noviembre de 2010). "Densidades de probabilidad exactas y explícitas para distribuciones estables de Lévy unilaterales". Physical Review Letters . 105 (21): 210604. arXiv : 1007.0193 . Código Bibliográfico :2010PhRvL.105u0604P. doi :10.1103/PhysRevLett.105.210604. PMID 21231282. S2CID 27497684.
^ abcde Lihn, Stephen (2017). "Una teoría del rendimiento y la volatilidad de los activos bajo una ley estable y una distribución lambda estable". SSRN .
^ Le Cam, L. (febrero de 1986). "El teorema del límite central en torno a 1935". Ciencia estadística . 1 (1): 78–91. JSTOR 2245503.
^ Levy, Paul (1937). Theorie de l'addition des variables aleatoires [Teoría de la combinación de variables impredecibles] . París: Gauthier-Villars.
^ Gnedenko, Boris Vladimirovich; Kologorov, Andreĭ Nikolaevich; Doob, Joseph L.; Hsu, Pao-Lu (1968). Distribuciones límite para sumas de variables aleatorias independientes . Reading, MA: Addison-Wesley.
^ Samorodnitsky, G.; Taqqu, MS (1994). Procesos aleatorios no gaussianos estables: modelos estocásticos con varianza infinita. CRC Press. ISBN9780412051715.
^ ab Lee, Wai Ha (2010). Propiedades continuas y discretas de procesos estocásticos. Tesis doctoral, Universidad de Nottingham.
^ Zolotarev, V. (1995). "Sobre la representación de densidades de leyes estables mediante funciones especiales". Teoría de la probabilidad y sus aplicaciones . 39 (2): 354–362. doi :10.1137/1139025. ISSN 0040-585X.
^ ab Peach, G. (1981). "Teoría del ensanchamiento y desplazamiento de las líneas espectrales por presión". Avances en Física . 30 (3): 367–474. Bibcode :1981AdPhy..30..367P. doi :10.1080/00018738100101467. ISSN 0001-8732.
^ Pollard, Howard (1946). "Representación de e^{-x^\lambda} como una integral de Laplace". Bull. Amer. Math. Soc . 52 : 908. doi : 10.1090/S0002-9904-1946-08672-3 .
^ McCulloch, J Huston (1986). "Estimadores consistentes simples de parámetros de distribución estable" (PDF) . Comunicaciones en Estadística. Simulación y Computación . 15 : 1109–1136. doi :10.1080/03610918608812563.
^ Chambers, JM; Mallows, CL; Stuck, BW (1976). "Un método para simular variables aleatorias estables". Revista de la Asociación Estadounidense de Estadística . 71 (354): 340–344. doi :10.1080/01621459.1976.10480344. ISSN 0162-1459.
^ Misiorek, Adam; Weron, Rafał (2012). Gentle, James E.; Härdle, Wolfgang Karl; Mori, Yuichi (eds.). Distribuciones de cola pesada en cálculos VaR (PDF) . Springer Handbooks of Computational Statistics. Springer Berlin Heidelberg. págs. 1025–1059. doi :10.1007/978-3-642-21551-3_34. ISBN978-3-642-21550-6.
^ Weron, Rafał (1996). "Sobre el método Chambers-Mallows-Stuck para simular variables aleatorias estables sesgadas". Statistics & Probability Letters . 28 (2): 165–171. CiteSeerX 10.1.1.46.3280 . doi :10.1016/0167-7152(95)00113-1. S2CID 9500064.
^ Janicki, Aleksander; Weron, Aleksander (1994). Simulación y comportamiento caótico de procesos estocásticos alfa-estables. CRC Press. ISBN9780824788827.
^ Mantegna, Rosario Nunzio (1994). "Algoritmo rápido y preciso para la simulación numérica de procesos estocásticos estables de Lévy". Physical Review E . 49 (5): 4677–4683. Bibcode :1994PhRvE..49.4677M. doi :10.1103/PhysRevE.49.4677. PMID 9961762.
^ Janicki, Aleksander; Kokoszka, Piotr (1992). "Investigación informática de la tasa de convergencia de series de tipo Lepage a variables aleatorias α-estables". Estadísticas . 23 (4): 365–373. doi :10.1080/02331889208802383. ISSN 0233-1888.
^ Rachev, Svetlozar T.; Mittnik, Stefan (2000). Modelos paretianos estables en finanzas. Wiley. ISBN978-0-471-95314-2.
^ Leddon, D., Un estudio estadístico de las erupciones solares de rayos X duros
^ ab Garoni, TM; Frankel, NE (2002). "Vuelos de Lévy: resultados exactos y asintóticos más allá de todos los órdenes". Journal of Mathematical Physics . 43 (5): 2670–2689. Bibcode :2002JMP....43.2670G. doi :10.1063/1.1467095.
^ ab Hopcraft, KI; Jakeman, E.; Tanner, RMJ (1999). "Paseos aleatorios de Lévy con número de pasos fluctuante y comportamiento multiescala". Physical Review E . 60 (5): 5327–5343. Bibcode :1999PhRvE..60.5327H. doi :10.1103/physreve.60.5327. PMID 11970402.
^ Uchaikin, VV; Zolotarev, VM (1999). "Azar y estabilidad: distribuciones estables y sus aplicaciones". VSP .
^ Zlotarev, VM (1961). "Expresión de la densidad de una distribución estable con exponente alfa mayor que uno mediante una frecuencia con exponente 1/alfa". Traducciones seleccionadas en estadística matemática y probabilidad (traducido del artículo ruso: Dokl. Akad. Nauk SSSR. 98, 735–738 (1954)) . 1 : 163–167.
^ Zaliapin, IV; Kagan, YY; Schoenberg, FP (2005). "Aproximación de la distribución de sumas de Pareto". Geofísica pura y aplicada . 162 (6): 1187–1228. Bibcode :2005PApGe.162.1187Z. doi :10.1007/s00024-004-2666-3. S2CID 18754585.