De los cuatro parámetros que definen a la familia, la mayor atención se ha centrado en el parámetro de estabilidad (ver panel). Las distribuciones estables tienen , con el límite superior correspondiente a la distribución normal y a la distribución de Cauchy . Las distribuciones tienen una varianza indefinida y una media indefinida para . La importancia de las distribuciones de probabilidad estables es que son " atractores " de sumas adecuadamente normalizadas de variables aleatorias independientes e idénticamente distribuidas ( iid ). La distribución normal define una familia de distribuciones estables. Según el teorema clásico del límite central , la suma adecuadamente normada de un conjunto de variables aleatorias, cada una con varianza finita, tenderá hacia una distribución normal a medida que aumenta el número de variables. Sin el supuesto de varianza finita, el límite puede ser una distribución estable que no es normal. Mandelbrot se refirió a tales distribuciones como "distribuciones paretianas estables", [3] [4] [5] en honor a Vilfredo Pareto . En particular, se refirió a aquellas con un sesgo máximo en la dirección positiva como "distribuciones de Pareto-Lévy", [1] que consideraba mejores descripciones de los precios de las acciones y las materias primas que las distribuciones normales. [6]
Sean X 1 y X 2 realizaciones independientes de una variable aleatoria X . Entonces se dice que X es estable si para cualesquiera constantes a > 0 y b > 0 la variable aleatoria aX 1 + bX 2 tiene la misma distribución que cX + d para algunas constantes c > 0 y d . Se dice que la distribución es estrictamente estable si esto se cumple con d = 0 . [7]
Dichas distribuciones forman una familia de cuatro parámetros de distribuciones de probabilidad continuas parametrizadas por los parámetros de ubicación y escala μ y c , respectivamente, y dos parámetros de forma y , que corresponden aproximadamente a medidas de asimetría y concentración, respectivamente (ver las figuras).
La función característica de cualquier distribución de probabilidad es la transformada de Fourier de su función de densidad de probabilidad . La función de densidad es, por tanto, la transformada de Fourier inversa de la función característica: [8]
Aunque la función de densidad de probabilidad para una distribución estable general no se puede escribir analíticamente, la función característica general se puede expresar analíticamente. Una variable aleatoria X se llama estable si su función característica se puede escribir como [7] [9]
donde sgn( t ) es solo el signo de t y μ ∈ R es un parámetro de desplazamiento, llamado parámetro de asimetría , es una medida de asimetría. Observe que en este contexto la asimetría habitual no está bien definida, ya que la distribución no admite segundos momentos o superiores , y la definición de asimetría habitual es el tercer momento central .
La razón por la que esto da una distribución estable es que la función característica para la suma de dos variables aleatorias independientes es igual al producto de las dos funciones características correspondientes. Agregar dos variables aleatorias de una distribución estable da algo con los mismos valores de y , pero posiblemente valores diferentes de μ y c .
No todas las funciones son funciones características de una distribución de probabilidad legítima (es decir, una cuya función de distribución acumulativa es real y va de 0 a 1 sin disminuir), pero las funciones características dadas anteriormente serán legítimas siempre que los parámetros estén en su mismo orden. rangos. El valor de la función característica en algún valor t es el conjugado complejo de su valor en − t como debería ser para que la función de distribución de probabilidad sea real.
En el caso más simple , la función característica es simplemente una función exponencial extendida ; la distribución es simétrica con respecto a μ y se conoce como distribución alfa-estable simétrica (Lévy) , a menudo abreviada SαS .
Cuando y , la distribución se apoya en [ μ , ∞).
El parámetro c > 0 es un factor de escala que es una medida del ancho de la distribución, mientras que es el exponente o índice de la distribución y especifica el comportamiento asintótico de la distribución.
Parametrizaciones
La parametrización de distribuciones estables no es única. Nolan [10] tabula 11 parametrizaciones vistas en la literatura y proporciona fórmulas de conversión. Las dos parametrizaciones más utilizadas son la de arriba (el "1" de Nolan) y la que está inmediatamente debajo (el "0" de Nolan).
La parametrización anterior es más fácil de usar para el trabajo teórico, pero su densidad de probabilidad no es continua en los parámetros en . [11] Una parametrización continua, mejor para trabajo numérico, es [7]
donde:
Los rangos de y son los mismos que antes, γ (como c ) debe ser positivo y δ (como μ ) debe ser real.
En cualquiera de las parametrizaciones se puede realizar una transformación lineal de la variable aleatoria para obtener una variable aleatoria cuya densidad sea . En la primera parametrización esto se hace definiendo la nueva variable:
Para la segunda parametrización, simplemente use
independiente de . En la primera parametrización, si la media existe (es decir, ) entonces es igual a μ , mientras que en la segunda parametrización cuando la media existe es igual a
la distribucion
Por lo tanto, los cuatro parámetros anteriores especifican una distribución estable. Se puede demostrar que cualquier distribución estable no degenerada tiene una función de densidad suave (infinitamente diferenciable). [7] Si denota la densidad de X e Y es la suma de copias independientes de X :
entonces Y tiene la densidad con
El comportamiento asintótico se describe, para , por: [7]
donde Γ es la función Gamma (excepto que cuando y , la cola no desaparece hacia la izquierda o hacia la derecha, respectivamente, de μ , aunque la expresión anterior es 0). Este comportamiento de " cola pesada " hace que la varianza de las distribuciones estables sea infinita para todos . Esta propiedad se ilustra en los gráficos log-log a continuación.
Cuando , la distribución es gaussiana (ver más abajo), con colas asintóticas a exp(− x 2 /4 c 2 )/(2 c √π).
Distribución estable unilateral y distribución de conteo estable
Cuando y , la distribución se soporta en [ μ , ∞). Esta familia se llama distribución estable unilateral . [12] Su distribución estándar (μ=0) se define como
, dónde .
Sea , su función característica es . Por tanto, la forma integral de su PDF es (nota: )
La integral de doble seno es más efectiva para valores muy pequeños .
Considere la suma de Lévy donde , entonces Y tiene la densidad donde . Listo para llegar a la distribución de recuento estable . [13] Su distribución estándar se define como
, dónde y .
La distribución de recuento estable es el prior conjugado de la distribución estable unilateral. Su familia de escala de ubicación se define como
, donde , , y .
También es una distribución unilateral compatible con . El parámetro de ubicación es la ubicación de corte, mientras que define su escala.
Su media es y su desviación estándar es . Se plantea la hipótesis de que VIX se distribuye como con y (consulte la Sección 7 de [13] ). Por tanto, la distribución de recuento estable es la distribución marginal de primer orden de un proceso de volatilidad. En este contexto, se denomina "piso de volatilidad".
Otro enfoque para derivar la distribución de recuento estable es utilizar la transformada de Laplace de la distribución estable unilateral (Sección 2.4 de [13] ).
, dónde .
Sea , y se puede descomponer la integral del lado izquierdo como una distribución del producto de una distribución estándar de Laplace y una distribución estándar de conteo estable,f
, dónde .
Esto se denomina "descomposición lambda" (consulte la sección 4 de [13] ) ya que el lado derecho se denominó "distribución lambda simétrica" en los trabajos anteriores de Lihn. Sin embargo, tiene varios nombres más populares, como " distribución de potencia exponencial " o " error generalizado / distribución normal ", a la que a menudo se hace referencia cuando .
El enésimo momento de es el enésimo momento de y todos los momentos positivos son finitos.
Las distribuciones estables se cierran bajo convolución para un valor fijo de . Dado que la convolución es equivalente a la multiplicación de la función transformada de Fourier, se deduce que el producto de dos funciones características estables con la misma producirá otra función característica similar. El producto de dos funciones características estables viene dado por:
Dado que Φ no es una función de μ , c o variables, se deduce que estos parámetros para la función convolucionada están dados por:
En cada caso, se puede demostrar que los parámetros resultantes se encuentran dentro de los intervalos requeridos para una distribución estable.
El teorema del límite central generalizado
El Teorema del Límite Central Generalizado (GCLT) fue un esfuerzo de múltiples matemáticos ( Berstein , Lindeberg , Lévy , Feller , Kolmogorov y otros) durante el período de 1920 a 1937. [14]
La primera prueba completa publicada (en francés) del GCLT fue en 1937 por Paul Lévy . [15]
Una versión en inglés de la prueba completa de la GCLT está disponible en la traducción del libro de 1954 de Gnedenko y Kolmogorov . [16]
El comunicado de la GLCT es el siguiente: [10]
Una variable aleatoria no degenerada Z es α-estable para algún 0 < α ≤ 2 si y sólo si existe una secuencia independiente e idénticamente distribuida de variables aleatorias X 1 , X 2 , X 3 , ... y constantes a n > 0, b norte ∈ ℝ con
un norte (X 1 + ... + X norte ) - segundo norte → Z.
Aquí → significa que la secuencia de sumas de variables aleatorias converge en distribución; es decir, las distribuciones correspondientes satisfacen F n (y) → F(y) en todos los puntos de continuidad de F.
En otras palabras, si sumas de variables aleatorias independientes distribuidas idénticamente convergen en su distribución a algún Z , entonces Z debe ser una distribución estable.
Casos especiales
No existe una solución analítica general para la forma de f ( x ). Sin embargo, hay tres casos especiales que pueden expresarse en términos de funciones elementales , como puede verse examinando la función característica : [7] [9] [17]
Porque la distribución se reduce a una distribución gaussiana con varianza σ 2 = 2 c 2 y media μ ; el parámetro de asimetría no tiene ningún efecto.
Para y la distribución se reduce a una distribución de Cauchy con parámetro de escala c y parámetro de desplazamiento μ .
Para y la distribución se reduce a una distribución de Lévy con parámetro de escala c y parámetro de desplazamiento μ .
Tenga en cuenta que las tres distribuciones anteriores también están conectadas de la siguiente manera: una variable aleatoria estándar de Cauchy puede verse como una mezcla de variables aleatorias gaussianas (todas con media cero), y la varianza se extrae de una distribución estándar de Lévy. Y, de hecho, este es un caso especial de un teorema más general (consulte la página 59 de [18] ) que permite ver cualquier distribución alfa estable simétrica de esta manera (con el parámetro alfa de la distribución de la mezcla igual al doble del parámetro alfa de la distribución de mezcla y el parámetro beta de la distribución de mezcla siempre igual a uno).
Está disponible una expresión general cerrada para PDF estables con valores racionales de en términos de funciones G de Meijer . [19] Las funciones H de Fox también se pueden utilizar para expresar funciones de densidad de probabilidad estables. Para números racionales simples, la expresión en forma cerrada suele expresarse en términos de funciones especiales menos complicadas . Están disponibles varias expresiones de forma cerrada que tienen expresiones bastante simples en términos de funciones especiales. En la siguiente tabla, las PDF expresables mediante funciones elementales se indican con una E y las que son expresables mediante funciones especiales se indican con una s . [18]
Algunos de los casos especiales se conocen con nombres particulares:
Para y , la distribución es una distribución de Landau ( L ) que tiene un uso específico en física con este nombre.
Para y la distribución se reduce a una distribución de Holtsmark con parámetro de escala c y parámetro de desplazamiento μ .
Además, en el límite cuando c se acerca a cero o cuando α se acerca a cero, la distribución se acercará a una función delta de Dirac δ ( x − μ ) .
Representación en serie
La distribución estable se puede reformular como la parte real de una integral más simple: [20]
Expresando la segunda exponencial como una serie de Taylor , esto lleva a:
donde . Invirtiendo el orden de integración y suma, y realizando la integración se obtiene:
que será válido para x ≠ μ y convergerá para valores apropiados de los parámetros. (Tenga en cuenta que, por lo tanto, se ha eliminado el término n = 0 que produce una función delta en x − μ .) Expresar la primera exponencial como una serie producirá otra serie en potencias positivas de x − μ que generalmente es menos útil.
Para una distribución estable unilateral, es necesario modificar la expansión de la serie anterior, ya que y . No hay una parte real que sumar. En cambio, la integral de la función característica debe realizarse en el eje negativo, lo que da: [21] [12]
Simulación de variables estables.
Simular secuencias de variables aleatorias estables no es sencillo, ya que no existen expresiones analíticas para la inversa ni para la CDF en sí. [11] [13] Todos los enfoques estándar, como los métodos de rechazo o inversión, requerirían cálculos tediosos. Chambers, Mallows y Stuck (CMS), [22] propusieron una solución mucho más elegante y eficiente, quienes notaron que cierta fórmula integral [23] producía el siguiente algoritmo: [24]
generar una variable aleatoria distribuida uniformemente y una variable aleatoria exponencial independiente con media 1;
para calcular:
para calcular: donde
Este algoritmo produce una variable aleatoria . Para una prueba detallada ver. [25]
Dadas las fórmulas para la simulación de una variable aleatoria estable estándar, podemos simular fácilmente una variable aleatoria estable para todos los valores admisibles de los parámetros , y utilizando la siguiente propiedad. Si entonces
es . Para (y ) el método CMS se reduce a la conocida transformada de Box-Muller para generar variables aleatorias gaussianas . [26] Se han propuesto muchos otros enfoques en la literatura, incluida la aplicación de las expansiones de series de Bergström [27] y LePage [28] . Sin embargo, el método CMS se considera el más rápido y preciso.
Aplicaciones
Las distribuciones estables deben su importancia tanto en la teoría como en la práctica a la generalización del teorema del límite central a variables aleatorias sin momentos de segundo (y posiblemente de primer) orden y la autosimilitud que las acompaña de la familia estable. Fue la aparente desviación de la normalidad junto con la demanda de un modelo autosimilar para los datos financieros (es decir, la forma de la distribución de las variaciones anuales de precios de los activos debería parecerse a la de las variaciones de precios diarias o mensuales constituyentes) lo que llevó a Benoît Mandelbrot a proponer que los precios del algodón siguen una distribución alfa estable igual a 1,7. [6] Las distribuciones de Lévy se encuentran con frecuencia en el análisis de comportamientos críticos y datos financieros. [9] [29]
La distribución de Lévy de los eventos de tiempo de espera de las erupciones solares (tiempo entre eventos de erupciones) se demostró para las erupciones solares de rayos X duros de CGRO BATSE en diciembre de 2001. El análisis de la firma estadística de Lévy reveló que eran evidentes dos firmas de memoria diferentes; uno relacionado con el ciclo solar y el segundo cuyo origen parece estar asociado con un efecto localizado o una combinación de efectos localizados de la región activa solar. [30]
Otros casos analíticos
Se conocen varios casos de distribuciones estables analíticamente expresables. Sea la distribución estable expresada por , entonces:
El programa STABLE para Windows está disponible en la página web estable de John Nolan: http://www.robustanalysis.com/public/stable.html. Calcula la densidad (pdf), la función de distribución acumulativa (cdf) y los cuantiles para una distribución estable general, y realiza una estimación de máxima verosimilitud de parámetros estables y algunas técnicas de análisis de datos exploratorios para evaluar el ajuste de un conjunto de datos.
libstable es una implementación en C para las funciones de distribución estable pdf, cdf, números aleatorios, cuantiles y de ajuste (junto con un paquete de replicación de referencia y un paquete R).
R Package 'stabledist' por Diethelm Wuertz, Martin Maechler y miembros del equipo central de Rmetrics. Calcula densidad estable, probabilidad, cuantiles y números aleatorios. Actualizado el 12 de septiembre de 2016.
Julia proporciona el paquete StableDistributions.jl que tiene métodos de generación, ajuste, densidad de probabilidad, función de distribución acumulativa, funciones generadoras de momentos y características, funciones cuantiles y relacionadas, convolución y transformaciones afines de distribuciones estables. Utiliza algoritmos modernizados mejorados por John P. Nolan. [10]
Referencias
^ ab Mandelbrot, B. (1960). "La ley de Pareto-Lévy y la distribución de la renta". Revista económica internacional . 1 (2): 79–106. doi :10.2307/2525289. JSTOR 2525289.
^ Levy, Paul (1925). Cálculo de probabilidades . París: Gauthier-Villars. OCLC 1417531.
^ Mandelbrot, B. (1961). "Funciones aleatorias paretianas estables y la variación multiplicativa de la renta". Econométrica . 29 (4): 517–543. doi :10.2307/1911802. JSTOR 1911802.
^ Mandelbrot, B. (1963). "La variación de ciertos precios especulativos". La Revista de Negocios . 36 (4): 394–419. doi :10.1086/294632. JSTOR 2350970.
^ Fama, Eugene F. (1963). "Mandelbrot y la hipótesis paretiana estable". La Revista de Negocios . 36 (4): 420–429. doi :10.1086/294633. JSTOR 2350971.
^ ab Mandelbrot, B. (1963). "Nuevos métodos en economía estadística". La Revista de Economía Política . 71 (5): 421–440. doi :10.1086/258792. S2CID 53004476.
^ abcdef Nolan, John P. "Distribuciones estables: modelos para datos de cola pesada" (PDF) . Archivado desde el original (PDF) el 17 de julio de 2011 . Consultado el 21 de febrero de 2009 .
^ Siegrist, Kyle. "Distribuciones estables". www.randomservices.org . Consultado el 18 de octubre de 2018 .
^ abc Voit, Johannes (2005). Balian, R; Beiglböck, W; Grosse, H; Thirring, W (eds.). La mecánica estadística de los mercados financieros - Springer . Textos y Monografías de Física. Saltador. doi :10.1007/b137351. ISBN978-3-540-26285-5.
^ abc Nolan, John P. (2020). Distribuciones estables univariadas, Modelos para datos de cola pesada. Serie Springer en Investigación de Operaciones e Ingeniería Financiera. Suiza: Springer. doi :10.1007/978-3-030-52915-4. ISBN978-3-030-52914-7. S2CID 226648987.
^ ab Nolan, John P. (1997). "Cálculo numérico de densidades estables y funciones de distribución". Comunicaciones en Estadística. Modelos estocásticos . 13 (4): 759–774. doi :10.1080/15326349708807450. ISSN 0882-0287.
^ ab Penson, KA; Górska, K. (17 de noviembre de 2010). "Densidades de probabilidad exactas y explícitas para distribuciones estables de Lévy unilaterales". Cartas de revisión física . 105 (21): 210604. arXiv : 1007.0193 . Código bibliográfico : 2010PhRvL.105u0604P. doi :10.1103/PhysRevLett.105.210604. PMID 21231282. S2CID 27497684.
^ abcde Lihn, Stephen (2017). "Una teoría del rendimiento de los activos y la volatilidad bajo una ley estable y una distribución Lambda estable". SSRN .
^ Le Cam, L. (febrero de 1986). "El teorema del límite central alrededor de 1935". Ciencia estadística . 1 (1): 78–91. JSTOR 2245503.
^ Levy, Paul (1937). Theorie de l'addition des variables aleatoires [Teoría de la combinación de variables impredecibles] . París: Gauthier-Villars.
^ Gnedenko, Boris Vladimirovich; Kologorov, Andreĭ Nikolaevich; Doob, José L.; Hsu, Pao-Lu (1968). Limitar distribuciones para sumas de variables aleatorias independientes . Lectura, MA: Addison-wesley.
^ Samorodnitsky, G.; Taqqu, MS (1994). Procesos aleatorios estables no gaussianos: modelos estocásticos con varianza infinita. Prensa CRC. ISBN9780412051715.
^ ab Lee, Wai Ha (2010). Propiedades continuas y discretas de los procesos estocásticos. Tesis doctoral, Universidad de Nottingham.
^ Zolotarev, V. (1995). "Sobre la representación de densidades de leyes estables mediante funciones especiales". Teoría de la probabilidad y sus aplicaciones . 39 (2): 354–362. doi :10.1137/1139025. ISSN 0040-585X.
^ ab Melocotón, G. (1981). "Teoría del ensanchamiento de presión y desplazamiento de líneas espectrales". Avances en Física . 30 (3): 367–474. Código bibliográfico : 1981AdPhy..30..367P. doi :10.1080/00018738100101467. ISSN 0001-8732.
^ Pollard, Howard (1946). "Representación de e^{-x^{\lambda}} como integral de Laplace". Toro. América. Matemáticas. Soc . 52 : 908. doi : 10.1090/S0002-9904-1946-08672-3 .
^ Cámaras, JM; Malvas, CL; Atascado, BW (1976). "Un método para simular variables aleatorias estables". Revista de la Asociación Estadounidense de Estadística . 71 (354): 340–344. doi :10.1080/01621459.1976.10480344. ISSN 0162-1459.
^ Misiorek, Adán; Weron, Rafał (2012). Gentil, James E.; Härdle, Wolfgang Karl; Mori, Yuichi (eds.). Distribuciones de cola pesada en cálculos de VaR (PDF) . Manuales Springer de estadística computacional. Springer Berlín Heidelberg. págs. 1025-1059. doi :10.1007/978-3-642-21551-3_34. ISBN978-3-642-21550-6.
^ Weron, Rafał (1996). "Sobre el método Chambers-Mallows-Stuck para simular variables aleatorias estables asimétricas". Cartas de estadística y probabilidad . 28 (2): 165-171. CiteSeerX 10.1.1.46.3280 . doi :10.1016/0167-7152(95)00113-1. S2CID 9500064.
^ Janicki, Aleksander; Weron, Aleksander (1994). Simulación y comportamiento caótico de procesos estocásticos alfa-estables. Prensa CRC. ISBN9780824788827.
^ Mantegna, Rosario Nunzio (1994). "Algoritmo rápido y preciso para la simulación numérica de procesos estocásticos estables de Lévy". Revisión física E. 49 (5): 4677–4683. Código bibliográfico : 1994PhRvE..49.4677M. doi : 10.1103/PhysRevE.49.4677. PMID 9961762.
^ Janicki, Aleksander; Kokoszka, Piotr (1992). "Investigación informática de la tasa de convergencia de series tipo Lepage con variables aleatorias α-estables". Estadísticas . 23 (4): 365–373. doi :10.1080/02331889208802383. ISSN 0233-1888.
^ Rachev, Svetlozar T.; Mittnik, Stefan (2000). Modelos paretianos estables en finanzas. Wiley. ISBN978-0-471-95314-2.
^ Leddon, D., Un estudio estadístico de erupciones solares de rayos X duros
^ ab Garoni, TM; Frankel, NE (2002). "Vuelos de Lévy: resultados exactos y asintóticos más allá de todo orden". Revista de Física Matemática . 43 (5): 2670–2689. Código Bib : 2002JMP....43.2670G. doi :10.1063/1.1467095.
^ ab Hopcraft, KI; Jakeman, E.; Tanner, RMJ (1999). "Caminatas aleatorias de Lévy con número de pasos fluctuante y comportamiento multiescala". Revisión física E. 60 (5): 5327–5343. Código bibliográfico : 1999PhRvE..60.5327H. doi :10.1103/physreve.60.5327. PMID 11970402.
^ Uchaikin, VV; Zolotarev, VM (1999). "Oportunidad y estabilidad: distribuciones estables y sus aplicaciones". VSP .
^ Zlotarev, VM (1961). "Expresión de la densidad de una distribución estable con exponente alfa mayor que uno mediante una frecuencia con exponente 1/alfa". Traducciones seleccionadas de estadística matemática y probabilidad (traducido del artículo ruso: Dokl. Akad. Nauk SSSR. 98, 735–738 (1954)) . 1 : 163–167.
^ Zaliapina, IV; Kagan, YY; Schoenberg, FP (2005). "Aproximación a la distribución de sumas de Pareto". Geofísica Pura y Aplicada . 162 (6): 1187-1228. Código Bib : 2005PApGe.162.1187Z. doi :10.1007/s00024-004-2666-3. S2CID 18754585.