stringtranslate.com

Distribución estable

En teoría de la probabilidad , se dice que una distribución es estable si una combinación lineal de dos variables aleatorias independientes con esta distribución tiene la misma distribución, hasta los parámetros de ubicación y escala . Se dice que una variable aleatoria es estable si su distribución es estable. La familia de distribuciones estables también se conoce a veces como distribución alfa-estable de Lévy , en honor a Paul Lévy , el primer matemático que la estudió. [1] [2]

De los cuatro parámetros que definen la familia, la mayor parte de la atención se ha centrado en el parámetro de estabilidad, (véase el panel). Las distribuciones estables tienen , con el límite superior correspondiente a la distribución normal , y a la distribución de Cauchy . Las distribuciones tienen varianza indefinida para , y media indefinida para . La importancia de las distribuciones de probabilidad estables es que son " atractores " para sumas correctamente normalizadas de variables aleatorias independientes e idénticamente distribuidas ( iid ). La distribución normal define una familia de distribuciones estables. Por el teorema clásico del límite central la suma correctamente normalizada de un conjunto de variables aleatorias, cada una con varianza finita, tenderá hacia una distribución normal a medida que aumenta el número de variables. Sin el supuesto de varianza finita, el límite puede ser una distribución estable que no es normal. Mandelbrot se refirió a tales distribuciones como "distribuciones paretianas estables", [3] [4] [5] después de Vilfredo Pareto . En particular, se refirió a aquellas distribuciones máximamente sesgadas en la dirección positiva como "distribuciones de Pareto-Lévy", [1] que consideraba como mejores descripciones de los precios de acciones y materias primas que las distribuciones normales. [6]

Definición

Una distribución no degenerada es una distribución estable si satisface la siguiente propiedad:

Sean X 1 y X 2 realizaciones independientes de una variable aleatoria X . Entonces se dice que X es estable si para cualquier constante a > 0 y b > 0 la variable aleatoria aX 1 + bX 2 tiene la misma distribución que cX + d para algunas constantes c > 0 y d . Se dice que la distribución es estrictamente estable si esto se cumple con d = 0 . [7]

Dado que la distribución normal , la distribución de Cauchy y la distribución de Lévy tienen la propiedad mencionada anteriormente, se deduce que son casos especiales de distribuciones estables.

Estas distribuciones forman una familia de cuatro parámetros de distribuciones de probabilidad continua parametrizada por los parámetros de ubicación y escala μ y c , respectivamente, y dos parámetros de forma y , que corresponden aproximadamente a medidas de asimetría y concentración, respectivamente (ver las figuras).

La función característica de cualquier distribución de probabilidad es la transformada de Fourier de su función de densidad de probabilidad . Por lo tanto, la función de densidad es la transformada de Fourier inversa de la función característica: [8]

Aunque la función de densidad de probabilidad para una distribución estable general no se puede escribir analíticamente, la función característica general sí se puede expresar analíticamente. Una variable aleatoria X se llama estable si su función característica se puede escribir como [7] [9] donde sgn( t ) es solo el signo de t y μR es un parámetro de desplazamiento, , llamado parámetro de asimetría , es una medida de asimetría. Nótese que en este contexto la asimetría usual no está bien definida, ya que la distribución no admite 2º momento o momentos superiores , y la definición usual de asimetría es el 3er momento central .

La razón por la que esto da una distribución estable es que la función característica de la suma de dos variables aleatorias independientes es igual al producto de las dos funciones características correspondientes. Sumar dos variables aleatorias de una distribución estable da como resultado algo con los mismos valores de y , pero posiblemente valores diferentes de μ y c .

No todas las funciones son funciones características de una distribución de probabilidad legítima (es decir, una cuya función de distribución acumulativa es real y va de 0 a 1 sin decrecer), pero las funciones características dadas anteriormente serán legítimas siempre que los parámetros estén dentro de sus rangos. El valor de la función característica en algún valor t es el conjugado complejo de su valor en − t como debería ser para que la función de distribución de probabilidad sea real.

En el caso más simple , la función característica es simplemente una función exponencial estirada ; la distribución es simétrica respecto de μ y se denomina distribución alfa-estable simétrica (de Lévy) , a menudo abreviada como SαS .

Cuando y , la distribución se apoya en [ μ , ∞).

El parámetro c > 0 es un factor de escala que es una medida del ancho de la distribución mientras que es el exponente o índice de la distribución y especifica el comportamiento asintótico de la distribución.

Parametrizaciones

La parametrización de distribuciones estables no es única. Nolan [10] tabula 11 parametrizaciones vistas en la literatura y proporciona fórmulas de conversión. Las dos parametrizaciones más utilizadas son la anterior (el "1" de Nolan) y la inmediatamente inferior (el "0" de Nolan).

La parametrización anterior es la más fácil de usar para el trabajo teórico, pero su densidad de probabilidad no es continua en los parámetros en . [11] Una parametrización continua, mejor para el trabajo numérico, es [7] donde:

Los rangos de y son los mismos que antes, γ (como c ) debe ser positivo y δ (como μ ) debe ser real.

En cualquiera de las dos parametrizaciones se puede realizar una transformación lineal de la variable aleatoria para obtener una variable aleatoria cuya densidad sea . En la primera parametrización, esto se hace definiendo la nueva variable:

Para la segunda parametrización, simplemente use independiente de . En la primera parametrización, si existe la media (es decir, ) entonces es igual a μ , mientras que en la segunda parametrización cuando existe la media es igual a

La distribución

Por lo tanto, una distribución estable se especifica mediante los cuatro parámetros anteriores. Se puede demostrar que cualquier distribución estable no degenerada tiene una función de densidad suave (infinitamente diferenciable). [7] Si denota la densidad de X e Y es la suma de copias independientes de X : entonces Y tiene la densidad con

El comportamiento asintótico se describe, para , por: [7] donde Γ es la función Gamma (excepto que cuando y , la cola no se desvanece hacia la izquierda o derecha, respectivamente, de μ , aunque la expresión anterior es 0). Este comportamiento de " cola pesada " hace que la varianza de las distribuciones estables sea infinita para todos los . Esta propiedad se ilustra en los gráficos log-log a continuación.

Cuando , la distribución es gaussiana (ver abajo), con colas asintóticas a exp(− x 2 /4 c 2 )/(2 c π ).

Distribución estable unilateral y distribución de conteo estable

Cuando y , la distribución se apoya en [ μ , ∞). Esta familia se denomina distribución estable unilateral . [12] Su distribución estándar ( μ  = 0) se define como

, dónde

Sea , su función característica es . Por lo tanto, la forma integral de su PDF es (nota: )

La integral de doble seno es más efectiva para valores muy pequeños .

Considere la suma de Lévy donde , entonces Y tiene la densidad donde . Establezca para llegar a la distribución de recuento estable . [13] Su distribución estándar se define como

La distribución de recuento estable es la distribución previa conjugada de la distribución estable unilateral. Su familia de ubicación-escala se define como

,

También es una distribución unilateral compatible con . El parámetro de ubicación es la ubicación de corte, mientras que define su escala.

Cuando , es la distribución de Lévy , que es una distribución gamma inversa. Por lo tanto, es una distribución gamma desplazada de forma 3/2 y escala ,

Su media es y su desviación estándar es . Se plantea la hipótesis de que el VIX se distribuye como y ( véase la sección 7 de [13] ). Por lo tanto, la distribución de recuento estable es la distribución marginal de primer orden de un proceso de volatilidad. En este contexto, se denomina "volatilidad de piso".

Otro enfoque para derivar la distribución de conteo estable es utilizar la transformada de Laplace de la distribución estable unilateral (Sección 2.4 de [13] ).

Sea , y se puede descomponer la integral en el lado izquierdo como una distribución de producto de una distribución de Laplace estándar y una distribución de conteo estable estándar,

Esto se denomina "descomposición lambda" (consulte la Sección 4 de [13] ) ya que el lado derecho se denominó "distribución lambda simétrica" ​​en los trabajos anteriores de Lihn. Sin embargo, tiene varios nombres más populares, como " distribución de potencia exponencial " o "distribución normal/de error generalizado", a la que a menudo se hace referencia cuando .

El n-ésimo momento de es el -ésimo momento de , y todos los momentos positivos son finitos.

Propiedades

Las distribuciones estables se cierran bajo convolución para un valor fijo de . Dado que la convolución es equivalente a la multiplicación de la función transformada de Fourier, se deduce que el producto de dos funciones características estables por la misma función dará como resultado otra función característica similar. El producto de dos funciones características estables viene dado por:

Dado que Φ no es una función de las variables μ , c o , se deduce que estos parámetros para la función convolucionada se dan por:

En cada caso, se puede demostrar que los parámetros resultantes se encuentran dentro de los intervalos requeridos para una distribución estable.

El teorema del límite central generalizado

El Teorema del Límite Central Generalizado (GCLT) fue un esfuerzo de varios matemáticos ( Berstein , Lindeberg , Lévy , Feller , Kolmogorov y otros) durante el período de 1920 a 1937. [14] La primera prueba completa publicada (en francés) del GCLT fue en 1937 por Paul Lévy . [15] Una versión en inglés de la prueba completa del GCLT está disponible en la traducción del libro de Gnedenko y Kolmogorov de 1954. [16]

La declaración del GLCT es la siguiente: [10]

Una variable aleatoria no degenerada Z es α-estable para algún 0 < α ≤ 2 si y solo si hay una secuencia independiente, idénticamente distribuida de variables aleatorias X 1 , X 2 , X 3 , ... y constantes a n > 0, b n ∈ ℝ con
a n ( X 1 + ... + X n ) − b nZ.
Aquí → significa que la secuencia de sumas de variables aleatorias converge en distribución; es decir, las distribuciones correspondientes satisfacen F n ( y ) → F ( y ) en todos los puntos de continuidad de F.

En otras palabras, si las sumas de variables aleatorias independientes e idénticamente distribuidas convergen en una distribución hacia algún Z , entonces Z debe ser una distribución estable.

Casos especiales

Diagrama logarítmico-logarítmico de las PDF de distribución estable centrada simétrica que muestra el comportamiento de la ley de potencia para x grande . El comportamiento de la ley de potencia se evidencia por la apariencia de línea recta de la PDF para x grande , con la pendiente igual a . (La única excepción es para , en negro, que es una distribución normal).
Diagrama logarítmico-logarítmico de las PDF de distribución estable centrada y sesgada que muestra el comportamiento de la ley de potencia para valores grandes de x . Nuevamente, la pendiente de las porciones lineales es igual a

No existe una solución analítica general para la forma f ( x ). Sin embargo, hay tres casos especiales que pueden expresarse en términos de funciones elementales , como se puede ver al examinar la función característica : [7] [9] [17]

Obsérvese que las tres distribuciones anteriores también están conectadas de la siguiente manera: una variable aleatoria estándar de Cauchy puede verse como una mezcla de variables aleatorias gaussianas (todas con media cero), con la varianza obtenida de una distribución estándar de Lévy. Y, de hecho, este es un caso especial de un teorema más general (véase la pág. 59 de [18] ) que permite que cualquier distribución alfa-estable simétrica se vea de esta manera (con el parámetro alfa de la distribución de mezcla igual al doble del parámetro alfa de la distribución de mezcla, y el parámetro beta de la distribución de mezcla siempre igual a uno).

Una expresión general en forma cerrada para las PDF estables con valores racionales de está disponible en términos de las funciones G de Meijer . [19] Las funciones H de Fox también se pueden utilizar para expresar las funciones de densidad de probabilidad estables. Para números racionales simples, la expresión en forma cerrada es a menudo en términos de funciones especiales menos complicadas . Hay disponibles varias expresiones en forma cerrada que tienen expresiones bastante simples en términos de funciones especiales. En la tabla siguiente, las PDF expresables por funciones elementales se indican con una E y las que se pueden expresar por funciones especiales se indican con una s . [18]

Algunos de los casos especiales se conocen con nombres particulares:

Además, en el límite, cuando c se acerca a cero o cuando α se acerca a cero, la distribución se aproximará a una función delta de Dirac δ ( x  −  μ ) .

Representación en serie

La distribución estable se puede reformular como la parte real de una integral más simple: [20]

Expresando la segunda exponencial como una serie de Taylor , esto conduce a: donde . Invirtiendo el orden de integración y suma, y ​​llevando a cabo la integración, se obtiene: que será válido para x  ≠  μ y convergerá para valores apropiados de los parámetros. (Tenga en cuenta que el  término n = 0 que produce una función delta en x  −  μ se ha eliminado). Expresando la primera exponencial como una serie, se obtendrá otra serie en potencias positivas de x  −  μ que generalmente es menos útil.

Para una distribución estable unilateral, es necesario modificar la expansión en serie anterior, ya que y . No hay una parte real para sumar. En cambio, la integral de la función característica debe realizarse en el eje negativo, lo que da: [21] [12]

Estimación de parámetros

Además de las pruebas existentes para la normalidad y la posterior estimación de parámetros , McCulloch desarrolló un método general que se basa en los cuantiles y funciona tanto para distribuciones estables simétricas como asimétricas y para parámetros de estabilidad . [22]

Simulación de variables estables

No existen expresiones analíticas para la inversa ni para la propia CDF , por lo que el método de inversión no se puede utilizar para generar variables distribuidas de manera estable. [11] [13] Otros enfoques estándar, como el método de rechazo, requerirían cálculos tediosos. Chambers, Mallows y Stuck (CMS) propusieron una solución elegante y eficiente, [23] quienes observaron que una determinada fórmula integral [24] producía el siguiente algoritmo: [25]

Este algoritmo produce una variable aleatoria . Para una prueba detallada, véase [26] .

Para simular una variable aleatoria estable para todos los valores admisibles de los parámetros , , y use la siguiente propiedad: Si entonces es . Para (y ) el método CMS se reduce a la conocida transformada de Box-Muller para generar variables aleatorias gaussianas . [27] Si bien se han propuesto otros enfoques en la literatura, incluida la aplicación de las expansiones de series de Bergström [28] y LePage [29] , el método CMS se considera el más rápido y el más preciso.

Aplicaciones

Las distribuciones estables deben su importancia, tanto en la teoría como en la práctica, a la generalización del teorema del límite central a variables aleatorias sin momentos de segundo (y posiblemente de primer) orden y la autosimilitud que lo acompaña de la familia estable. Fue la aparente desviación de la normalidad junto con la demanda de un modelo autosimilar para los datos financieros (es decir, la forma de la distribución para los cambios anuales de precios de los activos debería parecerse a la de los cambios de precios diarios o mensuales constituyentes) lo que llevó a Benoît Mandelbrot a proponer que los precios del algodón siguen una distribución alfa estable con un coeficiente de variación igual a 1,7. [6] Las distribuciones de Lévy se encuentran con frecuencia en el análisis de comportamientos críticos y datos financieros. [9] [30]

También se encuentran en espectroscopia como una expresión general para una línea espectral ensanchada por presión cuasiestática . [20]

La distribución de Lévy de los eventos de tiempo de espera de erupciones solares (tiempo entre eventos de erupciones) se demostró para las erupciones solares de rayos X duros de CGRO BATSE en diciembre de 2001. El análisis de la firma estadística de Lévy reveló que eran evidentes dos firmas de memoria diferentes: una relacionada con el ciclo solar y la segunda cuyo origen parece estar asociado con efectos localizados o una combinación de efectos localizados de la región activa solar. [31]

Otros casos analíticos

Se conocen varios casos de distribuciones estables expresables analíticamente. Sea la distribución estable expresada por , entonces:

Véase también

Implementaciones de software

Referencias

  1. ^ ab Mandelbrot, B. (1960). "La ley de Pareto-Lévy y la distribución del ingreso". Revista Económica Internacional . 1 (2): 79–106. doi :10.2307/2525289. JSTOR  2525289.
  2. ^ Levy, Paul (1925). Cálculo de probabilidades . París: Gauthier-Villars. OCLC  1417531.
  3. ^ Mandelbrot, B. (1961). "Funciones aleatorias paretianas estables y variación multiplicativa del ingreso". Econometrica . 29 (4): 517–543. doi :10.2307/1911802. JSTOR  1911802.
  4. ^ Mandelbrot, B. (1963). "La variación de ciertos precios especulativos". The Journal of Business . 36 (4): 394–419. doi :10.1086/294632. JSTOR  2350970.
  5. ^ Fama, Eugene F. (1963). "Mandelbrot y la hipótesis paretiana estable". The Journal of Business . 36 (4): 420–429. doi :10.1086/294633. JSTOR  2350971.
  6. ^ ab Mandelbrot, B. (1963). "Nuevos métodos en economía estadística". Revista de Economía Política . 71 (5): 421–440. doi :10.1086/258792. S2CID  53004476.
  7. ^ abcdef Nolan, John P. "Distribuciones estables: modelos para datos de cola pesada" (PDF) . Archivado desde el original (PDF) el 17 de julio de 2011. Consultado el 21 de febrero de 2009 .
  8. ^ Siegrist, Kyle. "Distribuciones estables". www.randomservices.org . Consultado el 18 de octubre de 2018 .
  9. ^ abc Voit, Johannes (2005). Balian, R; Beiglböck, W; Grosse, H; Thirring, W (eds.). La mecánica estadística de los mercados financieros – Springer . Textos y monografías de física. Springer. doi :10.1007/b137351. ISBN 978-3-540-26285-5.
  10. ^ abc Nolan, John P. (2020). Distribuciones estables univariadas, modelos para datos de cola pesada. Springer Series en investigación de operaciones e ingeniería financiera. Suiza: Springer. doi :10.1007/978-3-030-52915-4. ISBN 978-3-030-52914-7.S2CID226648987  .​
  11. ^ ab Nolan, John P. (1997). "Cálculo numérico de densidades estables y funciones de distribución". Comunicaciones en Estadística. Modelos Estocásticos . 13 (4): 759–774. doi :10.1080/15326349708807450. ISSN  0882-0287.
  12. ^ ab Penson, KA; Górska, K. (17 de noviembre de 2010). "Densidades de probabilidad exactas y explícitas para distribuciones estables de Lévy unilaterales". Physical Review Letters . 105 (21): 210604. arXiv : 1007.0193 . Código Bibliográfico :2010PhRvL.105u0604P. doi :10.1103/PhysRevLett.105.210604. PMID  21231282. S2CID  27497684.
  13. ^ abcde Lihn, Stephen (2017). "Una teoría del rendimiento y la volatilidad de los activos bajo una ley estable y una distribución lambda estable". SSRN .
  14. ^ Le Cam, L. (febrero de 1986). "El teorema del límite central en torno a 1935". Ciencia estadística . 1 (1): 78–91. JSTOR  2245503.
  15. ^ Levy, Paul (1937). Theorie de l'addition des variables aleatoires [Teoría de la combinación de variables impredecibles] . París: Gauthier-Villars.
  16. ^ Gnedenko, Boris Vladimirovich; Kologorov, Andreĭ Nikolaevich; Doob, Joseph L.; Hsu, Pao-Lu (1968). Distribuciones límite para sumas de variables aleatorias independientes . Reading, MA: Addison-Wesley.
  17. ^ Samorodnitsky, G.; Taqqu, MS (1994). Procesos aleatorios no gaussianos estables: modelos estocásticos con varianza infinita. CRC Press. ISBN 9780412051715.
  18. ^ ab Lee, Wai Ha (2010). Propiedades continuas y discretas de procesos estocásticos. Tesis doctoral, Universidad de Nottingham.
  19. ^ Zolotarev, V. (1995). "Sobre la representación de densidades de leyes estables mediante funciones especiales". Teoría de la probabilidad y sus aplicaciones . 39 (2): 354–362. doi :10.1137/1139025. ISSN  0040-585X.
  20. ^ ab Peach, G. (1981). "Teoría del ensanchamiento y desplazamiento de las líneas espectrales por presión". Avances en Física . 30 (3): 367–474. Bibcode :1981AdPhy..30..367P. doi :10.1080/00018738100101467. ISSN  0001-8732.
  21. ^ Pollard, Howard (1946). "Representación de e^{-x^\lambda} como una integral de Laplace". Bull. Amer. Math. Soc . 52 : 908. doi : 10.1090/S0002-9904-1946-08672-3 .
  22. ^ McCulloch, J Huston (1986). "Estimadores consistentes simples de parámetros de distribución estable" (PDF) . Comunicaciones en Estadística. Simulación y Computación . 15 : 1109–1136. doi :10.1080/03610918608812563.
  23. ^ Chambers, JM; Mallows, CL; Stuck, BW (1976). "Un método para simular variables aleatorias estables". Revista de la Asociación Estadounidense de Estadística . 71 (354): 340–344. doi :10.1080/01621459.1976.10480344. ISSN  0162-1459.
  24. ^ Zolotarev, VM (1986). Distribuciones estables unidimensionales . Sociedad Matemática Americana. ISBN 978-0-8218-4519-6.
  25. ^ Misiorek, Adam; Weron, Rafał (2012). Gentle, James E.; Härdle, Wolfgang Karl; Mori, Yuichi (eds.). Distribuciones de cola pesada en cálculos VaR (PDF) . Springer Handbooks of Computational Statistics. Springer Berlin Heidelberg. págs. 1025–1059. doi :10.1007/978-3-642-21551-3_34. ISBN 978-3-642-21550-6.
  26. ^ Weron, Rafał (1996). "Sobre el método Chambers-Mallows-Stuck para simular variables aleatorias estables sesgadas". Statistics & Probability Letters . 28 (2): 165–171. CiteSeerX 10.1.1.46.3280 . doi :10.1016/0167-7152(95)00113-1. S2CID  9500064. 
  27. ^ Janicki, Aleksander; Weron, Aleksander (1994). Simulación y comportamiento caótico de procesos estocásticos alfa-estables. CRC Press. ISBN 9780824788827.
  28. ^ Mantegna, Rosario Nunzio (1994). "Algoritmo rápido y preciso para la simulación numérica de procesos estocásticos estables de Lévy". Physical Review E . 49 (5): 4677–4683. Bibcode :1994PhRvE..49.4677M. doi :10.1103/PhysRevE.49.4677. PMID  9961762.
  29. ^ Janicki, Aleksander; Kokoszka, Piotr (1992). "Investigación informática de la tasa de convergencia de series de tipo Lepage a variables aleatorias α-estables". Estadísticas . 23 (4): 365–373. doi :10.1080/02331889208802383. ISSN  0233-1888.
  30. ^ Rachev, Svetlozar T.; Mittnik, Stefan (2000). Modelos paretianos estables en finanzas. Wiley. ISBN 978-0-471-95314-2.
  31. ^ Leddon, D., Un estudio estadístico de las erupciones solares de rayos X duros
  32. ^ ab Garoni, TM; Frankel, NE (2002). "Vuelos de Lévy: resultados exactos y asintóticos más allá de todos los órdenes". Journal of Mathematical Physics . 43 (5): 2670–2689. Bibcode :2002JMP....43.2670G. doi :10.1063/1.1467095.
  33. ^ ab Hopcraft, KI; Jakeman, E.; Tanner, RMJ (1999). "Paseos aleatorios de Lévy con número de pasos fluctuante y comportamiento multiescala". Physical Review E . 60 (5): 5327–5343. Bibcode :1999PhRvE..60.5327H. doi :10.1103/physreve.60.5327. PMID  11970402.
  34. ^ Uchaikin, VV; Zolotarev, VM (1999). "Azar y estabilidad: distribuciones estables y sus aplicaciones". VSP .
  35. ^ Zlotarev, VM (1961). "Expresión de la densidad de una distribución estable con exponente alfa mayor que uno mediante una frecuencia con exponente 1/alfa". Traducciones seleccionadas en estadística matemática y probabilidad (traducido del artículo ruso: Dokl. Akad. Nauk SSSR. 98, 735–738 (1954)) . 1 : 163–167.
  36. ^ Zaliapin, IV; Kagan, YY; Schoenberg, FP (2005). "Aproximación de la distribución de sumas de Pareto". Geofísica pura y aplicada . 162 (6): 1187–1228. Bibcode :2005PApGe.162.1187Z. doi :10.1007/s00024-004-2666-3. S2CID  18754585.