stringtranslate.com

Teorema de Berry-Esseen

En teoría de la probabilidad , el teorema del límite central establece que, bajo ciertas circunstancias, la distribución de probabilidad de la media escalada de una muestra aleatoria converge a una distribución normal a medida que el tamaño de la muestra aumenta hasta el infinito. Bajo supuestos más sólidos, el teorema de Berry-Esseen , o desigualdad de Berry-Esseen , da un resultado más cuantitativo, porque también especifica la velocidad a la que se produce esta convergencia al dar un límite al error máximo de aproximación entre la distribución normal y la distribución verdadera de la media muestral escalada. La aproximación se mide por la distancia Kolmogorov-Smirnov . En el caso de muestras independientes , la tasa de convergencia es n −1/2 , donde n es el tamaño de la muestra y la constante se estima en términos del tercer momento normalizado absoluto .

Declaración del teorema

Las declaraciones del teorema varían, ya que fue descubierto de forma independiente por dos matemáticos , Andrew C. Berry (en 1941) y Carl-Gustav Esseen (1942), quienes luego, junto con otros autores, lo refinaron repetidamente durante las décadas siguientes.

Sumandos distribuidos idénticamente

Una versión, que sacrifica un poco la generalidad en aras de la claridad, es la siguiente:

Existe una constante positiva C tal que si X 1 , X 2 , ..., son variables aleatorias iid con E ( X 1 ) = 0, E( X 1 2 ) = σ 2 > 0, y E(| X 1 3 ) = ρ < ∞, [nota 1] y si definimos
la media muestral , con F n la función de distribución acumulativa de
y Φ la función de distribución acumulada de la distribución normal estándar , entonces para todos x y n ,
Ilustración de la diferencia en funciones de distribución acumulativa a la que se alude en el teorema.

Es decir: dada una secuencia de variables aleatorias independientes e idénticamente distribuidas , cada una con media cero y varianza positiva , si además el tercer momento absoluto es finito, entonces las funciones de distribución acumulativa de la media muestral estandarizada y la distribución normal estándar difieren (verticalmente, en un gráfico) por no más de la cantidad especificada. Tenga en cuenta que el error de aproximación para todo n (y, por tanto, la tasa límite de convergencia para n indefinido suficientemente grande) está limitado por el orden de n −1/2 .

Los límites superiores calculados de la constante C han disminuido notablemente a lo largo de los años, desde el valor original de 7,59 por Esseen en 1942. [1] La estimación C  < 0,4748 se deriva de la desigualdad

ya que σ 3  ≤ ρ y 0,33554 · 1,415 < 0,4748. Sin embargo, si ρ ≥ 1,286σ 3 , entonces la estimación

es aún más estricto. [2]

Esseen (1956) demostró que la constante también satisface el límite inferior

Sumandos distribuidos de forma no idéntica

Sean X 1 , X 2 , ..., variables aleatorias independientes con E ( X i ) = 0, E( X i 2 ) = σ i 2 > 0, y E(| X i | 3 ) = ρ i < ∞. Además, deja que
sea ​​la n -ésima suma parcial normalizada. Denotemos por F n la CDF de S n y Φ la CDF de la distribución normal estándar . Por conveniencia denota
En 1941, Andrew C. Berry demostró que para todo n existe una constante absoluta C 1 tal que
dónde
Independientemente, en 1942, Carl-Gustav Esseen demostró que para todo n existe una constante absoluta C 0 tal que
dónde

Es fácil asegurarse de que ψ 0 ≤ψ 1 . Debido a esta circunstancia, la desigualdad (3) se denomina convencionalmente desigualdad de Berry-Esseen, y la cantidad ψ 0 se denomina fracción de Lyapunov de tercer orden. Además, en el caso de que los sumandos X 1 , ..., X n tengan distribuciones idénticas

y por tanto los límites establecidos por las desigualdades (1), (2) y (3) coinciden aparte de la constante.

Respecto a C 0 , obviamente, la cota inferior establecida por Esseen (1956) sigue siendo válida:

El límite inferior se alcanza exactamente sólo para ciertas distribuciones de Bernoulli (ver Esseen (1956) para sus expresiones explícitas).

Los límites superiores de C 0 se redujeron posteriormente desde la estimación original de Esseen de 7,59 a 0,5600. [3]

Versión multidimensional

Al igual que con el teorema del límite central multidimensional , existe una versión multidimensional del teorema de Berry-Esseen. [4] [5]

Sean vectores aleatorios de valores independientes , cada uno de los cuales tiene media cero. Escribir y asumir es invertible. Sea un gaussiano dimensional con la misma matriz de media y covarianza que . Entonces para todos los conjuntos convexos ,

,

donde es una constante universal y (la tercera potencia de la norma L 2 ).

Se conjetura que la dependencia es óptima, pero podría no serlo. [5]

Ver también

Notas

  1. ^ Dado que las variables aleatorias están distribuidas de manera idéntica, X 2 , X 3 , ... todas tienen los mismos momentos que X 1 .

Referencias

  1. ^ Essen (1942). Para mejoras, véase van Beek (1972), Shiganov (1986), Shevtsova (2007), Shevtsova (2008), Tyurin (2009), Korolev & Shevtsova (2010a), Tyurin (2010). La revisión detallada se puede encontrar en los artículos Korolev & Shevtsova (2010a) y Korolev & Shevtsova (2010b).
  2. ^ Shevtsova (2011).
  3. ^ Essen (1942); Zolotarev (1967); van Beek (1972); Shiganov (1986); Tiurin (2009); Tiurin (2010); Shevtsova (2010).
  4. ^ Bentkus, Vidmantas. "Un tipo Lyapunov encuadernado en R d ". Teoría de la probabilidad y sus aplicaciones 49.2 (2005): 311–323.
  5. ^ ab Raič, Martín (2019). "Un teorema de Berry-Esseen multivariado con constantes explícitas". Bernoulli . 25 (4A): 2824–2853. arXiv : 1802.06475 . doi :10.3150/18-BEJ1072. ISSN  1350-7265. S2CID  119607520.

Bibliografía

enlaces externos