stringtranslate.com

Teorema de Berry-Esseen

En teoría de la probabilidad , el teorema del límite central establece que, en determinadas circunstancias, la distribución de probabilidad de la media escalada de una muestra aleatoria converge a una distribución normal a medida que el tamaño de la muestra aumenta hasta el infinito. Bajo supuestos más fuertes, el teorema de Berry-Esseen , o desigualdad de Berry-Esseen , da un resultado más cuantitativo, porque también especifica la tasa a la que tiene lugar esta convergencia al dar un límite al error máximo de aproximación entre la distribución normal y la distribución verdadera de la media de la muestra escalada. La aproximación se mide mediante la distancia de Kolmogorov-Smirnov . En el caso de muestras independientes , la tasa de convergencia es n −1/2 , donde n es el tamaño de la muestra y la constante se estima en términos del tercer momento absoluto normalizado .

Enunciado del teorema

Los enunciados del teorema varían, ya que fue descubierto independientemente por dos matemáticos , Andrew C. Berry (en 1941) y Carl-Gustav Esseen (1942), quienes luego, junto con otros autores, lo refinaron repetidamente durante las décadas siguientes.

Sumandos distribuidos de forma idéntica

Una versión, sacrificando un poco la generalidad en aras de la claridad, es la siguiente:

Existe una constante positiva C tal que si X 1 , X 2 , ..., son variables aleatorias iid con E ( X 1 ) = 0, E( X 1 2 ) = σ 2 > 0, y E(| X 1 | 3 ) = ρ < ∞, [nota 1] y si definimos
la media de la muestra , con F n la función de distribución acumulativa de
y Φ la función de distribución acumulativa de la distribución normal estándar , entonces para todos los x y n ,
Ilustración de la diferencia en las funciones de distribución acumulativa a las que se alude en el teorema.

Es decir: dada una secuencia de variables aleatorias independientes e idénticamente distribuidas , cada una con media cero y varianza positiva , si además el tercer momento absoluto es finito, entonces las funciones de distribución acumulativa de la media muestral estandarizada y la distribución normal estándar difieren (verticalmente, en un gráfico) en no más de la cantidad especificada. Nótese que el error de aproximación para todos los n (y, por lo tanto, la tasa límite de convergencia para n indefinidos suficientemente grandes) está acotado por el orden de n −1/2 .

Los límites superiores calculados para la constante C han disminuido notablemente a lo largo de los años, desde el valor original de 7,59 de Esseen en 1942. [1] La estimación C  < 0,4748 se desprende de la desigualdad

ya que σ 3  ≤ ρ y 0,33554 · 1,415 < 0,4748. Sin embargo, si ρ ≥ 1,286σ 3 , entonces la estimación

es aún más apretado. [2]

Esseen (1956) demostró que la constante también satisface el límite inferior

Sumandos distribuidos de forma no idéntica

Sean X 1 , X 2 , ..., variables aleatorias independientes con E ( X i ) = 0, E( X i 2 ) = σ i 2 > 0, y E(| X i | 3 ) = ρ i < ∞. Además, sea
sea ​​la n -ésima suma parcial normalizada . Denotemos F n como la función de distribución acumulada de S n y Φ como la función de distribución acumulada de la distribución normal estándar . Por conveniencia denotemos
En 1941, Andrew C. Berry demostró que para todo n existe una constante absoluta C 1 tal que
dónde
Independientemente, en 1942, Carl-Gustav Esseen demostró que para todo n existe una constante absoluta C 0 tal que
dónde

Es fácil asegurarse de que ψ 0 ≤ψ 1 . Debido a esta circunstancia, la desigualdad (3) se denomina convencionalmente desigualdad de Berry-Esseen, y la cantidad ψ 0 se denomina fracción de Lyapunov de tercer orden. Además, en el caso en que los sumandos X 1 , ..., X n tengan distribuciones idénticas

y por tanto los límites establecidos por las desigualdades (1), (2) y (3) coinciden, salvo la constante.

Respecto a C 0 , obviamente, sigue siendo válido el límite inferior establecido por Esseen (1956):

El límite inferior se alcanza con exactitud sólo para ciertas distribuciones de Bernoulli (véase Esseen (1956) para sus expresiones explícitas).

Los límites superiores para C 0 se redujeron posteriormente de la estimación original de Esseen de 7,59 a 0,5600. [3]

Versión multidimensional

Al igual que ocurre con el teorema del límite central multidimensional , existe una versión multidimensional del teorema de Berry-Esseen. [4] [5]

Sean vectores aleatorios independientes con media cero. Escriba y suponga que es invertible. Sea una gaussiana de dimensión 1 con la misma media y matriz de covarianza que . Entonces, para todos los conjuntos convexos ,

,

donde es una constante universal y (la tercera potencia de la norma L 2 ).

Se supone que la dependencia es óptima, pero podría no serlo. [5]

Véase también

Notas

  1. ^ Dado que las variables aleatorias se distribuyen de manera idéntica, X 2 , X 3 , ... todas tienen los mismos momentos que X 1 .

Referencias

  1. ^ Essen (1942). Para mejoras, véase van Beek (1972), Shiganov (1986), Shevtsova (2007), Shevtsova (2008), Tyurin (2009), Korolev & Shevtsova (2010a), Tyurin (2010). La revisión detallada se puede encontrar en los artículos Korolev & Shevtsova (2010a) y Korolev & Shevtsova (2010b).
  2. ^ Shevtsova (2011).
  3. ^ Essen (1942); Zolotarev (1967); van Beek (1972); Shiganov (1986); Tiurin (2009); Tiurin (2010); Shevtsova (2010).
  4. ^ Bentkus, Vidmantas. "Un límite de tipo Lyapunov en R d ". Teoría de la probabilidad y sus aplicaciones 49.2 (2005): 311–323.
  5. ^ ab Raič, Martin (2019). "Un teorema de Berry--Esseen multivariado con constantes explícitas". Bernoulli . 25 (4A): 2824–2853. arXiv : 1802.06475 . doi :10.3150/18-BEJ1072. ISSN  1350-7265. S2CID  119607520.

Bibliografía

Enlaces externos