stringtranslate.com

Teorema del límite central

En teoría de la probabilidad , el teorema del límite central ( CLT ) establece que, bajo condiciones apropiadas, la distribución de una versión normalizada de la media muestral converge a una distribución normal estándar . Esto es válido incluso si las variables originales en sí mismas no están distribuidas normalmente . Existen varias versiones del CLT, cada una de las cuales se aplica en el contexto de diferentes condiciones.

El teorema es un concepto clave en la teoría de la probabilidad porque implica que los métodos probabilísticos y estadísticos que funcionan para distribuciones normales pueden ser aplicables a muchos problemas que involucran otros tipos de distribuciones.

Este teorema ha experimentado muchos cambios durante el desarrollo formal de la teoría de la probabilidad. Las versiones anteriores del teorema se remontan a 1811, pero en su forma general moderna, este resultado fundamental en la teoría de la probabilidad se estableció con precisión en 1920, [1] sirviendo así como un puente entre la teoría de la probabilidad clásica y la moderna.

Una forma elemental del teorema establece lo siguiente. Denotemos una muestra aleatoria de observaciones independientes de una población con valor esperado general (promedio) y varianza finita , y denotemos la media muestral de esa muestra (que es en sí misma una variable aleatoria ). Entonces el límite a partir de la distribución de donde es la distribución normal estándar. [2]

En otras palabras, supongamos que se obtiene una muestra grande de observaciones , cada observación se produce aleatoriamente de una manera que no depende de los valores de las otras observaciones, y que se calcula el promedio ( media aritmética ) de los valores observados. Si este procedimiento se realiza muchas veces, lo que da como resultado una colección de promedios observados, el teorema del límite central dice que si el tamaño de la muestra fue lo suficientemente grande, la distribución de probabilidad de estos promedios se aproximará mucho a una distribución normal.

El teorema del límite central tiene varias variantes. En su forma común, las variables aleatorias deben ser independientes e idénticamente distribuidas (iid). Este requisito puede debilitarse; La convergencia de la media a la distribución normal también ocurre para distribuciones no idénticas o para observaciones no independientes si cumplen con ciertas condiciones.

La primera versión de este teorema, de que la distribución normal puede usarse como una aproximación a la distribución binomial , es el teorema de Moivre-Laplace .

Secuencias independientes

Cualquiera que sea la forma de la distribución de la población, la distribución muestral tiende a ser gaussiana y su dispersión viene dada por el teorema del límite central. [3]

CLT clásico

Sea una secuencia de variables aleatorias iid que tienen una distribución con un valor esperado dado por y una varianza finita dada por Supongamos que estamos interesados ​​en el promedio muestral

Por la ley de los grandes números , el promedio muestral converge casi con seguridad (y por lo tanto también converge en probabilidad ) al valor esperado como

El teorema del límite central clásico describe el tamaño y la forma distributiva de las fluctuaciones estocásticas alrededor del número determinista durante esta convergencia. Más precisamente, establece que a medida que aumenta, la distribución de la diferencia entre el promedio de la muestra y su límite cuando se multiplica por el factor ( es decir, ) se aproxima a la distribución normal con media y varianza. Para lo suficientemente grande, la distribución de se acerca arbitrariamente a la distribución normal con media y varianza

La utilidad del teorema es que la distribución de se aproxima a la normalidad independientemente de la forma de la distribución del individuo. Formalmente, el teorema se puede enunciar de la siguiente manera:

Lindeberg–Lévy CLT  -  Supongamos que es una secuencia de variables aleatorias iid con y Luego, cuando se acerca al infinito, las variables aleatorias convergen en distribución a una normal : [4]

En el caso de la convergencia en la distribución significa que las funciones de distribución acumuladas de convergen puntualmente a la CDF de la distribución: para cada número real

supremo[5]

Lyapunov CLT

El teorema lleva el nombre del matemático ruso Aleksandr Lyapunov . En esta variante del teorema del límite central las variables aleatorias tienen que ser independientes, pero no necesariamente distribuidas de forma idéntica. El teorema también requiere que las variables aleatorias tengan momentos de algún orden y que la tasa de crecimiento de estos momentos esté limitada por la condición de Lyapunov que se detalla a continuación.

Lyapunov CLT [6]  -  Supongamos que es una secuencia de variables aleatorias independientes, cada una con un valor esperado y una varianza finitos . Definir

Si para algunos la condición de Lyapunov

se satisface, entonces una suma de converge en distribución a una variable aleatoria normal estándar, y llega al infinito:

En la práctica, suele ser más fácil comprobar el estado de Lyapunov .

Si una secuencia de variables aleatorias satisface la condición de Lyapunov, entonces también satisface la condición de Lindeberg. Sin embargo, la implicación inversa no se cumple.

Lindeberg CLT

En el mismo escenario y con la misma notación anterior, la condición de Lyapunov puede reemplazarse por la siguiente, más débil (de Lindeberg en 1920).

Supongamos que por cada

función indicadora
.

CLT multidimensional

Las pruebas que utilizan funciones características se pueden extender a casos en los que cada individuo es un vector aleatorio en , con vector medio y matriz de covarianza (entre los componentes del vector), y estos vectores aleatorios son independientes y están distribuidos de manera idéntica. La suma de estos vectores se realiza por componentes. El teorema del límite central multidimensional establece que cuando se escalan, las sumas convergen a una distribución normal multivariada . [7]

Dejar

ksuma

El teorema del límite central multivariado establece que

matriz de covarianza

La tasa de convergencia viene dada por el siguiente resultado del tipo Berry-Esseen :

Teorema [8]  —  Sean vectores aleatorios de valores independientes , cada uno con media cero. Escribir y asumir es invertible. Sea un gaussiano dimensional con la misma media y la misma matriz de covarianza que . Entonces para todos los conjuntos convexos ,

donde es una constante universal, y denota la norma euclidiana en .

Se desconoce si el factor es necesario. [9]

El teorema del límite central generalizado

El Teorema del Límite Central Generalizado (GCLT) fue un esfuerzo de múltiples matemáticos ( Bernstein , Lindeberg , Lévy , Feller , Kolmogorov y otros) durante el período de 1920 a 1937. [10] La primera prueba completa publicada del GCLT fue en 1937. por Paul Lévy en francés. [11] Una versión en inglés de la prueba completa de la GCLT está disponible en la traducción del libro de 1954 de Gnedenko y Kolmogorov . [12]

El pronunciamiento de la CGLT es el siguiente: [13]

Una variable aleatoria no degenerada Z es α -estable para algún 0 < α ≤ 2 si y sólo si existe una secuencia independiente e idénticamente distribuida de variables aleatorias X 1 , X 2 , X 3 , ... y constantes a n > 0, b norte ∈ ℝ con
un norte ( X 1 + ... + X norte ) - segundo norteZ .
Aquí → significa que la secuencia de sumas de variables aleatorias converge en distribución; es decir, las distribuciones correspondientes satisfacen F n ( y ) → F ( y ) en todos los puntos de continuidad de F.

En otras palabras, si sumas de variables aleatorias independientes distribuidas idénticamente convergen en su distribución a algún Z , entonces Z debe ser una distribución estable .

Procesos dependientes

CLT bajo dependencia débil

Una generalización útil de una secuencia de variables aleatorias independientes distribuidas idénticamente es un proceso aleatorio de mezcla en tiempo discreto; "mezclar" significa, aproximadamente, que las variables aleatorias temporalmente alejadas entre sí son casi independientes. Se utilizan varios tipos de mezcla en la teoría ergódica y la teoría de la probabilidad. Véase mezcla especialmente fuerte (también llamada mezcla α) definida por el llamado coeficiente de mezcla fuerte .

Una formulación simplificada del teorema del límite central bajo mezcla fuerte es: [14]

Teorema  :  supongamos que eso es estacionario y se mezcla con y eso y . Denota , entonces el límite

existe, y si entonces converge en distribución a .

De hecho,

El supuesto no se puede omitir, ya que la normalidad asintótica falla cuando hay otra secuencia estacionaria .

Existe una versión más sólida del teorema: [15] el supuesto se reemplaza por y el supuesto se reemplaza por

La existencia de los mismos asegura la conclusión. Para un tratamiento enciclopédico de teoremas de límites en condiciones de mezcla, consulte (Bradley 2007).

Diferencia martingala CLT

Teorema  :  dejemos que una martingala satisfaga

luego converge en distribución a as . [16] [17]

Observaciones

Prueba de CLT clásica

El teorema del límite central tiene una demostración mediante funciones características . [18] Es similar a la prueba de la ley (débil) de los grandes números .

Supongamos que son variables aleatorias independientes y distribuidas idénticamente, cada una con media y varianza finita . La suma tiene media y varianza . Considere la variable aleatoria

,( ). función característica
el teorema de Taylor
notación pequeña o? función exponencial ( ),

Todos los términos de orden superior desaparecen en el límite . El lado derecho es igual a la función característica de una distribución normal estándar , lo que implica, mediante el teorema de continuidad de Lévy , que la distribución de la voluntad se aproxima a . Por lo tanto, el promedio muestral

,

Convergencia al límite

El teorema del límite central da sólo una distribución asintótica . Como aproximación para un número finito de observaciones, proporciona una aproximación razonable sólo cuando está cerca del pico de la distribución normal; se requiere una gran cantidad de observaciones para llegar a las colas. [ cita necesaria ]

La convergencia en el teorema del límite central es uniforme porque la función de distribución acumulativa límite es continua. Si el tercer momento central existe y es finito, entonces la velocidad de convergencia es al menos del orden de (ver teorema de Berry-Esseen ). El método de Stein [19] puede usarse no sólo para demostrar el teorema del límite central, sino también para proporcionar límites a las tasas de convergencia para métricas seleccionadas. [20]

La convergencia a la distribución normal es monótona, en el sentido de que la entropía de aumenta monótonamente a la de la distribución normal. [21]

El teorema del límite central se aplica en particular a sumas de variables aleatorias discretas independientes e idénticamente distribuidas . Una suma de variables aleatorias discretas sigue siendo una variable aleatoria discreta , de modo que nos enfrentamos a una secuencia de variables aleatorias discretas cuya función de distribución de probabilidad acumulada converge hacia una función de distribución de probabilidad acumulada correspondiente a una variable continua (es decir, la de la distribución normal ) . Esto significa que si construimos un histograma de las realizaciones de la suma de n variables discretas idénticas independientes, la curva lineal por tramos que une los centros de las caras superiores de los rectángulos que forman el histograma converge hacia una curva gaussiana cuando n se acerca al infinito; esta relación se conoce como teorema de Moivre-Laplace . El artículo sobre distribución binomial detalla dicha aplicación del teorema del límite central en el caso simple de una variable discreta que toma solo dos valores posibles.

Conceptos erróneos comunes

Los estudios han demostrado que el teorema del límite central está sujeto a varios conceptos erróneos comunes pero graves, algunos de los cuales aparecen en libros de texto ampliamente utilizados. [22] [23] [24] Estos incluyen:

Relación con la ley de los grandes números.

La ley de los grandes números así como el teorema del límite central son soluciones parciales a un problema general: "¿Cuál es el comportamiento límite de S n cuando n tiende al infinito?" En el análisis matemático, las series asintóticas son una de las herramientas más populares empleadas para abordar este tipo de cuestiones.

Supongamos que tenemos una expansión asintótica de :

Dividir ambas partes por φ 1 ( n ) y tomar el límite producirá un 1 , el coeficiente del término de orden más alto en la expansión, que representa la velocidad a la que f ( n ) cambia en su término principal.

Informalmente, se puede decir: " f ( n ) crece aproximadamente como 1 φ 1 ( n ) " . Tomando la diferencia entre f ( n ) y su aproximación y luego dividiéndola por el siguiente término de la expansión, llegamos a una afirmación más refinada sobre f ( n ) :

Aquí se puede decir que la diferencia entre la función y su aproximación crece aproximadamente como 2 φ 2 ( n ) . La idea es que dividir la función entre funciones normalizadoras apropiadas y observar el comportamiento limitante del resultado puede decirnos mucho sobre el comportamiento limitante de la función original misma.

Informalmente, algo similar sucede cuando la suma, S n , de variables aleatorias independientes distribuidas idénticamente, X 1 , ..., X n , se estudia en la teoría de probabilidad clásica. [ cita necesaria ] Si cada X i tiene una media finita μ , entonces, según la ley de los números grandes,sn _/norteμ . [26] Si además cada X i tiene varianza finita σ 2 , entonces por el teorema del límite central,

ξN (0, σ 2 )

En el caso de que X i no tenga media o varianza finita, la convergencia de la suma desplazada y reescalada también puede ocurrir con diferentes factores de centrado y escala:

Las distribuciones Ξ que pueden surgir de esta manera se denominan estables . [27] Claramente, la distribución normal es estable, pero también existen otras distribuciones estables, como la distribución de Cauchy , para las cuales la media o la varianza no están definidas. El factor de escala b n puede ser proporcional a n c , para cualquier c1/2; también se puede multiplicar por una función de n que varía lentamente . [28] [29]

La ley del logaritmo iterado especifica lo que sucede "entre" la ley de los grandes números y el teorema del límite central. Específicamente dice que la función de normalización n log log n , de tamaño intermedio entre n de la ley de los grandes números y n del teorema del límite central, proporciona un comportamiento limitante no trivial.

Enunciados alternativos del teorema

Funciones de densidad

La densidad de la suma de dos o más variables independientes es la convolución de sus densidades (si estas densidades existen). Por tanto, el teorema del límite central puede interpretarse como una afirmación sobre las propiedades de las funciones de densidad bajo convolución: la convolución de una serie de funciones de densidad tiende a la densidad normal a medida que el número de funciones de densidad aumenta sin límite. Estos teoremas requieren hipótesis más sólidas que las formas del teorema del límite central dadas anteriormente. Los teoremas de este tipo suelen denominarse teoremas de límite local. Véase Petrov [30] para conocer un teorema de límite local particular para sumas de variables aleatorias independientes e idénticamente distribuidas .

Funciones características

Dado que la función característica de una convolución es el producto de las funciones características de las densidades involucradas, el teorema del límite central tiene aún otra reformulación: el producto de las funciones características de varias funciones de densidad se acerca a la función característica de la densidad normal. a medida que el número de funciones de densidad aumenta sin límite, en las condiciones indicadas anteriormente. Específicamente, es necesario aplicar un factor de escala apropiado al argumento de la función característica.

Se puede hacer una afirmación equivalente sobre las transformadas de Fourier , ya que la función característica es esencialmente una transformada de Fourier.

Calculando la varianza

Sea S n la suma de n variables aleatorias. Muchos teoremas del límite central proporcionan condiciones tales que S n / Var( S n ) converge en distribución a N (0,1) (la distribución normal con media 0, varianza 1) cuando n → ∞ . En algunos casos, es posible encontrar una constante σ 2 y una función f(n) tal que S n /(σ n⋅f ( n ) ) converja en distribución a N (0,1) cuando n → ∞ .

Lema [31]  -  Supongamos que es una secuencia de variables aleatorias estrictamente estacionarias y de valor real con para todos , y . Construir

  1. Si es absolutamente convergente, y luego como donde .
  2. Si además y converge en distribución a as entonces también converge en distribución a as .

Extensiones

Productos de variables aleatorias positivas.

El logaritmo de un producto es simplemente la suma de los logaritmos de los factores. Por lo tanto, cuando el logaritmo de un producto de variables aleatorias que toman sólo valores positivos se aproxima a una distribución normal, el producto en sí se aproxima a una distribución log-normal . Muchas cantidades físicas (especialmente la masa o la longitud, que son una cuestión de escala y no pueden ser negativas) son productos de diferentes factores aleatorios , por lo que siguen una distribución log-normal. Esta versión multiplicativa del teorema del límite central a veces se denomina ley de Gibrat .

Mientras que el teorema del límite central para sumas de variables aleatorias requiere la condición de varianza finita, el teorema correspondiente para productos requiere la condición correspondiente de que la función de densidad sea integrable al cuadrado. [32]

Más allá del marco clásico

La normalidad asintótica, es decir, la convergencia a la distribución normal después de un cambio y reescalamiento apropiados, es un fenómeno mucho más general que el marco clásico tratado anteriormente, es decir, sumas de variables aleatorias independientes (o vectores). De vez en cuando se revelan nuevos marcos; Por el momento no existe un marco unificador único.

cuerpo convexo

Teorema  :  existe una secuencia ε n ↓ 0 para la cual se cumple lo siguiente. Sea n ≥ 1 y las variables aleatorias X 1 , ..., X n tengan una densidad conjunta log-cóncava f tal que f ( x 1 , ..., x n ) = f (| x 1 |, .. ., | x n |) para todo x 1 , ..., x n y E( X 2
mil
) = 1
para todo k = 1, ..., n . Entonces la distribución de

es ε n -cerca de en la distancia de variación total . [33]

Estas dos distribuciones cercanas ε n tienen densidades (de hecho, densidades log-cóncavas), por lo tanto, la distancia de varianza total entre ellas es la integral del valor absoluto de la diferencia entre las densidades. La convergencia en la variación total es más fuerte que la convergencia débil.

Un ejemplo importante de densidad logarítmica cóncava es una función constante dentro de un cuerpo convexo dado y que desaparece hacia afuera; corresponde a la distribución uniforme en el cuerpo convexo, lo que explica el término "teorema del límite central para cuerpos convexos".

Otro ejemplo: f ( x 1 , ..., x n ) = const · exp(−(| x 1 | α + ⋯ + | x n | α ) β ) donde α > 1 y αβ > 1 . Si β = 1 entonces f ( x 1 , ..., x n ) se factoriza en const · exp (−| x 1 | α ) … exp(−| x n | α ), lo que significa X 1 , ..., X n son independientes. Sin embargo, en general son dependientes.

La condición f ( x 1 , ..., x n ) = f (| x 1 |, ..., | x n |) asegura que X 1 , ..., X n sean de media cero y no estén correlacionados ; [ cita necesaria ] aún así, no es necesario que sean independientes, ni siquiera independientes por pares . [ cita necesaria ] Por cierto, la independencia por pares no puede reemplazar la independencia en el teorema del límite central clásico. [34]

Aquí hay un resultado tipo Berry-Esseen .

Teorema  :  Sea X 1 , ..., X n satisfaga los supuestos del teorema anterior, entonces [35]

para todo a < b ; aquí C es una constante universal (absoluta) . Además, para cada c 1 , ..., c nR tal que c2
1
+ ⋯ + c2
norte
= 1
,

La distribución deX 1 + ⋯ + X norte/norteNo es necesario que sea aproximadamente normal (de hecho, puede ser uniforme). [36] Sin embargo, la distribución de c 1 X 1 + ⋯ + c n X n es cercana a (en la distancia de variación total) para la mayoría de los vectores ( c 1 , ..., c n ) según la distribución uniforme en el esfera c2
1
+ ⋯ + c2
norte
= 1
.

Serie trigonométrica lacunaria

Teorema ( SalemZygmund )  :  Sea U una variable aleatoria distribuida uniformemente en (0,2π) , y X k = r k cos ( n k U + a k ) , donde

Entonces [37] [38]

converge en distribución a .

politopos gaussianos

Teorema  :  Sean A 1 , ..., An puntos aleatorios independientes en el plano R 2 , cada uno de los cuales tiene la distribución normal estándar bidimensional. Sea K n la envolvente convexa de estos puntos y X n el área de K n Entonces [39]

converge en distribución cuando n tiende al infinito.

Lo mismo ocurre también en todas las dimensiones mayores que 2.

El politopo K n se denomina politopo aleatorio gaussiano.

Un resultado similar se aplica al número de vértices (del politopo gaussiano), al número de aristas y, de hecho, a las caras de todas las dimensiones. [40]

Funciones lineales de matrices ortogonales.

Una función lineal de una matriz M es una combinación lineal de sus elementos (con coeficientes dados), M ↦ tr( AM ) donde A es la matriz de los coeficientes; consulte Trace (álgebra lineal) #Producto interno .

Se dice que una matriz ortogonal aleatoria está distribuida uniformemente si su distribución es la medida de Haar normalizada en el grupo ortogonal O ( n , R ) ; consulte Matriz de rotación # Matrices de rotación aleatoria uniforme .

Teorema  :  Sea M una matriz ortogonal aleatoria de n × n distribuida uniformemente, y A una matriz fija de n × n tal que tr( AA *) = n , y sea X = tr( AM ) . Entonces [41] la distribución de X es cercana a en la métrica de variación total hasta [ se necesita aclaración ] 2 3/norte - 1.

Subsecuencias

Teorema  :  Sean las variables aleatorias X 1 , X 2 , ... ∈ L 2 (Ω) tales que X n → 0 débilmente en L 2 (Ω) y X
norte
→ 1
débilmente en L 1 (Ω) . Entonces existen números enteros n 1 < n 2 < ⋯ tales que

converge en distribución a cuando k tiende al infinito. [42]

Paseo aleatorio sobre una red cristalina.

El teorema del límite central se puede establecer para el paseo aleatorio simple en una red cristalina (un gráfico de cobertura abeliano de pliegues infinitos sobre un gráfico finito) y se utiliza para el diseño de estructuras cristalinas. [43] [44]

Aplicaciones y ejemplos

Un ejemplo sencillo del teorema del límite central es lanzar muchos dados idénticos e imparciales. La distribución de la suma (o promedio) de los números arrojados se aproximará bien mediante una distribución normal. Dado que las cantidades del mundo real suelen ser la suma equilibrada de muchos eventos aleatorios no observados, el teorema del límite central también proporciona una explicación parcial de la prevalencia de la distribución de probabilidad normal. También justifica la aproximación de estadísticas de muestras grandes a la distribución normal en experimentos controlados.

Otra simulación utilizando la distribución binomial. Se generaron 0 y 1 aleatorios y luego se calcularon sus medias para tamaños de muestra que van de 1 a 512. Tenga en cuenta que a medida que aumenta el tamaño de la muestra, las colas se vuelven más delgadas y la distribución se vuelve más concentrada alrededor de la media.

Regresión

El análisis de regresión , y en particular los mínimos cuadrados ordinarios , especifica que una variable dependiente depende según alguna función de una o más variables independientes , con un término de error aditivo . Varios tipos de inferencia estadística sobre la regresión suponen que el término de error se distribuye normalmente. Esta suposición puede justificarse suponiendo que el término de error es en realidad la suma de muchos términos de error independientes; incluso si los términos de error individuales no están distribuidos normalmente, según el teorema del límite central su suma puede aproximarse bien mediante una distribución normal.

Otras ilustraciones

Dada su importancia para la estadística, se encuentran disponibles varios artículos y paquetes informáticos que demuestran la convergencia involucrada en el teorema del límite central. [45]

Historia

El matemático holandés Henk Tijms escribe: [46]

El teorema del límite central tiene una historia interesante. La primera versión de este teorema fue postulada por el matemático de origen francés Abraham de Moivre quien, en un notable artículo publicado en 1733, utilizó la distribución normal para aproximar la distribución del número de caras resultantes de muchos lanzamientos de una moneda justa. Este hallazgo se adelantó mucho a su tiempo y estuvo casi olvidado hasta que el famoso matemático francés Pierre-Simon Laplace lo rescató de la oscuridad en su monumental obra Théorie analytique des probabilités , publicada en 1812. Laplace amplió el hallazgo de De Moivre aproximando el binomio. distribución con la distribución normal. Pero al igual que con De Moivre, el hallazgo de Laplace recibió poca atención en su época. No fue hasta finales del siglo XIX que se discernió la importancia del teorema del límite central, cuando, en 1901, el matemático ruso Aleksandr Lyapunov lo definió en términos generales y demostró precisamente cómo funcionaba matemáticamente. Hoy en día, el teorema del límite central se considera el soberano no oficial de la teoría de la probabilidad.

Sir Francis Galton describió el teorema del límite central de esta manera: [47]

Pocas veces conozco algo tan apto para impresionar la imaginación como la maravillosa forma de orden cósmico expresada por la "Ley de la Frecuencia del Error". La ley habría sido personificada y divinizada por los griegos si la hubieran conocido. Reina con serenidad y con total modestia, en medio de la confusión más salvaje. Cuanto más grande es la turba y mayor la aparente anarquía, más perfecto es su dominio. Es la ley suprema de la Sinrazón. Siempre que se toma en mano una gran muestra de elementos caóticos y se ordenan según su magnitud, se demuestra que una forma insospechada y bellísima de regularidad ha estado latente desde el principio.

El término actual "teorema del límite central" (en alemán: "zentraler Grenzwertsatz") fue utilizado por primera vez por George Pólya en 1920 en el título de un artículo. [48] ​​[49] Pólya se refirió al teorema como "central" debido a su importancia en la teoría de la probabilidad. Según Le Cam, la escuela francesa de probabilidad interpreta la palabra central en el sentido de que "describe el comportamiento del centro de la distribución frente a sus colas". [49] El resumen del artículo Sobre el teorema del límite central del cálculo de probabilidad y el problema de los momentos de Pólya [48] en 1920 se traduce como sigue.

La aparición de la densidad de probabilidad gaussiana 1 = e x 2 en experimentos repetidos, en errores de medición que resultan de la combinación de muchos y muy pequeños errores elementales, en procesos de difusión, etc., se puede explicar, como es bien sabido: conocido, por el mismo teorema del límite, que juega un papel central en el cálculo de probabilidad. El verdadero descubridor de este teorema del límite se llamará Laplace; es probable que su prueba rigurosa haya sido dada por primera vez por Tschebyscheff y su formulación más aguda pueda encontrarse, hasta donde yo sé, en un artículo de Liapounoff . ...

Hald proporciona una descripción exhaustiva de la historia del teorema, que detalla el trabajo fundamental de Laplace, así como las contribuciones de Cauchy , Bessel y Poisson . [50] Hans Fischer ofrece dos relatos históricos, uno que cubre el desarrollo desde Laplace hasta Cauchy, el segundo las contribuciones de von Mises , Pólya , Lindeberg , Lévy y Cramér durante la década de 1920. [51] Le Cam describe un período alrededor de 1935. [49] Bernstein [52] presenta una discusión histórica centrada en el trabajo de Pafnuty Chebyshev y sus alumnos Andrey Markov y Aleksandr Lyapunov que condujo a las primeras pruebas del CLT en un contexto general. .

Una nota curiosa a pie de página sobre la historia del teorema del límite central es que una demostración de un resultado similar al CLT de Lindeberg de 1922 fue el tema de la disertación de beca de Alan Turing de 1934 para el King's College de la Universidad de Cambridge . Sólo después de presentar el trabajo Turing se enteró de que ya había sido probado. En consecuencia, la disertación de Turing no fue publicada. [53]

Ver también

Notas

  1. ^ Fischer (2011), pág. [ página necesaria ] .
  2. ^ Montgomery, Douglas C.; Runger, George C. (2014). Estadística Aplicada y Probabilidad para Ingenieros (6ª ed.). Wiley. pag. 241.ISBN _ 9781118539712.
  3. ^ Rouaud, Mathieu (2013). Probabilidad, Estadística y Estimación (PDF) . pag. 10. Archivado (PDF) desde el original el 9 de octubre de 2022.
  4. ^ Billingsley (1995), pág. 357.
  5. ^ Bauer (2001), pág. 199, teorema 30.13.
  6. ^ Billingsley (1995), pág. 362.
  7. ^ van der Vaart, AW (1998). Estadísticas asintóticas . Nueva York, Nueva York: Cambridge University Press. ISBN 978-0-521-49603-2. LCCN  98015176.
  8. ^ O'Donnell, Ryan (2014). "Teorema 5.38". Archivado desde el original el 8 de abril de 2019 . Consultado el 18 de octubre de 2017 .
  9. ^ Bentkus, V. (2005). "Un tipo Lyapunov encuadernado ". Teoría probable. Aplica . 49 (2): 311–323. doi :10.1137/S0040585X97981123.
  10. ^ Le Cam, L. (febrero de 1986). "El teorema del límite central alrededor de 1935". Ciencia estadística . 1 (1): 78–91. JSTOR  2245503.
  11. ^ Levy, Paul (1937). Theorie de l'addition des variables aleatoires [Teoría de la combinación de variables impredecibles] . París: Gauthier-Villars.
  12. ^ Gnedenko, Boris Vladimirovich; Kologorov, Andreĭ Nikolaevich; Doob, José L.; Hsu, Pao-Lu (1968). Limitar distribuciones para sumas de variables aleatorias independientes . Lectura, MA: Addison-wesley.
  13. ^ Nolan, John P. (2020). Distribuciones estables univariadas, Modelos para datos de cola pesada. Serie Springer en Investigación de Operaciones e Ingeniería Financiera. Suiza: Springer. doi :10.1007/978-3-030-52915-4. ISBN 978-3-030-52914-7. S2CID  226648987.
  14. ^ Billingsley (1995), Teorema 27.4.
  15. ^ Durrett (2004), secc. 7.7(c), Teorema 7.8.
  16. ^ Durrett (2004), secc. 7.7, Teorema 7.4.
  17. ^ Billingsley (1995), Teorema 35.12.
  18. ^ Limones, Don (2003). Introducción a los procesos estocásticos en física. doi :10.56021/9780801868665. ISBN 9780801876387. Consultado el 11 de agosto de 2016 . {{cite book}}: |website=ignorado ( ayuda )
  19. ^ Stein, C. (1972). "Un límite para el error en la aproximación normal a la distribución de una suma de variables aleatorias dependientes". Actas del Sexto Simposio de Berkeley sobre probabilidad y estadística matemática . 6 (2): 583–602. SEÑOR  0402873. Zbl  0278.60026.
  20. ^ Chen, LHY; Goldstein, L.; Shao, QM (2011). Aproximación normal por el método de Stein . Saltador. ISBN 978-3-642-15006-7.
  21. ^ Artstein, S .; Bola, K .; Barthe, F .; Naor, A. (2004). "Solución del problema de Shannon sobre la monotonicidad de la entropía". Revista de la Sociedad Matemática Estadounidense . 17 (4): 975–982. doi : 10.1090/S0894-0347-04-00459-X .
  22. ^ Cervecero, JK (1985). "Libros de texto de estadística del comportamiento: ¿fuente de mitos y conceptos erróneos?". Revista de Estadísticas Educativas . 10 (3): 252–268. doi :10.3102/10769986010003252. S2CID  119611584.
  23. ^ Yu, C.; Behrens, J.; Spencer, A. Identificación de conceptos erróneos en el teorema del límite central y conceptos relacionados, conferencia de la Asociación Estadounidense de Investigación Educativa 19 de abril de 1995
  24. ^ Sotos, AEC; Vanhoof, S.; Van den Noortgate, W.; Onghena, P. (2007). "Conceptos erróneos de los estudiantes sobre la inferencia estadística: una revisión de la evidencia empírica de la investigación sobre educación estadística". Revisión de investigaciones educativas . 2 (2): 98-113. doi :10.1016/j.edurev.2007.04.001.
  25. ^ "Distribución muestral de la media muestral (video) | Khan Academy". 2 de junio de 2023. Archivado desde el original el 2 de junio de 2023 . Consultado el 8 de octubre de 2023 .
  26. ^ Rosenthal, Jeffrey Seth (2000). Una primera mirada a la teoría rigurosa de la probabilidad . Científico mundial. Teorema 5.3.4, pág. 47.ISBN _ 981-02-4322-7.
  27. ^ Johnson, Oliver Thomas (2004). Teoría de la información y teorema del límite central . Prensa del Imperial College. pag. 88.ISBN _ 1-86094-473-6.
  28. ^ Uchaikin, Vladimir V.; Zolotarev, VM (1999). Suerte y estabilidad: distribuciones estables y sus aplicaciones . VSP. págs. 61–62. ISBN 90-6764-301-7.
  29. ^ Borodin, AN; Ibragimov, IA; Sudakov, VN (1995). Teoremas de límites para funcionales de paseos aleatorios . Librería AMS. Teorema 1.1, pág. 8.ISBN _ 0-8218-0438-3.
  30. ^ Petrov, VV (1976). Sumas de variables aleatorias independientes. Nueva York-Heidelberg: Springer-Verlag. cap. 7.ISBN _ 9783642658099.
  31. ^ Vaya, Patrick Chisan (2017). "Distribución asintótica de recompensas acumuladas por procesos de renovación alternos". Cartas de Estadística y Probabilidad . 129 : 355–359. doi :10.1016/j.spl.2017.06.027.
  32. ^ Rempala, G.; Wesolowski, J. (2002). "Asintóticas de productos de sumas y estadísticos U" (PDF) . Comunicaciones electrónicas en probabilidad . 7 : 47–54. doi : 10.1214/ecp.v7-1046 .
  33. ^ Klartag (2007), Teorema 1.2.
  34. ^ Durrett (2004), Sección 2.4, Ejemplo 4.5.
  35. ^ Klartag (2008), Teorema 1.
  36. ^ Klartag (2007), Teorema 1.1.
  37. ^ Zygmund, Antoni (2003) [1959]. Serie trigonométrica . Prensa de la Universidad de Cambridge. vol. II, sección. XVI.5, Teorema 5-5. ISBN 0-521-89053-5.
  38. ^ Gaposhkin (1966), Teorema 2.1.13.
  39. ^ Bárány & Vu (2007), Teorema 1.1.
  40. ^ Bárány & Vu (2007), Teorema 1.2.
  41. ^ Meckes, Isabel (2008). "Funciones lineales sobre los grupos matriciales clásicos". Transacciones de la Sociedad Matemática Estadounidense . 360 (10): 5355–5366. arXiv : matemáticas/0509441 . doi :10.1090/S0002-9947-08-04444-9. S2CID  11981408.
  42. ^ Gaposhkin (1966), secc. 1.5.
  43. ^ Kotani, M.; Sunada, Toshikazu (2003). Geometría espectral de redes cristalinas . vol. 338. Matemáticas contemporáneas. págs. 271–305. ISBN 978-0-8218-4269-0.
  44. ^ Sunada, Toshikazu (2012). Cristalografía topológica: con miras al análisis geométrico discreto . Encuestas y Tutorías en Ciencias Matemáticas Aplicadas. vol. 6. Saltador. ISBN 978-4-431-54177-6.
  45. ^ Marasinghe, M.; Meeker, W.; Cocinero, D.; Shin, TS (agosto de 1994). Usar gráficos y simulación para enseñar conceptos estadísticos . Reunión anual de la Asociación Estadounidense de Estadísticos, Toronto, Canadá.
  46. ^ Henk, Tijms (2004). Comprensión de la probabilidad: reglas del azar en la vida cotidiana . Cambridge: Prensa de la Universidad de Cambridge. pag. 169.ISBN _ 0-521-54036-4.
  47. ^ Galton, F. (1889). Herencia natural. pag. 66.
  48. ^ ab Pólya, George (1920). "Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem" [Sobre el teorema del límite central del cálculo de probabilidades y el problema de los momentos]. Mathematische Zeitschrift (en alemán). 8 (3–4): 171–181. doi :10.1007/BF01206525. S2CID  123063388.
  49. ^ abc Le Cam, Lucien (1986). "El teorema del límite central alrededor de 1935". Ciencia estadística . 1 (1): 78–91. doi : 10.1214/ss/1177013818 .
  50. ^ Hald, Andreas (22 de abril de 1998). Una historia de la estadística matemática de 1750 a 1930 (PDF) . Wiley. capítulo 17. ISBN 978-0471179122. Archivado (PDF) desde el original el 9 de octubre de 2022. {{cite book}}: |website=ignorado ( ayuda )
  51. ^ Fischer (2011), Capítulo 2; Capítulo 5.2.
  52. ^ Bernstein, SN (1945). "Sobre el trabajo de PL Chebyshev en la teoría de la probabilidad". En Bernstein., SN (ed.). Nauchnoe Nasledie PL Chebysheva. Vypusk Pervyi: Matematika [ El legado científico de PL Chebyshev. Parte I: Matemáticas ] (en ruso). Moscú y Leningrado: Academiya Nauk SSSR. pag. 174.
  53. ^ Zabell, SL (1995). "Alan Turing y el teorema del límite central". Mensual Matemático Estadounidense . 102 (6): 483–494. doi :10.1080/00029890.1995.12004608.
  54. ^ Jørgensen, doblado (1997). La teoría de los modelos de dispersión . Chapman y Hall. ISBN 978-0412997112.

Referencias

enlaces externos