El teorema apareció en la segunda edición de La doctrina de las probabilidades de Abraham de Moivre , publicada en 1738. Aunque de Moivre no utilizó el término "ensayos de Bernoulli", escribió sobre la distribución de probabilidad del número de veces que aparece "cara" cuando se lanza una moneda 3600 veces. [1]
Ésta es una derivación de la función gaussiana particular utilizada en la distribución normal.
Es un caso especial del teorema del límite central porque un proceso de Bernoulli puede considerarse como la extracción de variables aleatorias independientes de una distribución discreta bimodal con probabilidad distinta de cero solo para los valores 0 y 1. En este caso, la distribución binomial modela el número de éxitos (es decir, el número de 1), mientras que el teorema del límite central establece que, dado un n suficientemente grande , la distribución de las medias muestrales será aproximadamente normal. Sin embargo, debido a que en este caso la fracción de éxitos (es decir, el número de 1 dividido por el número de ensayos, n ) es igual a la media muestral , la distribución de las fracciones de éxitos (descrita por la distribución binomial dividida por la constante n ) y la distribución de las medias muestrales (aproximadamente normal con n grande debido al teorema del límite central) son equivalentes.
Teorema
A medida que n crece, para k en el entorno de np podemos aproximarnos a [2] [3]
en el sentido de que la relación entre el lado izquierdo y el lado derecho converge a 1 cuando n → ∞.
Prueba
El teorema se puede enunciar de manera más rigurosa de la siguiente manera: , con una variable aleatoria distribuida binomialmente, se aproxima a la normal estándar como , con una relación entre la masa de probabilidad de y la densidad normal límite que es 1. Esto se puede demostrar para un punto arbitrario distinto de cero y finito . En la curva sin escala para , este sería un punto dado por
Por ejemplo, con 3, permanece 3 desviaciones estándar de la media en la curva sin escala.
La distribución normal con media y desviación estándar se define mediante la ecuación diferencial (ED)
con una condición inicial establecida por el axioma de probabilidad .
El límite de la distribución binomial se aproxima a la normal si la binomial satisface esta ED. Como la binomial es discreta, la ecuación comienza como una ecuación diferencial cuyo límite se transforma en una ED. Las ecuaciones diferenciales utilizan la derivada discreta, , el cambio para un tamaño de paso 1. Como , la derivada discreta se convierte en la derivada continua . Por lo tanto, la prueba solo necesita mostrar que, para la distribución binomial sin escala,
como .
El resultado requerido se puede mostrar directamente:
Esto último es válido porque el término domina tanto el denominador como el numerador como .
Como sólo toma valores enteros, la constante está sujeta a un error de redondeo. Sin embargo, el máximo de este error, , es un valor que se desvanece. [4]
Prueba alternativa
La demostración consiste en transformar el lado izquierdo (en el enunciado del teorema) en el lado derecho mediante tres aproximaciones.
En primer lugar, según la fórmula de Stirling , el factorial de un número grande n se puede reemplazar con la aproximación
De este modo
A continuación, se utiliza la aproximación para hacer coincidir la raíz de arriba con la raíz deseada en el lado derecho.
Finalmente, la expresión se reescribe como exponencial y se utiliza la aproximación de la serie de Taylor para ln(1+x):
Entonces
Cada " " en el argumento anterior es una afirmación de que dos cantidades son asintóticamente equivalentes a medida que n aumenta, en el mismo sentido que en la afirmación original del teorema, es decir, que la relación de cada par de cantidades se acerca a 1 cuando n → ∞.
^ Walker, Helen M (1985). "De Moivre sobre la ley de la probabilidad normal" (PDF) . En Smith, David Eugene (ed.). Un libro de consulta sobre matemáticas. Dover. p. 78. ISBN 0-486-64690-4. Pero aunque no sea posible realizar un número infinito de experimentos, las conclusiones anteriores pueden aplicarse muy bien a números finitos, siempre que sean grandes; por ejemplo, si se realizan 3600 experimentos, haga n = 3600, por lo tanto, ½ n será = 1800 y ½√ n 30, entonces la probabilidad de que el evento no aparezca menos de 1830 veces, ni menos de 1770, será 0,682688.
^ Papoulis, Athanasios ; Pillai, S. Unnikrishna (2002). Probabilidad, variables aleatorias y procesos estocásticos (4.ª ed.). Boston: McGraw-Hill. ISBN0-07-122661-3.
^ Feller, W. (1968). Introducción a la teoría de la probabilidad y sus aplicaciones . Vol. 1. Wiley. Sección VII.3. ISBN0-471-25708-7.
^ Thamattoor, Ajoy (2018). "Límite normal del binomio a través de la derivada discreta". The College Mathematics Journal . 49 (3): 216–217. doi :10.1080/07468342.2018.1440872. S2CID 125977913.