Teorema de De Moivre-Laplace

Consideremos el caso de lanzar un conjunto de n monedas una gran cantidad de veces y contar la cantidad de "caras" que resultan cada vez. La cantidad posible de caras en cada lanzamiento, k , va de 0 a n a lo largo del eje horizontal, mientras que el eje vertical representa la frecuencia relativa de ocurrencia del resultado k caras. La altura de cada punto es, por lo tanto, la probabilidad de observar k caras al lanzar n monedas (una distribución binomial basada en n ensayos). Según el teorema de De Moivre-Laplace, a medida que n aumenta, la forma de la distribución discreta converge a la curva gaussiana continua de la distribución normal .

En teoría de la probabilidad , el teorema de De Moivre-Laplace , que es un caso especial del teorema del límite central , establece que la distribución normal puede utilizarse como aproximación a la distribución binomial en determinadas condiciones. En particular, el teorema muestra que la función de masa de probabilidad del número aleatorio de "éxitos" observados en una serie de ensayos de Bernoulli independientes , cada uno con probabilidad de éxito (una distribución binomial con ensayos), converge a la función de densidad de probabilidad de la distribución normal con expectativa y desviación estándar , a medida que crece, suponiendo que no es o . ${\estilo de visualización n}$ ${\estilo de visualización p}$ ${\estilo de visualización n}$ ${\estilo de visualización np}$ ${\textstyle {\sqrt {np(1-p)}}}$ ${\estilo de visualización n}$ ${\estilo de visualización p}$ ${\estilo de visualización 0}$ ${\estilo de visualización 1}$

El teorema apareció en la segunda edición de La doctrina de las probabilidades de Abraham de Moivre , publicada en 1738. Aunque de Moivre no utilizó el término "ensayos de Bernoulli", escribió sobre la distribución de probabilidad del número de veces que aparece "cara" cuando se lanza una moneda 3600 veces. ^[1]

Ésta es una derivación de la función gaussiana particular utilizada en la distribución normal.

Es un caso especial del teorema del límite central porque un proceso de Bernoulli puede considerarse como la extracción de variables aleatorias independientes de una distribución discreta bimodal con probabilidad distinta de cero solo para los valores 0 y 1. En este caso, la distribución binomial modela el número de éxitos (es decir, el número de 1), mientras que el teorema del límite central establece que, dado un n suficientemente grande , la distribución de las medias muestrales será aproximadamente normal. Sin embargo, debido a que en este caso la fracción de éxitos (es decir, el número de 1 dividido por el número de ensayos, n ) es igual a la media muestral , la distribución de las fracciones de éxitos (descrita por la distribución binomial dividida por la constante n ) y la distribución de las medias muestrales (aproximadamente normal con n grande debido al teorema del límite central) son equivalentes.

Teorema

A medida que n crece, para k en el entorno de np podemos aproximarnos ^{a [2]}^[3]

{n \choose k}\,p^{k}q^{nk}\simeq {\frac {1}{\sqrt {2\pi npq}}}\,e^{-{\frac { (k-np)^{2}}{2npq}}},\qquad p+q=1,\ p,q>0

en el sentido de que la relación entre el lado izquierdo y el lado derecho converge a 1 cuando n → ∞.

Prueba

El teorema se puede enunciar de manera más rigurosa de la siguiente manera: , con una variable aleatoria distribuida binomialmente, se aproxima a la normal estándar como , con una relación entre la masa de probabilidad de y la densidad normal límite que es 1. Esto se puede demostrar para un punto arbitrario distinto de cero y finito . En la curva sin escala para , este sería un punto dado por $\left(X\!\,-\!\,np\right)\!/\!{\sqrt {npq}}$ $\textstyle X$ $n\!\to \!\infty$ ${\estilo de visualización X}$ ${\estilo de visualización c}$ ${\estilo de visualización X}$ ${\estilo de visualización k}$

k=np+c{\sqrt {npq}}

Por ejemplo, con 3, permanece 3 desviaciones estándar de la media en la curva sin escala. ${\estilo de visualización c}$ ${\estilo de visualización k}$

La distribución normal con media y desviación estándar se define mediante la ecuación diferencial (ED) ${\estilo de visualización \mu}$ ${\estilo de visualización \sigma}$

f'\!(x)\!=\!-\!\,{\frac {x-\mu }{\sigma ^{2}}}f(x)

con una condición inicial establecida por el axioma de probabilidad .

\int _{-\infty }^{\infty }\!f(x)\,dx\!=\!1

El límite de la distribución binomial se aproxima a la normal si la binomial satisface esta ED. Como la binomial es discreta, la ecuación comienza como una ecuación diferencial cuyo límite se transforma en una ED. Las ecuaciones diferenciales utilizan la derivada discreta, , el cambio para un tamaño de paso 1. Como , la derivada discreta se convierte en la derivada continua . Por lo tanto, la prueba solo necesita mostrar que, para la distribución binomial sin escala, $\textstyle p(k\!+\!1)\!-\!p(k)$ $\textstyle n\!\to \!\infty$

{\frac {f'\!(x)}{f\!(x)}}\!\cdot \!\left(-{\frac {\sigma ^{2}}{x-\mu }}\right)\!\to \!1

como .

n\!\to \!\infty

El resultado requerido se puede mostrar directamente:

{\begin{aligned}{\frac {f'\!(x)}{f\!(x)}}{\frac {npq}{np\!\,-\!\,k}}\!&={\frac {p\left(n,k+1\right)-p\left(n,k\right)}{p\left(n,k\right)}}{\frac {\sqrt {npq}}{-c}}\\&={\frac {np-kq}{kq+q}}{\frac {\sqrt {npq}}{-c}}\\&={\frac {-c{\sqrt {npq}}-q}{npq+cq{\sqrt {npq}}+q}}{\frac {\sqrt {npq}}{-c}}\\&\to 1\end{aligned}}

Esto último es válido porque el término domina tanto el denominador como el numerador como . ${\estilo de visualización -cnpq}$ $n\!\to \!\infty$

Como sólo toma valores enteros, la constante está sujeta a un error de redondeo. Sin embargo, el máximo de este error, , es un valor que se desvanece. ^[4] $\textstyle k$ $\textstyle c$ $\textstyle {0.5}/\!{\sqrt {npq}}$

Prueba alternativa

La demostración consiste en transformar el lado izquierdo (en el enunciado del teorema) en el lado derecho mediante tres aproximaciones.

En primer lugar, según la fórmula de Stirling , el factorial de un número grande n se puede reemplazar con la aproximación

n!\simeq n^{n}e^{-n}{\sqrt {2\pi n}}\qquad {\text{as }}n\to \infty .

De este modo

{\begin{aligned}{n \choose k}p^{k}q^{n-k}&={\frac {n!}{k!(n-k)!}}p^{k}q^{n-k}\\&\simeq {\frac {n^{n}e^{-n}{\sqrt {2\pi n}}}{k^{k}e^{-k}{\sqrt {2\pi k}}(n-k)^{n-k}e^{-(n-k)}{\sqrt {2\pi (n-k)}}}}p^{k}q^{n-k}\\&={\sqrt {\frac {n}{2\pi k\left(n-k\right)}}}{\frac {n^{n}}{k^{k}\left(n-k\right)^{n-k}}}p^{k}q^{n-k}\\&={\sqrt {\frac {n}{2\pi k\left(n-k\right)}}}\left({\frac {np}{k}}\right)^{k}\left({\frac {nq}{n-k}}\right)^{n-k}\end{aligned}}

A continuación, se utiliza la aproximación para hacer coincidir la raíz de arriba con la raíz deseada en el lado derecho. ${\tfrac {k}{n}}\to p$

{\begin{aligned}{n \choose k}p^{k}q^{n-k}&\simeq {\sqrt {\frac {1}{2\pi n{\frac {k}{n}}\left(1-{\frac {k}{n}}\right)}}}\left({\frac {np}{k}}\right)^{k}\left({\frac {nq}{n-k}}\right)^{n-k}\\&\simeq {\frac {1}{\sqrt {2\pi npq}}}\left({\frac {np}{k}}\right)^{k}\left({\frac {nq}{n-k}}\right)^{n-k}\qquad p+q=1\\\end{aligned}}

Finalmente, la expresión se reescribe como exponencial y se utiliza la aproximación de la serie de Taylor para ln(1+x):

\ln \left(1+x\right)\simeq x-{\frac {x^{2}}{2}}+{\frac {x^{3}}{3}}-\cdots

Entonces

{\begin{aligned}{n \choose k}p^{k}q^{n-k}&\simeq {\frac {1}{\sqrt {2\pi npq}}}\exp \left\{\ln \left(\left({\frac {np}{k}}\right)^{k}\right)+\ln \left(\left({\frac {nq}{n-k}}\right)^{n-k}\right)\right\}\\&={\frac {1}{\sqrt {2\pi npq}}}\exp \left\{-k\ln \left({\frac {k}{np}}\right)+(k-n)\ln \left({\frac {n-k}{nq}}\right)\right\}\\&={\frac {1}{\sqrt {2\pi npq}}}\exp \left\{-k\ln \left({\frac {np+x{\sqrt {npq}}}{np}}\right)+(k-n)\ln \left({\frac {n-np-x{\sqrt {npq}}}{nq}}\right)\right\}\\&={\frac {1}{\sqrt {2\pi npq}}}\exp \left\{-k\ln \left({1+x{\sqrt {\frac {q}{np}}}}\right)+(k-n)\ln \left({1-x{\sqrt {\frac {p}{nq}}}}\right)\right\}\qquad p+q=1\\&={\frac {1}{\sqrt {2\pi npq}}}\exp \left\{-k\left({x{\sqrt {\frac {q}{np}}}}-{\frac {x^{2}q}{2np}}+\cdots \right)+(k-n)\left({-x{\sqrt {\frac {p}{nq}}}-{\frac {x^{2}p}{2nq}}}-\cdots \right)\right\}\\&={\frac {1}{\sqrt {2\pi npq}}}\exp \left\{\left(-np-x{\sqrt {npq}}\right)\left({x{\sqrt {\frac {q}{np}}}}-{\frac {x^{2}q}{2np}}+\cdots \right)+\left(np+x{\sqrt {npq}}-n\right)\left(-x{\sqrt {\frac {p}{nq}}}-{\frac {x^{2}p}{2nq}}-\cdots \right)\right\}\\&={\frac {1}{\sqrt {2\pi npq}}}\exp \left\{\left(-np-x{\sqrt {npq}}\right)\left(x{\sqrt {\frac {q}{np}}}-{\frac {x^{2}q}{2np}}+\cdots \right)-\left(nq-x{\sqrt {npq}}\right)\left(-x{\sqrt {\frac {p}{nq}}}-{\frac {x^{2}p}{2nq}}-\cdots \right)\right\}\\&={\frac {1}{\sqrt {2\pi npq}}}\exp \left\{\left(-x{\sqrt {npq}}+{\frac {1}{2}}x^{2}q-x^{2}q+\cdots \right)+\left(x{\sqrt {npq}}+{\frac {1}{2}}x^{2}p-x^{2}p-\cdots \right)\right\}\\&={\frac {1}{\sqrt {2\pi npq}}}\exp \left\{-{\frac {1}{2}}x^{2}q-{\frac {1}{2}}x^{2}p-\cdots \right\}\\&={\frac {1}{\sqrt {2\pi npq}}}\exp \left\{-{\frac {1}{2}}x^{2}(p+q)-\cdots \right\}\\&\simeq {\frac {1}{\sqrt {2\pi npq}}}\exp \left\{-{\frac {1}{2}}x^{2}\right\}\\&={\frac {1}{\sqrt {2\pi npq}}}e^{\frac {-(k-np)^{2}}{2npq}}\\\end{aligned}}

Cada " " en el argumento anterior es una afirmación de que dos cantidades son asintóticamente equivalentes a medida que n aumenta, en el mismo sentido que en la afirmación original del teorema, es decir, que la relación de cada par de cantidades se acerca a 1 cuando n → ∞. $\simeq$

Véase también

Teorema del límite de Poisson, una aproximación alternativa de la distribución binomial para valores grandes de n .

Notas

^ Walker, Helen M (1985). "De Moivre sobre la ley de la probabilidad normal" (PDF) . En Smith, David Eugene (ed.). Un libro de consulta sobre matemáticas. Dover. p. 78. ISBN 0-486-64690-4. Pero aunque no sea posible realizar un número infinito de experimentos, las conclusiones anteriores pueden aplicarse muy bien a números finitos, siempre que sean grandes; por ejemplo, si se realizan 3600 experimentos, haga n = 3600, por lo tanto, ½ n será = 1800 y ½√ n 30, entonces la probabilidad de que el evento no aparezca menos de 1830 veces, ni menos de 1770, será 0,682688.
^ Papoulis, Athanasios ; Pillai, S. Unnikrishna (2002). Probabilidad, variables aleatorias y procesos estocásticos (4.ª ed.). Boston: McGraw-Hill. ISBN 0-07-122661-3.
^ Feller, W. (1968). Introducción a la teoría de la probabilidad y sus aplicaciones . Vol. 1. Wiley. Sección VII.3. ISBN 0-471-25708-7.
^ Thamattoor, Ajoy (2018). "Límite normal del binomio a través de la derivada discreta". The College Mathematics Journal . 49 (3): 216–217. doi :10.1080/07468342.2018.1440872. S2CID 125977913.