Distribución de Poisson

En teoría de probabilidad y estadística , la distribución de Poisson es una distribución de probabilidad discreta que expresa la probabilidad de que ocurra un número dado de eventos en un intervalo fijo de tiempo si estos eventos ocurren con una tasa media constante conocida e independientemente del tiempo transcurrido desde el último evento. ^[1] También se puede utilizar para el número de eventos en otros tipos de intervalos distintos del tiempo, y en dimensión mayor que 1 (por ejemplo, número de eventos en un área o volumen determinado).

La distribución de Poisson recibe su nombre del matemático francés Siméon Denis Poisson ( / ˈpwɑːsɒn / ; pronunciación francesa: [ pwasɔ̃ ] ) . Desempeña un papel importante en las distribuciones discretas - estables .

Bajo una distribución de Poisson con la expectativa de λ eventos en un intervalo dado, la probabilidad de k eventos en el mismo intervalo es: ^[2]^{: 60}

{\frac {\lambda ^{k}e^{-\lambda }}{k!}}.

Por ejemplo, supongamos que un centro de llamadas recibe, aleatoriamente, un promedio de λ = 3 llamadas por minuto a todas horas del día. Si las llamadas son independientes, recibir una no cambia la probabilidad de cuándo llegará la siguiente. Con arreglo a estos supuestos, la cantidad k de llamadas recibidas durante cualquier minuto tiene una distribución de probabilidad de Poisson. Recibir k = 1 a 4 llamadas tiene entonces una probabilidad de aproximadamente 0,77, mientras que recibir 0 o al menos 5 llamadas tiene una probabilidad de aproximadamente 0,23.

Un ejemplo clásico utilizado para motivar la distribución de Poisson es el número de eventos de desintegración radiactiva durante un período de observación fijo. ^[3]

Historia

La distribución fue introducida por primera vez por Siméon Denis Poisson (1781-1840) y publicada junto con su teoría de probabilidad en su obra Recherches sur la probabilité des jugements en matière criminelle et en matière civile (1837). ^[4]^{: 205-207} El trabajo teorizó sobre el número de condenas injustas en un país determinado centrándose en ciertas variables aleatorias $N$ que cuentan, entre otras cosas, el número de ocurrencias discretas (a veces llamadas "eventos" o "llegadas") que tienen lugar durante un intervalo de tiempo de longitud dada. El resultado ya había sido dado en 1711 por Abraham de Moivre en De Mensura Sortis seu; de Probabilitate Eventuum in Ludis a Casu Fortuito Pendentibus . ^[5]^{: 219}^[6]^{: 14-15}^[7]^{: 193}^[8]^{: 157} Esto lo convierte en un ejemplo de la ley de Stigler y ha llevado a algunos autores a argumentar que la distribución de Poisson debería llevar el nombre de De Moivre. ^[9]^[10]

En 1860, Simon Newcomb ajustó la distribución de Poisson al número de estrellas que se encuentran en una unidad de espacio. ^[11]Ladislaus Bortkiewicz realizó otra aplicación práctica en 1898. Bortkiewicz demostró que la frecuencia con la que los soldados del ejército prusiano morían accidentalmente por patadas de caballo podía modelarse bien mediante una distribución de Poisson. ^[12]^{: 23-25} .

Definiciones

Función de masa de probabilidad

Se dice que una variable aleatoria discreta $X$ tiene una distribución de Poisson, con parámetro si tiene una función de masa de probabilidad dada por: ^[2]^{: 60} $\lambda >0,$

f(k;\lambda )=\Pr(X{=}k)={\frac {\lambda ^{k}e^{-\lambda }}{k!}},

dónde

$k$ es el número de ocurrencias ( ) $k=0,1,2,\ldots$
$e$ es el número de Euler ( ) $e=2.71828\ldots$
k ! = k ( k– 1) ··· (3)(2)(1) es el factorial .

El número real positivo $λ$ es igual al valor esperado de $X$ y también a su varianza . ^[13]

\lambda =\operatorname {E} (X)=\operatorname {Var} (X).

La distribución de Poisson se puede aplicar a sistemas con una gran cantidad de eventos posibles, cada uno de los cuales es poco común . El número de eventos de este tipo que ocurren durante un intervalo de tiempo fijo es, en las circunstancias adecuadas, un número aleatorio con una distribución de Poisson.

La ecuación se puede adaptar si, en lugar del número promedio de eventos, nos dan la tasa promedio a la que ocurren los eventos. Entonces y: ^[14] $\lambda ,$ $r$ $\lambda =rt,$

P(k{\text{ events in interval }}t)={\frac {(rt)^{k}e^{-rt}}{k!}}.

Ejemplos

La distribución de Poisson puede ser útil para modelar eventos como:

el número de meteoritos de más de un metro de diámetro que impactan la Tierra en un año;
el número de fotones láser que inciden en un detector en un intervalo de tiempo determinado;
el número de estudiantes que obtienen una calificación baja y alta en un examen; y
Ubicación de defectos y dislocaciones en materiales.

Ejemplos de la aparición de puntos aleatorios en el espacio son: las ubicaciones de los impactos de asteroides con la Tierra (bidimensionales), las ubicaciones de las imperfecciones en un material (tridimensionales) y las ubicaciones de los árboles en un bosque (bidimensionales). ^[15]

Supuestos y validez

La distribución de Poisson es un modelo apropiado si se cumplen los siguientes supuestos:

$k$ es el número de veces que ocurre un evento en un intervalo y $k$ puede tomar valores 0, 1, 2, ... .
La ocurrencia de un evento no afecta la probabilidad de que ocurra un segundo evento. Es decir, los eventos ocurren independientemente.
La tasa promedio a la que ocurren los eventos es independiente de cualquier ocurrencia. Para simplificar, generalmente se supone que es constante, pero en la práctica puede variar con el tiempo.
Dos eventos no pueden ocurrir exactamente en el mismo instante; en cambio, en cada subintervalo muy pequeño, ocurre exactamente un evento o no ocurre ningún evento.

Si estas condiciones son verdaderas, entonces $k$ es una variable aleatoria de Poisson y la distribución de $k$ es una distribución de Poisson.

La distribución de Poisson es también el límite de una distribución binomial , para la cual la probabilidad de éxito de cada ensayo es igual $a λ$ dividido por el número de ensayos, a medida que el número de ensayos se acerca al infinito (ver Distribuciones relacionadas).

Ejemplos de probabilidad para distribuciones de Poisson

Eventos que ocurren una vez en un intervalo: el caso especial de $la$ = 1 y $a$ = 0

Supongamos que los astrónomos estiman que los meteoritos grandes (de un tamaño superior a determinado) impactan la Tierra en promedio una vez cada 100 años ( $λ$ = 1 evento cada 100 años), y que el número de impactos de meteoritos sigue una distribución de Poisson. ¿Cuál es la probabilidad de que $k$ = 0 impactos de meteoritos en los próximos 100 años?

P(k={\text{0 meteorites hit in next 100 years}})={\frac {1^{0}e^{-1}}{0!}}={\frac {1}{e}}\approx 0.37.

Según estos supuestos, la probabilidad de que no caigan meteoritos de gran tamaño sobre la Tierra en los próximos 100 años es de aproximadamente 0,37. El 1 − 0,37 = 0,63 restante es la probabilidad de que caigan 1, 2, 3 o más meteoritos de gran tamaño en los próximos 100 años. En el ejemplo anterior, se produjo una inundación por desbordamiento una vez cada 100 años ( $λ$ = 1). La probabilidad de que no se produjeran inundaciones por desbordamiento en 100 años era de aproximadamente 0,37, según el mismo cálculo.

En general, si un evento ocurre en promedio una vez por intervalo ( $λ$ = 1), y los eventos siguen una distribución de Poisson, entonces $P$ (0 eventos en el siguiente intervalo) = 0,37. Además, $P$ (exactamente un evento en el siguiente intervalo) = 0,37, como se muestra en la tabla para inundaciones por desbordamiento.

Ejemplos que violan los supuestos de Poisson

La cantidad de estudiantes que llegan a la asociación de estudiantes por minuto probablemente no seguirá una distribución de Poisson, porque la tasa no es constante (tasa baja durante el horario de clase, tasa alta entre horarios de clase) y las llegadas de estudiantes individuales no son independientes (los estudiantes tienden a venir en grupos). La tasa de llegada no constante se puede modelar como una distribución de Poisson mixta y la llegada de grupos en lugar de estudiantes individuales como un proceso de Poisson compuesto .

El número de terremotos de magnitud 5 por año en un país puede no seguir una distribución de Poisson, si un gran terremoto aumenta la probabilidad de réplicas de magnitud similar.

Los ejemplos en los que se garantiza al menos un evento no tienen distribución de Poisson, pero pueden modelarse utilizando una distribución de Poisson truncada en cero .

Las distribuciones de recuento en las que el número de intervalos con cero eventos es mayor que el previsto por un modelo de Poisson se pueden modelar utilizando un modelo de ceros inflados .

Propiedades

Estadísticas descriptivas

El valor esperado y la varianza de una variable aleatoria distribuida según Poisson son ambos iguales a $λ$ .
El coeficiente de variación es mientras que el índice de dispersión es 1. ^[8]^{: 163} ${\textstyle \lambda ^{-1/2},}$
La desviación absoluta media respecto a la media es ^[8]^{: 163} $\operatorname {E} [\ |X-\lambda |\ ]={\frac {2\lambda ^{\lfloor \lambda \rfloor +1}e^{-\lambda }}{\lfloor \lambda \rfloor !}}.$
La moda de una variable aleatoria distribuida por Poisson con un número no entero $λ$ es igual a , que es el mayor número entero menor o igual a $λ$ . Esto también se escribe como floor ( $λ$ ). Cuando $λ$ es un número entero positivo, las modas son $λ$ y $λ$ − 1. $\lfloor \lambda \rfloor ,$
Todos los cumulantes de la distribución de Poisson son iguales al valor esperado $λ$ . El momento factorial n $de$ la distribución de Poisson es $λ$ ^$n$ .
El valor esperado de un proceso de Poisson a veces se descompone en el producto de la intensidad y la exposición (o se expresa más generalmente como la integral de una "función de intensidad" en el tiempo o el espacio, a veces descrita como "exposición"). ^[17]

Mediana

Los límites para la mediana ( ) de la distribución son conocidos y precisos : ^[18] $\nu$ $\lambda -\ln 2\leq \nu <\lambda +{\frac {1}{3}}.$

Momentos más elevados

Los momentos no centrados superiores , $m$ _$k$ de la distribución de Poisson, son polinomios de Touchard en $λ$ : donde las llaves { } denotan números de Stirling de segundo tipo . ^[19]^[1]^{: 6} En otras palabras, cuando el valor esperado se establece en λ = 1, la fórmula de Dobinski implica que el $n$ -ésimo momento es igual al número de particiones de un conjunto de tamaño $n$ . $m_{k}=\sum _{i=0}^{k}\lambda ^{i}{\begin{Bmatrix}k\\i\end{Bmatrix}},$ $E[X]=\lambda ,\quad E[X(X-1)]=\lambda ^{2},\quad E[X(X-1)(X-2)]=\lambda ^{3},\cdots$

Un límite superior simple es: ^[20] $m_{k}=E[X^{k}]\leq \left({\frac {k}{\log(k/\lambda +1)}}\right)^{k}\leq \lambda ^{k}\exp \left({\frac {k^{2}}{2\lambda }}\right).$

Sumas de variables aleatorias distribuidas por Poisson

Si para son independientes , entonces ^[21]^{: 65} Un recíproco es el teorema de Raikov , que dice que si la suma de dos variables aleatorias independientes tiene distribución de Poisson, entonces también lo son cada una de esas dos variables aleatorias independientes. ^[22]^[23] $X_{i}\sim \operatorname {Pois} (\lambda _{i})$ $i=1,\dotsc ,n$ ${\textstyle \sum _{i=1}^{n}X_{i}\sim \operatorname {Pois} \left(\sum _{i=1}^{n}\lambda _{i}\right).}$

Entropía máxima

Es una distribución de máxima entropía entre el conjunto de distribuciones binomiales generalizadas con media y , ^[24] donde una distribución binomial generalizada se define como una distribución de la suma de N variables de Bernoulli independientes pero no idénticamente distribuidas. $B_{n}(\lambda )$ $\lambda$ $n\rightarrow \infty$

Otras propiedades

Las distribuciones de Poisson son distribuciones de probabilidad infinitamente divisibles . ^[25]^{: 233}^[8]^{: 164}
La divergencia dirigida de Kullback-Leibler de está dada por $P=\operatorname {Pois} (\lambda )$ $P_{0}=\operatorname {Pois} (\lambda _{0})$ $\operatorname {D} _{\text{KL}}(P\parallel P_{0})=\lambda _{0}-\lambda +\lambda \log {\frac {\lambda }{\lambda _{0}}}.$
Si es un entero, entonces satisface y ^[26]^[^{verificación fallida}^–^{ver discusión}^] $\lambda \geq 1$ $Y\sim \operatorname {Pois} (\lambda )$ $\Pr(Y\geq E[Y])\geq {\frac {1}{2}}$ $\Pr(Y\leq E[Y])\geq {\frac {1}{2}}.$
Los límites para las probabilidades de cola de una variable aleatoria de Poisson se pueden derivar utilizando un argumento de límite de Chernoff . ^[27]^{: 97-98} $X\sim \operatorname {Pois} (\lambda )$ $P(X\geq x)\leq {\frac {(e\lambda )^{x}e^{-\lambda }}{x^{x}}},{\text{ for }}x>\lambda ,$ $P(X\leq x)\leq {\frac {(e\lambda )^{x}e^{-\lambda }}{x^{x}}},{\text{ for }}x<\lambda .$
La probabilidad de cola superior se puede ajustar (por un factor de al menos dos) de la siguiente manera: ^[28]

$P(X\geq x)\leq {\frac {e^{-\operatorname {D} _{\text{KL}}(Q\parallel P)}}{\max {(2,{\sqrt {4\pi \operatorname {D} _{\text{KL}}(Q\parallel P)}}})}},{\text{ for }}x>\lambda ,$ ¿Dónde está la divergencia de Kullback-Leibler de de ? $\operatorname {D} _{\text{KL}}(Q\parallel P)$ $Q=\operatorname {Pois} (x)$ $P=\operatorname {Pois} (\lambda )$

Las desigualdades que relacionan la función de distribución de una variable aleatoria de Poisson con la función de distribución normal estándar son las siguientes: ^[29] donde es la divergencia de Kullback–Leibler de de y es la divergencia de Kullback–Leibler de de . $X\sim \operatorname {Pois} (\lambda )$ $\Phi (x)$ $\Phi \left(\operatorname {sign} (k-\lambda ){\sqrt {2\operatorname {D} _{\text{KL}}(Q_{-}\parallel P)}}\right)<P(X\leq k)<\Phi \left(\operatorname {sign} (k+1-\lambda ){\sqrt {2\operatorname {D} _{\text{KL}}(Q_{+}\parallel P)}}\right),{\text{ for }}k>0,$ $\operatorname {D} _{\text{KL}}(Q_{-}\parallel P)$ $Q_{-}=\operatorname {Pois} (k)$ $P=\operatorname {Pois} (\lambda )$ $\operatorname {D} _{\text{KL}}(Q_{+}\parallel P)$ $Q_{+}=\operatorname {Pois} (k+1)$ $P$

Razas de Poisson

Sean y variables aleatorias independientes, con lo que tenemos que $X\sim \operatorname {Pois} (\lambda )$ $Y\sim \operatorname {Pois} (\mu )$ $\lambda <\mu ,$ ${\frac {e^{-({\sqrt {\mu }}-{\sqrt {\lambda }})^{2}}}{(\lambda +\mu )^{2}}}-{\frac {e^{-(\lambda +\mu )}}{2{\sqrt {\lambda \mu }}}}-{\frac {e^{-(\lambda +\mu )}}{4\lambda \mu }}\leq P(X-Y\geq 0)\leq e^{-({\sqrt {\mu }}-{\sqrt {\lambda }})^{2}}$

El límite superior se demuestra utilizando un límite de Chernoff estándar.

El límite inferior se puede demostrar observando que es la probabilidad de que donde que está acotado por debajo por donde es la entropía relativa (ver la entrada sobre límites en las colas de las distribuciones binomiales para más detalles). Observando además que y calculando un límite inferior en la probabilidad incondicional se obtiene el resultado. Se pueden encontrar más detalles en el apéndice de Kamath et al. ^[30] $P(X-Y\geq 0\mid X+Y=i)$ ${\textstyle Z\geq {\frac {i}{2}},}$ ${\textstyle Z\sim \operatorname {Bin} \left(i,{\frac {\lambda }{\lambda +\mu }}\right),}$ ${\textstyle {\frac {1}{(i+1)^{2}}}e^{-iD\left(0.5\|{\frac {\lambda }{\lambda +\mu }}\right)},}$ $D$ $X+Y\sim \operatorname {Pois} (\lambda +\mu ),$

Distribuciones relacionadas

Como una distribución binomial con pasos de tiempo infinitesimales

La distribución de Poisson se puede derivar como un caso límite de la distribución binomial , ya que el número de ensayos tiende al infinito y el número esperado de éxitos permanece fijo (véase la ley de los eventos raros a continuación). Por lo tanto, se puede utilizar como una aproximación de la distribución binomial si $n$ es suficientemente grande y p es suficientemente pequeño. La distribución de Poisson es una buena aproximación de la distribución binomial si $n$ es al menos 20 y p es menor o igual a 0,05, y una excelente aproximación si $n$ ≥ 100 y $np$ ≤ 10. ^[31] Dejando y sean las respectivas funciones de densidad acumulada de las distribuciones binomial y de Poisson, se tiene: Una derivación de esto utiliza funciones generadoras de probabilidad . ^[32] Considere un ensayo de Bernoulli (lanzamiento de moneda) cuya probabilidad de un éxito (o número esperado de éxitos) está dentro de un intervalo dado. Divida el intervalo en n partes y realice un ensayo en cada subintervalo con probabilidad . La probabilidad de k éxitos de n ensayos durante todo el intervalo viene dada entonces por la distribución binomial. $F_{\mathrm {B} }$ $F_{\mathrm {P} }$ $F_{\mathrm {B} }(k;n,p)\ \approx \ F_{\mathrm {P} }(k;\lambda =np).$ $\lambda \leq 1$ ${\tfrac {\lambda }{n}}$

$p_{k}^{(n)}={\binom {n}{k}}\left({\frac {\lambda }{n}}\right)^{\!k}\left(1{-}{\frac {\lambda }{n}}\right)^{\!n-k}$ ,

cuya función generadora es:

$P^{(n)}(x)=\sum _{k=0}^{n}p_{k}^{(n)}x^{k}=\left(1-{\frac {\lambda }{n}}+{\frac {\lambda }{n}}x\right)^{n}.$

Tomando el límite cuando n aumenta hasta infinito (con x fijo) y aplicando la definición de límite del producto de la función exponencial , esto se reduce a la función generadora de la distribución de Poisson:

$\lim _{n\to \infty }P^{(n)}(x)=\lim _{n\to \infty }\left(1{+}{\tfrac {\lambda (x-1)}{n}}\right)^{n}=e^{\lambda (x-1)}=\sum _{k=0}^{\infty }e^{-\lambda }{\frac {\lambda ^{k}}{k!}}x^{k}.$

General

Si y son independientes, entonces la diferencia sigue una distribución de Skellam . $X_{1}\sim \mathrm {Pois} (\lambda _{1})\,$ $X_{2}\sim \mathrm {Pois} (\lambda _{2})\,$ $Y=X_{1}-X_{2}$
Si y son independientes, entonces la distribución de condicional a es una distribución binomial . $X_{1}\sim \mathrm {Pois} (\lambda _{1})\,$ $X_{2}\sim \mathrm {Pois} (\lambda _{2})\,$ $X_{1}$ $X_{1}+X_{2}$
En concreto, si entonces $X_{1}+X_{2}=k,$ $X_{1}|X_{1}+X_{2}=k\sim \mathrm {Binom} (k,\lambda _{1}/(\lambda _{1}+\lambda _{2})).$
De manera más general, si X ₁ , X ₂ , ..., X _$n$ son variables aleatorias de Poisson independientes con parámetros $λ$ ₁ , $λ$ ₂ , ..., $λ$ _$n$ entonces
De lo cual se deduce que, en realidad, $\sum _{j=1}^{n}X_{j}=k,$ $X_{i}{\Big |}\sum _{j=1}^{n}X_{j}=k\sim \mathrm {Binom} \left(k,{\frac {\lambda _{i}}{\sum _{j=1}^{n}\lambda _{j}}}\right).$ $\{X_{i}\}\sim \mathrm {Multinom} \left(k,\left\{{\frac {\lambda _{i}}{\sum _{j=1}^{n}\lambda _{j}}}\right\}\right).$
Si y la distribución de condicional a X = $k$ es una distribución binomial , entonces la distribución de Y sigue una distribución de Poisson. De hecho, si, condicional a sigue una distribución multinomial , entonces cada uno sigue una distribución de Poisson independiente . $X\sim \mathrm {Pois} (\lambda )\,$ $Y$ $Y\mid (X=k)\sim \mathrm {Binom} (k,p),$ $Y\sim \mathrm {Pois} (\lambda \cdot p).$ $\{X=k\},$ $\{Y_{i}\}$ $\{Y_{i}\}\mid (X=k)\sim \mathrm {Multinom} \left(k,p_{i}\right),$ $Y_{i}$ $Y_{i}\sim \mathrm {Pois} (\lambda \cdot p_{i}),\rho (Y_{i},Y_{j})=0.$
La distribución de Poisson es un caso especial de la distribución de Poisson compuesta discreta (o distribución de Poisson tartamudeante) con un solo parámetro. ^[33]^[34] La distribución de Poisson compuesta discreta se puede deducir de la distribución límite de la distribución multinomial univariante. También es un caso especial de una distribución de Poisson compuesta .
Para valores suficientemente grandes de $λ$ , (digamos $λ$ >1000), la distribución normal con media $λ$ y varianza $λ$ (desviación estándar ) es una excelente aproximación a la distribución de Poisson. Si $λ$ es mayor que aproximadamente 10, entonces la distribución normal es una buena aproximación si se realiza una corrección de continuidad apropiada, es decir, si $P($ $X$ $\leq$ $x$ $)$ , donde x es un entero no negativo, se reemplaza por $P($ $X$ $\leq$ $x$ $+ 0.5)$ . ${\sqrt {\lambda }}$ $F_{\mathrm {Poisson} }(x;\lambda )\approx F_{\mathrm {normal} }(x;\mu =\lambda ,\sigma ^{2}=\lambda )$
Transformación estabilizadora de varianza : Si entonces ^[8]^{: 168} y ^[35]^{: 196} Bajo esta transformación, la convergencia a la normalidad (a medida que aumenta) es mucho más rápida que la variable no transformada. ^[^{cita requerida}^] Hay otras transformaciones estabilizadoras de varianza ligeramente más complicadas, ^[8]^{: 168} una de las cuales es la transformada de Anscombe . ^[36] Consulte Transformación de datos (estadísticas) para usos más generales de las transformaciones. $X\sim \mathrm {Pois} (\lambda ),$ $Y=2{\sqrt {X}}\approx {\mathcal {N}}(2{\sqrt {\lambda }};1),$ $Y={\sqrt {X}}\approx {\mathcal {N}}({\sqrt {\lambda }};1/4).$ $\lambda$
Si para cada t > 0 el número de llegadas en el intervalo de tiempo $[0, t]$ sigue la distribución de Poisson con media λt , entonces la secuencia de tiempos entre llegadas son variables aleatorias exponenciales independientes e idénticamente distribuidas con media 1/ $λ$ . ^[37]^{: 317–319}
Las funciones de distribución acumulativa de las distribuciones de Poisson y chi-cuadrado están relacionadas de las siguientes maneras: ^[8]^{: 167} y ^[8]^{: 158} $F_{\text{Poisson}}(k;\lambda )=1-F_{\chi ^{2}}(2\lambda ;2(k+1))\quad \quad {\text{ integer }}k,$ $P(X=k)=F_{\chi ^{2}}(2\lambda ;2(k+1))-F_{\chi ^{2}}(2\lambda ;2k).$

Aproximación de Poisson

Supongamos que entonces ^[38] se distribuye multinomialmente condicionado a $X_{1}\sim \operatorname {Pois} (\lambda _{1}),X_{2}\sim \operatorname {Pois} (\lambda _{2}),\dots ,X_{n}\sim \operatorname {Pois} (\lambda _{n})$ $\lambda _{1}+\lambda _{2}+\dots +\lambda _{n}=1,$ $(X_{1},X_{2},\dots ,X_{n})$ $(X_{1},X_{2},\dots ,X_{n})\sim \operatorname {Mult} (N,\lambda _{1},\lambda _{2},\dots ,\lambda _{n})$ $N=X_{1}+X_{2}+\dots X_{n}.$

Esto significa ^[27]^{: 101-102} , entre otras cosas, que para cualquier función no negativa si se distribuye multinomialmente, entonces donde $f(x_{1},x_{2},\dots ,x_{n}),$ $(Y_{1},Y_{2},\dots ,Y_{n})\sim \operatorname {Mult} (m,\mathbf {p} )$ $\operatorname {E} [f(Y_{1},Y_{2},\dots ,Y_{n})]\leq e{\sqrt {m}}\operatorname {E} [f(X_{1},X_{2},\dots ,X_{n})]$ $(X_{1},X_{2},\dots ,X_{n})\sim \operatorname {Pois} (\mathbf {p} ).$

El factor de puede reemplazarse por 2 si se supone además que aumenta o disminuye monótonamente. $e{\sqrt {m}}$ $f$

Distribución de Poisson bivariada

Esta distribución se ha extendido al caso bivariado . ^[39] La función generadora para esta distribución es $g(u,v)=\exp[(\theta _{1}-\theta _{12})(u-1)+(\theta _{2}-\theta _{12})(v-1)+\theta _{12}(uv-1)]$

con $\theta _{1},\theta _{2}>\theta _{12}>0$

Las distribuciones marginales son Poisson( θ ₁ ) y Poisson( θ ₂ ) y el coeficiente de correlación está limitado al rango $0\leq \rho \leq \min \left\{{\sqrt {\frac {\theta _{1}}{\theta _{2}}}},{\sqrt {\frac {\theta _{2}}{\theta _{1}}}}\right\}$

Una forma sencilla de generar una distribución de Poisson bivariada es tomar tres distribuciones de Poisson independientes con medias y luego establecer La función de probabilidad de la distribución de Poisson bivariada es $X_{1},X_{2}$ $Y_{1},Y_{2},Y_{3}$ $\lambda _{1},\lambda _{2},\lambda _{3}$ $X_{1}=Y_{1}+Y_{3},X_{2}=Y_{2}+Y_{3}.$ $\Pr(X_{1}=k_{1},X_{2}=k_{2})=\exp \left(-\lambda _{1}-\lambda _{2}-\lambda _{3}\right){\frac {\lambda _{1}^{k_{1}}}{k_{1}!}}{\frac {\lambda _{2}^{k_{2}}}{k_{2}!}}\sum _{k=0}^{\min(k_{1},k_{2})}{\binom {k_{1}}{k}}{\binom {k_{2}}{k}}k!\left({\frac {\lambda _{3}}{\lambda _{1}\lambda _{2}}}\right)^{k}$

Distribución libre de Poisson

La distribución de Poisson libre ^[40] con tamaño y tasa de salto surge en la teoría de probabilidad libre como el límite de la convolución libre repetida cuando $N$ $\to \infty$ . $\alpha$ $\lambda$ $\left(\left(1-{\frac {\lambda }{N}}\right)\delta _{0}+{\frac {\lambda }{N}}\delta _{\alpha }\right)^{\boxplus N}$

En otras palabras, sean variables aleatorias de modo que tenga valor con probabilidad y valor 0 con la probabilidad restante. Supongamos también que la familia es libremente independiente . Entonces el límite de la ley de está dado por la ley de Poisson libre con parámetros $X_{N}$ $X_{N}$ $\alpha$ ${\textstyle {\frac {\lambda }{N}}}$ $X_{1},X_{2},\ldots$ $N\to \infty$ $X_{1}+\cdots +X_{N}$ $\lambda ,\alpha .$

Esta definición es análoga a una de las formas en que se obtiene la distribución de Poisson clásica a partir de un proceso de Poisson (clásico).

La medida asociada a la ley de Poisson libre está dada por ^[41] donde y tiene soporte $\mu ={\begin{cases}(1-\lambda )\delta _{0}+\nu ,&{\text{if }}0\leq \lambda \leq 1\\\nu ,&{\text{if }}\lambda >1,\end{cases}}$ $\nu ={\frac {1}{2\pi \alpha t}}{\sqrt {4\lambda \alpha ^{2}-(t-\alpha (1+\lambda ))^{2}}}\,dt$ $[\alpha (1-{\sqrt {\lambda }})^{2},\alpha (1+{\sqrt {\lambda }})^{2}].$

Esta ley también surge en la teoría de matrices aleatorias como la ley de Marchenko-Pastur . Sus cumulantes libres son iguales a $\kappa _{n}=\lambda \alpha ^{n}.$

Algunas transformaciones de esta ley

Damos valores de algunas transformadas importantes de la ley de Poisson libre; el cálculo se puede encontrar, por ejemplo, en el libro Lectures on the Combinatorics of Free Probability de A. Nica y R. Speicher ^[42].

La transformada R de la ley de Poisson libre está dada por $R(z)={\frac {\lambda \alpha }{1-\alpha z}}.$

La transformada de Cauchy (que es el negativo de la transformación de Stieltjes ) está dada por $G(z)={\frac {z+\alpha -\lambda \alpha -{\sqrt {(z-\alpha (1+\lambda ))^{2}-4\lambda \alpha ^{2}}}}{2\alpha z}}$

La transformada S viene dada por en el caso de que $S(z)={\frac {1}{z+\lambda }}$ $\alpha =1.$

Recuento de Weibull y estable

La función de masa de probabilidad de Poisson se puede expresar en una forma similar a la distribución del producto de una distribución de Weibull y una forma variante de la distribución de recuento estable . La variable se puede considerar como inversa del parámetro de estabilidad de Lévy en la distribución de recuento estable: donde es una distribución de recuento estable estándar de forma y es una distribución de forma Weibull estándar $f(k;\lambda )$ $(k+1)$ $f(k;\lambda )=\displaystyle \int _{0}^{\infty }{\frac {1}{u}}\,W_{k+1}({\frac {\lambda }{u}})\left[\left(k+1\right)u^{k}\,{\mathfrak {N}}_{\frac {1}{k+1}}\left(u^{k+1}\right)\right]\,du,$ ${\mathfrak {N}}_{\alpha }(\nu )$ $\alpha =1/\left(k+1\right),$ $W_{k+1}(x)$ $k+1.$

Inferencia estadística

Estimación de parámetros

Dada una muestra de $n$ valores medidos para $i$ $= 1, ...,$ $n$ , deseamos estimar el valor del parámetro $λ$ de la población de Poisson de la que se extrajo la muestra. La estimación de máxima verosimilitud es ^[43] $k_{i}\in \{0,1,\dots \},$

{\widehat {\lambda }}_{\mathrm {MLE} }={\frac {1}{n}}\sum _{i=1}^{n}k_{i}\ .

Dado que cada observación tiene una expectativa $λ,$ también la tiene la media de la muestra. Por lo tanto, la estimación de máxima verosimilitud es un estimador insesgado de $λ$ . También es un estimador eficiente ya que su varianza alcanza el límite inferior de Cramér-Rao (CRLB). ^[44] Por lo tanto, es insesgado en cuanto a varianza mínima . También se puede demostrar que la suma (y, por lo tanto, la media de la muestra, ya que es una función uno a uno de la suma) es una estadística completa y suficiente para $λ$ .

Para demostrar la suficiencia podemos usar el teorema de factorización . Considere la partición de la función de masa de probabilidad de la distribución de Poisson conjunta para la muestra en dos partes: una que depende únicamente de la muestra , llamada , y otra que depende del parámetro y de la muestra solo a través de la función Entonces es una estadística suficiente para $\mathbf {x}$ $h(\mathbf {x} )$ $\lambda$ $\mathbf {x}$ $T(\mathbf {x} ).$ $T(\mathbf {x} )$ $\lambda .$

P(\mathbf {x} )=\prod _{i=1}^{n}{\frac {\lambda ^{x_{i}}e^{-\lambda }}{x_{i}!}}={\frac {1}{\prod _{i=1}^{n}x_{i}!}}\times \lambda ^{\sum _{i=1}^{n}x_{i}}e^{-n\lambda }

El primer término depende únicamente de . El segundo término depende únicamente de la muestra mediante Por lo tanto, es suficiente. $h(\mathbf {x} )$ $\mathbf {x}$ $g(T(\mathbf {x} )|\lambda )$ ${\textstyle T(\mathbf {x} )=\sum _{i=1}^{n}x_{i}.}$ $T(\mathbf {x} )$

Para encontrar el parámetro $λ$ que maximiza la función de probabilidad para la población de Poisson, podemos utilizar el logaritmo de la función de probabilidad:

{\begin{aligned}\ell (\lambda )&=\ln \prod _{i=1}^{n}f(k_{i}\mid \lambda )\\&=\sum _{i=1}^{n}\ln \!\left({\frac {e^{-\lambda }\lambda ^{k_{i}}}{k_{i}!}}\right)\\&=-n\lambda +\left(\sum _{i=1}^{n}k_{i}\right)\ln(\lambda )-\sum _{i=1}^{n}\ln(k_{i}!).\end{aligned}}

Tomamos la derivada de con respecto a $λ$ y la comparamos con cero: $\ell$

{\frac {\mathrm {d} }{\mathrm {d} \lambda }}\ell (\lambda )=0\iff -n+\left(\sum _{i=1}^{n}k_{i}\right){\frac {1}{\lambda }}=0.\!

Resolviendo $λ$ obtenemos un punto estacionario.

\lambda ={\frac {\sum _{i=1}^{n}k_{i}}{n}}

Por lo tanto, $λ$ es el promedio de los valores $de k$ _i . La obtención del signo de la segunda derivada de L en el punto estacionario determinará qué tipo de valor extremo es $λ$ .

{\frac {\partial ^{2}\ell }{\partial \lambda ^{2}}}=-\lambda ^{-2}\sum _{i=1}^{n}k_{i}

Evaluando la segunda derivada en el punto estacionario obtenemos:

{\frac {\partial ^{2}\ell }{\partial \lambda ^{2}}}=-{\frac {n^{2}}{\sum _{i=1}^{n}k_{i}}}

que es el negativo de $n$ veces el recíproco del promedio de k _i . Esta expresión es negativa cuando el promedio es positivo. Si esto se cumple, entonces el punto estacionario maximiza la función de probabilidad.

Para completar , se dice que una familia de distribuciones es completa si y solo si implica que para todos Si los individuos son iid entonces Conociendo la distribución que queremos investigar, es fácil ver que la estadística es completa. $E(g(T))=0$ $P_{\lambda }(g(T)=0)=1$ $\lambda .$ $X_{i}$ $\mathrm {Po} (\lambda ),$ ${\textstyle T(\mathbf {x} )=\sum _{i=1}^{n}X_{i}\sim \mathrm {Po} (n\lambda ).}$

E(g(T))=\sum _{t=0}^{\infty }g(t){\frac {(n\lambda )^{t}e^{-n\lambda }}{t!}}=0

Para que se cumpla esta igualdad, debe ser 0. Esto se deduce del hecho de que ninguno de los otros términos será 0 para todos en la suma y para todos los valores posibles de Por lo tanto, para todos implica que y se ha demostrado que la estadística es completa. $g(t)$ $t$ $\lambda .$ $E(g(T))=0$ $\lambda$ $P_{\lambda }(g(T)=0)=1,$

Intervalo de confianza

El intervalo de confianza para la media de una distribución de Poisson se puede expresar utilizando la relación entre las funciones de distribución acumulativa de las distribuciones de Poisson y de chi-cuadrado . La distribución de chi-cuadrado está estrechamente relacionada con la distribución gamma , y esto conduce a una expresión alternativa. Dada una observación $k$ de una distribución de Poisson con media μ , un intervalo de confianza para μ con nivel de confianza $1 - α$ es

{\tfrac {1}{2}}\chi ^{2}(\alpha /2;2k)\leq \mu \leq {\tfrac {1}{2}}\chi ^{2}(1-\alpha /2;2k+2),

o equivalentemente,

F^{-1}(\alpha /2;k,1)\leq \mu \leq F^{-1}(1-\alpha /2;k+1,1),

donde es la función cuantil (correspondiente a un área de cola inferior p ) de la distribución chi-cuadrado con $n$ grados de libertad y es la función cuantil de una distribución gamma con parámetro de forma n y parámetro de escala 1. ^[8]^{: 176-178}^[45] Este intervalo es ' exacto ' en el sentido de que su probabilidad de cobertura nunca es menor que el nominal $1 -$ $α$ . $\chi ^{2}(p;n)$ $F^{-1}(p;n,1)$

Cuando no se dispone de cuantiles de la distribución gamma, se ha propuesto una aproximación precisa a este intervalo exacto (basada en la transformación de Wilson-Hilferty ): ^[46]

k\left(1-{\frac {1}{9k}}-{\frac {z_{\alpha /2}}{3{\sqrt {k}}}}\right)^{3}\leq \mu \leq (k+1)\left(1-{\frac {1}{9(k+1)}}+{\frac {z_{\alpha /2}}{3{\sqrt {k+1}}}}\right)^{3},

donde denota la desviación normal estándar con área de cola superior $α / 2$ . $z_{\alpha /2}$

Para aplicar estas fórmulas en el mismo contexto que el anterior (dada una muestra de $n$ valores medidos $k$ _i cada uno extraído de una distribución de Poisson con media $λ$ ), se establecería

k=\sum _{i=1}^{n}k_{i},

Calcular un intervalo para $μ$ = $n λ$ , y luego derivar el intervalo para $λ$ .

Inferencia bayesiana

En la inferencia bayesiana , la distribución conjugada previa para el parámetro de velocidad $λ$ de la distribución de Poisson es la distribución gamma . ^[47] Sea

\lambda \sim \mathrm {Gamma} (\alpha ,\beta )

denotamos que $λ$ se distribuye de acuerdo con la densidad gamma g parametrizada en términos de un parámetro de forma α y un parámetro de escala inverso β :

g(\lambda \mid \alpha ,\beta )={\frac {\beta ^{\alpha }}{\Gamma (\alpha )}}\;\lambda ^{\alpha -1}\;e^{-\beta \,\lambda }\qquad {\text{ for }}\lambda >0\,\!.

Entonces, dada la misma muestra de $n$ valores medidos $k$ _i que antes, y una distribución previa de Gamma( α , β ), la distribución posterior es

\lambda \sim \mathrm {Gamma} \left(\alpha +\sum _{i=1}^{n}k_{i},\beta +n\right).

Nótese que la media posterior es lineal y está dada por

E[\lambda |k_{1},\ldots ,k_{n}]={\frac {\alpha +\sum _{i=1}^{n}k_{i}}{\beta +n}}.

Se puede demostrar que la distribución gamma es la única distribución previa que induce linealidad de la media condicional. Además, existe un resultado inverso que establece que si la media condicional está cerca de una función lineal en la distancia, entonces la distribución previa de $λ$ debe estar cerca de la distribución gamma en la distancia de Levy . ^[48] $L_{2}$

La media posterior E[ $λ$ ] se aproxima a la estimación de máxima verosimilitud en el límite como lo que se desprende inmediatamente de la expresión general de la media de la distribución gamma . ${\widehat {\lambda }}_{\mathrm {MLE} }$ $\alpha \to 0,\beta \to 0,$

La distribución predictiva posterior para una sola observación adicional es una distribución binomial negativa , ^[49]^{: 53} a veces llamada distribución gamma-Poisson.

Estimación simultánea de múltiples medias de Poisson

Supongamos que hay un conjunto de variables aleatorias independientes de un conjunto de distribuciones de Poisson, cada una con un parámetro y nos gustaría estimar estos parámetros. Entonces, Clevenson y Zidek muestran que bajo la pérdida de error cuadrático normalizado cuando , de manera similar al ejemplo de Stein para las medias normales, el estimador MLE es inadmisible . ^[50] $X_{1},X_{2},\dots ,X_{p}$ $p$ $\lambda _{i},$ $i=1,\dots ,p,$ ${\textstyle L(\lambda ,{\hat {\lambda }})=\sum _{i=1}^{p}\lambda _{i}^{-1}({\hat {\lambda }}_{i}-\lambda _{i})^{2},}$ $p>1,$ ${\hat {\lambda }}_{i}=X_{i}$

En este caso, se da una familia de estimadores minimax para cualquier y como ^[51] $0<c\leq 2(p-1)$ $b\geq (p-2+p^{-1})$

{\hat {\lambda }}_{i}=\left(1-{\frac {c}{b+\sum _{i=1}^{p}X_{i}}}\right)X_{i},\qquad i=1,\dots ,p.

Ocurrencia y aplicaciones

Algunas aplicaciones de la distribución de Poisson para contar datos (número de eventos): ^[52]

telecomunicaciones : llamadas telefónicas que llegan a un sistema,
astronomía : fotones que llegan a un telescopio,
Química : la distribución de masa molar de una polimerización viva , ^[53]
Biología : el número de mutaciones en una cadena de ADN por unidad de longitud,
Gestión : clientes que llegan a un mostrador o centro de llamadas,
Finanzas y seguros : número de pérdidas o reclamaciones que se producen en un período de tiempo determinado,
sismología : modelo asintótico de Poisson de riesgo para grandes terremotos, ^[54]
radiactividad : se desintegra en un intervalo de tiempo determinado en una muestra radiactiva,
óptica : número de fotones emitidos en un solo pulso láser (una vulnerabilidad importante de los protocolos de distribución de claves cuánticas , conocida como división del número de fotones).

Más ejemplos de eventos de conteo que pueden modelarse como procesos de Poisson incluyen:

En cada cuerpo de caballería prusiana , cada año, se mataban a patadas de caballos unos 100 soldados . Este ejemplo fue utilizado en un libro de Ladislaus Bortkiewicz (1868-1931), ^[12]^{: 23-25}
Células de levadura utilizadas en la elaboración de cerveza Guinness . Este ejemplo fue utilizado por William Sealy Gosset (1876–1937), ^[55]^[56]
Llamadas telefónicas que llegan a un centro de llamadas en menos de un minuto. Este ejemplo fue descrito por AK Erlang (1878-1929), ^[57]
objetivos en deportes en los que compiten dos equipos, ^[58]
muertes por año en un grupo de edad determinado,
saltos en el precio de una acción en un intervalo de tiempo determinado,
veces que se accede a un servidor web por minuto (bajo un supuesto de homogeneidad ),
mutaciones en un tramo determinado de ADN después de una cierta cantidad de radiación,
células infectadas en una multiplicidad dada de infección ,
bacterias en una cierta cantidad de líquido, ^[59]
fotones que llegan a un circuito de píxeles con una iluminación determinada durante un período de tiempo determinado,
aterrizaje de bombas voladoras V-1 en Londres durante la Segunda Guerra Mundial, investigado por RD Clarke en 1946. ^[60]

En la teoría de números probabilísticos , Gallagher demostró en 1976 que, si se cumple una cierta versión de la conjetura no probada de la r-tupla prima , ^[61] entonces los conteos de números primos en intervalos cortos obedecerían a una distribución de Poisson. ^[62]

Ley de los eventos raros

La tasa de ocurrencia de un evento está relacionada con la probabilidad de que ocurra en un pequeño subintervalo (de tiempo, espacio o de otro tipo). En el caso de la distribución de Poisson, se supone que existe un subintervalo lo suficientemente pequeño para el cual la probabilidad de que ocurra un evento dos veces es "despreciable". Con esta suposición, se puede derivar la distribución de Poisson a partir de la distribución binomial, dada únicamente la información del número esperado de eventos totales en todo el intervalo.

Sea el número total de eventos en todo el intervalo denotado por Divida todo el intervalo en subintervalos de igual tamaño, de modo que (ya que estamos interesados solo en porciones muy pequeñas del intervalo, esta suposición es significativa). Esto significa que el número esperado de eventos en cada uno de los $n$ subintervalos es igual a $\lambda .$ $n$ $I_{1},\dots ,I_{n}$ $n>\lambda$ $\lambda /n.$

Ahora suponemos que la ocurrencia de un evento en todo el intervalo puede verse como una secuencia de $n$ ensayos de Bernoulli , donde el -ésimo ensayo de Bernoulli corresponde a ver si un evento ocurre en el subintervalo con probabilidad. El número esperado de eventos totales en tales ensayos sería el número esperado de eventos totales en todo el intervalo. Por lo tanto, para cada subdivisión del intervalo hemos aproximado la ocurrencia del evento como un proceso de Bernoulli de la forma Como hemos notado antes, queremos considerar solo subintervalos muy pequeños. Por lo tanto, tomamos el límite como tiende a infinito. $i$ $I_{i}$ $\lambda /n.$ $n$ $\lambda ,$ ${\textrm {B}}(n,\lambda /n).$ $n$

En este caso la distribución binomial converge a lo que se conoce como distribución de Poisson por el teorema del límite de Poisson .

En varios de los ejemplos anteriores (como el número de mutaciones en una secuencia dada de ADN), los eventos que se cuentan son en realidad los resultados de ensayos discretos y se modelarían con mayor precisión utilizando la distribución binomial , es decir $X\sim {\textrm {B}}(n,p).$

En tales casos, $n$ es muy grande y $p$ es muy pequeño (y por lo tanto, la expectativa $np$ es de magnitud intermedia). Entonces, la distribución puede aproximarse mediante la distribución de Poisson, que es menos engorrosa. $X\sim {\textrm {Pois}}(np).$

Esta aproximación a veces se conoce como la ley de eventos raros , ^[63]^{: 5} ya que cada uno de los $n$ eventos individuales de Bernoulli ocurre raramente.

El nombre "ley de los eventos raros" puede ser engañoso porque el recuento total de eventos exitosos en un proceso de Poisson no necesita ser raro si el parámetro $np$ no es pequeño. Por ejemplo, el número de llamadas telefónicas a una centralita ocupada en una hora sigue una distribución de Poisson en la que los eventos parecen frecuentes para el operador, pero son raros desde el punto de vista del miembro promedio de la población, que tiene muy pocas probabilidades de hacer una llamada a esa centralita en esa hora.

La varianza de la distribución binomial es 1 − p veces la de la distribución de Poisson, por lo que es casi igual cuando p es muy pequeño.

La palabra ley se utiliza a veces como sinónimo de distribución de probabilidad , y convergencia en ley significa convergencia en distribución . En consecuencia, la distribución de Poisson a veces se denomina "ley de los números pequeños" porque es la distribución de probabilidad del número de ocurrencias de un evento que ocurre raramente pero tiene muchas oportunidades de ocurrir. La ley de los números pequeños es un libro de Ladislaus Bortkiewicz sobre la distribución de Poisson, publicado en 1898. ^[12]^[64]

Proceso de puntos de Poisson

La distribución de Poisson surge como el número de puntos de un proceso puntual de Poisson ubicados en alguna región finita. Más específicamente, si D es algún espacio de región, por ejemplo el espacio euclidiano R ^d , para el cual | D |, el área, el volumen o, más generalmente, la medida de Lebesgue de la región es finita, y si $N$ $($ $D$ $)$ denota el número de puntos en D , entonces

P(N(D)=k)={\frac {(\lambda |D|)^{k}e^{-\lambda |D|}}{k!}}.

Regresión de Poisson y regresión binomial negativa

La regresión de Poisson y la regresión binomial negativa son útiles para los análisis donde la variable dependiente (de respuesta) es el recuento (0, 1, 2, ...) del número de eventos u ocurrencias en un intervalo.

Biología

El experimento de Luria-Delbrück puso a prueba la hipótesis de la evolución lamarckiana, que debería dar como resultado una distribución de Poisson.

Katz y Miledi midieron el potencial de membrana con y sin la presencia de acetilcolina (ACh). ^[65] Cuando hay ACh presente, los canales iónicos de la membrana se abren aleatoriamente durante una pequeña fracción del tiempo. Como hay una gran cantidad de canales iónicos abiertos cada uno durante una pequeña fracción del tiempo, la cantidad total de canales iónicos abiertos en cualquier momento tiene una distribución de Poisson. Cuando no hay ACh presente, efectivamente no hay canales iónicos abiertos. El potencial de membrana es . Restando el efecto del ruido, Katz y Miledi encontraron que la media y la varianza del potencial de membrana son , lo que da . (pp. 94-95 ^[66] ) $V=N_{\text{open}}V_{\text{ion}}+V_{0}+V_{\text{noise}}$ $8.5\times 10^{-3}\;\mathrm {V} ,(29.2\times 10^{-6}\;\mathrm {V} )^{2}$ $V_{\text{ion}}=10^{-7}\;\mathrm {V}$

Durante cada evento de replicación celular, el número de mutaciones se distribuye aproximadamente según el método de Poisson. ^[67] Por ejemplo, el virus VIH tiene 10 000 pares de bases y una tasa de mutación de aproximadamente 1 por cada 30 000 pares de bases, lo que significa que el número de mutaciones por evento de replicación se distribuye como . (p. 64 ^[66] ) $\mathrm {Pois} (1/3)$

Otras aplicaciones en la ciencia

En un proceso de Poisson, el número de ocurrencias observadas fluctúa alrededor de su media $λ$ con una desviación estándar. Estas fluctuaciones se denominan ruido de Poisson o (particularmente en electrónica) ruido de disparo . $\sigma _{k}={\sqrt {\lambda }}.$

La correlación de la media y la desviación estándar al contar ocurrencias discretas independientes es útil científicamente. Al monitorear cómo varían las fluctuaciones con la señal media, se puede estimar la contribución de una sola ocurrencia, incluso si esa contribución es demasiado pequeña para ser detectada directamente . Por ejemplo, la carga e en un electrón se puede estimar correlacionando la magnitud de una corriente eléctrica con su ruido de disparo . Si N electrones pasan por un punto en un tiempo dado t en promedio, la corriente media es ; dado que las fluctuaciones de corriente deben ser del orden (es decir, la desviación estándar del proceso de Poisson ), la carga se puede estimar a partir de la relación ^[^{cita requerida}^] $I=eN/t$ $\sigma _{I}=e{\sqrt {N}}/t$ $e$ $t\sigma _{I}^{2}/I.$

Un ejemplo cotidiano es la granulosidad que aparece cuando se amplían las fotografías; la granulosidad se debe a las fluctuaciones de Poisson en el número de granos de plata reducidos, no a los granos individuales en sí. Al correlacionar la granulosidad con el grado de ampliación, se puede estimar la contribución de un grano individual (que de otro modo sería demasiado pequeño para verlo sin ayuda). ^{[ cita requerida ]}

En la teoría de conjuntos causales , los elementos discretos del espacio-tiempo siguen una distribución de Poisson en el volumen.

La distribución de Poisson también aparece en mecánica cuántica , especialmente en óptica cuántica . Es decir, para un sistema oscilador armónico cuántico en estado coherente , la probabilidad de medir un nivel de energía particular tiene una distribución de Poisson.

Métodos computacionales

La distribución de Poisson plantea dos tareas diferentes para las bibliotecas de software dedicadas: evaluar la distribución y extraer números aleatorios de acuerdo con esa distribución. $P(k;\lambda )$

Evaluación de la distribución de Poisson

Calcular para y dados es una tarea trivial que se puede realizar utilizando la definición estándar de en términos de funciones exponenciales, de potencia y factoriales. Sin embargo, la definición convencional de la distribución de Poisson contiene dos términos que pueden desbordarse fácilmente en las computadoras: $λ$ ^$k$ y $k$ $!$ . La fracción de $λ$ ^$k$ a $k$ ! también puede producir un error de redondeo que es muy grande en comparación con e ⁻^$λ$ , y por lo tanto dar un resultado erróneo. Por lo tanto, para la estabilidad numérica, la función de masa de probabilidad de Poisson debe evaluarse como $P(k;\lambda )$ $k$ $\lambda$ $P(k;\lambda )$

\!f(k;\lambda )=\exp \left[k\ln \lambda -\lambda -\ln \Gamma (k+1)\right],

que es matemáticamente equivalente pero numéricamente estable. El logaritmo natural de la función Gamma se puede obtener utilizando la lgammafunción en la biblioteca estándar de C (versión C99) o R , la gammalnfunción en MATLAB o SciPy , o la log_gammafunción en Fortran 2008 y posteriores.

Algunos lenguajes informáticos proporcionan funciones integradas para evaluar la distribución de Poisson, a saber:

R : función dpois(x, lambda);
Excel : función POISSON( x, mean, cumulative), con una bandera para especificar la distribución acumulativa;
Mathematica : distribución de Poisson univariante como , ^[68] distribución de Poisson bivariante como ,. ^[69]PoissonDistribution[ $\lambda$ ]MultivariatePoissonDistribution[ $\theta _{12},$ { $\theta _{1}-\theta _{12},$ $\theta _{2}-\theta _{12}$ }]

Generación de variables aleatorias

La tarea menos trivial es extraer una variable aleatoria entera de la distribución de Poisson con datos dados. $\lambda .$

Las soluciones son proporcionadas por:

R : función rpois(n, lambda);
Biblioteca científica GNU (GSL): función gsl_ran_poisson

Knuth ha propuesto un algoritmo simple para generar números aleatorios distribuidos por Poisson ( muestreo de números pseudoaleatorios ) : ^[70]^{: 137-138}

algoritmo de  números aleatorios de Poisson (Knuth) : init : Sea L ← e ^−λ , k ← 0 y p ← 1. hacer : k ← k + 1. Genere un número aleatorio uniforme u en [0,1] y sea p ← p × u. mientras p > L. devuelva k − 1.

La complejidad es lineal en el valor devuelto $k$ , que es $λ$ en promedio. Existen muchos otros algoritmos para mejorar esto. Algunos se dan en Ahrens & Dieter, consulte § Referencias a continuación.

Para valores grandes de $λ$ , el valor de $L$ = e ^{− $λ$} puede ser tan pequeño que sea difícil de representar. Esto se puede solucionar modificando el algoritmo que utiliza un parámetro adicional STEP de modo que e ^−STEP no se desborde: ^{[ cita requerida ]}

Algoritmo de  números aleatorios de Poisson (Junhao, basado en Knuth) : init : Sea   $λ$  Izquierda ←  $λ$  , k ← 0 y p ← 1. hacer : k ← k + 1. Generar un número aleatorio uniforme u en (0,1) y sea p ← p × u. mientras p < 1 y  $λ$  Izquierda > 0: si   $λ$  Izquierda > PASO: p ← p × e ^PASO  $λ$  Izquierda ←  $λ$  Izquierda − PASO de lo contrario : p ← p × e ^{$λ$  Izquierda}  $λ$  Izquierda ← 0 mientras p > 1. devuelve k − 1.

La elección de STEP depende del umbral de desbordamiento. Para el formato de punto flotante de doble precisión, el umbral está cerca de e ⁷⁰⁰ , por lo que 500 debería ser un valor seguro de STEP .

Otras soluciones para valores grandes de $λ$ incluyen el muestreo de rechazo y el uso de la aproximación gaussiana.

El muestreo por transformada inversa es simple y eficiente para valores pequeños de $λ$ y requiere solo un número aleatorio uniforme u por muestra. Las probabilidades acumuladas se examinan una a una hasta que una excede u .

Algoritmo  generador de Poisson basado en la inversión por búsqueda secuencial : ^[71]^{: 505}  init : Sea x ← 0, p ← e ^−λ , s ← p. Generar un número aleatorio uniforme u en [0,1]. mientras que u > s hacen : x ← x + 1. p ← p ×  $λ$  / x. s ← s + p. return x.

References

Citations

^ a b Haight, Frank A. (1967). Handbook of the Poisson Distribution. New York, NY, US: John Wiley & Sons. ISBN 978-0-471-33932-8.
^ a b Yates, Roy D.; Goodman, David J. (2014). Probability and Stochastic Processes: A Friendly Introduction for Electrical and Computer Engineers (2nd ed.). Hoboken, NJ: Wiley. ISBN 978-0-471-45259-1.
^ Ross, Sheldon M. (2014). Introduction to Probability Models (11th ed.). Academic Press.
^ Poisson, Siméon D. (1837). Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilités [Research on the Probability of Judgments in Criminal and Civil Matters] (in French). Paris, France: Bachelier.
^ de Moivre, Abraham (1711). "De mensura sortis, seu, de probabilitate eventuum in ludis a casu fortuito pendentibus" [On the Measurement of Chance, or, on the Probability of Events in Games Depending Upon Fortuitous Chance]. Philosophical Transactions of the Royal Society (in Latin). 27 (329): 213–264. doi:10.1098/rstl.1710.0018.
^ de Moivre, Abraham (1718). The Doctrine of Chances: Or, A Method of Calculating the Probability of Events in Play. London, Great Britain: W. Pearson. ISBN 9780598843753.
^ de Moivre, Abraham (1721). "Of the Laws of Chance". In Motte, Benjamin (ed.). The Philosophical Transactions from the Year MDCC (where Mr. Lowthorp Ends) to the Year MDCCXX. Abridg'd, and Dispos'd Under General Heads (in Latin). Vol. I. London, Great Britain: R. Wilkin, R. Robinson, S. Ballard, W. and J. Innys, and J. Osborn. pp. 190–219.
^ a b c d e f g h i Johnson, Norman L.; Kemp, Adrienne W.; Kotz, Samuel (2005). "Poisson Distribution". Univariate Discrete Distributions (3rd ed.). New York, NY, US: John Wiley & Sons, Inc. pp. 156–207. doi:10.1002/0471715816. ISBN 978-0-471-27246-5.
^ Stigler, Stephen M. (1982). "Poisson on the Poisson Distribution". Statistics & Probability Letters. 1 (1): 33–35. doi:10.1016/0167-7152(82)90010-4.
^ Hald, Anders; de Moivre, Abraham; McClintock, Bruce (1984). "A. de Moivre: 'De Mensura Sortis' or 'On the Measurement of Chance'". International Statistical Review / Revue Internationale de Statistique. 52 (3): 229–262. doi:10.2307/1403045. JSTOR 1403045.
^ Newcomb, Simon (1860). "Notes on the theory of probabilities". The Mathematical Monthly. 2 (4): 134–140.
^ a b c von Bortkiewitsch, Ladislaus (1898). Das Gesetz der kleinen Zahlen [The law of small numbers] (in German). Leipzig, Germany: B.G. Teubner. pp. 1, 23–25.
On page 1, Bortkiewicz presents the Poisson distribution.
On pages 23–25, Bortkiewitsch presents his analysis of "4. Beispiel: Die durch Schlag eines Pferdes im preußischen Heere Getöteten." [4. Example: Those killed in the Prussian army by a horse's kick.]
^ For the proof, see: Proof wiki: expectation and Proof wiki: variance
^ Kardar, Mehran (2007). Statistical Physics of Particles. Cambridge University Press. p. 42. ISBN 978-0-521-87342-0. OCLC 860391091.
^ Dekking, Frederik Michel; Kraaikamp, Cornelis; Lopuhaä, Hendrik Paul; Meester, Ludolf Erwin (2005). A Modern Introduction to Probability and Statistics. Springer Texts in Statistics. p. 167. doi:10.1007/1-84628-168-7. ISBN 978-1-85233-896-1.
^ Ugarte, M.D.; Militino, A.F.; Arnholt, A.T. (2016). Probability and Statistics with R (2nd ed.). Boca Raton, FL, US: CRC Press. ISBN 978-1-4665-0439-4.
^ Helske, Jouni (2017). "KFAS: Exponential Family State Space Models in R". Journal of Statistical Software. 78 (10). arXiv:1612.01907. doi:10.18637/jss.v078.i10. S2CID 14379617.
^ Choi, Kwok P. (1994). "On the medians of gamma distributions and an equation of Ramanujan". Proceedings of the American Mathematical Society. 121 (1): 245–251. doi:10.2307/2160389. JSTOR 2160389.
^ Riordan, John (1937). "Moment Recurrence Relations for Binomial, Poisson and Hypergeometric Frequency Distributions" (PDF). Annals of Mathematical Statistics. 8 (2): 103–111. doi:10.1214/aoms/1177732430. JSTOR 2957598.
^ D. Ahle, Thomas (2022). "Sharp and simple bounds for the raw moments of the Binomial and Poisson distributions". Statistics & Probability Letters. 182: 109306. arXiv:2103.17027. doi:10.1016/j.spl.2021.109306.
^ Lehmann, Erich Leo (1986). Testing Statistical Hypotheses (2nd ed.). New York, NJ, US: Springer Verlag. ISBN 978-0-387-94919-2.
^ Raikov, Dmitry (1937). "On the decomposition of Poisson laws". Comptes Rendus de l'Académie des Sciences de l'URSS. 14: 9–11.
^ von Mises, Richard (1964). Mathematical Theory of Probability and Statistics. New York, NJ, US: Academic Press. doi:10.1016/C2013-0-12460-9. ISBN 978-1-4832-3213-3.
^ Harremoes, P. (July 2001). "Binomial and Poisson distributions as maximum entropy distributions". IEEE Transactions on Information Theory. 47 (5): 2039–2041. doi:10.1109/18.930936. S2CID 16171405.
^ Laha, Radha G.; Rohatgi, Vijay K. (1979). Probability Theory. New York, NJ, US: John Wiley & Sons. ISBN 978-0-471-03262-5.
^ Mitzenmacher, Michael (2017). Probability and computing: Randomization and probabilistic techniques in algorithms and data analysis. Eli Upfal (2nd ed.). Cambridge, UK. Exercise 5.14. ISBN 978-1-107-15488-9. OCLC 960841613.{{cite book}}: CS1 maint: location missing publisher (link)
^ a b Mitzenmacher, Michael; Upfal, Eli (2005). Probability and Computing: Randomized Algorithms and Probabilistic Analysis. Cambridge, UK: Cambridge University Press. ISBN 978-0-521-83540-4.
^ Short, Michael (2013). "Improved Inequalities for the Poisson and Binomial Distribution and Upper Tail Quantile Functions". ISRN Probability and Statistics. 2013. Corollary 6. doi:10.1155/2013/412958.
^ Short, Michael (2013). "Improved Inequalities for the Poisson and Binomial Distribution and Upper Tail Quantile Functions". ISRN Probability and Statistics. 2013. Theorem 2. doi:10.1155/2013/412958.
^ Kamath, Govinda M.; Şaşoğlu, Eren; Tse, David (14–19 June 2015). Optimal haplotype assembly from high-throughput mate-pair reads. 2015 IEEE International Symposium on Information Theory (ISIT). Hong Kong, China. pp. 914–918. arXiv:1502.01975. doi:10.1109/ISIT.2015.7282588. S2CID 128634.
^ Prins, Jack (2012). "6.3.3.1. Counts Control Charts". e-Handbook of Statistical Methods. NIST/SEMATECH. Retrieved 20 September 2019.
^ Feller, William. An Introduction to Probability Theory and its Applications.
^ Zhang, Huiming; Liu, Yunxiao; Li, Bo (2014). "Notes on discrete compound Poisson model with applications to risk theory". Insurance: Mathematics and Economics. 59: 325–336. doi:10.1016/j.insmatheco.2014.09.012.
^ Zhang, Huiming; Li, Bo (2016). "Characterizations of discrete compound Poisson distributions". Communications in Statistics - Theory and Methods. 45 (22): 6789–6802. doi:10.1080/03610926.2014.901375. S2CID 125475756.
^ McCullagh, Peter; Nelder, John (1989). Generalized Linear Models. Monographs on Statistics and Applied Probability. Vol. 37. London, UK: Chapman and Hall. ISBN 978-0-412-31760-6.
^ Anscombe, Francis J. (1948). "The transformation of Poisson, binomial and negative binomial data". Biometrika. 35 (3–4): 246–254. doi:10.1093/biomet/35.3-4.246. JSTOR 2332343.
^ Ross, Sheldon M. (2010). Introduction to Probability Models (10th ed.). Boston, MA: Academic Press. ISBN 978-0-12-375686-2.
^ "1.7.7 – Relationship between the Multinomial and Poisson | STAT 504". Archived from the original on 6 August 2019. Retrieved 6 August 2019.
^ Loukas, Sotirios; Kemp, C. David (1986). "The Index of Dispersion Test for the Bivariate Poisson Distribution". Biometrics. 42 (4): 941–948. doi:10.2307/2530708. JSTOR 2530708.
^ Free Random Variables by D. Voiculescu, K. Dykema, A. Nica, CRM Monograph Series, American Mathematical Society, Providence RI, 1992
^ Alexandru Nica, Roland Speicher: Lectures on the Combinatorics of Free Probability. London Mathematical Society Lecture Note Series, Vol. 335, Cambridge University Press, 2006.
^ Lectures on the Combinatorics of Free Probability by A. Nica and R. Speicher, pp. 203–204, Cambridge Univ. Press 2006
^ Paszek, Ewa. "Maximum likelihood estimation – examples". cnx.org.
^ Van Trees, Harry L. (2013). Detection estimation and modulation theory. Kristine L. Bell, Zhi Tian (Second ed.). Hoboken, N.J. ISBN 978-1-299-66515-6. OCLC 851161356.{{cite book}}: CS1 maint: location missing publisher (link)
^ Garwood, Frank (1936). "Fiducial Limits for the Poisson Distribution". Biometrika. 28 (3/4): 437–442. doi:10.1093/biomet/28.3-4.437. JSTOR 2333958.
^ Breslow, Norman E.; Day, Nick E. (1987). Statistical Methods in Cancer Research. Vol. 2 — The Design and Analysis of Cohort Studies. Lyon, France: International Agency for Research on Cancer. ISBN 978-92-832-0182-3. Archived from the original on 8 August 2018. Retrieved 11 March 2012.
^ Fink, Daniel (1997). A Compendium of Conjugate Priors.
^ Dytso, Alex; Poor, H. Vincent (2020). "Estimation in Poisson noise: Properties of the conditional mean estimator". IEEE Transactions on Information Theory. 66 (7): 4304–4323. arXiv:1911.03744. doi:10.1109/TIT.2020.2979978. S2CID 207853178.
^ Gelman; Carlin, John B.; Stern, Hal S.; Rubin, Donald B. (2003). Bayesian Data Analysis (2nd ed.). Boca Raton, FL, US: Chapman & Hall/CRC. ISBN 1-58488-388-X.
^ Clevenson, M. Lawrence; Zidek, James V. (1975). "Simultaneous estimation of the means of independent Poisson laws". Journal of the American Statistical Association. 70 (351): 698–705. doi:10.1080/01621459.1975.10482497. JSTOR 2285958.
^ Berger, James O. (1985). Statistical Decision Theory and Bayesian Analysis. Springer Series in Statistics (2nd ed.). New York, NY: Springer-Verlag. Bibcode:1985sdtb.book.....B. doi:10.1007/978-1-4757-4286-2. ISBN 978-0-387-96098-2.
^ Rasch, Georg (1963). The Poisson Process as a Model for a Diversity of Behavioural Phenomena (PDF). 17th International Congress of Psychology. Vol. 2. Washington, DC: American Psychological Association. doi:10.1037/e685262012-108.
^ Flory, Paul J. (1940). "Molecular Size Distribution in Ethylene Oxide Polymers". Journal of the American Chemical Society. 62 (6): 1561–1565. doi:10.1021/ja01863a066.
^ Lomnitz, Cinna (1994). Fundamentals of Earthquake Prediction. New York, NY: John Wiley & Sons. ISBN 0-471-57419-8. OCLC 647404423.
^ a student (1907). "On the error of counting with a haemacytometer". Biometrika. 5 (3): 351–360. doi:10.2307/2331633. JSTOR 2331633.
^ Boland, Philip J. (1984). "A biographical glimpse of William Sealy Gosset". The American Statistician. 38 (3): 179–183. doi:10.1080/00031305.1984.10483195. JSTOR 2683648.
^ Erlang, Agner K. (1909). "Sandsynlighedsregning og Telefonsamtaler" [Probability Calculation and Telephone Conversations]. Nyt Tidsskrift for Matematik (in Danish). 20 (B): 33–39. JSTOR 24528622.
^ Hornby, Dave (2014). "Football Prediction Model: Poisson Distribution". Sports Betting Online. Retrieved 19 September 2014.
^ Koyama, Kento; Hokunan, Hidekazu; Hasegawa, Mayumi; Kawamura, Shuso; Koseki, Shigenobu (2016). "Do bacterial cell numbers follow a theoretical Poisson distribution? Comparison of experimentally obtained numbers of single cells with random number generation via computer simulation". Food Microbiology. 60: 49–53. doi:10.1016/j.fm.2016.05.019. PMID 27554145.
^ Clarke, R. D. (1946). "An application of the Poisson distribution" (PDF). Journal of the Institute of Actuaries. 72 (3): 481. doi:10.1017/S0020268100035435.
^ Hardy, Godfrey H.; Littlewood, John E. (1923). "On some problems of "partitio numerorum" III: On the expression of a number as a sum of primes". Acta Mathematica. 44: 1–70. doi:10.1007/BF02403921.
^ Gallagher, Patrick X. (1976). "On the distribution of primes in short intervals". Mathematika. 23 (1): 4–9. doi:10.1112/s0025579300016442.
^ Cameron, A. Colin; Trivedi, Pravin K. (1998). Regression Analysis of Count Data. Cambridge, UK: Cambridge University Press. ISBN 978-0-521-63567-7.
^ Edgeworth, F.Y. (1913). "On the use of the theory of probabilities in statistics relating to society". Journal of the Royal Statistical Society. 76 (2): 165–193. doi:10.2307/2340091. JSTOR 2340091.
^ Katz, B.; Miledi, R. (August 1972). "The statistical nature of the acetylcholine potential and its molecular components". The Journal of Physiology. 224 (3): 665–699. doi:10.1113/jphysiol.1972.sp009918. ISSN 0022-3751. PMC 1331515. PMID 5071933.
^ a b Nelson, Philip Charles; Bromberg, Sarina; Hermundstad, Ann; Prentice, Jason (2015). Physical models of living systems. New York, NY: W.H. Freeman & Company, a Macmillan Education Imprint. ISBN 978-1-4641-4029-7. OCLC 891121698.
^ Foster, Patricia L. (1 January 2006), "Methods for Determining Spontaneous Mutation Rates", DNA Repair, Part B, Methods in Enzymology, vol. 409, Academic Press, pp. 195–213, doi:10.1016/S0076-6879(05)09012-9, ISBN 978-0-12-182814-1, PMC 2041832, PMID 16793403
^ "Wolfram Language: PoissonDistribution reference page". wolfram.com. Retrieved 8 April 2016.
^ "Wolfram Language: MultivariatePoissonDistribution reference page". wolfram.com. Retrieved 8 April 2016.
^ Knuth, Donald Ervin (1997). Seminumerical Algorithms. The Art of Computer Programming. Vol. 2 (3rd ed.). Addison Wesley. ISBN 978-0-201-89684-8.
^ Devroye, Luc (1986). "Discrete Univariate Distributions" (PDF). Non-Uniform Random Variate Generation. New York, NY: Springer-Verlag. pp. 485–553. doi:10.1007/978-1-4613-8643-8_10. ISBN 978-1-4613-8645-2.

Sources

Ahrens, Joachim H.; Dieter, Ulrich (1974). "Computer Methods for Sampling from Gamma, Beta, Poisson and Binomial Distributions". Computing. 12 (3): 223–246. doi:10.1007/BF02293108. S2CID 37484126.
Ahrens, Joachim H.; Dieter, Ulrich (1982). "Computer Generation of Poisson Deviates". ACM Transactions on Mathematical Software. 8 (2): 163–179. doi:10.1145/355993.355997. S2CID 12410131.
Evans, Ronald J.; Boersma, J.; Blachman, N. M.; Jagers, A. A. (1988). "The Entropy of a Poisson Distribution: Problem 87-6". SIAM Review. 30 (2): 314–317. doi:10.1137/1030059.