Distribución de Poisson

En teoría de probabilidad y estadística , la distribución de Poisson ( / ˈpwɑːsɒn / ; pronunciación francesa : [ pwasɔ̃] ) es una distribución de probabilidad discreta que expresa la probabilidad de que ocurra un número dado de eventos en un intervalo fijo de tiempo si estos eventos ocurren con una tasa media constante conocida e independientemente del tiempo desde el último evento. ^[1] También se puede utilizar para el número de eventos en otros tipos de intervalos distintos del tiempo, y en dimensión mayor que 1 (por ejemplo, número de eventos en un área o volumen determinado).

La distribución de Poisson recibe su nombre del matemático francés Siméon Denis Poisson y cumple una función importante en las distribuciones discretas estables .

Bajo una distribución de Poisson con la expectativa de λ eventos en un intervalo dado, la probabilidad de k eventos en el mismo intervalo es: ^[2]^{: 60}

{\frac {\lambda ^{k}e^{-\lambda }}{k!}}.

Por ejemplo, considere un centro de llamadas que recibe un promedio de λ = 3 llamadas por minuto en todo momento del día. Si las llamadas son independientes, recibir una no cambia la probabilidad de cuándo llegará la siguiente. Bajo estos supuestos, la cantidad k de llamadas recibidas durante cualquier minuto tiene una distribución de probabilidad de Poisson. Recibir k = 1 a 4 llamadas tiene entonces una probabilidad de aproximadamente 0,77, mientras que recibir 0 o al menos 5 llamadas tiene una probabilidad de aproximadamente 0,23.

Un ejemplo clásico utilizado para motivar la distribución de Poisson es el número de eventos de desintegración radiactiva durante un período de observación fijo. ^[3]

Historia

La distribución fue introducida por primera vez por Siméon Denis Poisson (1781-1840) y publicada junto con su teoría de probabilidad en su obra Recherches sur la probabilité des jugements en matière criminelle et en matière civile (1837). ^[4]^{: 205-207} El trabajo teorizó sobre el número de condenas injustas en un país determinado centrándose en ciertas variables aleatorias $N$ que cuentan, entre otras cosas, el número de ocurrencias discretas (a veces llamadas "eventos" o "llegadas") que tienen lugar durante un intervalo de tiempo de longitud dada. El resultado ya había sido dado en 1711 por Abraham de Moivre en De Mensura Sortis seu; de Probabilitate Eventuum in Ludis a Casu Fortuito Pendentibus . ^[5]^{: 219}^[6]^{: 14-15}^[7]^{: 193}^[8]^{: 157} Esto lo convierte en un ejemplo de la ley de Stigler y ha llevado a algunos autores a argumentar que la distribución de Poisson debería llevar el nombre de De Moivre. ^[9]^[10]

En 1860, Simon Newcomb ajustó la distribución de Poisson al número de estrellas que se encuentran en una unidad de espacio. ^[11]Ladislaus Bortkiewicz realizó otra aplicación práctica en 1898. Bortkiewicz demostró que la frecuencia con la que los soldados del ejército prusiano morían accidentalmente por patadas de caballo podía modelarse bien mediante una distribución de Poisson. ^[12]^{: 23-25} .

Definiciones

Función de masa de probabilidad

Se dice que una variable aleatoria discreta $X$ tiene una distribución de Poisson con parámetro si tiene una función de masa de probabilidad dada por: ^[2]^{: 60} $\lambda >0$

f(k;\lambda )=\Pr(X{=}k)={\frac {\lambda ^{k}e^{-\lambda }}{k!}},

dónde

$k$ es el número de ocurrencias ( ) $k=0,1,2,\lpuntos$
$e$ es el número de Euler ( ) $e=2.71828\lpuntos$
k ! = k ( k– 1) ··· (3)(2)(1) es el factorial .

El número real positivo $λ$ es igual al valor esperado de $X$ y también a su varianza . ^[13]

\lambda =\nombredeloperador {E} (X)=\nombredeloperador {Var} (X).

La distribución de Poisson se puede aplicar a sistemas con una gran cantidad de eventos posibles, cada uno de los cuales es poco común . El número de eventos de este tipo que ocurren durante un intervalo de tiempo fijo es, en las circunstancias adecuadas, un número aleatorio con una distribución de Poisson.

La ecuación se puede adaptar si, en lugar del número promedio de eventos, nos dan la tasa promedio a la que ocurren los eventos. Entonces y: ^[14] ${\estilo de visualización \lambda ,}$ ${\estilo de visualización r}$ $\lambda =rt,$

P(k{\text{ eventos en el intervalo }}t)={\frac {(rt)^{k}e^{-rt}}{k!}}.

Ejemplos

La distribución de Poisson puede ser útil para modelar eventos como:

el número de meteoritos de más de un metro de diámetro que impactan la Tierra en un año;
el número de fotones láser que inciden en un detector en un intervalo de tiempo determinado;
el número de estudiantes que obtienen una calificación baja y alta en un examen; y
Ubicación de defectos y dislocaciones en materiales.

Ejemplos de la aparición de puntos aleatorios en el espacio son: las ubicaciones de los impactos de asteroides con la Tierra (bidimensionales), las ubicaciones de las imperfecciones en un material (tridimensionales) y las ubicaciones de los árboles en un bosque (bidimensionales). ^[15]

Supuestos y validez

La distribución de Poisson es un modelo apropiado si se cumplen los siguientes supuestos:

$k$ , un entero no negativo, es el número de veces que ocurre un evento en un intervalo.
La ocurrencia de un evento no afecta la probabilidad de un segundo evento.
La tasa promedio a la que ocurren los eventos es independiente de cualquier ocurrencia.
Dos eventos no pueden ocurrir exactamente en el mismo instante.

Si estas condiciones son verdaderas, entonces $k$ es una variable aleatoria de Poisson; la distribución de $k$ es una distribución de Poisson.

La distribución de Poisson es también el límite de una distribución binomial , para la cual la probabilidad de éxito de cada ensayo es igual $a λ$ dividido por el número de ensayos, a medida que el número de ensayos se acerca al infinito (ver Distribuciones relacionadas).

Ejemplos de probabilidad para distribuciones de Poisson

Eventos que ocurren una vez en un intervalo: el caso especial de $la$ = 1 y $a$ = 0

Supongamos que los astrónomos estiman que los meteoritos grandes (de un tamaño superior a un determinado) impactan la Tierra en promedio una vez cada 100 años ( $λ$ = 1 evento cada 100 años), y que el número de impactos de meteoritos sigue una distribución de Poisson. ¿Cuál es la probabilidad de que $k$ = 0 impactos de meteoritos en los próximos 100 años?

P(k={\text{0 meteorites hit in next 100 years}})={\frac {1^{0}e^{-1}}{0!}}={\frac {1}{e}}\approx 0.37.

Según estos supuestos, la probabilidad de que no caigan meteoritos de gran tamaño sobre la Tierra en los próximos 100 años es de aproximadamente 0,37. El 1 − 0,37 = 0,63 restante es la probabilidad de que caigan 1, 2, 3 o más meteoritos de gran tamaño en los próximos 100 años. En el ejemplo anterior, se produjo una inundación por desbordamiento una vez cada 100 años ( $λ$ = 1). La probabilidad de que no se produjeran inundaciones por desbordamiento en 100 años era de aproximadamente 0,37, según el mismo cálculo.

En general, si un evento ocurre en promedio una vez por intervalo ( $λ$ = 1), y los eventos siguen una distribución de Poisson, entonces $P$ (0 eventos en el siguiente intervalo) = 0,37. Además, $P$ (exactamente un evento en el siguiente intervalo) = 0,37, como se muestra en la tabla para inundaciones por desbordamiento.

Ejemplos que violan los supuestos de Poisson

La cantidad de estudiantes que llegan a la asociación de estudiantes por minuto probablemente no seguirá una distribución de Poisson, porque la tasa no es constante (tasa baja durante el horario de clase, tasa alta entre horarios de clase) y las llegadas de estudiantes individuales no son independientes (los estudiantes tienden a venir en grupos). La tasa de llegada no constante se puede modelar como una distribución de Poisson mixta y la llegada de grupos en lugar de estudiantes individuales como un proceso de Poisson compuesto .

El número de terremotos de magnitud 5 por año en un país puede no seguir una distribución de Poisson, si un gran terremoto aumenta la probabilidad de réplicas de magnitud similar.

Los ejemplos en los que se garantiza al menos un evento no tienen distribución de Poisson, pero pueden modelarse utilizando una distribución de Poisson truncada en cero .

Las distribuciones de recuento en las que el número de intervalos con cero eventos es mayor que el previsto por un modelo de Poisson se pueden modelar utilizando un modelo de ceros inflados .

Propiedades

Estadísticas descriptivas

El valor esperado de una variable aleatoria de Poisson es $λ$ .
La varianza de una variable aleatoria de Poisson también es $λ$ .
El coeficiente de variación es mientras que el índice de dispersión es 1. ^[8]^{: 163} ${\textstyle \lambda ^{-1/2},}$
La desviación absoluta media respecto a la media es ^[8]^{: 163} $\operatorname {E} [\ |X-\lambda |\ ]={\frac {2\lambda ^{\lfloor \lambda \rfloor +1}e^{-\lambda }}{\lfloor \lambda \rfloor !}}.$
La moda de una variable aleatoria distribuida por Poisson con un número no entero $λ$ es igual a , que es el mayor entero menor o igual que $λ$ . Esto también se escribe como floor ( $λ$ ). Cuando $λ$ es un número entero positivo, las modas son $λ$ y $λ$ − 1. $\lfloor \lambda \rfloor ,$
Todos los cumulantes de la distribución de Poisson son iguales al valor esperado $λ$ . El momento factorial n $de$ la distribución de Poisson es $λ$ ^$n$ .
El valor esperado de un proceso de Poisson a veces se descompone en el producto de la intensidad y la exposición (o se expresa más generalmente como la integral de una "función de intensidad" en el tiempo o el espacio, a veces descrita como "exposición"). ^[17]

Mediana

Los límites para la mediana ( ) de la distribución son conocidos y precisos : ^[18] $\nu$ $\lambda -\ln 2\leq \nu <\lambda +{\frac {1}{3}}.$

Momentos más elevados

Los momentos no centrados superiores $m$ _$k$ de la distribución de Poisson son polinomios de Touchard en $λ$ : donde las llaves { } denotan números de Stirling de segundo tipo . ^[19]^[1]^{: 6} En otras palabras, cuando el valor esperado se establece en λ = 1, la fórmula de Dobinski implica que el $n$ -ésimo momento es igual al número de particiones de un conjunto de tamaño $n$ . $m_{k}=\sum _{i=0}^{k}\lambda ^{i}{\begin{Bmatrix}k\\i\end{Bmatrix}},$ $E[X]=\lambda ,\quad E[X(X-1)]=\lambda ^{2},\quad E[X(X-1)(X-2)]=\lambda ^{3},\cdots$

Un límite superior simple es: ^[20] $m_{k}=E[X^{k}]\leq \left({\frac {k}{\log(k/\lambda +1)}}\right)^{k}\leq \lambda ^{k}\exp \left({\frac {k^{2}}{2\lambda }}\right).$

Sumas de variables aleatorias distribuidas según Poisson

Si para son independientes , entonces ^[21]^{: 65} Un recíproco es el teorema de Raikov , que dice que si la suma de dos variables aleatorias independientes tiene distribución de Poisson, entonces también lo son cada una de esas dos variables aleatorias independientes. ^[22]^[23] $X_{i}\sim \operatorname {Pois} (\lambda _{i})$ $i=1,\dotsc ,n$ ${\textstyle \sum _{i=1}^{n}X_{i}\sim \operatorname {Pois} \left(\sum _{i=1}^{n}\lambda _{i}\right).}$

Entropía máxima

Es una distribución de máxima entropía entre el conjunto de distribuciones binomiales generalizadas con media y , ^[24] donde una distribución binomial generalizada se define como una distribución de la suma de N variables de Bernoulli independientes pero no idénticamente distribuidas. $B_{n}(\lambda )$ $\lambda$ $n\rightarrow \infty$

Otras propiedades

Las distribuciones de Poisson son distribuciones de probabilidad infinitamente divisibles . ^[25]^{: 233}^[8]^{: 164}
La divergencia dirigida de Kullback-Leibler de está dada por $P=\operatorname {Pois} (\lambda )$ $P_{0}=\operatorname {Pois} (\lambda _{0})$ $\operatorname {D} _{\text{KL}}(P\parallel P_{0})=\lambda _{0}-\lambda +\lambda \log {\frac {\lambda }{\lambda _{0}}}.$
Si es un entero, entonces satisface y ^[26]^[^{verificación fallida}^–^{ver discusión}^] $\lambda \geq 1$ $Y\sim \operatorname {Pois} (\lambda )$ $\Pr(Y\geq E[Y])\geq {\frac {1}{2}}$ $\Pr(Y\leq E[Y])\geq {\frac {1}{2}}.$
Los límites para las probabilidades de cola de una variable aleatoria de Poisson se pueden derivar utilizando un argumento de límite de Chernoff . ^[27]^{: 97-98} $X\sim \operatorname {Pois} (\lambda )$ $P(X\geq x)\leq {\frac {(e\lambda )^{x}e^{-\lambda }}{x^{x}}},{\text{ for }}x>\lambda ,$ $P(X\leq x)\leq {\frac {(e\lambda )^{x}e^{-\lambda }}{x^{x}}},{\text{ for }}x<\lambda .$
La probabilidad de cola superior se puede ajustar (por un factor de al menos dos) de la siguiente manera: ^[28]

$P(X\geq x)\leq {\frac {e^{-\operatorname {D} _{\text{KL}}(Q\parallel P)}}{\max {(2,{\sqrt {4\pi \operatorname {D} _{\text{KL}}(Q\parallel P)}}})}},{\text{ for }}x>\lambda ,$ ¿Dónde está la divergencia de Kullback-Leibler de de ? $\operatorname {D} _{\text{KL}}(Q\parallel P)$ $Q=\operatorname {Pois} (x)$ $P=\operatorname {Pois} (\lambda )$

Las desigualdades que relacionan la función de distribución de una variable aleatoria de Poisson con la función de distribución normal estándar son las siguientes: ^[29] donde es la divergencia de Kullback-Leibler de de y es la divergencia de Kullback-Leibler de de . $X\sim \operatorname {Pois} (\lambda )$ $\Phi (x)$ $\Phi \left(\operatorname {sign} (k-\lambda ){\sqrt {2\operatorname {D} _{\text{KL}}(Q_{-}\parallel P)}}\right)<P(X\leq k)<\Phi \left(\operatorname {sign} (k+1-\lambda ){\sqrt {2\operatorname {D} _{\text{KL}}(Q_{+}\parallel P)}}\right),{\text{ for }}k>0,$ $\operatorname {D} _{\text{KL}}(Q_{-}\parallel P)$ $Q_{-}=\operatorname {Pois} (k)$ $P=\operatorname {Pois} (\lambda )$ $\operatorname {D} _{\text{KL}}(Q_{+}\parallel P)$ $Q_{+}=\operatorname {Pois} (k+1)$ $P$

Razas de Poisson

Sean y variables aleatorias independientes, con entonces tenemos que $X\sim \operatorname {Pois} (\lambda )$ $Y\sim \operatorname {Pois} (\mu )$ $\lambda <\mu ,$ ${\frac {e^{-({\sqrt {\mu }}-{\sqrt {\lambda }})^{2}}}{(\lambda +\mu )^{2}}}-{\frac {e^{-(\lambda +\mu )}}{2{\sqrt {\lambda \mu }}}}-{\frac {e^{-(\lambda +\mu )}}{4\lambda \mu }}\leq P(X-Y\geq 0)\leq e^{-({\sqrt {\mu }}-{\sqrt {\lambda }})^{2}}$

El límite superior se demuestra utilizando un límite de Chernoff estándar.

El límite inferior se puede demostrar observando que es la probabilidad de que donde que está acotado por debajo por donde es la entropía relativa (ver la entrada sobre límites en las colas de las distribuciones binomiales para más detalles). Observando además que y calculando un límite inferior en la probabilidad incondicional se obtiene el resultado. Se pueden encontrar más detalles en el apéndice de Kamath et al. ^[30] $P(X-Y\geq 0\mid X+Y=i)$ ${\textstyle Z\geq {\frac {i}{2}},}$ ${\textstyle Z\sim \operatorname {Bin} \left(i,{\frac {\lambda }{\lambda +\mu }}\right),}$ ${\textstyle {\frac {1}{(i+1)^{2}}}e^{-iD\left(0.5\|{\frac {\lambda }{\lambda +\mu }}\right)},}$ $D$ $X+Y\sim \operatorname {Pois} (\lambda +\mu ),$

Distribuciones relacionadas

Como una distribución binomial con pasos de tiempo infinitesimales

La distribución de Poisson se puede derivar como un caso límite de la distribución binomial , ya que el número de ensayos tiende al infinito y el número esperado de éxitos permanece fijo (véase la ley de los eventos raros a continuación). Por lo tanto, se puede utilizar como una aproximación de la distribución binomial si $n$ es suficientemente grande y p es suficientemente pequeño. La distribución de Poisson es una buena aproximación de la distribución binomial si $n$ es al menos 20 y p es menor o igual a 0,05, y una excelente aproximación si $n$ ≥ 100 y $np$ ≤ 10. ^[31] Dejando y sean las respectivas funciones de densidad acumulada de las distribuciones binomial y de Poisson, se tiene: Una derivación de esto utiliza funciones generadoras de probabilidad . ^[32] Considere un ensayo de Bernoulli (lanzamiento de moneda) cuya probabilidad de un éxito (o número esperado de éxitos) está dentro de un intervalo dado. Divida el intervalo en n partes y realice un ensayo en cada subintervalo con probabilidad . La probabilidad de k éxitos de n ensayos durante todo el intervalo viene dada entonces por la distribución binomial. $F_{\mathrm {B} }$ $F_{\mathrm {P} }$ $F_{\mathrm {B} }(k;n,p)\ \approx \ F_{\mathrm {P} }(k;\lambda =np).$ $\lambda \leq 1$ ${\tfrac {\lambda }{n}}$

$p_{k}^{(n)}={\binom {n}{k}}\left({\frac {\lambda }{n}}\right)^{\!k}\left(1{-}{\frac {\lambda }{n}}\right)^{\!n-k}$ ,

cuya función generadora es:

$P^{(n)}(x)=\sum _{k=0}^{n}p_{k}^{(n)}x^{k}=\left(1-{\frac {\lambda }{n}}+{\frac {\lambda }{n}}x\right)^{n}.$

Tomando el límite cuando n aumenta hasta infinito (con x fijo) y aplicando la definición de límite del producto de la función exponencial , esto se reduce a la función generadora de la distribución de Poisson:

$\lim _{n\to \infty }P^{(n)}(x)=\lim _{n\to \infty }\left(1{+}{\tfrac {\lambda (x-1)}{n}}\right)^{n}=e^{\lambda (x-1)}=\sum _{k=0}^{\infty }e^{-\lambda }{\frac {\lambda ^{k}}{k!}}x^{k}.$

General

Si y son independientes, entonces la diferencia sigue una distribución de Skellam . $X_{1}\sim \mathrm {Pois} (\lambda _{1})\,$ $X_{2}\sim \mathrm {Pois} (\lambda _{2})\,$ $Y=X_{1}-X_{2}$
Si y son independientes, entonces la distribución de condicional a es una distribución binomial . $X_{1}\sim \mathrm {Pois} (\lambda _{1})\,$ $X_{2}\sim \mathrm {Pois} (\lambda _{2})\,$ $X_{1}$ $X_{1}+X_{2}$
En concreto, si entonces $X_{1}+X_{2}=k,$ $X_{1}|X_{1}+X_{2}=k\sim \mathrm {Binom} (k,\lambda _{1}/(\lambda _{1}+\lambda _{2})).$
De manera más general, si X ₁ , X ₂ , ..., X _$n$ son variables aleatorias de Poisson independientes con parámetros $λ$ ₁ , $λ$ ₂ , ..., $λ$ _$n$ entonces
De lo cual se deduce que, en realidad, $\sum _{j=1}^{n}X_{j}=k,$ $X_{i}{\Big |}\sum _{j=1}^{n}X_{j}=k\sim \mathrm {Binom} \left(k,{\frac {\lambda _{i}}{\sum _{j=1}^{n}\lambda _{j}}}\right).$ $\{X_{i}\}\sim \mathrm {Multinom} \left(k,\left\{{\frac {\lambda _{i}}{\sum _{j=1}^{n}\lambda _{j}}}\right\}\right).$
Si y la distribución de condicional a X = $k$ es una distribución binomial , entonces la distribución de Y sigue una distribución de Poisson. De hecho, si, condicional a sigue una distribución multinomial , entonces cada uno sigue una distribución de Poisson independiente . $X\sim \mathrm {Pois} (\lambda )\,$ $Y$ $Y\mid (X=k)\sim \mathrm {Binom} (k,p),$ $Y\sim \mathrm {Pois} (\lambda \cdot p).$ $\{X=k\},$ $\{Y_{i}\}$ $\{Y_{i}\}\mid (X=k)\sim \mathrm {Multinom} \left(k,p_{i}\right),$ $Y_{i}$ $Y_{i}\sim \mathrm {Pois} (\lambda \cdot p_{i}),\rho (Y_{i},Y_{j})=0.$
La distribución de Poisson es un caso especial de la distribución de Poisson compuesta discreta (o distribución de Poisson tartamudeante) con un solo parámetro. ^[33]^[34] La distribución de Poisson compuesta discreta se puede deducir de la distribución límite de la distribución multinomial univariante. También es un caso especial de una distribución de Poisson compuesta .
Para valores suficientemente grandes de $λ$ , (digamos $λ$ >1000), la distribución normal con media $λ$ y varianza $λ$ (desviación estándar ) es una excelente aproximación a la distribución de Poisson. Si $λ$ es mayor que aproximadamente 10, entonces la distribución normal es una buena aproximación si se realiza una corrección de continuidad apropiada, es decir, si $P($ $X$ $\leq$ $x$ $)$ , donde x es un entero no negativo, se reemplaza por $P($ $X$ $\leq$ $x$ $+ 0.5)$ . ${\sqrt {\lambda }}$ $F_{\mathrm {Poisson} }(x;\lambda )\approx F_{\mathrm {normal} }(x;\mu =\lambda ,\sigma ^{2}=\lambda )$
Transformación estabilizadora de varianza : Si entonces ^[8]^{: 168} y ^[35]^{: 196} Bajo esta transformación, la convergencia a la normalidad (a medida que aumenta) es mucho más rápida que la variable no transformada. ^[^{cita requerida}^] Hay otras transformaciones estabilizadoras de varianza ligeramente más complicadas, ^[8]^{: 168} una de las cuales es la transformada de Anscombe . ^[36] Consulte Transformación de datos (estadísticas) para usos más generales de las transformaciones. $X\sim \mathrm {Pois} (\lambda ),$ $Y=2{\sqrt {X}}\approx {\mathcal {N}}(2{\sqrt {\lambda }};1),$ $Y={\sqrt {X}}\approx {\mathcal {N}}({\sqrt {\lambda }};1/4).$ $\lambda$
Si para cada t > 0 el número de llegadas en el intervalo de tiempo $[0, t]$ sigue la distribución de Poisson con media λt , entonces la secuencia de tiempos entre llegadas son variables aleatorias exponenciales independientes e idénticamente distribuidas con media 1/ $λ$ . ^[37]^{: 317–319}
Las funciones de distribución acumulativa de las distribuciones de Poisson y chi-cuadrado están relacionadas de las siguientes maneras: ^[8]^{: 167} y ^[8]^{: 158} $F_{\text{Poisson}}(k;\lambda )=1-F_{\chi ^{2}}(2\lambda ;2(k+1))\quad \quad {\text{ integer }}k,$ $P(X=k)=F_{\chi ^{2}}(2\lambda ;2(k+1))-F_{\chi ^{2}}(2\lambda ;2k).$

Aproximación de Poisson

Supongamos que entonces ^[38] se distribuye multinomialmente condicionado a $X_{1}\sim \operatorname {Pois} (\lambda _{1}),X_{2}\sim \operatorname {Pois} (\lambda _{2}),\dots ,X_{n}\sim \operatorname {Pois} (\lambda _{n})$ $\lambda _{1}+\lambda _{2}+\dots +\lambda _{n}=1,$ $(X_{1},X_{2},\dots ,X_{n})$ $(X_{1},X_{2},\dots ,X_{n})\sim \operatorname {Mult} (N,\lambda _{1},\lambda _{2},\dots ,\lambda _{n})$ $N=X_{1}+X_{2}+\dots X_{n}.$

Esto significa ^[27]^{: 101-102} , entre otras cosas, que para cualquier función no negativa si se distribuye multinomialmente, entonces donde $f(x_{1},x_{2},\dots ,x_{n}),$ $(Y_{1},Y_{2},\dots ,Y_{n})\sim \operatorname {Mult} (m,\mathbf {p} )$ $\operatorname {E} [f(Y_{1},Y_{2},\dots ,Y_{n})]\leq e{\sqrt {m}}\operatorname {E} [f(X_{1},X_{2},\dots ,X_{n})]$ $(X_{1},X_{2},\dots ,X_{n})\sim \operatorname {Pois} (\mathbf {p} ).$

El factor de puede reemplazarse por 2 si se supone además que aumenta o disminuye monótonamente. $e{\sqrt {m}}$ $f$

Distribución de Poisson bivariada

Esta distribución se ha extendido al caso bivariado . ^[39] La función generadora para esta distribución es $g(u,v)=\exp[(\theta _{1}-\theta _{12})(u-1)+(\theta _{2}-\theta _{12})(v-1)+\theta _{12}(uv-1)]$

con $\theta _{1},\theta _{2}>\theta _{12}>0$

Las distribuciones marginales son Poisson( θ ₁ ) y Poisson( θ ₂ ) y el coeficiente de correlación está limitado al rango $0\leq \rho \leq \min \left\{{\sqrt {\frac {\theta _{1}}{\theta _{2}}}},{\sqrt {\frac {\theta _{2}}{\theta _{1}}}}\right\}$

Una forma sencilla de generar una distribución de Poisson bivariada es tomar tres distribuciones de Poisson independientes con medias y luego establecer La función de probabilidad de la distribución de Poisson bivariada es $X_{1},X_{2}$ $Y_{1},Y_{2},Y_{3}$ $\lambda _{1},\lambda _{2},\lambda _{3}$ $X_{1}=Y_{1}+Y_{3},X_{2}=Y_{2}+Y_{3}.$ $\Pr(X_{1}=k_{1},X_{2}=k_{2})=\exp \left(-\lambda _{1}-\lambda _{2}-\lambda _{3}\right){\frac {\lambda _{1}^{k_{1}}}{k_{1}!}}{\frac {\lambda _{2}^{k_{2}}}{k_{2}!}}\sum _{k=0}^{\min(k_{1},k_{2})}{\binom {k_{1}}{k}}{\binom {k_{2}}{k}}k!\left({\frac {\lambda _{3}}{\lambda _{1}\lambda _{2}}}\right)^{k}$

Distribución libre de Poisson

La distribución de Poisson libre ^[40] con tamaño y tasa de salto surge en la teoría de probabilidad libre como el límite de la convolución libre repetida cuando $N$ $\to \infty$ . $\alpha$ $\lambda$ $\left(\left(1-{\frac {\lambda }{N}}\right)\delta _{0}+{\frac {\lambda }{N}}\delta _{\alpha }\right)^{\boxplus N}$

En otras palabras, sean variables aleatorias de modo que tenga valor con probabilidad y valor 0 con la probabilidad restante. Supongamos también que la familia es libremente independiente . Entonces el límite de la ley de está dado por la ley de Poisson libre con parámetros $X_{N}$ $X_{N}$ $\alpha$ ${\textstyle {\frac {\lambda }{N}}}$ $X_{1},X_{2},\ldots$ $N\to \infty$ $X_{1}+\cdots +X_{N}$ $\lambda ,\alpha .$

Esta definición es análoga a una de las formas en que se obtiene la distribución de Poisson clásica a partir de un proceso de Poisson (clásico).

La medida asociada a la ley de Poisson libre está dada por ^[41] donde y tiene soporte $\mu ={\begin{cases}(1-\lambda )\delta _{0}+\nu ,&{\text{if }}0\leq \lambda \leq 1\\\nu ,&{\text{if }}\lambda >1,\end{cases}}$ $\nu ={\frac {1}{2\pi \alpha t}}{\sqrt {4\lambda \alpha ^{2}-(t-\alpha (1+\lambda ))^{2}}}\,dt$ $[\alpha (1-{\sqrt {\lambda }})^{2},\alpha (1+{\sqrt {\lambda }})^{2}].$

Esta ley también surge en la teoría de matrices aleatorias como la ley de Marchenko-Pastur . Sus cumulantes libres son iguales a $\kappa _{n}=\lambda \alpha ^{n}.$

Algunas transformaciones de esta ley

Damos valores de algunas transformadas importantes de la ley de Poisson libre; el cálculo se puede encontrar, por ejemplo, en el libro Lectures on the Combinatorics of Free Probability de A. Nica y R. Speicher ^[42].

La transformada R de la ley de Poisson libre está dada por $R(z)={\frac {\lambda \alpha }{1-\alpha z}}.$

La transformada de Cauchy (que es el negativo de la transformación de Stieltjes ) está dada por $G(z)={\frac {z+\alpha -\lambda \alpha -{\sqrt {(z-\alpha (1+\lambda ))^{2}-4\lambda \alpha ^{2}}}}{2\alpha z}}$

La transformada S viene dada por en el caso de que $S(z)={\frac {1}{z+\lambda }}$ $\alpha =1.$

Recuento de Weibull y estable

La función de masa de probabilidad de Poisson se puede expresar en una forma similar a la distribución del producto de una distribución de Weibull y una forma variante de la distribución de recuento estable . La variable se puede considerar como inversa del parámetro de estabilidad de Lévy en la distribución de recuento estable: donde es una distribución de recuento estable estándar de forma y es una distribución de Weibull estándar de forma $f(k;\lambda )$ $(k+1)$ $f(k;\lambda )=\displaystyle \int _{0}^{\infty }{\frac {1}{u}}\,W_{k+1}({\frac {\lambda }{u}})\left[\left(k+1\right)u^{k}\,{\mathfrak {N}}_{\frac {1}{k+1}}\left(u^{k+1}\right)\right]\,du,$ ${\mathfrak {N}}_{\alpha }(\nu )$ $\alpha =1/\left(k+1\right),$ $W_{k+1}(x)$ $k+1.$

Inferencia estadística

Estimación de parámetros

Dada una muestra de $n$ valores medidos para $i$ $= 1, ...,$ $n$ , deseamos estimar el valor del parámetro $λ$ de la población de Poisson de la que se extrajo la muestra. La estimación de máxima verosimilitud es ^[43] $k_{i}\in \{0,1,\dots \},$

{\widehat {\lambda }}_{\mathrm {MLE} }={\frac {1}{n}}\sum _{i=1}^{n}k_{i}\ .

Dado que cada observación tiene una expectativa $λ,$ también la tiene la media de la muestra. Por lo tanto, la estimación de máxima verosimilitud es un estimador insesgado de $λ$ . También es un estimador eficiente ya que su varianza alcanza el límite inferior de Cramér-Rao (CRLB). ^[44] Por lo tanto, es insesgado en cuanto a varianza mínima . También se puede demostrar que la suma (y, por lo tanto, la media de la muestra, ya que es una función uno a uno de la suma) es una estadística completa y suficiente para $λ$ .

Para demostrar la suficiencia podemos usar el teorema de factorización . Considere la partición de la función de masa de probabilidad de la distribución de Poisson conjunta para la muestra en dos partes: una que depende únicamente de la muestra , llamada , y otra que depende del parámetro y de la muestra solo a través de la función Entonces es una estadística suficiente para $\mathbf {x}$ $h(\mathbf {x} )$ $\lambda$ $\mathbf {x}$ $T(\mathbf {x} ).$ $T(\mathbf {x} )$ $\lambda .$

P(\mathbf {x} )=\prod _{i=1}^{n}{\frac {\lambda ^{x_{i}}e^{-\lambda }}{x_{i}!}}={\frac {1}{\prod _{i=1}^{n}x_{i}!}}\times \lambda ^{\sum _{i=1}^{n}x_{i}}e^{-n\lambda }

El primer término depende únicamente de . El segundo término depende únicamente de la muestra mediante Por lo tanto, es suficiente. $h(\mathbf {x} )$ $\mathbf {x}$ $g(T(\mathbf {x} )|\lambda )$ ${\textstyle T(\mathbf {x} )=\sum _{i=1}^{n}x_{i}.}$ $T(\mathbf {x} )$

Para encontrar el parámetro $λ$ que maximiza la función de probabilidad para la población de Poisson, podemos utilizar el logaritmo de la función de probabilidad:

{\begin{aligned}\ell (\lambda )&=\ln \prod _{i=1}^{n}f(k_{i}\mid \lambda )\\&=\sum _{i=1}^{n}\ln \!\left({\frac {e^{-\lambda }\lambda ^{k_{i}}}{k_{i}!}}\right)\\&=-n\lambda +\left(\sum _{i=1}^{n}k_{i}\right)\ln(\lambda )-\sum _{i=1}^{n}\ln(k_{i}!).\end{aligned}}

Tomamos la derivada de con respecto a $λ$ y la comparamos con cero: $\ell$

{\frac {\mathrm {d} }{\mathrm {d} \lambda }}\ell (\lambda )=0\iff -n+\left(\sum _{i=1}^{n}k_{i}\right){\frac {1}{\lambda }}=0.\!

Resolviendo $λ$ obtenemos un punto estacionario.

\lambda ={\frac {\sum _{i=1}^{n}k_{i}}{n}}

Por lo tanto, $λ$ es el promedio de los valores $de k$ _i . La obtención del signo de la segunda derivada de L en el punto estacionario determinará qué tipo de valor extremo es $λ$ .

{\frac {\partial ^{2}\ell }{\partial \lambda ^{2}}}=-\lambda ^{-2}\sum _{i=1}^{n}k_{i}

Evaluando la segunda derivada en el punto estacionario obtenemos:

{\frac {\partial ^{2}\ell }{\partial \lambda ^{2}}}=-{\frac {n^{2}}{\sum _{i=1}^{n}k_{i}}}

que es el negativo de $n$ veces el recíproco del promedio de k _i . Esta expresión es negativa cuando el promedio es positivo. Si esto se cumple, entonces el punto estacionario maximiza la función de probabilidad.

Para completar , se dice que una familia de distribuciones es completa si y solo si implica que para todos Si los individuos son iid entonces Conociendo la distribución que queremos investigar, es fácil ver que la estadística es completa. $E(g(T))=0$ $P_{\lambda }(g(T)=0)=1$ $\lambda .$ $X_{i}$ $\mathrm {Po} (\lambda ),$ ${\textstyle T(\mathbf {x} )=\sum _{i=1}^{n}X_{i}\sim \mathrm {Po} (n\lambda ).}$

E(g(T))=\sum _{t=0}^{\infty }g(t){\frac {(n\lambda )^{t}e^{-n\lambda }}{t!}}=0

Para que se cumpla esta igualdad, debe ser 0. Esto se deduce del hecho de que ninguno de los otros términos será 0 para todos en la suma y para todos los valores posibles de Por lo tanto, para todos implica que y se ha demostrado que la estadística es completa. $g(t)$ $t$ $\lambda .$ $E(g(T))=0$ $\lambda$ $P_{\lambda }(g(T)=0)=1,$

Intervalo de confianza

El intervalo de confianza para la media de una distribución de Poisson se puede expresar utilizando la relación entre las funciones de distribución acumulativa de las distribuciones de Poisson y de chi-cuadrado . La distribución de chi-cuadrado está estrechamente relacionada con la distribución gamma , y esto conduce a una expresión alternativa. Dada una observación $k$ de una distribución de Poisson con media μ , un intervalo de confianza para μ con nivel de confianza $1 - α$ es

{\tfrac {1}{2}}\chi ^{2}(\alpha /2;2k)\leq \mu \leq {\tfrac {1}{2}}\chi ^{2}(1-\alpha /2;2k+2),

o equivalentemente,

F^{-1}(\alpha /2;k,1)\leq \mu \leq F^{-1}(1-\alpha /2;k+1,1),

donde es la función cuantil (correspondiente a un área de cola inferior p ) de la distribución chi-cuadrado con $n$ grados de libertad y es la función cuantil de una distribución gamma con parámetro de forma n y parámetro de escala 1. ^[8]^{: 176-178}^[45] Este intervalo es ' exacto ' en el sentido de que su probabilidad de cobertura nunca es menor que el nominal $1 -$ $α$ . $\chi ^{2}(p;n)$ $F^{-1}(p;n,1)$

Cuando no se dispone de cuantiles de la distribución gamma, se ha propuesto una aproximación precisa a este intervalo exacto (basada en la transformación de Wilson-Hilferty ): ^[46]

k\left(1-{\frac {1}{9k}}-{\frac {z_{\alpha /2}}{3{\sqrt {k}}}}\right)^{3}\leq \mu \leq (k+1)\left(1-{\frac {1}{9(k+1)}}+{\frac {z_{\alpha /2}}{3{\sqrt {k+1}}}}\right)^{3},

donde denota la desviación normal estándar con área de cola superior $α / 2$ . $z_{\alpha /2}$

Para aplicar estas fórmulas en el mismo contexto que el anterior (dada una muestra de $n$ valores medidos $k$ _i cada uno extraído de una distribución de Poisson con media $λ$ ), se establecería

k=\sum _{i=1}^{n}k_{i},

Calcular un intervalo para $μ$ = $n λ$ , y luego derivar el intervalo para $λ$ .

Inferencia bayesiana

En la inferencia bayesiana , la distribución conjugada previa para el parámetro de velocidad $λ$ de la distribución de Poisson es la distribución gamma . ^[47] Sea

\lambda \sim \mathrm {Gamma} (\alpha ,\beta )

denotamos que $λ$ se distribuye según la densidad gamma g parametrizada en términos de un parámetro de forma α y un parámetro de escala inverso β :

g(\lambda \mid \alpha ,\beta )={\frac {\beta ^{\alpha }}{\Gamma (\alpha )}}\;\lambda ^{\alpha -1}\;e^{-\beta \,\lambda }\qquad {\text{ for }}\lambda >0\,\!.

Entonces, dada la misma muestra de $n$ valores medidos $k$ _i que antes, y una distribución previa de Gamma( α , β ), la distribución posterior es

\lambda \sim \mathrm {Gamma} \left(\alpha +\sum _{i=1}^{n}k_{i},\beta +n\right).

Nótese que la media posterior es lineal y está dada por

E[\lambda |k_{1},\ldots ,k_{n}]={\frac {\alpha +\sum _{i=1}^{n}k_{i}}{\beta +n}}.

Se puede demostrar que la distribución gamma es la única distribución previa que induce linealidad de la media condicional. Además, existe un resultado inverso que establece que si la media condicional está cerca de una función lineal en la distancia, entonces la distribución previa de $λ$ debe estar cerca de la distribución gamma en la distancia de Levy . ^[48] $L_{2}$

La media posterior E[ $λ$ ] se aproxima a la estimación de máxima verosimilitud en el límite como lo que se desprende inmediatamente de la expresión general de la media de la distribución gamma . ${\widehat {\lambda }}_{\mathrm {MLE} }$ $\alpha \to 0,\beta \to 0,$

La distribución predictiva posterior para una sola observación adicional es una distribución binomial negativa , ^[49]^{: 53} a veces llamada distribución gamma-Poisson.

Estimación simultánea de múltiples medias de Poisson

Supongamos que hay un conjunto de variables aleatorias independientes de un conjunto de distribuciones de Poisson, cada una con un parámetro y nos gustaría estimar estos parámetros. Entonces, Clevenson y Zidek muestran que bajo la pérdida de error cuadrático normalizado cuando , de manera similar al ejemplo de Stein para las medias normales, el estimador MLE es inadmisible . ^[50] $X_{1},X_{2},\dots ,X_{p}$ $p$ $\lambda _{i},$ $i=1,\dots ,p,$ ${\textstyle L(\lambda ,{\hat {\lambda }})=\sum _{i=1}^{p}\lambda _{i}^{-1}({\hat {\lambda }}_{i}-\lambda _{i})^{2},}$ $p>1,$ ${\hat {\lambda }}_{i}=X_{i}$

En este caso, se da una familia de estimadores minimax para cualquier y como ^[51] $0<c\leq 2(p-1)$ $b\geq (p-2+p^{-1})$

{\hat {\lambda }}_{i}=\left(1-{\frac {c}{b+\sum _{i=1}^{p}X_{i}}}\right)X_{i},\qquad i=1,\dots ,p.

Ocurrencia y aplicaciones

Algunas aplicaciones de la distribución de Poisson para contar datos (número de eventos): ^[52]

telecomunicaciones : llamadas telefónicas que llegan a un sistema,
astronomía : fotones que llegan a un telescopio,
Química : la distribución de masa molar de una polimerización viva , ^[53]
Biología : el número de mutaciones en una cadena de ADN por unidad de longitud,
Gestión : clientes que llegan a un mostrador o centro de llamadas,
Finanzas y seguros : número de pérdidas o reclamaciones que se producen en un período de tiempo determinado,
sismología : modelo asintótico de Poisson de riesgo para grandes terremotos, ^[54]
radiactividad : se desintegra en un intervalo de tiempo determinado en una muestra radiactiva,
óptica : número de fotones emitidos en un solo pulso láser (una vulnerabilidad importante de los protocolos de distribución de claves cuánticas , conocida como división del número de fotones).

Más ejemplos de eventos de conteo que pueden modelarse como procesos de Poisson incluyen:

En cada cuerpo de caballería prusiana , cada año, se mataban a patadas de caballos unos 100 soldados . Este ejemplo fue utilizado en un libro de Ladislaus Bortkiewicz (1868-1931), ^[12]^{: 23-25}
Células de levadura utilizadas en la elaboración de cerveza Guinness . Este ejemplo fue utilizado por William Sealy Gosset (1876–1937), ^[55]^[56]
Llamadas telefónicas que llegan a un centro de llamadas en menos de un minuto. Este ejemplo fue descrito por AK Erlang (1878-1929), ^[57]
objetivos en deportes en los que compiten dos equipos, ^[58]
muertes por año en un grupo de edad determinado,
saltos en el precio de una acción en un intervalo de tiempo determinado,
veces que se accede a un servidor web por minuto (bajo un supuesto de homogeneidad ),
mutaciones en un tramo determinado de ADN después de una cierta cantidad de radiación,
células infectadas en una multiplicidad dada de infección ,
bacterias en una cierta cantidad de líquido, ^[59]
fotones que llegan a un circuito de píxeles con una iluminación determinada durante un período de tiempo determinado,
aterrizaje de bombas voladoras V-1 en Londres durante la Segunda Guerra Mundial, investigado por RD Clarke en 1946. ^[60]

En la teoría de números probabilísticos , Gallagher demostró en 1976 que, si se cumple una cierta versión de la conjetura no probada de la r-tupla prima , ^[61] entonces los conteos de números primos en intervalos cortos obedecerían a una distribución de Poisson. ^[62]

Ley de los eventos raros

La tasa de un evento está relacionada con la probabilidad de que ocurra un evento en algún subintervalo pequeño (de tiempo, espacio o de otro tipo). En el caso de la distribución de Poisson, se supone que existe un subintervalo lo suficientemente pequeño para el cual la probabilidad de que un evento ocurra dos veces es "despreciable". Con esta suposición, se puede derivar la distribución de Poisson a partir de la distribución binomial, dada únicamente la información del número esperado de eventos totales en todo el intervalo.

Sea el número total de eventos en todo el intervalo denotado por Divida todo el intervalo en subintervalos de igual tamaño, de modo que (ya que estamos interesados solo en porciones muy pequeñas del intervalo, esta suposición es significativa). Esto significa que el número esperado de eventos en cada uno de los $n$ subintervalos es igual a $\lambda .$ $n$ $I_{1},\dots ,I_{n}$ $n>\lambda$ $\lambda /n.$

Ahora asumimos que la ocurrencia de un evento en todo el intervalo puede verse como una secuencia de $n$ ensayos de Bernoulli , donde el -ésimo ensayo de Bernoulli corresponde a ver si un evento sucede en el subintervalo con probabilidad. El número esperado de eventos totales en tales ensayos sería el número esperado de eventos totales en todo el intervalo. Por lo tanto, para cada subdivisión del intervalo hemos aproximado la ocurrencia del evento como un proceso de Bernoulli de la forma Como hemos notado antes, queremos considerar solo subintervalos muy pequeños. Por lo tanto, tomamos el límite como tiende a infinito. $i$ $I_{i}$ $\lambda /n.$ $n$ $\lambda ,$ ${\textrm {B}}(n,\lambda /n).$ $n$

En este caso la distribución binomial converge a lo que se conoce como distribución de Poisson por el teorema del límite de Poisson .

En varios de los ejemplos anteriores (como el número de mutaciones en una secuencia dada de ADN), los eventos que se cuentan son en realidad los resultados de ensayos discretos y se modelarían con mayor precisión utilizando la distribución binomial , es decir $X\sim {\textrm {B}}(n,p).$

En tales casos, $n$ es muy grande y $p$ es muy pequeño (y por lo tanto, la expectativa $np$ es de magnitud intermedia). Entonces, la distribución puede aproximarse mediante la distribución de Poisson, que es menos engorrosa. $X\sim {\textrm {Pois}}(np).$

Esta aproximación a veces se conoce como la ley de eventos raros , ^[63]^{: 5} ya que cada uno de los $n$ eventos individuales de Bernoulli ocurre raramente.

El nombre "ley de los eventos raros" puede ser engañoso porque el recuento total de eventos exitosos en un proceso de Poisson no necesita ser raro si el parámetro $np$ no es pequeño. Por ejemplo, el número de llamadas telefónicas a una centralita ocupada en una hora sigue una distribución de Poisson en la que los eventos parecen frecuentes para el operador, pero son raros desde el punto de vista del miembro promedio de la población, que tiene muy pocas probabilidades de hacer una llamada a esa centralita en esa hora.

La varianza de la distribución binomial es 1 − p veces la de la distribución de Poisson, por lo que es casi igual cuando p es muy pequeño.

La palabra ley se utiliza a veces como sinónimo de distribución de probabilidad , y convergencia en ley significa convergencia en distribución . En consecuencia, la distribución de Poisson a veces se denomina "ley de los números pequeños" porque es la distribución de probabilidad del número de ocurrencias de un evento que ocurre raramente pero tiene muchas oportunidades de ocurrir. La ley de los números pequeños es un libro de Ladislaus Bortkiewicz sobre la distribución de Poisson, publicado en 1898. ^[12]^[64]

Proceso de puntos de Poisson

La distribución de Poisson surge como el número de puntos de un proceso puntual de Poisson ubicados en alguna región finita. Más específicamente, si D es algún espacio de región, por ejemplo el espacio euclidiano R ^d , para el cual | D |, el área, el volumen o, más generalmente, la medida de Lebesgue de la región es finita, y si $N$ $($ $D$ $)$ denota el número de puntos en D , entonces

P(N(D)=k)={\frac {(\lambda |D|)^{k}e^{-\lambda |D|}}{k!}}.

Regresión de Poisson y regresión binomial negativa

La regresión de Poisson y la regresión binomial negativa son útiles para los análisis donde la variable dependiente (de respuesta) es el recuento (0, 1, 2, ...) del número de eventos u ocurrencias en un intervalo.

Biología

El experimento de Luria-Delbrück puso a prueba la hipótesis de la evolución lamarckiana, que debería dar como resultado una distribución de Poisson.

Katz y Miledi midieron el potencial de membrana con y sin la presencia de acetilcolina (ACh). ^[65] Cuando hay ACh presente, los canales iónicos de la membrana se abren aleatoriamente durante una pequeña fracción del tiempo. Como hay una gran cantidad de canales iónicos abiertos cada uno durante una pequeña fracción del tiempo, la cantidad total de canales iónicos abiertos en cualquier momento tiene una distribución de Poisson. Cuando no hay ACh presente, efectivamente no hay canales iónicos abiertos. El potencial de membrana es . Restando el efecto del ruido, Katz y Miledi encontraron que la media y la varianza del potencial de membrana son , lo que da . (pp. 94-95 ^[66] ) $V=N_{\text{open}}V_{\text{ion}}+V_{0}+V_{\text{noise}}$ $8.5\times 10^{-3}\;\mathrm {V} ,(29.2\times 10^{-6}\;\mathrm {V} )^{2}$ $V_{\text{ion}}=10^{-7}\;\mathrm {V}$

Durante cada evento de replicación celular, el número de mutaciones se distribuye aproximadamente según el método de Poisson. ^[67] Por ejemplo, el virus VIH tiene 10 000 pares de bases y una tasa de mutación de aproximadamente 1 por cada 30 000 pares de bases, lo que significa que el número de mutaciones por evento de replicación se distribuye como . (p. 64 ^[66] ) $\mathrm {Pois} (1/3)$

Otras aplicaciones en la ciencia

En un proceso de Poisson, el número de ocurrencias observadas fluctúa alrededor de su media $λ$ con una desviación estándar. Estas fluctuaciones se denominan ruido de Poisson o (particularmente en electrónica) ruido de disparo . $\sigma _{k}={\sqrt {\lambda }}.$

La correlación de la media y la desviación estándar al contar ocurrencias discretas independientes es útil científicamente. Al monitorear cómo varían las fluctuaciones con la señal media, se puede estimar la contribución de una sola ocurrencia, incluso si esa contribución es demasiado pequeña para ser detectada directamente . Por ejemplo, la carga e en un electrón se puede estimar correlacionando la magnitud de una corriente eléctrica con su ruido de disparo . Si N electrones pasan por un punto en un tiempo dado t en promedio, la corriente media es ; dado que las fluctuaciones de corriente deben ser del orden (es decir, la desviación estándar del proceso de Poisson ), la carga se puede estimar a partir de la relación ^[^{cita requerida}^] $I=eN/t$ $\sigma _{I}=e{\sqrt {N}}/t$ $e$ $t\sigma _{I}^{2}/I.$

Un ejemplo cotidiano es la granulosidad que aparece cuando se amplían las fotografías; la granulosidad se debe a las fluctuaciones de Poisson en el número de granos de plata reducidos, no a los granos individuales en sí. Al correlacionar la granulosidad con el grado de ampliación, se puede estimar la contribución de un grano individual (que de otro modo sería demasiado pequeño para verlo sin ayuda). ^{[ cita requerida ]}

En la teoría de conjuntos causales , los elementos discretos del espacio-tiempo siguen una distribución de Poisson en el volumen.

La distribución de Poisson también aparece en mecánica cuántica , especialmente en óptica cuántica . Es decir, para un sistema oscilador armónico cuántico en estado coherente , la probabilidad de medir un nivel de energía particular tiene una distribución de Poisson.

Métodos computacionales

La distribución de Poisson plantea dos tareas diferentes para las bibliotecas de software dedicadas: evaluar la distribución y extraer números aleatorios de acuerdo con esa distribución. $P(k;\lambda )$

Evaluación de la distribución de Poisson

Calcular para y dados es una tarea trivial que se puede realizar utilizando la definición estándar de en términos de funciones exponenciales, de potencia y factoriales. Sin embargo, la definición convencional de la distribución de Poisson contiene dos términos que pueden desbordarse fácilmente en las computadoras: $λ$ ^$k$ y $k$ $!$ . La fracción de $λ$ ^$k$ a $k$ ! también puede producir un error de redondeo que es muy grande en comparación con e ⁻^$λ$ , y por lo tanto dar un resultado erróneo. Por lo tanto, para la estabilidad numérica, la función de masa de probabilidad de Poisson debe evaluarse como $P(k;\lambda )$ $k$ $\lambda$ $P(k;\lambda )$

\!f(k;\lambda )=\exp \left[k\ln \lambda -\lambda -\ln \Gamma (k+1)\right],

que es matemáticamente equivalente pero numéricamente estable. El logaritmo natural de la función Gamma se puede obtener utilizando la lgammafunción en la biblioteca estándar de C (versión C99) o R , la gammalnfunción en MATLAB o SciPy , o la log_gammafunción en Fortran 2008 y posteriores.

Algunos lenguajes informáticos proporcionan funciones integradas para evaluar la distribución de Poisson, a saber:

R : función dpois(x, lambda);
Excel : función POISSON( x, mean, cumulative), con una bandera para especificar la distribución acumulativa;
Mathematica : distribución de Poisson univariante como , ^[68] distribución de Poisson bivariante como ,. ^[69]PoissonDistribution[ $\lambda$ ]MultivariatePoissonDistribution[ $\theta _{12},$ { $\theta _{1}-\theta _{12},$ $\theta _{2}-\theta _{12}$ }]

Generación de variables aleatorias

La tarea menos trivial es extraer una variable aleatoria entera de la distribución de Poisson con datos dados. $\lambda .$

Las soluciones son proporcionadas por:

R : función rpois(n, lambda);
Biblioteca científica GNU (GSL): función gsl_ran_poisson

Knuth ha propuesto un algoritmo simple para generar números aleatorios distribuidos por Poisson ( muestreo de números pseudoaleatorios ) : ^[70]^{: 137-138}

algoritmo de  números aleatorios de Poisson (Knuth) : init : Sea L ← e ^−λ , k ← 0 y p ← 1. hacer : k ← k + 1. Genere un número aleatorio uniforme u en [0,1] y sea p ← p × u. mientras p > L. devuelva k − 1.

La complejidad es lineal en el valor devuelto $k$ , que es $λ$ en promedio. Existen muchos otros algoritmos para mejorar esto. Algunos de ellos se encuentran en Ahrens & Dieter, consulte el § Referencias a continuación.

Para valores grandes de $λ$ , el valor de $L$ = e ^{− $λ$} puede ser tan pequeño que sea difícil de representar. Esto se puede solucionar modificando el algoritmo que utiliza un parámetro adicional STEP de modo que e ^−STEP no se desborde: ^{[ cita requerida ]}

Algoritmo de  números aleatorios de Poisson (Junhao, basado en Knuth) : init : Sea   $λ$  Izquierda ←  $λ$  , k ← 0 y p ← 1. hacer : k ← k + 1. Generar un número aleatorio uniforme u en (0,1) y sea p ← p × u. mientras p < 1 y  $λ$  Izquierda > 0: si   $λ$  Izquierda > PASO: p ← p × e ^PASO  $λ$  Izquierda ←  $λ$  Izquierda − PASO de lo contrario : p ← p × e ^{$λ$  Izquierda}  $λ$  Izquierda ← 0 mientras p > 1. devuelve k − 1.

La elección de STEP depende del umbral de desbordamiento. Para el formato de punto flotante de doble precisión, el umbral está cerca de e ⁷⁰⁰ , por lo que 500 debería ser un valor seguro de STEP .

Otras soluciones para valores grandes de $λ$ incluyen el muestreo de rechazo y el uso de la aproximación gaussiana.

El muestreo por transformada inversa es simple y eficiente para valores pequeños de $λ$ y requiere solo un número aleatorio uniforme u por muestra. Las probabilidades acumuladas se examinan una a una hasta que una excede u .

algoritmo  generador de Poisson basado en la inversión por búsqueda secuencial : ^[71]^{: 505}  init : Sea x ← 0, p ← e ^−λ , s ← p. Generar un número aleatorio uniforme u en [0,1]. mientras que u > s hacen : x ← x + 1. p ← p ×  $λ$  / x. es ← es + p. devuelve x.

Véase también

Referencias

Citas

^ ab Haight, Frank A. (1967). Manual de la distribución de Poisson . Nueva York, NY, EE. UU.: John Wiley & Sons. ISBN 978-0-471-33932-8.
^ ab Yates, Roy D.; Goodman, David J. (2014). Probabilidad y procesos estocásticos: una introducción fácil de entender para ingenieros eléctricos e informáticos (2.ª ed.). Hoboken, NJ: Wiley. ISBN 978-0-471-45259-1.
^ Ross, Sheldon M. (2014). Introducción a los modelos de probabilidad (11.ª ed.). Academic Press.
^ Poisson, Siméon D. (1837). Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilités [ Investigación sobre la probabilidad de las sentencias en materia penal y civil ] (en francés). París, Francia: Bachelier.
^ de Moivre, Abraham (1711). "De mensura sortis, seu, de probabilitate eventuum in ludis a casu fortuito pendentibus" [Sobre la medida del azar o sobre la probabilidad de los acontecimientos en los juegos que dependen del azar fortuito]. Transacciones filosóficas de la Royal Society (en latín). 27 (329): 213–264. doi : 10.1098/rstl.1710.0018 .
^ de Moivre, Abraham (1718). La doctrina de las probabilidades: o un método para calcular la probabilidad de los acontecimientos en el juego. Londres, Gran Bretaña: W. Pearson. ISBN 9780598843753.
^ de Moivre, Abraham (1721). "De las leyes del azar". En Motte, Benjamin (ed.). Las Transacciones filosóficas desde el año MDCC (donde termina el Sr. Lowthorp) hasta el año MDCCXX. Abreviadas y ordenadas bajo títulos generales (en latín). Vol. I. Londres, Gran Bretaña: R. Wilkin, R. Robinson, S. Ballard, W. y J. Innys, y J. Osborn. págs. 190-219.
^ abcdefghi Johnson, Norman L.; Kemp, Adrienne W.; Kotz, Samuel (2005). "Distribución de Poisson". Distribuciones discretas univariadas (3.ª ed.). Nueva York, NY, EE. UU.: John Wiley & Sons, Inc., págs. 156-207. doi :10.1002/0471715816. ISBN 978-0-471-27246-5.
^ Stigler, Stephen M. (1982). "Poisson en la distribución de Poisson". Statistics & Probability Letters . 1 (1): 33–35. doi :10.1016/0167-7152(82)90010-4.
^ Hald, Anders; de Moivre, Abraham; McClintock, Bruce (1984). "A. de Moivre: 'De Mensura Sortis' o 'Sobre la medida del azar'". Revista estadística internacional / Revue Internationale de Statistique . 52 (3): 229–262. doi :10.2307/1403045. JSTOR 1403045.
^ Newcomb, Simon (1860). «Notas sobre la teoría de las probabilidades». The Mathematical Monthly . 2 (4): 134–140.
^ abc von Bortkiewitsch, Ladislao (1898). Das Gesetz der kleinen Zahlen [ La ley de los pequeños números ] (en alemán). Leipzig, Alemania: BG Teubner. págs. 1, 23-25.
En la página 1, Bortkiewicz presenta la distribución de Poisson.
En las páginas 23-25, Bortkiewitsch presenta su análisis de "4. Beispiel: Die durch Schlag eines Pferdes im preußischen Heere Getöteten". [4. Ejemplo: Los muertos en el ejército prusiano por la coz de un caballo.]
^ Para la prueba, véase: Wiki de prueba: expectativa y Wiki de prueba: varianza
^ Kardar, Mehran (2007). Física estadística de partículas . Cambridge University Press . pág. 42. ISBN. 978-0-521-87342-0.OCLC 860391091 .
^ Dekking, Frederik Michel; Kraaikamp, Cornelis; Lopuhaä, Hendrik Paul; Meester, Ludolf Erwin (2005). Una introducción moderna a la probabilidad y la estadística. Textos de Springer en Estadística. pag. 167. doi :10.1007/1-84628-168-7. ISBN 978-1-85233-896-1.
^ Ugarte, MD ; Militino, AF ; Arnholt, AT (2016). Probabilidad y estadística con R (2.ª ed.). Boca Raton, FL, EE. UU.: CRC Press. ISBN 978-1-4665-0439-4.
^ Helske, Jouni (2017). "KFAS: Modelos de espacio de estados de familia exponencial en R". Revista de software estadístico . 78 (10). arXiv : 1612.01907 . doi :10.18637/jss.v078.i10. S2CID 14379617.
^ Choi, Kwok P. (1994). "Sobre las medianas de las distribuciones gamma y una ecuación de Ramanujan". Actas de la American Mathematical Society . 121 (1): 245–251. doi : 10.2307/2160389 . JSTOR 2160389.
^ Riordan, John (1937). "Relaciones de recurrencia de momento para distribuciones de frecuencia binomial, de Poisson e hipergeométrica" (PDF) . Anales de estadística matemática . 8 (2): 103–111. doi : 10.1214/aoms/1177732430 . JSTOR 2957598.
^ D. Ahle, Thomas (2022). "Límites claros y simples para los momentos brutos de las distribuciones binomial y de Poisson". Statistics & Probability Letters . 182 : 109306. arXiv : 2103.17027 . doi :10.1016/j.spl.2021.109306.
^ Lehmann, Erich Leo (1986). Prueba de hipótesis estadísticas (2.ª ed.). Nueva York, NJ, EE. UU.: Springer Verlag. ISBN 978-0-387-94919-2.
^ Raikov, Dmitry (1937). "Sobre la descomposición de las leyes de Poisson". Cuentas Rendus de la Academia de Ciencias de la URSS . 14 : 9–11.
^ von Mises, Richard (1964). Teoría matemática de la probabilidad y la estadística . Nueva York, NJ, EE. UU.: Academic Press. doi :10.1016/C2013-0-12460-9. ISBN 978-1-4832-3213-3.
^ Harremoes, P. (julio de 2001). "Distribuciones binomial y de Poisson como distribuciones de máxima entropía". IEEE Transactions on Information Theory . 47 (5): 2039–2041. doi :10.1109/18.930936. S2CID 16171405.
^ Laha, Radha G.; Rohatgi, Vijay K. (1979). Teoría de la probabilidad . Nueva York, Nueva Jersey, Estados Unidos: John Wiley & Sons. ISBN 978-0-471-03262-5.
^ Mitzenmacher, Michael (2017). Probabilidad y computación: técnicas de aleatorización y probabilísticas en algoritmos y análisis de datos . Eli Upfal (2.ª ed.). Cambridge, Reino Unido. Ejercicio 5.14. ISBN 978-1-107-15488-9.OCLC 960841613 .{{cite book}}: CS1 maint: location missing publisher (link)
^ de Mitzenmacher, Michael ; Upfal, Eli (2005). Probabilidad y computación: algoritmos aleatorios y análisis probabilístico . Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-83540-4.
^ Short, Michael (2013). "Desigualdades mejoradas para la distribución de Poisson y binomial y funciones cuantiles de cola superior". ISRN Probability and Statistics . 2013 . Corolario 6. doi : 10.1155/2013/412958 .
^ Short, Michael (2013). "Desigualdades mejoradas para la distribución de Poisson y binomial y funciones cuantiles de cola superior". ISRN Probability and Statistics . 2013 . Teorema 2. doi : 10.1155/2013/412958 .
^ Kamath, Govinda M.; Şaşoğlu, Eren; Tse, David (14–19 de junio de 2015). Ensamblaje óptimo de haplotipos a partir de lecturas de pares de alto rendimiento . Simposio internacional IEEE sobre teoría de la información (ISIT) de 2015. Hong Kong, China. págs. 914–918. arXiv : 1502.01975 . doi :10.1109/ISIT.2015.7282588. S2CID 128634.
^ Prins, Jack (2012). "6.3.3.1. Gráficos de control de recuentos". Manual electrónico de métodos estadísticos . NIST/SEMATECH . Consultado el 20 de septiembre de 2019 .
^ Feller, William. Introducción a la teoría de la probabilidad y sus aplicaciones .
^ Zhang, Huiming; Liu, Yunxiao; Li, Bo (2014). "Notas sobre el modelo de Poisson compuesto discreto con aplicaciones a la teoría del riesgo". Seguros: Matemáticas y Economía . 59 : 325–336. doi :10.1016/j.insmatheco.2014.09.012.
^ Zhang, Huiming; Li, Bo (2016). "Caracterización de distribuciones de Poisson compuestas discretas". Communications in Statistics - Theory and Methods . 45 (22): 6789–6802. doi :10.1080/03610926.2014.901375. S2CID 125475756.
^ McCullagh, Peter ; Nelder, John (1989). Modelos lineales generalizados . Monografías sobre estadística y probabilidad aplicada. Vol. 37. Londres, Reino Unido: Chapman and Hall. ISBN. 978-0-412-31760-6.
^ Anscombe, Francis J. (1948). "La transformación de datos de Poisson, binomiales y binomiales negativos". Biometrika . 35 (3–4): 246–254. doi :10.1093/biomet/35.3-4.246. JSTOR 2332343.
^ Ross, Sheldon M. (2010). Introducción a los modelos de probabilidad (10.ª ed.). Boston, MA: Academic Press. ISBN 978-0-12-375686-2.
^ «1.7.7 – Relación entre el multinomial y la ecuación de Poisson | STAT 504». Archivado desde el original el 6 de agosto de 2019 . Consultado el 6 de agosto de 2019 .
^ Loukas, Sotirios; Kemp, C. David (1986). "La prueba del índice de dispersión para la distribución de Poisson bivariada". Biometrics . 42 (4): 941–948. doi :10.2307/2530708. JSTOR 2530708.
^ Variables aleatorias libres por D. Voiculescu, K. Dykema, A. Nica, CRM Monograph Series, American Mathematical Society, Providence RI, 1992
^ Alexandru Nica, Roland Speicher: Lecciones sobre la combinatoria de la probabilidad libre. Serie de notas de conferencias de la London Mathematical Society, vol. 335, Cambridge University Press, 2006.
^ Lecciones sobre la combinatoria de la probabilidad libre, por A. Nica y R. Speicher, págs. 203-204, Cambridge Univ. Press, 2006
^ Paszek, Ewa. "Estimación de máxima verosimilitud: ejemplos". cnx.org .
^ Van Trees, Harry L. (2013). Estimación de detección y teoría de modulación. Kristine L. Bell, Zhi Tian (segunda edición). Hoboken, NJ ISBN 978-1-299-66515-6. OCLC 851161356.{{cite book}}: CS1 maint: location missing publisher (link)
^ Garwood, Frank (1936). "Límites fiduciales para la distribución de Poisson". Biometrika . 28 (3/4): 437–442. doi :10.1093/biomet/28.3-4.437. JSTOR 2333958.
^ Breslow, Norman E. ; Day, Nick E. (1987). Métodos estadísticos en la investigación del cáncer. Vol. 2 — El diseño y análisis de estudios de cohorte. Lyon, Francia: Agencia Internacional para la Investigación sobre el Cáncer . ISBN 978-92-832-0182-3Archivado desde el original el 8 de agosto de 2018 . Consultado el 11 de marzo de 2012 .
^ Fink, Daniel (1997). Un compendio de priores conjugados .
^ Dytso, Alex; Poor, H. Vincent (2020). "Estimación en ruido de Poisson: Propiedades del estimador de media condicional". IEEE Transactions on Information Theory . 66 (7): 4304–4323. arXiv : 1911.03744 . doi : 10.1109/TIT.2020.2979978 . S2CID 207853178.
^ Gelman; Carlin, John B.; Stern, Hal S.; Rubin, Donald B. (2003). Análisis de datos bayesianos (2.ª ed.). Boca Raton, FL, EE. UU.: Chapman & Hall/CRC. ISBN 1-58488-388-X.
^ Clevenson, M. Lawrence; Zidek, James V. (1975). "Estimación simultánea de las medias de leyes de Poisson independientes". Revista de la Asociación Estadounidense de Estadística . 70 (351): 698–705. doi :10.1080/01621459.1975.10482497. JSTOR 2285958.
^ Berger, James O. (1985). Teoría de la decisión estadística y análisis bayesiano . Springer Series in Statistics (2.ª ed.). Nueva York, NY: Springer-Verlag. Bibcode :1985sdtb.book.....B. doi :10.1007/978-1-4757-4286-2. ISBN 978-0-387-96098-2.
^ Rasch, Georg (1963). El proceso de Poisson como modelo para la diversidad de fenómenos conductuales (PDF) . 17.° Congreso Internacional de Psicología. Vol. 2. Washington, DC: Asociación Estadounidense de Psicología. doi :10.1037/e685262012-108.
^ Flory, Paul J. (1940). "Distribución del tamaño molecular en polímeros de óxido de etileno". Revista de la Sociedad Química Americana . 62 (6): 1561–1565. doi :10.1021/ja01863a066.
^ Lomnitz, Cinna (1994). Fundamentos de la predicción de terremotos . Nueva York, Nueva York: John Wiley & Sons. ISBN 0-471-57419-8.OCLC 647404423 .
^ Un estudiante (1907). "Sobre el error de conteo con un hematocitómetro". Biometrika . 5 (3): 351–360. doi :10.2307/2331633. JSTOR 2331633.
^ Boland, Philip J. (1984). "Una mirada biográfica a William Sealy Gosset". The American Statistician . 38 (3): 179–183. doi :10.1080/00031305.1984.10483195. JSTOR 2683648.
^ Erlang, Agner K. (1909). "Sandsynlighedsregning og Telefonsamtaler" [Cálculo de probabilidades y conversaciones telefónicas]. Nyt Tidsskrift para Matematik (en danés). 20 (B): 33–39. JSTOR 24528622.
^ Hornby, Dave (2014). "Modelo de predicción de fútbol: distribución de Poisson". Apuestas deportivas online . Consultado el 19 de septiembre de 2014 .
^ Koyama, Kento; Hokunan, Hidekazu; Hasegawa, Mayumi; Kawamura, Shuso; Koseki, Shigenobu (2016). "¿Siguen los números de células bacterianas una distribución teórica de Poisson? Comparación de números de células individuales obtenidos experimentalmente con generación de números aleatorios mediante simulación por computadora". Microbiología de alimentos . 60 : 49–53. doi :10.1016/j.fm.2016.05.019. PMID 27554145.
^ Clarke, RD (1946). "Una aplicación de la distribución de Poisson" (PDF) . Revista del Instituto de Actuarios . 72 (3): 481. doi : 10.1017/S0020268100035435 .
^ Hardy, Godfrey H. ; Littlewood, John E. (1923). "Sobre algunos problemas de "partitio numerorum" III: Sobre la expresión de un número como suma de primos". Acta Mathematica . 44 : 1–70. doi : 10.1007/BF02403921 .
^ Gallagher, Patrick X. (1976). "Sobre la distribución de primos en intervalos cortos". Mathematika . 23 (1): 4–9. doi :10.1112/s0025579300016442.
^ Cameron, A. Colin; Trivedi, Pravin K. (1998). Análisis de regresión de datos de recuento. Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-63567-7.
^ Edgeworth, FY (1913). "Sobre el uso de la teoría de probabilidades en las estadísticas relacionadas con la sociedad". Journal of the Royal Statistical Society . 76 (2): 165–193. doi :10.2307/2340091. JSTOR 2340091.
^ Katz, B.; Miledi, R. (agosto de 1972). "La naturaleza estadística del potencial de acetilcolina y sus componentes moleculares". The Journal of Physiology . 224 (3): 665–699. doi :10.1113/jphysiol.1972.sp009918. ISSN 0022-3751. PMC 1331515 . PMID 5071933.
^ ab Nelson, Philip Charles; Bromberg, Sarina; Hermundstad, Ann; Prentice, Jason (2015). Modelos físicos de sistemas vivos. Nueva York, NY: WH Freeman & Company, una editorial de Macmillan Education. ISBN 978-1-4641-4029-7. OCLC 891121698.
^ Foster, Patricia L. (1 de enero de 2006), "Métodos para determinar las tasas de mutación espontánea", Reparación del ADN, Parte B , Métodos en enzimología, vol. 409, Academic Press, págs. 195-213, doi :10.1016/S0076-6879(05)09012-9, ISBN 978-0-12-182814-1, PMC2041832 , PMID16793403
^ "Página de referencia de Wolfram Language: PoissonDistribution". wolfram.com . Consultado el 8 de abril de 2016 .
^ "Página de referencia de Wolfram Language: MultivariatePoissonDistribution". wolfram.com . Consultado el 8 de abril de 2016 .
^ Knuth, Donald Ervin (1997). Algoritmos seminuméricos . El arte de la programación informática . Vol. 2 (3.ª ed.). Addison Wesley . ISBN 978-0-201-89684-8.
^ Devroye, Luc (1986). "Distribuciones univariadas discretas" (PDF) . Generación de variables aleatorias no uniformes. Nueva York, NY: Springer-Verlag. págs. 485–553. doi :10.1007/978-1-4613-8643-8_10. ISBN 978-1-4613-8645-2.

Fuentes

Ahrens, Joachim H.; Dieter, Ulrich (1974). "Métodos informáticos para el muestreo de distribuciones gamma, beta, de Poisson y binomiales". Computing . 12 (3): 223–246. doi :10.1007/BF02293108. S2CID 37484126.
Ahrens, Joachim H.; Dieter, Ulrich (1982). "Generación por computadora de desviaciones de Poisson". ACM Transactions on Mathematical Software . 8 (2): 163–179. doi : 10.1145/355993.355997 . S2CID 12410131.
Evans, Ronald J.; Boersma, J.; Blachman, NM; Jagers, AA (1988). "La entropía de una distribución de Poisson: Problema 87-6". SIAM Review . 30 (2): 314–317. doi :10.1137/1030059.