stringtranslate.com

Distribución de Poisson

En teoría de probabilidad y estadística , la distribución de Poisson ( / ˈpwɑːsɒn / ; pronunciación francesa : [ pwasɔ̃] ) es una distribución de probabilidad discreta que expresa la probabilidad de que ocurra un número dado de eventos en un intervalo fijo de tiempo si estos eventos ocurren con una tasa media constante conocida e independientemente del tiempo desde el último evento. [1] También se puede utilizar para el número de eventos en otros tipos de intervalos distintos del tiempo, y en dimensión mayor que 1 (por ejemplo, número de eventos en un área o volumen determinado).

La distribución de Poisson recibe su nombre del matemático francés Siméon Denis Poisson y cumple una función importante en las distribuciones discretas estables .

Bajo una distribución de Poisson con la expectativa de λ eventos en un intervalo dado, la probabilidad de k eventos en el mismo intervalo es: [2] : 60 

Por ejemplo, considere un centro de llamadas que recibe un promedio de λ = 3 llamadas por minuto en todo momento del día. Si las llamadas son independientes, recibir una no cambia la probabilidad de cuándo llegará la siguiente. Bajo estos supuestos, la cantidad k de llamadas recibidas durante cualquier minuto tiene una distribución de probabilidad de Poisson. Recibir k = 1 a 4 llamadas tiene entonces una probabilidad de aproximadamente 0,77, mientras que recibir 0 o al menos 5 llamadas tiene una probabilidad de aproximadamente 0,23.

Un ejemplo clásico utilizado para motivar la distribución de Poisson es el número de eventos de desintegración radiactiva durante un período de observación fijo. [3]

Historia

La distribución fue introducida por primera vez por Siméon Denis Poisson (1781-1840) y publicada junto con su teoría de probabilidad en su obra Recherches sur la probabilité des jugements en matière criminelle et en matière civile (1837). [4] : 205-207  El trabajo teorizó sobre el número de condenas injustas en un país determinado centrándose en ciertas variables aleatorias N que cuentan, entre otras cosas, el número de ocurrencias discretas (a veces llamadas "eventos" o "llegadas") que tienen lugar durante un intervalo de tiempo de longitud dada. El resultado ya había sido dado en 1711 por Abraham de Moivre en De Mensura Sortis seu; de Probabilitate Eventuum in Ludis a Casu Fortuito Pendentibus . [5] : 219  [6] : 14-15  [7] : 193  [8] : 157  Esto lo convierte en un ejemplo de la ley de Stigler y ha llevado a algunos autores a argumentar que la distribución de Poisson debería llevar el nombre de De Moivre. [9] [10]

En 1860, Simon Newcomb ajustó la distribución de Poisson al número de estrellas que se encuentran en una unidad de espacio. [11] Ladislaus Bortkiewicz realizó otra aplicación práctica en 1898. Bortkiewicz demostró que la frecuencia con la que los soldados del ejército prusiano morían accidentalmente por patadas de caballo podía modelarse bien mediante una distribución de Poisson. [12] : 23-25  ​​.

Definiciones

Función de masa de probabilidad

Se dice que una variable aleatoria discreta X tiene una distribución de Poisson con parámetro si tiene una función de masa de probabilidad dada por: [2] : 60 

dónde

El número real positivo λ es igual al valor esperado de X y también a su varianza . [13]

La distribución de Poisson se puede aplicar a sistemas con una gran cantidad de eventos posibles, cada uno de los cuales es poco común . El número de eventos de este tipo que ocurren durante un intervalo de tiempo fijo es, en las circunstancias adecuadas, un número aleatorio con una distribución de Poisson.

La ecuación se puede adaptar si, en lugar del número promedio de eventos, nos dan la tasa promedio a la que ocurren los eventos. Entonces y: [14]

Ejemplos

Masticando chicle en una acera en Reikiavik.
Chicle en una acera. El número de piezas en una sola baldosa se distribuye aproximadamente según el método de Poisson.

La distribución de Poisson puede ser útil para modelar eventos como:

Ejemplos de la aparición de puntos aleatorios en el espacio son: las ubicaciones de los impactos de asteroides con la Tierra (bidimensionales), las ubicaciones de las imperfecciones en un material (tridimensionales) y las ubicaciones de los árboles en un bosque (bidimensionales). [15]

Supuestos y validez

La distribución de Poisson es un modelo apropiado si se cumplen los siguientes supuestos:

Si estas condiciones son verdaderas, entonces k es una variable aleatoria de Poisson; la distribución de k es una distribución de Poisson.

La distribución de Poisson es también el límite de una distribución binomial , para la cual la probabilidad de éxito de cada ensayo es igual a λ dividido por el número de ensayos, a medida que el número de ensayos se acerca al infinito (ver Distribuciones relacionadas).

Ejemplos de probabilidad para distribuciones de Poisson

Eventos que ocurren una vez en un intervalo: el caso especial dela= 1 ya= 0

Supongamos que los astrónomos estiman que los meteoritos grandes (de un tamaño superior a un determinado) impactan la Tierra en promedio una vez cada 100 años ( λ = 1 evento cada 100 años), y que el número de impactos de meteoritos sigue una distribución de Poisson. ¿Cuál es la probabilidad de que k = 0 impactos de meteoritos en los próximos 100 años?

Según estos supuestos, la probabilidad de que no caigan meteoritos de gran tamaño sobre la Tierra en los próximos 100 años es de aproximadamente 0,37. El 1 − 0,37 = 0,63 restante es la probabilidad de que caigan 1, 2, 3 o más meteoritos de gran tamaño en los próximos 100 años. En el ejemplo anterior, se produjo una inundación por desbordamiento una vez cada 100 años ( λ = 1). La probabilidad de que no se produjeran inundaciones por desbordamiento en 100 años era de aproximadamente 0,37, según el mismo cálculo.

En general, si un evento ocurre en promedio una vez por intervalo ( λ  = 1), y los eventos siguen una distribución de Poisson, entonces P (0 eventos en el siguiente intervalo) = 0,37. Además, P (exactamente un evento en el siguiente intervalo) = 0,37, como se muestra en la tabla para inundaciones por desbordamiento.

Ejemplos que violan los supuestos de Poisson

La cantidad de estudiantes que llegan a la asociación de estudiantes por minuto probablemente no seguirá una distribución de Poisson, porque la tasa no es constante (tasa baja durante el horario de clase, tasa alta entre horarios de clase) y las llegadas de estudiantes individuales no son independientes (los estudiantes tienden a venir en grupos). La tasa de llegada no constante se puede modelar como una distribución de Poisson mixta y la llegada de grupos en lugar de estudiantes individuales como un proceso de Poisson compuesto .

El número de terremotos de magnitud 5 por año en un país puede no seguir una distribución de Poisson, si un gran terremoto aumenta la probabilidad de réplicas de magnitud similar.

Los ejemplos en los que se garantiza al menos un evento no tienen distribución de Poisson, pero pueden modelarse utilizando una distribución de Poisson truncada en cero .

Las distribuciones de recuento en las que el número de intervalos con cero eventos es mayor que el previsto por un modelo de Poisson se pueden modelar utilizando un modelo de ceros inflados .

Propiedades

Estadísticas descriptivas

Mediana

Los límites para la mediana ( ) de la distribución son conocidos y precisos : [18]

Momentos más elevados

Los momentos no centrados superiores m k de la distribución de Poisson son polinomios de Touchard en λ : donde las llaves { } denotan números de Stirling de segundo tipo . [19] [1] : 6  En otras palabras, cuando el valor esperado se establece en λ = 1, la fórmula de Dobinski implica que el n -ésimo momento es igual al número de particiones de un conjunto de tamaño n .

Un límite superior simple es: [20]

Sumas de variables aleatorias distribuidas según Poisson

Si para son independientes , entonces [21] : 65  Un recíproco es el teorema de Raikov , que dice que si la suma de dos variables aleatorias independientes tiene distribución de Poisson, entonces también lo son cada una de esas dos variables aleatorias independientes. [22] [23]

Entropía máxima

Es una distribución de máxima entropía entre el conjunto de distribuciones binomiales generalizadas con media y , [24] donde una distribución binomial generalizada se define como una distribución de la suma de N variables de Bernoulli independientes pero no idénticamente distribuidas.

Otras propiedades

¿Dónde está la divergencia de Kullback-Leibler de de ?

Razas de Poisson

Sean y variables aleatorias independientes, con entonces tenemos que

El límite superior se demuestra utilizando un límite de Chernoff estándar.

El límite inferior se puede demostrar observando que es la probabilidad de que donde que está acotado por debajo por donde es la entropía relativa (ver la entrada sobre límites en las colas de las distribuciones binomiales para más detalles). Observando además que y calculando un límite inferior en la probabilidad incondicional se obtiene el resultado. Se pueden encontrar más detalles en el apéndice de Kamath et al. [30]

Distribuciones relacionadas

Como una distribución binomial con pasos de tiempo infinitesimales

La distribución de Poisson se puede derivar como un caso límite de la distribución binomial , ya que el número de ensayos tiende al infinito y el número esperado de éxitos permanece fijo (véase la ley de los eventos raros a continuación). Por lo tanto, se puede utilizar como una aproximación de la distribución binomial si n es suficientemente grande y p es suficientemente pequeño. La distribución de Poisson es una buena aproximación de la distribución binomial si n es al menos 20 y p es menor o igual a 0,05, y una excelente aproximación si n  ≥ 100 y np  ≤ 10. [31] Dejando y sean las respectivas funciones de densidad acumulada de las distribuciones binomial y de Poisson, se tiene: Una derivación de esto utiliza funciones generadoras de probabilidad . [32] Considere un ensayo de Bernoulli (lanzamiento de moneda) cuya probabilidad de un éxito (o número esperado de éxitos) está dentro de un intervalo dado. Divida el intervalo en n partes y realice un ensayo en cada subintervalo con probabilidad . La probabilidad de k éxitos de n ensayos durante todo el intervalo viene dada entonces por la distribución binomial.

,

cuya función generadora es:

Tomando el límite cuando n aumenta hasta infinito (con x fijo) y aplicando la definición de límite del producto de la función exponencial , esto se reduce a la función generadora de la distribución de Poisson:

General

Aproximación de Poisson

Supongamos que entonces [38] se distribuye multinomialmente condicionado a

Esto significa [27] : 101-102  , entre otras cosas, que para cualquier función no negativa si se distribuye multinomialmente, entonces donde

El factor de puede reemplazarse por 2 si se supone además que aumenta o disminuye monótonamente.

Distribución de Poisson bivariada

Esta distribución se ha extendido al caso bivariado . [39] La función generadora para esta distribución es

con

Las distribuciones marginales son Poisson( θ 1 ) y Poisson( θ 2 ) y el coeficiente de correlación está limitado al rango

Una forma sencilla de generar una distribución de Poisson bivariada es tomar tres distribuciones de Poisson independientes con medias y luego establecer La función de probabilidad de la distribución de Poisson bivariada es

Distribución libre de Poisson

La distribución de Poisson libre [40] con tamaño y tasa de salto surge en la teoría de probabilidad libre como el límite de la convolución libre repetida cuando N → ∞ .

En otras palabras, sean variables aleatorias de modo que tenga valor con probabilidad y valor 0 con la probabilidad restante. Supongamos también que la familia es libremente independiente . Entonces el límite de la ley de está dado por la ley de Poisson libre con parámetros

Esta definición es análoga a una de las formas en que se obtiene la distribución de Poisson clásica a partir de un proceso de Poisson (clásico).

La medida asociada a la ley de Poisson libre está dada por [41] donde y tiene soporte

Esta ley también surge en la teoría de matrices aleatorias como la ley de Marchenko-Pastur . Sus cumulantes libres son iguales a

Algunas transformaciones de esta ley

Damos valores de algunas transformadas importantes de la ley de Poisson libre; el cálculo se puede encontrar, por ejemplo, en el libro Lectures on the Combinatorics of Free Probability de A. Nica y R. Speicher [42].

La transformada R de la ley de Poisson libre está dada por

La transformada de Cauchy (que es el negativo de la transformación de Stieltjes ) está dada por

La transformada S viene dada por en el caso de que

Recuento de Weibull y estable

La función de masa de probabilidad de Poisson se puede expresar en una forma similar a la distribución del producto de una distribución de Weibull y una forma variante de la distribución de recuento estable . La variable se puede considerar como inversa del parámetro de estabilidad de Lévy en la distribución de recuento estable: donde es una distribución de recuento estable estándar de forma y es una distribución de Weibull estándar de forma

Inferencia estadística

Estimación de parámetros

Dada una muestra de n valores medidos para i = 1, ..., n , deseamos estimar el valor del parámetro λ de la población de Poisson de la que se extrajo la muestra. La estimación de máxima verosimilitud es [43]

Dado que cada observación tiene una expectativa λ, también la tiene la media de la muestra. Por lo tanto, la estimación de máxima verosimilitud es un estimador insesgado de λ . También es un estimador eficiente ya que su varianza alcanza el límite inferior de Cramér-Rao (CRLB). [44] Por lo tanto, es insesgado en cuanto a varianza mínima . También se puede demostrar que la suma (y, por lo tanto, la media de la muestra, ya que es una función uno a uno de la suma) es una estadística completa y suficiente para λ .

Para demostrar la suficiencia podemos usar el teorema de factorización . Considere la partición de la función de masa de probabilidad de la distribución de Poisson conjunta para la muestra en dos partes: una que depende únicamente de la muestra , llamada , y otra que depende del parámetro y de la muestra solo a través de la función Entonces es una estadística suficiente para

El primer término depende únicamente de . El segundo término depende únicamente de la muestra mediante Por lo tanto, es suficiente.

Para encontrar el parámetro λ que maximiza la función de probabilidad para la población de Poisson, podemos utilizar el logaritmo de la función de probabilidad:

Tomamos la derivada de con respecto a λ y la comparamos con cero:

Resolviendo λ obtenemos un punto estacionario.

Por lo tanto, λ es el promedio de los valores de k i . La obtención del signo de la segunda derivada de L en el punto estacionario determinará qué tipo de valor extremo es λ .

Evaluando la segunda derivada en el punto estacionario obtenemos:

que es el negativo de n veces el recíproco del promedio de k i . Esta expresión es negativa cuando el promedio es positivo. Si esto se cumple, entonces el punto estacionario maximiza la función de probabilidad.

Para completar , se dice que una familia de distribuciones es completa si y solo si implica que para todos Si los individuos son iid entonces Conociendo la distribución que queremos investigar, es fácil ver que la estadística es completa.

Para que se cumpla esta igualdad, debe ser 0. Esto se deduce del hecho de que ninguno de los otros términos será 0 para todos en la suma y para todos los valores posibles de Por lo tanto, para todos implica que y se ha demostrado que la estadística es completa.

Intervalo de confianza

El intervalo de confianza para la media de una distribución de Poisson se puede expresar utilizando la relación entre las funciones de distribución acumulativa de las distribuciones de Poisson y de chi-cuadrado . La distribución de chi-cuadrado está estrechamente relacionada con la distribución gamma , y ​​esto conduce a una expresión alternativa. Dada una observación k de una distribución de Poisson con media μ , un intervalo de confianza para μ con nivel de confianza 1 – α es

o equivalentemente,

donde es la función cuantil (correspondiente a un área de cola inferior p ) de la distribución chi-cuadrado con n grados de libertad y es la función cuantil de una distribución gamma con parámetro de forma n y parámetro de escala 1. [8] : 176-178  [45] Este intervalo es ' exacto ' en el sentido de que su probabilidad de cobertura nunca es menor que el nominal 1 – α .

Cuando no se dispone de cuantiles de la distribución gamma, se ha propuesto una aproximación precisa a este intervalo exacto (basada en la transformación de Wilson-Hilferty ): [46]

donde denota la desviación normal estándar con área de cola superior α / 2 .

Para aplicar estas fórmulas en el mismo contexto que el anterior (dada una muestra de n valores medidos k i cada uno extraído de una distribución de Poisson con media λ ), se establecería

Calcular un intervalo para μ = n λ , y luego derivar el intervalo para λ .

Inferencia bayesiana

En la inferencia bayesiana , la distribución conjugada previa para el parámetro de velocidad λ de la distribución de Poisson es la distribución gamma . [47] Sea

denotamos que λ se distribuye según la densidad gamma g parametrizada en términos de un parámetro de forma α y un parámetro de escala inverso β :

Entonces, dada la misma muestra de n valores medidos k i que antes, y una distribución previa de Gamma( α , β ), la distribución posterior es

Nótese que la media posterior es lineal y está dada por

Se puede demostrar que la distribución gamma es la única distribución previa que induce linealidad de la media condicional. Además, existe un resultado inverso que establece que si la media condicional está cerca de una función lineal en la distancia, entonces la distribución previa de λ debe estar cerca de la distribución gamma en la distancia de Levy . [48]

La media posterior E[ λ ] se aproxima a la estimación de máxima verosimilitud en el límite como lo que se desprende inmediatamente de la expresión general de la media de la distribución gamma .

La distribución predictiva posterior para una sola observación adicional es una distribución binomial negativa , [49] : 53  a veces llamada distribución gamma-Poisson.

Estimación simultánea de múltiples medias de Poisson

Supongamos que hay un conjunto de variables aleatorias independientes de un conjunto de distribuciones de Poisson, cada una con un parámetro y nos gustaría estimar estos parámetros. Entonces, Clevenson y Zidek muestran que bajo la pérdida de error cuadrático normalizado cuando , de manera similar al ejemplo de Stein para las medias normales, el estimador MLE es inadmisible . [50]

En este caso, se da una familia de estimadores minimax para cualquier y como [51]

Ocurrencia y aplicaciones

Algunas aplicaciones de la distribución de Poisson para contar datos (número de eventos): [52]

Más ejemplos de eventos de conteo que pueden modelarse como procesos de Poisson incluyen:

En la teoría de números probabilísticos , Gallagher demostró en 1976 que, si se cumple una cierta versión de la conjetura no probada de la r-tupla prima , [61] entonces los conteos de números primos en intervalos cortos obedecerían a una distribución de Poisson. [62]

Ley de los eventos raros

Comparación de la distribución de Poisson (líneas negras) y la distribución binomial con n = 10 (círculos rojos), n = 20 (círculos azules), n = 1000 (círculos verdes). Todas las distribuciones tienen una media de 5. El eje horizontal muestra el número de eventos  k . A medida que n se hace más grande, la distribución de Poisson se convierte en una aproximación cada vez mejor para la distribución binomial con la misma media.

La tasa de un evento está relacionada con la probabilidad de que ocurra un evento en algún subintervalo pequeño (de tiempo, espacio o de otro tipo). En el caso de la distribución de Poisson, se supone que existe un subintervalo lo suficientemente pequeño para el cual la probabilidad de que un evento ocurra dos veces es "despreciable". Con esta suposición, se puede derivar la distribución de Poisson a partir de la distribución binomial, dada únicamente la información del número esperado de eventos totales en todo el intervalo.

Sea el número total de eventos en todo el intervalo denotado por Divida todo el intervalo en subintervalos de igual tamaño, de modo que (ya que estamos interesados ​​solo en porciones muy pequeñas del intervalo, esta suposición es significativa). Esto significa que el número esperado de eventos en cada uno de los n subintervalos es igual a

Ahora asumimos que la ocurrencia de un evento en todo el intervalo puede verse como una secuencia de n ensayos de Bernoulli , donde el -ésimo ensayo de Bernoulli corresponde a ver si un evento sucede en el subintervalo con probabilidad. El número esperado de eventos totales en tales ensayos sería el número esperado de eventos totales en todo el intervalo. Por lo tanto, para cada subdivisión del intervalo hemos aproximado la ocurrencia del evento como un proceso de Bernoulli de la forma Como hemos notado antes, queremos considerar solo subintervalos muy pequeños. Por lo tanto, tomamos el límite como tiende a infinito.

En este caso la distribución binomial converge a lo que se conoce como distribución de Poisson por el teorema del límite de Poisson .

En varios de los ejemplos anteriores (como el número de mutaciones en una secuencia dada de ADN), los eventos que se cuentan son en realidad los resultados de ensayos discretos y se modelarían con mayor precisión utilizando la distribución binomial , es decir

En tales casos, n es muy grande y p es muy pequeño (y por lo tanto, la expectativa np es de magnitud intermedia). Entonces, la distribución puede aproximarse mediante la distribución de Poisson, que es menos engorrosa.

Esta aproximación a veces se conoce como la ley de eventos raros , [63] : 5  ya que cada uno de los n eventos individuales de Bernoulli ocurre raramente.

El nombre "ley de los eventos raros" puede ser engañoso porque el recuento total de eventos exitosos en un proceso de Poisson no necesita ser raro si el parámetro np no es pequeño. Por ejemplo, el número de llamadas telefónicas a una centralita ocupada en una hora sigue una distribución de Poisson en la que los eventos parecen frecuentes para el operador, pero son raros desde el punto de vista del miembro promedio de la población, que tiene muy pocas probabilidades de hacer una llamada a esa centralita en esa hora.

La varianza de la distribución binomial es 1 − p veces la de la distribución de Poisson, por lo que es casi igual cuando p es muy pequeño.

La palabra ley se utiliza a veces como sinónimo de distribución de probabilidad , y convergencia en ley significa convergencia en distribución . En consecuencia, la distribución de Poisson a veces se denomina "ley de los números pequeños" porque es la distribución de probabilidad del número de ocurrencias de un evento que ocurre raramente pero tiene muchas oportunidades de ocurrir. La ley de los números pequeños es un libro de Ladislaus Bortkiewicz sobre la distribución de Poisson, publicado en 1898. [12] [64]

Proceso de puntos de Poisson

La distribución de Poisson surge como el número de puntos de un proceso puntual de Poisson ubicados en alguna región finita. Más específicamente, si D es algún espacio de región, por ejemplo el espacio euclidiano R d , para el cual | D |, el área, el volumen o, más generalmente, la medida de Lebesgue de la región es finita, y si N ( D ) denota el número de puntos en D , entonces

Regresión de Poisson y regresión binomial negativa

La regresión de Poisson y la regresión binomial negativa son útiles para los análisis donde la variable dependiente (de respuesta) es el recuento (0, 1, 2, ...) del número de eventos u ocurrencias en un intervalo.

Biología

El experimento de Luria-Delbrück puso a prueba la hipótesis de la evolución lamarckiana, que debería dar como resultado una distribución de Poisson.

Katz y Miledi midieron el potencial de membrana con y sin la presencia de acetilcolina (ACh). [65] Cuando hay ACh presente, los canales iónicos de la membrana se abren aleatoriamente durante una pequeña fracción del tiempo. Como hay una gran cantidad de canales iónicos abiertos cada uno durante una pequeña fracción del tiempo, la cantidad total de canales iónicos abiertos en cualquier momento tiene una distribución de Poisson. Cuando no hay ACh presente, efectivamente no hay canales iónicos abiertos. El potencial de membrana es . Restando el efecto del ruido, Katz y Miledi encontraron que la media y la varianza del potencial de membrana son , lo que da . (pp. 94-95 [66] )

Durante cada evento de replicación celular, el número de mutaciones se distribuye aproximadamente según el método de Poisson. [67] Por ejemplo, el virus VIH tiene 10 000 pares de bases y una tasa de mutación de aproximadamente 1 por cada 30 000 pares de bases, lo que significa que el número de mutaciones por evento de replicación se distribuye como . (p. 64 [66] )

Otras aplicaciones en la ciencia

En un proceso de Poisson, el número de ocurrencias observadas fluctúa alrededor de su media λ con una desviación estándar. Estas fluctuaciones se denominan ruido de Poisson o (particularmente en electrónica) ruido de disparo .

La correlación de la media y la desviación estándar al contar ocurrencias discretas independientes es útil científicamente. Al monitorear cómo varían las fluctuaciones con la señal media, se puede estimar la contribución de una sola ocurrencia, incluso si esa contribución es demasiado pequeña para ser detectada directamente . Por ejemplo, la carga e en un electrón se puede estimar correlacionando la magnitud de una corriente eléctrica con su ruido de disparo . Si N electrones pasan por un punto en un tiempo dado t en promedio, la corriente media es ; dado que las fluctuaciones de corriente deben ser del orden (es decir, la desviación estándar del proceso de Poisson ), la carga se puede estimar a partir de la relación [ cita requerida ]

Un ejemplo cotidiano es la granulosidad que aparece cuando se amplían las fotografías; la granulosidad se debe a las fluctuaciones de Poisson en el número de granos de plata reducidos, no a los granos individuales en sí. Al correlacionar la granulosidad con el grado de ampliación, se puede estimar la contribución de un grano individual (que de otro modo sería demasiado pequeño para verlo sin ayuda). [ cita requerida ]

En la teoría de conjuntos causales , los elementos discretos del espacio-tiempo siguen una distribución de Poisson en el volumen.

La distribución de Poisson también aparece en mecánica cuántica , especialmente en óptica cuántica . Es decir, para un sistema oscilador armónico cuántico en estado coherente , la probabilidad de medir un nivel de energía particular tiene una distribución de Poisson.

Métodos computacionales

La distribución de Poisson plantea dos tareas diferentes para las bibliotecas de software dedicadas: evaluar la distribución y extraer números aleatorios de acuerdo con esa distribución.

Evaluación de la distribución de Poisson

Calcular para y dados es una tarea trivial que se puede realizar utilizando la definición estándar de en términos de funciones exponenciales, de potencia y factoriales. Sin embargo, la definición convencional de la distribución de Poisson contiene dos términos que pueden desbordarse fácilmente en las computadoras: λ k y k ! . La fracción de λ k a k ! también puede producir un error de redondeo que es muy grande en comparación con e λ , y por lo tanto dar un resultado erróneo. Por lo tanto, para la estabilidad numérica, la función de masa de probabilidad de Poisson debe evaluarse como

que es matemáticamente equivalente pero numéricamente estable. El logaritmo natural de la función Gamma se puede obtener utilizando la lgammafunción en la biblioteca estándar de C (versión C99) o R , la gammalnfunción en MATLAB o SciPy , o la log_gammafunción en Fortran 2008 y posteriores.

Algunos lenguajes informáticos proporcionan funciones integradas para evaluar la distribución de Poisson, a saber:

Generación de variables aleatorias

La tarea menos trivial es extraer una variable aleatoria entera de la distribución de Poisson con datos dados.

Las soluciones son proporcionadas por:

Knuth ha propuesto un algoritmo simple para generar números aleatorios distribuidos por Poisson ( muestreo de números pseudoaleatorios ) : [70] : 137-138 

algoritmo de  números aleatorios de Poisson (Knuth) : init : Sea L ← e −λ , k ← 0 y p ← 1. hacer : k ← k + 1. Genere un número aleatorio uniforme u en [0,1] y sea p ← p × u. mientras p > L. devuelva k − 1.

La complejidad es lineal en el valor devuelto k , que es λ en promedio. Existen muchos otros algoritmos para mejorar esto. Algunos de ellos se encuentran en Ahrens & Dieter, consulte el § Referencias a continuación.

Para valores grandes de λ , el valor de L = e λ puede ser tan pequeño que sea difícil de representar. Esto se puede solucionar modificando el algoritmo que utiliza un parámetro adicional STEP de modo que e −STEP no se desborde: [ cita requerida ]

Algoritmo de  números aleatorios de Poisson (Junhao, basado en Knuth) : init : Sea  λ Izquierda ← λ , k ← 0 y p ← 1. hacer : k ← k + 1. Generar un número aleatorio uniforme u en (0,1) y sea p ← p × u. mientras p < 1 y λ Izquierda > 0: si  λ Izquierda > PASO: p ← p × e PASO  λ Izquierda ← λ Izquierda − PASO de lo contrario : p ← p × e λ Izquierda  λ Izquierda ← 0 mientras p > 1. devuelve k − 1.

La elección de STEP depende del umbral de desbordamiento. Para el formato de punto flotante de doble precisión, el umbral está cerca de e 700 , por lo que 500 debería ser un valor seguro de STEP .

Otras soluciones para valores grandes de λ incluyen el muestreo de rechazo y el uso de la aproximación gaussiana.

El muestreo por transformada inversa es simple y eficiente para valores pequeños de λ y requiere solo un número aleatorio uniforme u por muestra. Las probabilidades acumuladas se examinan una a una hasta que una excede u .

algoritmo  generador de Poisson basado en la inversión por búsqueda secuencial : [71] : 505   init : Sea x ← 0, p ← e −λ , s ← p. Generar un número aleatorio uniforme u en [0,1]. mientras que u > s hacen : x ← x + 1. p ← p × λ / x. es ← es + p. devuelve x.

Véase también

Referencias

Citas

  1. ^ ab Haight, Frank A. (1967). Manual de la distribución de Poisson . Nueva York, NY, EE. UU.: John Wiley & Sons. ISBN 978-0-471-33932-8.
  2. ^ ab Yates, Roy D.; Goodman, David J. (2014). Probabilidad y procesos estocásticos: una introducción fácil de entender para ingenieros eléctricos e informáticos (2.ª ed.). Hoboken, NJ: Wiley. ISBN 978-0-471-45259-1.
  3. ^ Ross, Sheldon M. (2014). Introducción a los modelos de probabilidad (11.ª ed.). Academic Press.
  4. ^ Poisson, Siméon D. (1837). Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilités [ Investigación sobre la probabilidad de las sentencias en materia penal y civil ] (en francés). París, Francia: Bachelier.
  5. ^ de Moivre, Abraham (1711). "De mensura sortis, seu, de probabilitate eventuum in ludis a casu fortuito pendentibus" [Sobre la medida del azar o sobre la probabilidad de los acontecimientos en los juegos que dependen del azar fortuito]. Transacciones filosóficas de la Royal Society (en latín). 27 (329): 213–264. doi : 10.1098/rstl.1710.0018 .
  6. ^ de Moivre, Abraham (1718). La doctrina de las probabilidades: o un método para calcular la probabilidad de los acontecimientos en el juego. Londres, Gran Bretaña: W. Pearson. ISBN 9780598843753.
  7. ^ de Moivre, Abraham (1721). "De las leyes del azar". En Motte, Benjamin (ed.). Las Transacciones filosóficas desde el año MDCC (donde termina el Sr. Lowthorp) hasta el año MDCCXX. Abreviadas y ordenadas bajo títulos generales (en latín). Vol. I. Londres, Gran Bretaña: R. Wilkin, R. Robinson, S. Ballard, W. y J. Innys, y J. Osborn. págs. 190-219.
  8. ^ abcdefghi Johnson, Norman L.; Kemp, Adrienne W.; Kotz, Samuel (2005). "Distribución de Poisson". Distribuciones discretas univariadas (3.ª ed.). Nueva York, NY, EE. UU.: John Wiley & Sons, Inc., págs. 156-207. doi :10.1002/0471715816. ISBN 978-0-471-27246-5.
  9. ^ Stigler, Stephen M. (1982). "Poisson en la distribución de Poisson". Statistics & Probability Letters . 1 (1): 33–35. doi :10.1016/0167-7152(82)90010-4.
  10. ^ Hald, Anders; de Moivre, Abraham; McClintock, Bruce (1984). "A. de Moivre: 'De Mensura Sortis' o 'Sobre la medida del azar'". Revista estadística internacional / Revue Internationale de Statistique . 52 (3): 229–262. doi :10.2307/1403045. JSTOR  1403045.
  11. ^ Newcomb, Simon (1860). «Notas sobre la teoría de las probabilidades». The Mathematical Monthly . 2 (4): 134–140.
  12. ^ abc von Bortkiewitsch, Ladislao (1898). Das Gesetz der kleinen Zahlen [ La ley de los pequeños números ] (en alemán). Leipzig, Alemania: BG Teubner. págs. 1, 23-25.
    En la página 1, Bortkiewicz presenta la distribución de Poisson.
    En las páginas 23-25, Bortkiewitsch presenta su análisis de "4. Beispiel: Die durch Schlag eines Pferdes im preußischen Heere Getöteten". [4. Ejemplo: Los muertos en el ejército prusiano por la coz de un caballo.]
  13. ^ Para la prueba, véase: Wiki de prueba: expectativa y Wiki de prueba: varianza
  14. ^ Kardar, Mehran (2007). Física estadística de partículas . Cambridge University Press . pág. 42. ISBN. 978-0-521-87342-0.OCLC 860391091  .
  15. ^ Dekking, Frederik Michel; Kraaikamp, ​​Cornelis; Lopuhaä, Hendrik Paul; Meester, Ludolf Erwin (2005). Una introducción moderna a la probabilidad y la estadística. Textos de Springer en Estadística. pag. 167. doi :10.1007/1-84628-168-7. ISBN 978-1-85233-896-1.
  16. ^ Ugarte, MD ; Militino, AF ; Arnholt, AT (2016). Probabilidad y estadística con R (2.ª ed.). Boca Raton, FL, EE. UU.: CRC Press. ISBN 978-1-4665-0439-4.
  17. ^ Helske, Jouni (2017). "KFAS: Modelos de espacio de estados de familia exponencial en R". Revista de software estadístico . 78 (10). arXiv : 1612.01907 . doi :10.18637/jss.v078.i10. S2CID  14379617.
  18. ^ Choi, Kwok P. (1994). "Sobre las medianas de las distribuciones gamma y una ecuación de Ramanujan". Actas de la American Mathematical Society . 121 (1): 245–251. doi : 10.2307/2160389 . JSTOR  2160389.
  19. ^ Riordan, John (1937). "Relaciones de recurrencia de momento para distribuciones de frecuencia binomial, de Poisson e hipergeométrica" ​​(PDF) . Anales de estadística matemática . 8 (2): 103–111. doi : 10.1214/aoms/1177732430 . JSTOR  2957598.
  20. ^ D. Ahle, Thomas (2022). "Límites claros y simples para los momentos brutos de las distribuciones binomial y de Poisson". Statistics & Probability Letters . 182 : 109306. arXiv : 2103.17027 . doi :10.1016/j.spl.2021.109306.
  21. ^ Lehmann, Erich Leo (1986). Prueba de hipótesis estadísticas (2.ª ed.). Nueva York, NJ, EE. UU.: Springer Verlag. ISBN 978-0-387-94919-2.
  22. ^ Raikov, Dmitry (1937). "Sobre la descomposición de las leyes de Poisson". Cuentas Rendus de la Academia de Ciencias de la URSS . 14 : 9–11.
  23. ^ von Mises, Richard (1964). Teoría matemática de la probabilidad y la estadística . Nueva York, NJ, EE. UU.: Academic Press. doi :10.1016/C2013-0-12460-9. ISBN 978-1-4832-3213-3.
  24. ^ Harremoes, P. (julio de 2001). "Distribuciones binomial y de Poisson como distribuciones de máxima entropía". IEEE Transactions on Information Theory . 47 (5): 2039–2041. doi :10.1109/18.930936. S2CID  16171405.
  25. ^ Laha, Radha G.; Rohatgi, Vijay K. (1979). Teoría de la probabilidad . Nueva York, Nueva Jersey, Estados Unidos: John Wiley & Sons. ISBN 978-0-471-03262-5.
  26. ^ Mitzenmacher, Michael (2017). Probabilidad y computación: técnicas de aleatorización y probabilísticas en algoritmos y análisis de datos . Eli Upfal (2.ª ed.). Cambridge, Reino Unido. Ejercicio 5.14. ISBN 978-1-107-15488-9.OCLC 960841613  .{{cite book}}: CS1 maint: location missing publisher (link)
  27. ^ de Mitzenmacher, Michael ; Upfal, Eli (2005). Probabilidad y computación: algoritmos aleatorios y análisis probabilístico . Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-83540-4.
  28. ^ Short, Michael (2013). "Desigualdades mejoradas para la distribución de Poisson y binomial y funciones cuantiles de cola superior". ISRN Probability and Statistics . 2013 . Corolario 6. doi : 10.1155/2013/412958 .
  29. ^ Short, Michael (2013). "Desigualdades mejoradas para la distribución de Poisson y binomial y funciones cuantiles de cola superior". ISRN Probability and Statistics . 2013 . Teorema 2. doi : 10.1155/2013/412958 .
  30. ^ Kamath, Govinda M.; Şaşoğlu, Eren; Tse, David (14–19 de junio de 2015). Ensamblaje óptimo de haplotipos a partir de lecturas de pares de alto rendimiento . Simposio internacional IEEE sobre teoría de la información (ISIT) de 2015. Hong Kong, China. págs. 914–918. arXiv : 1502.01975 . doi :10.1109/ISIT.2015.7282588. S2CID  128634.
  31. ^ Prins, Jack (2012). "6.3.3.1. Gráficos de control de recuentos". Manual electrónico de métodos estadísticos . NIST/SEMATECH . Consultado el 20 de septiembre de 2019 .
  32. ^ Feller, William. Introducción a la teoría de la probabilidad y sus aplicaciones .
  33. ^ Zhang, Huiming; Liu, Yunxiao; Li, Bo (2014). "Notas sobre el modelo de Poisson compuesto discreto con aplicaciones a la teoría del riesgo". Seguros: Matemáticas y Economía . 59 : 325–336. doi :10.1016/j.insmatheco.2014.09.012.
  34. ^ Zhang, Huiming; Li, Bo (2016). "Caracterización de distribuciones de Poisson compuestas discretas". Communications in Statistics - Theory and Methods . 45 (22): 6789–6802. doi :10.1080/03610926.2014.901375. S2CID  125475756.
  35. ^ McCullagh, Peter ; Nelder, John (1989). Modelos lineales generalizados . Monografías sobre estadística y probabilidad aplicada. Vol. 37. Londres, Reino Unido: Chapman and Hall. ISBN. 978-0-412-31760-6.
  36. ^ Anscombe, Francis J. (1948). "La transformación de datos de Poisson, binomiales y binomiales negativos". Biometrika . 35 (3–4): 246–254. doi :10.1093/biomet/35.3-4.246. JSTOR  2332343.
  37. ^ Ross, Sheldon M. (2010). Introducción a los modelos de probabilidad (10.ª ed.). Boston, MA: Academic Press. ISBN 978-0-12-375686-2.
  38. ^ «1.7.7 – Relación entre el multinomial y la ecuación de Poisson | STAT 504». Archivado desde el original el 6 de agosto de 2019 . Consultado el 6 de agosto de 2019 .
  39. ^ Loukas, Sotirios; Kemp, C. David (1986). "La prueba del índice de dispersión para la distribución de Poisson bivariada". Biometrics . 42 (4): 941–948. doi :10.2307/2530708. JSTOR  2530708.
  40. ^ Variables aleatorias libres por D. Voiculescu, K. Dykema, A. Nica, CRM Monograph Series, American Mathematical Society, Providence RI, 1992
  41. ^ Alexandru Nica, Roland Speicher: Lecciones sobre la combinatoria de la probabilidad libre. Serie de notas de conferencias de la London Mathematical Society, vol. 335, Cambridge University Press, 2006.
  42. ^ Lecciones sobre la combinatoria de la probabilidad libre, por A. Nica y R. Speicher, págs. 203-204, Cambridge Univ. Press, 2006
  43. ^ Paszek, Ewa. "Estimación de máxima verosimilitud: ejemplos". cnx.org .
  44. ^ Van Trees, Harry L. (2013). Estimación de detección y teoría de modulación. Kristine L. Bell, Zhi Tian (segunda edición). Hoboken, NJ ISBN 978-1-299-66515-6. OCLC  851161356.{{cite book}}: CS1 maint: location missing publisher (link)
  45. ^ Garwood, Frank (1936). "Límites fiduciales para la distribución de Poisson". Biometrika . 28 (3/4): 437–442. doi :10.1093/biomet/28.3-4.437. JSTOR  2333958.
  46. ^ Breslow, Norman E. ; Day, Nick E. (1987). Métodos estadísticos en la investigación del cáncer. Vol. 2 — El diseño y análisis de estudios de cohorte. Lyon, Francia: Agencia Internacional para la Investigación sobre el Cáncer . ISBN 978-92-832-0182-3Archivado desde el original el 8 de agosto de 2018 . Consultado el 11 de marzo de 2012 .
  47. ^ Fink, Daniel (1997). Un compendio de priores conjugados .
  48. ^ Dytso, Alex; Poor, H. Vincent (2020). "Estimación en ruido de Poisson: Propiedades del estimador de media condicional". IEEE Transactions on Information Theory . 66 (7): 4304–4323. arXiv : 1911.03744 . doi : 10.1109/TIT.2020.2979978 . S2CID  207853178.
  49. ^ Gelman; Carlin, John B.; Stern, Hal S.; Rubin, Donald B. (2003). Análisis de datos bayesianos (2.ª ed.). Boca Raton, FL, EE. UU.: Chapman & Hall/CRC. ISBN 1-58488-388-X.
  50. ^ Clevenson, M. Lawrence; Zidek, James V. (1975). "Estimación simultánea de las medias de leyes de Poisson independientes". Revista de la Asociación Estadounidense de Estadística . 70 (351): 698–705. doi :10.1080/01621459.1975.10482497. JSTOR  2285958.
  51. ^ Berger, James O. (1985). Teoría de la decisión estadística y análisis bayesiano . Springer Series in Statistics (2.ª ed.). Nueva York, NY: Springer-Verlag. Bibcode :1985sdtb.book.....B. doi :10.1007/978-1-4757-4286-2. ISBN 978-0-387-96098-2.
  52. ^ Rasch, Georg (1963). El proceso de Poisson como modelo para la diversidad de fenómenos conductuales (PDF) . 17.° Congreso Internacional de Psicología. Vol. 2. Washington, DC: Asociación Estadounidense de Psicología. doi :10.1037/e685262012-108.
  53. ^ Flory, Paul J. (1940). "Distribución del tamaño molecular en polímeros de óxido de etileno". Revista de la Sociedad Química Americana . 62 (6): 1561–1565. doi :10.1021/ja01863a066.
  54. ^ Lomnitz, Cinna (1994). Fundamentos de la predicción de terremotos . Nueva York, Nueva York: John Wiley & Sons. ISBN 0-471-57419-8.OCLC 647404423  .
  55. ^ Un estudiante (1907). "Sobre el error de conteo con un hematocitómetro". Biometrika . 5 (3): 351–360. doi :10.2307/2331633. JSTOR  2331633.
  56. ^ Boland, Philip J. (1984). "Una mirada biográfica a William Sealy Gosset". The American Statistician . 38 (3): 179–183. doi :10.1080/00031305.1984.10483195. JSTOR  2683648.
  57. ^ Erlang, Agner K. (1909). "Sandsynlighedsregning og Telefonsamtaler" [Cálculo de probabilidades y conversaciones telefónicas]. Nyt Tidsskrift para Matematik (en danés). 20 (B): 33–39. JSTOR  24528622.
  58. ^ Hornby, Dave (2014). "Modelo de predicción de fútbol: distribución de Poisson". Apuestas deportivas online . Consultado el 19 de septiembre de 2014 .
  59. ^ Koyama, Kento; Hokunan, Hidekazu; Hasegawa, Mayumi; Kawamura, Shuso; Koseki, Shigenobu (2016). "¿Siguen los números de células bacterianas una distribución teórica de Poisson? Comparación de números de células individuales obtenidos experimentalmente con generación de números aleatorios mediante simulación por computadora". Microbiología de alimentos . 60 : 49–53. doi :10.1016/j.fm.2016.05.019. PMID  27554145.
  60. ^ Clarke, RD (1946). "Una aplicación de la distribución de Poisson" (PDF) . Revista del Instituto de Actuarios . 72 (3): 481. doi : 10.1017/S0020268100035435 .
  61. ^ Hardy, Godfrey H. ; Littlewood, John E. (1923). "Sobre algunos problemas de "partitio numerorum" III: Sobre la expresión de un número como suma de primos". Acta Mathematica . 44 : 1–70. doi : 10.1007/BF02403921 .
  62. ^ Gallagher, Patrick X. (1976). "Sobre la distribución de primos en intervalos cortos". Mathematika . 23 (1): 4–9. doi :10.1112/s0025579300016442.
  63. ^ Cameron, A. Colin; Trivedi, Pravin K. (1998). Análisis de regresión de datos de recuento. Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-63567-7.
  64. ^ Edgeworth, FY (1913). "Sobre el uso de la teoría de probabilidades en las estadísticas relacionadas con la sociedad". Journal of the Royal Statistical Society . 76 (2): 165–193. doi :10.2307/2340091. JSTOR  2340091.
  65. ^ Katz, B.; Miledi, R. (agosto de 1972). "La naturaleza estadística del potencial de acetilcolina y sus componentes moleculares". The Journal of Physiology . 224 (3): 665–699. doi :10.1113/jphysiol.1972.sp009918. ISSN  0022-3751. PMC 1331515 . PMID  5071933. 
  66. ^ ab Nelson, Philip Charles; Bromberg, Sarina; Hermundstad, Ann; Prentice, Jason (2015). Modelos físicos de sistemas vivos. Nueva York, NY: WH Freeman & Company, una editorial de Macmillan Education. ISBN 978-1-4641-4029-7. OCLC  891121698.
  67. ^ Foster, Patricia L. (1 de enero de 2006), "Métodos para determinar las tasas de mutación espontánea", Reparación del ADN, Parte B , Métodos en enzimología, vol. 409, Academic Press, págs. 195-213, doi :10.1016/S0076-6879(05)09012-9, ISBN 978-0-12-182814-1, PMC2041832  , PMID16793403 ​
  68. ^ "Página de referencia de Wolfram Language: PoissonDistribution". wolfram.com . Consultado el 8 de abril de 2016 .
  69. ^ "Página de referencia de Wolfram Language: MultivariatePoissonDistribution". wolfram.com . Consultado el 8 de abril de 2016 .
  70. ^ Knuth, Donald Ervin (1997). Algoritmos seminuméricos . El arte de la programación informática . Vol. 2 (3.ª ed.). Addison Wesley . ISBN 978-0-201-89684-8.
  71. ^ Devroye, Luc (1986). "Distribuciones univariadas discretas" (PDF) . Generación de variables aleatorias no uniformes. Nueva York, NY: Springer-Verlag. págs. 485–553. doi :10.1007/978-1-4613-8643-8_10. ISBN 978-1-4613-8645-2.

Fuentes