Distribución binomial negativa

En teoría de la probabilidad y estadística , la distribución binomial negativa es una distribución de probabilidad discreta que modela el número de fracasos en una secuencia de ensayos de Bernoulli independientes e idénticamente distribuidos antes de que ocurra un número específico (no aleatorio) de éxitos (denotado ). ^[2] Por ejemplo, podemos definir tirar un 6 en algunos dados como un éxito, y tirar cualquier otro número como un fracaso, y preguntar cuántas tiradas fallidas ocurrirán antes de que veamos el tercer éxito ( ). En tal caso, la distribución de probabilidad del número de fallas que aparecen será una distribución binomial negativa. $r$ $r=3$

Una formulación alternativa es modelar el número total de ensayos (en lugar del número de fracasos). De hecho, para un número específico (no aleatorio) de éxitos ( r ), el número de fracasos ( n − r ) es aleatorio porque el número total de ensayos ( n ) es aleatorio. Por ejemplo, podríamos usar la distribución binomial negativa para modelar el número de días n (aleatorios) que trabaja una determinada máquina (especificada por r ) antes de averiarse.

La distribución de Pascal (después de Blaise Pascal ) y la distribución de Polya (de George Pólya ) son casos especiales de distribución binomial negativa. Una convención entre ingenieros, climatólogos y otros es utilizar "binomial negativo" o "Pascal" para el caso de un parámetro de tiempo de parada con valor entero ( ) y utilizar "Polya" para el caso con valor real. $r$

Para ocurrencias de eventos discretos asociados, como brotes de tornados, las distribuciones de Polya se pueden usar para brindar modelos más precisos que la distribución de Poisson al permitir que la media y la varianza sean diferentes, a diferencia de la distribución de Poisson. La distribución binomial negativa tiene una varianza , y la distribución se vuelve idéntica a Poisson en el límite para una media dada (es decir, cuando los fallos son cada vez más raros). Esto puede hacer que la distribución sea una alternativa sobredispersada útil a la distribución de Poisson, por ejemplo, para una modificación robusta de la regresión de Poisson . En epidemiología, se ha utilizado para modelar la transmisión de enfermedades infecciosas en las que el número probable de infecciones posteriores puede variar considerablemente de un individuo a otro y de un entorno a otro. ^[3] De manera más general, puede ser apropiado cuando los eventos tienen ocurrencias correlacionadas positivamente causando una varianza mayor que si las ocurrencias fueran independientes, debido a un término de covarianza positivo . $\mu /p$ $p\to 1$ $\mu$

El término "binomio negativo" probablemente se deba al hecho de que cierto coeficiente binomial que aparece en la fórmula de la función de masa de probabilidad de la distribución se puede escribir de manera más simple con números negativos. ^[4]

Definiciones

Imagine una secuencia de ensayos independientes de Bernoulli : cada ensayo tiene dos resultados potenciales llamados "éxito" y "fracaso". En cada ensayo la probabilidad de éxito es y la de fracaso es . Observamos esta secuencia hasta que ocurre un número predefinido de éxitos. Luego, el número aleatorio de fallas observadas, sigue la distribución binomial negativa (o Pascal ): $p$ $1-p$ $r$ $X$

X\sim \operatorname {NB} (r,p)

Función de probabilidad

La función de masa de probabilidad de la distribución binomial negativa es

f(k;r,p)\equiv \Pr(X=k)={\binom {k+r-1}{k}}(1-p)^{k}p^{r}

donde r es el número de éxitos, k es el número de fracasos y p es la probabilidad de éxito en cada prueba.

Aquí, la cantidad entre paréntesis es el coeficiente binomial y es igual a

{\binom {k+r-1}{k}}={\frac {(k+r-1)!}{(r-1)!\,(k)!}}={\frac {(k+r-1)(k+r-2)\dotsm (r)}{k!}}={\frac {\Gamma (k+r)}{k!\ \Gamma (r)}}.

Tenga en cuenta que Γ(r) es la función Gamma .

Hay k fracasos elegidos entre k + r − 1 ensayos en lugar de k + r porque el último de los k + r ensayos es, por definición, un éxito.

Alternativamente, esta cantidad se puede escribir de la siguiente manera, explicando el nombre de "binomio negativo":

{\begin{aligned}&{\frac {(k+r-1)\dotsm (r)}{k!}}\\[10pt]={}&(-1)^{k}{\frac {\overbrace {(-r)(-r-1)(-r-2)\dotsm (-r-k+1)} ^{k{\text{ factors}}}}{k!}}=(-1)^{k}{\binom {-r}{{\phantom {-}}k}}.\end{aligned}}

Tenga en cuenta que por la última expresión y la serie binomial , para cada 0 ≤ p < 1 y , $q=1-p$

p^{-r}=(1-q)^{-r}=\sum _{k=0}^{\infty }{\binom {-r}{{\phantom {-}}k}}(-q)^{k}=\sum _{k=0}^{\infty }{\binom {k+r-1}{k}}q^{k}

por lo tanto, los términos de la función de masa de probabilidad suman uno como se muestra a continuación.

\sum _{k=0}^{\infty }{\binom {k+r-1}{k}}(1-p)^{k}p^{r}=p^{-r}p^{r}=1

Para comprender la definición anterior de la función de masa de probabilidad, tenga en cuenta que la probabilidad de cada secuencia específica de r éxitos y k fracasos es p ^r (1 − p ) ^k , porque se supone que los resultados de las k + r pruebas ocurren de forma independiente . Dado que el r -ésimo éxito siempre es el último, queda elegir los k ensayos con fracasos entre los k + r − 1 ensayos restantes. El coeficiente binomial anterior, debido a su interpretación combinatoria, da precisamente el número de todas estas secuencias de longitud k + r − 1.

Función de distribución acumulativa

La función de distribución acumulativa se puede expresar en términos de la función beta incompleta regularizada : ^[2]^[5]

F(k;r,p)\equiv \Pr(X\leq k)=I_{p}(r,k+1).

(Esta fórmula utiliza la misma parametrización que en la tabla del artículo, con r el número de éxitos y con la media). $p=r/(r+\mu )$ $\mu$

También se puede expresar en términos de la función de distribución acumulativa de la distribución binomial : ^[6]

F(k;r,p)=F_{\text{binomial}}(k;n=k+r,1-p).

Formulaciones alternativas

Algunas fuentes pueden definir la distribución binomial negativa de manera ligeramente diferente a la principal aquí. Las variaciones más comunes son aquellas en las que la variable aleatoria X cuenta cosas diferentes. Estas variaciones se pueden ver en la tabla aquí:

Cada una de las cuatro definiciones de distribución binomial negativa se puede expresar de formas ligeramente diferentes pero equivalentes. La primera formulación alternativa es simplemente una forma equivalente del coeficiente binomial, es decir: . La segunda formulación alternativa simplifica un poco la expresión al reconocer que el número total de ensayos es simplemente el número de éxitos y fracasos, es decir: . Estas segundas formulaciones pueden ser más intuitivas de entender, sin embargo, quizás sean menos prácticas ya que tienen más términos. ${\textstyle {\binom {a}{b}}={\binom {a}{a-b}}\quad {\text{for }}\ 0\leq b\leq a}$ ${\textstyle n=r+k}$

La definición donde X es el número de n intentos que ocurren para un número dado de r éxitos es similar a la definición primaria, excepto que se da el número de intentos en lugar del número de fracasos. Esto suma r al valor de la variable aleatoria, desplazando su soporte y su media.
La definición donde X es el número de k éxitos (o n intentos ) que ocurren para un número determinado de r fracasos es similar a la definición principal utilizada en este artículo, excepto que los números de fracasos y éxitos se intercambian al considerar lo que se está contando. y lo que se da. Sin embargo, tenga en cuenta que p todavía se refiere a la probabilidad de "éxito".
La definición de distribución binomial negativa se puede ampliar al caso en que el parámetro r puede tomar un valor real positivo . Aunque es imposible visualizar un número no entero de "fallos", todavía podemos definir formalmente la distribución a través de su función de masa de probabilidad. El problema de extender la definición a r de valor real (positivo) se reduce a extender el coeficiente binomial a su contraparte de valor real, basado en la función gamma :

{\binom {k+r-1}{k}}={\frac {(k+r-1)(k+r-2)\dotsm (r)}{k!}}={\frac {\Gamma (k+r)}{k!\,\Gamma (r)}}

Después de sustituir esta expresión en la definición original, decimos que X tiene una distribución binomial negativa (o Pólya ) si tiene una función de masa de probabilidad :

f(k;r,p)\equiv \Pr(X=k)={\frac {\Gamma (k+r)}{k!\,\Gamma (r)}}(1-p)^{k}p^{r}\quad {\text{for }}k=0,1,2,\dotsc

Aquí r es un número real positivo.

En la regresión binomial negativa, ^[15] la distribución se especifica en términos de su media, que luego se relaciona con variables explicativas como en la regresión lineal u otros modelos lineales generalizados . De la expresión de la media m , se puede derivar y . Luego, sustituyendo estas expresiones en la de la función de masa de probabilidad cuando r tiene un valor real, se obtiene esta parametrización de la función de masa de probabilidad en términos de m : ${\textstyle m={\frac {r(1-p)}{p}}}$ ${\textstyle p={\frac {r}{m+r}}}$ ${\textstyle 1-p={\frac {m}{m+r}}}$

\Pr(X=k)={\frac {\Gamma (r+k)}{k!\,\Gamma (r)}}\left({\frac {r}{r+m}}\right)^{r}\left({\frac {m}{r+m}}\right)^{k}\quad {\text{for }}k=0,1,2,\dotsc

Entonces la varianza se puede escribir como . Algunos autores prefieren establecer y expresar la varianza como . En este contexto, y dependiendo del autor, al parámetro r o a su recíproco α se le denomina "parámetro de dispersión", "parámetro de forma" o "coeficiente de agrupamiento", ^[16] o "heterogeneidad" ^[15] o parámetro "agregación". ^[10] El término "agregación" se utiliza particularmente en ecología cuando se describe el recuento de organismos individuales. La disminución del parámetro de agregación r hacia cero corresponde a una agregación creciente de los organismos; El aumento de r hacia el infinito corresponde a la ausencia de agregación, como se puede describir mediante la regresión de Poisson . ${\textstyle m+{\frac {m^{2}}{r}}}$ ${\textstyle \alpha ={\frac {1}{r}}}$ ${\textstyle m+\alpha m^{2}}$

Parametrizaciones alternativas

A veces, la distribución se parametriza en términos de su media μ y su varianza σ ² :

{\begin{aligned}&p={\frac {\mu }{\sigma ^{2}}},\\[6pt]&r={\frac {\mu ^{2}}{\sigma ^{2}-\mu }},\\[3pt]&\Pr(X=k)={k+{\frac {\mu ^{2}}{\sigma ^{2}-\mu }}-1 \choose k}\left(1-{\frac {\mu }{\sigma ^{2}}}\right)^{k}\left({\frac {\mu }{\sigma ^{2}}}\right)^{\mu ^{2}/(\sigma ^{2}-\mu )}\\&\operatorname {E} (X)=\mu \\&\operatorname {Var} (X)=\sigma ^{2}.\end{aligned}}

Otra parametrización popular utiliza r y las probabilidades de fallo β :

{\begin{aligned}&p={\frac {1}{1+\beta }}\\&\Pr(X=k)={k+r-1 \choose k}\left({\frac {\beta }{1+\beta }}\right)^{k}\left({\frac {1}{1+\beta }}\right)^{r}\\&\operatorname {E} (X)=r\beta \\&\operatorname {Var} (X)=r\beta (1+\beta ).\end{aligned}}

Ejemplos

Duración de la estancia hospitalaria

La duración de la estancia hospitalaria es un ejemplo de datos del mundo real que se pueden modelar bien con una distribución binomial negativa mediante una regresión binomial negativa . ^[17]^[18]

vendiendo dulces

Pat Collis debe vender barras de chocolate para recaudar dinero para la excursión de sexto grado. Se supone que Pat (con cierta dureza) no debe regresar a casa hasta que se hayan vendido cinco barras de chocolate. Entonces el niño va de puerta en puerta vendiendo barras de chocolate. En cada casa, hay una probabilidad de 0,6 de vender una barra de chocolate y una probabilidad de 0,4 de no vender nada.

¿Cuál es la probabilidad de vender la última barra de chocolate en la enésima casa ?

Vender dulces con éxito suficientes veces es lo que define nuestro criterio de parada (a diferencia de no venderlos), por lo que k en este caso representa el número de fracasos y r representa el número de éxitos. Recuerde que la distribución NegBin( r , p ) describe la probabilidad de k fracasos y r éxitos en k + r ensayos de Bernoulli( p ) con éxito en el último ensayo. Vender cinco chocolatinas significa conseguir cinco éxitos. El número de pruebas (es decir, casas) que esto requiere es, por lo tanto, k + 5 = n . La variable aleatoria que nos interesa es el número de casas, por lo que sustituimos k = n − 5 en una función de masa NegBin(5, 0.4) y obtenemos la siguiente función de masa de la distribución de casas (para n ≥ 5):

f(n)={(n-5)+5-1 \choose n-5}\;(1-0.4)^{5}\;0.4^{n-5}={n-1 \choose n-5}\;3^{5}\;{\frac {2^{n-5}}{5^{n}}}.

¿Cuál es la probabilidad de que Pat termine en la décima casa?

f(10)=0.1003290624.\,

¿Cuál es la probabilidad de que Pat termine en la octava casa o antes?

Para terminar en la octava casa o antes, Pat debe terminar en la quinta, sexta, séptima u octava casa. Sume esas probabilidades:

f(5)=0.07776\,

f(6)=0.15552\,

f(7)=0.18662\,

f(8)=0.17418\,

\sum _{j=5}^{8}f(j)=0.59408.

¿Cuál es la probabilidad de que Pat agote las 30 casas que se encuentran en el vecindario?

Esto se puede expresar como la probabilidad de que Pat no termine entre las casas quinta y trigésima:

1-\sum _{j=5}^{30}f(j)=1-I_{0.4}(5,30-5+1)\approx 1-0.99999342=0.00000658.

Debido a la probabilidad bastante alta de que Pat venda cada casa (60 por ciento), la probabilidad de que NO cumpla su misión es extremadamente pequeña.

Propiedades

Expectativa

El número total esperado de pruebas necesarias para lograr r éxitos es . Por tanto, el número esperado de fracasos sería este valor, menos los éxitos: ${\frac {r}{p}}$

E[\operatorname {NB} (r,p)]={\frac {r}{p}}-r={\frac {r(1-p)}{p}}

Expectativa de éxitos

El número total esperado de fallas en una distribución binomial negativa con parámetros $(r, p)$ es r (1 − p )/ p . Para ver esto, imagine que se realiza muchas veces un experimento que simula el binomio negativo. Es decir, se realiza un conjunto de ensayos hasta obtener $r$ éxitos, luego otro conjunto de ensayos, y luego otro etc. Anota el número de ensayos realizados en cada experimento: $a, b, c, ...$ y establece $a + b + c + ... = norte$ . Ahora esperaríamos aproximadamente $Np$ éxitos en total. Digamos que el experimento se realizó $n$ veces. Entonces hay $nr$ éxitos en total. Entonces esperaríamos $nr = Np$ , entonces $N / n = r / p$ . Observe que $N / n$ es solo el número promedio de ensayos por experimento. Eso es lo que queremos decir con "expectativa". El número promedio de fracasos por experimento es $N / n - r = r / p - r = r (1 - p)/ p$ . Esto concuerda con la media dada en el cuadro del lado derecho de esta página.

Se puede realizar una derivación rigurosa representando la distribución binomial negativa como la suma de los tiempos de espera. Sea con la convención representa el número de fracasos observados antes de los éxitos siendo la probabilidad de éxito . Y dejemos que represente el número de fracasos antes de ver un éxito. Podemos considerarlo como el tiempo de espera (número de fracasos) entre el enésimo y el enésimo éxito. De este modo $X_{r}\sim \operatorname {NB} (r,p)$ $X$ $r$ $p$ $Y_{i}\sim Geom(p)$ $Y_{i}$ $Y_{i}$ $i$ $(i-1)$

X_{r}=Y_{1}+Y_{2}+\cdots +Y_{r}.

La media es

E[X_{r}]=E[Y_{1}]+E[Y_{2}]+\cdots +E[Y_{r}]={\frac {r(1-p)}{p}},

que se desprende del hecho . $E[Y_{i}]=(1-p)/p$

Diferencia

Al contar el número de fracasos antes del r -ésimo éxito, la varianza es r (1 − p )/ p ² . Al contar el número de éxitos antes del r -ésimo fracaso, como en la formulación alternativa (3) anterior, la varianza es rp /(1 − p ) ² .

Relación con el teorema del binomio

Supongamos que Y es una variable aleatoria con distribución binomial con parámetros n y p . Supongamos p + q = 1, con p , q ≥ 0, entonces

1=1^{n}=(p+q)^{n}.

Usando el teorema del binomio de Newton , esto también se puede escribir como:

(p+q)^{n}=\sum _{k=0}^{\infty }{n \choose k}p^{k}q^{n-k},

en el que el límite superior de sumatoria es infinito. En este caso, el coeficiente binomial

{n \choose k}={n(n-1)(n-2)\cdots (n-k+1) \over k!}.

se define cuando n es un número real, en lugar de simplemente un entero positivo. Pero en nuestro caso de distribución binomial es cero cuando k > n . Entonces podemos decir, por ejemplo

(p+q)^{8.3}=\sum _{k=0}^{\infty }{8.3 \choose k}p^{k}q^{8.3-k}.

Ahora supongamos r > 0 y usamos un exponente negativo:

1=p^{r}\cdot p^{-r}=p^{r}(1-q)^{-r}=p^{r}\sum _{k=0}^{\infty }{-r \choose k}(-q)^{k}.

Entonces todos los términos son positivos y el término

p^{r}{-r \choose k}(-q)^{k}

es solo la probabilidad de que el número de fracasos antes del r- ésimo éxito sea igual a k , siempre que r sea un número entero. (Si r es un número no entero negativo, de modo que el exponente es un número no entero positivo, entonces algunos de los términos de la suma anterior son negativos, por lo que no tenemos una distribución de probabilidad en el conjunto de todos los números enteros no negativos).

Ahora también permitimos valores no enteros de r . Entonces tenemos una distribución binomial negativa propia, que es una generalización de la distribución de Pascal, que coincide con la distribución de Pascal cuando r resulta ser un número entero positivo.

Recuerda desde arriba que

La suma de variables aleatorias independientes distribuidas binomialmente negativamente r ₁ y r ₂ con el mismo valor para el parámetro p está distribuida binomialmente negativa con el mismo p pero con valor r r ₁ + r ₂ .

Esta propiedad persiste cuando la definición se generaliza así y proporciona una manera rápida de ver que la distribución binomial negativa es infinitamente divisible .

Relaciones de recurrencia

Se mantienen las siguientes relaciones de recurrencia :

Para la función de masa de probabilidad

{\begin{cases}(k+1)\Pr(X=k+1)-p\Pr(X=k)(k+r)=0,\\[5pt]\Pr(X=0)=(1-p)^{r}.\end{cases}}

por los momentos $m_{k}=\mathbb {E} (X^{k}),$

m_{k+1}=rPm_{k}+(P^{2}+P){dm_{k} \over dP},\quad P:=(1-p)/p,\quad m_{0}=1.

Para los cumulantes

\kappa _{k+1}=(Q-1)Q{d\kappa _{k} \over dQ},\quad Q:=1/p,\quad \kappa _{1}=r(Q-1).

Distribuciones relacionadas

La distribución geométrica (en { 0, 1, 2, 3, ... }) es un caso especial de la distribución binomial negativa, con

\operatorname {Geom} (p)=\operatorname {NB} (1,\,p).\,

La distribución binomial negativa es un caso especial de la distribución discreta de tipo fase .
La distribución binomial negativa es un caso especial de distribución de Poisson compuesta discreta .

distribución de veneno

Considere una secuencia de variables aleatorias binomiales negativas donde el parámetro de parada r llega al infinito, mientras que la probabilidad p de éxito en cada ensayo llega a uno, de tal manera que se mantenga la media de la distribución (es decir, el número esperado de fracasos). constante. Denotando esta media como λ , el parámetro p será p = r /( r + λ )

{\begin{aligned}{\text{Mean:}}\quad &\lambda ={\frac {(1-p)r}{p}}\quad \Rightarrow \quad p={\frac {r}{r+\lambda }},\\{\text{Variance:}}\quad &\lambda \left(1+{\frac {\lambda }{r}}\right)>\lambda ,\quad {\text{thus always overdispersed}}.\end{aligned}}

Bajo esta parametrización la función de masa de probabilidad será

f(k;r,p)={\frac {\Gamma (k+r)}{k!\cdot \Gamma (r)}}(1-p)^{k}p^{r}={\frac {\lambda ^{k}}{k!}}\cdot {\frac {\Gamma (r+k)}{\Gamma (r)\;(r+\lambda )^{k}}}\cdot {\frac {1}{\left(1+{\frac {\lambda }{r}}\right)^{r}}}

Ahora si consideramos el límite como r → ∞, el segundo factor convergerá a uno, y el tercero a la función exponente:

\lim _{r\to \infty }f(k;r,p)={\frac {\lambda ^{k}}{k!}}\cdot 1\cdot {\frac {1}{e^{\lambda }}},

que es la función de masa de una variable aleatoria distribuida por Poisson con valor esperado λ .

En otras palabras, la distribución binomial negativa parametrizada alternativamente converge a la distribución de Poisson y r controla la desviación de la Poisson. Esto hace que la distribución binomial negativa sea adecuada como una alternativa sólida a la Poisson, que se aproxima a la Poisson para r grande , pero que tiene una varianza mayor que la Poisson para r pequeña .

\operatorname {Poisson} (\lambda )=\lim _{r\to \infty }\operatorname {NB} \left(r,{\frac {r}{r+\lambda }}\right).

Mezcla gamma-poisson

La distribución binomial negativa también surge como una mezcla continua de distribuciones de Poisson (es decir, una distribución de probabilidad compuesta ) donde la distribución mixta de la tasa de Poisson es una distribución gamma . Es decir, podemos ver el binomio negativo como una distribución de Poisson ( λ ) , donde λ es en sí misma una variable aleatoria, distribuida como una distribución gamma con forma r y escala θ = (1 − p )/ p o, correspondientemente, tasa β = p. /(1 − p ) .

Para mostrar la intuición detrás de esta afirmación, considere dos procesos de Poisson independientes, "Éxito" y "Fracaso", con intensidades p y 1 − p . Juntos, los procesos de éxito y fracaso son equivalentes a un único proceso de Poisson de intensidad 1, donde una ocurrencia del proceso es un éxito si al lanzar una moneda independiente correspondiente sale cara con probabilidad p ; de lo contrario, es un fracaso. Si r es un número de conteo, los lanzamientos de moneda muestran que el conteo de éxitos antes del r -ésimo fracaso sigue una distribución binomial negativa con parámetros r y p . Sin embargo, el recuento también es el recuento del proceso de Poisson de éxito en el momento aleatorio T de la r a ocurrencia en el proceso de Poisson de fracaso. El recuento de éxito sigue una distribución de Poisson con pT media , donde T es el tiempo de espera para r ocurrencias en un proceso de Poisson de intensidad 1 − p , es decir, T tiene distribución gamma con parámetro de forma r e intensidad 1 − p . Por lo tanto, la distribución binomial negativa es equivalente a una distribución de Poisson con pT media , donde la variable aleatoria T tiene distribución gamma con parámetro de forma r e intensidad (1 − p ) . El párrafo anterior sigue, porque λ = pT tiene distribución gamma con parámetro de forma r e intensidad (1 − p )/ p .

La siguiente derivación formal (que no depende de que r sea un número de conteo) confirma la intuición.

{\begin{aligned}&\int _{0}^{\infty }f_{\operatorname {Poisson} (\lambda )}(k)\times f_{\operatorname {Gamma} \left(r,\,{\frac {p}{1-p}}\right)}(\lambda )\,\mathrm {d} \lambda \\[8pt]={}&\int _{0}^{\infty }{\frac {\lambda ^{k}}{k!}}e^{-\lambda }\times {\frac {1}{\Gamma (r)}}\left({\frac {p}{1-p}}\lambda \right)^{r-1}e^{-{\frac {p}{1-p}}\lambda }\,\left({\frac {p}{1-p}}\,\right)\mathrm {d} \lambda \\[8pt]={}&\left({\frac {p}{1-p}}\right)^{r}{\frac {1}{k!\,\Gamma (r)}}\int _{0}^{\infty }\lambda ^{r+k-1}e^{-\lambda {\frac {p+1-p}{1-p}}}\;\mathrm {d} \lambda \\[8pt]={}&\left({\frac {p}{1-p}}\right)^{r}{\frac {1}{k!\,\Gamma (r)}}\Gamma (r+k)(1-p)^{k+r}\int _{0}^{\infty }f_{\operatorname {Gamma} \left(k+r,{\frac {1}{1-p}}\right)}(\lambda )\;\mathrm {d} \lambda \\[8pt]={}&{\frac {\Gamma (r+k)}{k!\;\Gamma (r)}}\;(1-p)^{k}\,p^{r}\\[8pt]={}&f(k;r,p).\end{aligned}}

Debido a esto, la distribución binomial negativa también se conoce como distribución gamma-Poisson (mezcla) . La distribución binomial negativa se derivó originalmente como un caso límite de la distribución gamma-Poisson. ^[19]

Distribución de una suma de variables aleatorias distribuidas geométricamente.

Si Y _r es una variable aleatoria que sigue la distribución binomial negativa con parámetros r y p , y admite {0, 1, 2, ...}, entonces Y _r es una suma de r variables independientes que siguen la distribución geométrica (en {0 , 1, 2, ...}) con parámetro p . Como resultado del teorema del límite central , Yr ₍ adecuadamente escalado y desplazado) es aproximadamente normal para r suficientemente grande .

Además, si B _{s + r} es una variable aleatoria que sigue la distribución binomial con parámetros s + r y p , entonces

{\begin{aligned}\Pr(Y_{r}\leq s)&{}=1-I_{p}(s+1,r)\\[5pt]&{}=1-I_{p}((s+r)-(r-1),(r-1)+1)\\[5pt]&{}=1-\Pr(B_{s+r}\leq r-1)\\[5pt]&{}=\Pr(B_{s+r}\geq r)\\[5pt]&{}=\Pr({\text{after }}s+r{\text{ trials, there are at least }}r{\text{ successes}}).\end{aligned}}

En este sentido, la distribución binomial negativa es la "inversa" de la distribución binomial.

La distribución binomial negativa es infinitamente divisible , es decir, si Y tiene una distribución binomial negativa, entonces para cualquier entero positivo n , existen variables aleatorias independientes distribuidas idénticamente Y ₁ , ..., Y _n cuya suma tiene la misma distribución que Y .

Representación como distribución de Poisson compuesta.

La distribución binomial negativa NB( r , p ) se puede representar como una distribución de Poisson compuesta : denotemos una secuencia de variables aleatorias independientes e idénticamente distribuidas , cada una con la distribución en serie logarítmica Log( p ), con función de masa de probabilidad. ${\textstyle (Y_{n})_{n\,\in \,\mathbb {N} }}$

f(k;r,p)={\frac {-p^{k}}{k\ln(1-p)}},\qquad k\in {\mathbb {N} }.

Sea N una variable aleatoria, independiente de la secuencia, y supongamos que N tiene una distribución de Poisson con media λ = − r ln(1 − p ) . Entonces la suma aleatoria

X=\sum _{n=1}^{N}Y_{n}

está distribuido NB ( r , p ). Para probar esto, calculamos la función generadora de probabilidad G _X de X , que es la composición de las funciones generadoras de probabilidad G _N y G _{Y ₁} . Usando

G_{N}(z)=\exp(\lambda (z-1)),\qquad z\in \mathbb {R} ,

G_{Y_{1}}(z)={\frac {\ln(1-pz)}{\ln(1-p)}},\qquad |z|<{\frac {1}{p}},

obtenemos

{\begin{aligned}G_{X}(z)&=G_{N}(G_{Y_{1}}(z))\\[4pt]&=\exp {\biggl (}\lambda {\biggl (}{\frac {\ln(1-pz)}{\ln(1-p)}}-1{\biggr )}{\biggr )}\\[4pt]&=\exp {\bigl (}-r(\ln(1-pz)-\ln(1-p)){\bigr )}\\[4pt]&={\biggl (}{\frac {1-p}{1-pz}}{\biggr )}^{r},\qquad |z|<{\frac {1}{p}},\end{aligned}}

que es la función generadora de probabilidad de la distribución NB( r , p ).

La siguiente tabla describe cuatro distribuciones relacionadas con el número de éxitos en una secuencia de sorteos:

(a,b,0) clase de distribuciones

El binomio negativo, junto con las distribuciones de Poisson y binomial, es miembro de la clase de distribuciones ( a , b ,0) . Estas tres distribuciones son casos especiales de la distribución Panjer. También son miembros de una familia exponencial natural .

Inferencia estadística

Estimación de parámetros

MVUE parapag

Supongamos que se desconoce p y se realiza un experimento en el que se decide de antemano que el muestreo continuará hasta que se encuentren r éxitos. Una estadística suficiente para el experimento es k , el número de fracasos.

Al estimar p , el estimador insesgado de varianza mínima es

{\widehat {p}}={\frac {r-1}{r+k-1}}.

Estimación de máxima verosimilitud

Cuando se conoce r , la estimación de máxima verosimilitud de p es

{\widetilde {p}}={\frac {r}{r+k}},

pero ésta es una estimación sesgada . Sin embargo, su inversa ( r + k )/ r es una estimación insesgada de 1/ p . ^[20]

Cuando se desconoce r , el estimador de máxima verosimilitud para p y r juntos solo existe para muestras cuya varianza muestral es mayor que la media muestral. ^[21] La función de verosimilitud para N observaciones iid ( k ₁ , ..., k _N ) es

L(r,p)=\prod _{i=1}^{N}f(k_{i};r,p)\,\!

a partir del cual calculamos la función log-verosimilitud

\ell (r,p)=\sum _{i=1}^{N}\ln(\Gamma (k_{i}+r))-\sum _{i=1}^{N}\ln(k_{i}!)-N\ln(\Gamma (r))+\sum _{i=1}^{N}k_{i}\ln(1-p)+Nr\ln(p).

Para encontrar el máximo tomamos las derivadas parciales con respecto a r y p y las igualamos a cero:

{\frac {\partial \ell (r,p)}{\partial p}}=-\left[\sum _{i=1}^{N}k_{i}{\frac {1}{1-p}}\right]+Nr{\frac {1}{p}}=0

{\frac {\partial \ell (r,p)}{\partial r}}=\left[\sum _{i=1}^{N}\psi (k_{i}+r)\right]-N\psi (r)+N\ln(p)=0

dónde

\psi (k)={\frac {\Gamma '(k)}{\Gamma (k)}}\!

es la función digamma .

Resolver la primera ecuación para p da:

p={\frac {Nr}{Nr+\sum _{i=1}^{N}k_{i}}}

Sustituyendo esto en la segunda ecuación se obtiene:

{\frac {\partial \ell (r,p)}{\partial r}}=\left[\sum _{i=1}^{N}\psi (k_{i}+r)\right]-N\psi (r)+N\ln \left({\frac {r}{r+\sum _{i=1}^{N}k_{i}/N}}\right)=0

Esta ecuación no se puede resolver para r en forma cerrada . Si se desea una solución numérica, se puede utilizar una técnica iterativa como el método de Newton . Alternativamente, se puede utilizar el algoritmo de maximización de expectativas . ^[21]

Ocurrencia y aplicaciones

Tiempo de espera en un proceso de Bernoulli

Para el caso especial donde r es un número entero, la distribución binomial negativa se conoce como distribución de Pascal . Es la distribución de probabilidad de un cierto número de fracasos y éxitos en una serie de ensayos de Bernoulli independientes e idénticamente distribuidos . Para k + r ensayos de Bernoulli con probabilidad de éxito p , el binomio negativo da la probabilidad de k éxitos y r fracasos, con un fracaso en el último ensayo. En otras palabras, la distribución binomial negativa es la distribución de probabilidad del número de éxitos antes del r -ésimo fracaso en un proceso de Bernoulli , con probabilidad p de éxitos en cada ensayo. Un proceso de Bernoulli es un proceso de tiempo discreto , por lo que el número de pruebas, fracasos y éxitos son números enteros.

Considere el siguiente ejemplo. Supongamos que lanzamos un dado repetidamente y consideramos que un 1 es un fracaso. La probabilidad de éxito en cada prueba es 5/6. El número de éxitos antes del tercer fracaso pertenece al conjunto infinito {0, 1, 2, 3,...}. Ese número de éxitos es una variable aleatoria distribuida binomialmente negativa.

Cuando r = 1 obtenemos la distribución de probabilidad del número de éxitos antes del primer fracaso (es decir, la probabilidad de que ocurra el primer fracaso en el ( k + 1)er intento), que es una distribución geométrica :

f(k;r,p)=(1-p)\cdot p^{k}\!

Hallazgos recientes sugieren que el tiempo de espera en un proceso de Bernoulli está fuertemente relacionado con los fractales y la función de Dirichlet. Las distribuciones de probabilidad con propiedades fractales relacionadas con la función de Dirichlet pueden derivarse de procesos recurrentes generados por distribuciones discretas uniformes. Estas distribuciones discretas uniformes pueden ser dígitos pi, lanzamientos de dados o giros de casino en vivo. Considere el siguiente tiempo de espera en un proceso de Bernoulli: Una variable aleatoria Ci _se muestrea repetidamente N veces a partir de una distribución uniforme discreta, donde i oscila entre 1 y N. Por ejemplo, considere valores enteros que oscilan entre 1 y 10. Momentos de ocurrencia, T _k , significa cuando los eventos C _i se repiten, definidos como C _i = C _i-1 o C _i = C _i-2 , donde k varía de 1 a M, siendo M menor que N. Posteriormente, defina S _j como el Intervalo entre _Tk sucesivos , que representa el tiempo de espera para que ocurra un evento. Finalmente, introduzca Z _l como ln(S _j ) – ln(S _j-1 ), donde l varía de 1 a U-1. La variable aleatoria Z muestra propiedades fractales, asemejándose a la distribución de formas similar a la función de Thomae o Dirichlet. ^[22]

Poisson sobredispersado

La distribución binomial negativa, especialmente en su parametrización alternativa descrita anteriormente, se puede utilizar como alternativa a la distribución de Poisson. Es especialmente útil para datos discretos en un rango positivo ilimitado cuya varianza muestral excede la media muestral . En tales casos, las observaciones están sobredispersadas con respecto a una distribución de Poisson, para la cual la media es igual a la varianza. Por tanto, una distribución de Poisson no es un modelo apropiado. Dado que la distribución binomial negativa tiene un parámetro más que la de Poisson, el segundo parámetro se puede utilizar para ajustar la varianza independientemente de la media. Ver Acumulantes de algunas distribuciones de probabilidad discretas .

Una aplicación de esto es a los conteos anuales de ciclones tropicales en el Atlántico norte o a los conteos mensuales a semestrales de ciclones extratropicales invernales en Europa, para los cuales la variación es mayor que la media. ^[23]^[24]^[25] En el caso de una sobredispersión modesta, esto puede producir resultados sustancialmente similares a una distribución de Poisson sobredispersada. ^[26]^[27]

El modelado binomial negativo se emplea ampliamente en la investigación de ecología y biodiversidad para analizar datos de recuento donde la sobredispersión es muy común. Esto se debe a que la sobredispersión es indicativa de agregación biológica, como especies o comunidades que forman grupos. Ignorar la dispersión excesiva puede conducir a parámetros del modelo significativamente inflados, lo que resulta en inferencias estadísticas engañosas. La distribución binomial negativa aborda eficazmente los recuentos sobredispersados al permitir que la varianza varíe cuadráticamente con la media. Un parámetro de dispersión adicional gobierna la pendiente del término cuadrático, determinando la gravedad de la sobredispersión. La relación cuadrática media-varianza del modelo demuestra ser un enfoque realista para manejar la sobredispersión, como lo respalda la evidencia empírica de muchos estudios. En general, el modelo NB ofrece dos características atractivas: (1) la interpretación conveniente del parámetro de dispersión como un índice de agrupamiento o agregación, y (2) su forma manejable, que presenta una expresión cerrada para la función de masa de probabilidad. ^[28]

En genética, la distribución binomial negativa se utiliza comúnmente para modelar datos en forma de recuentos de lecturas de secuencias discretas de experimentos de secuenciación de ADN y ARN de alto rendimiento. ^[29]^[30]^[31]^[32]

En epidemiología de enfermedades infecciosas, el binomio negativo se ha utilizado como una mejor opción que la distribución de Poisson para modelar recuentos sobredispersados de infecciones secundarias de un caso infectado (eventos de superpropagación). ^[33]

Observaciones de multiplicidad (física)

La distribución binomial negativa ha sido el modelo estadístico más efectivo para una amplia gama de observaciones de multiplicidad en experimentos de colisión de partículas , por ejemplo, ^[34]^[35]^[36]^[37]^[38] (ver ^[39] para una descripción general), y se argumenta que es una propiedad de la materia que no varía en escala , ^[40]^[41] y proporciona el mejor ajuste para las observaciones astronómicas, donde predice el número de galaxias en una región del espacio. ^[42]^[43]^[44]^[45] La justificación fenomenológica de la eficacia de la distribución binomial negativa en estos contextos permaneció desconocida durante cincuenta años, desde su primera observación en 1973. ^[46] En 2023, una prueba de los primeros principios Fue finalmente demostrado por Scott V. Tezlaf, donde se demostró que la distribución binomial negativa surge de simetrías en las ecuaciones dinámicas de un conjunto canónico de partículas en el espacio de Minkowski . ^[47] Aproximadamente, dado un número esperado de ensayos y un número esperado de éxitos , donde $p{\bar {p}},\ hh,\ hA,\ AA,\ e^{+}e^{-}$ $\langle n\rangle$ $\langle r\rangle$

\langle {\mathcal {n}}\rangle -\langle r\rangle =k,\quad \quad \langle p\rangle ={\frac {\langle r\rangle }{\langle {\mathcal {n}}\rangle }}\quad \quad \quad \implies \quad \quad \quad \langle {\mathcal {n}}\rangle ={\frac {k}{1-\langle p\rangle }},\quad \quad \langle {r}\rangle ={\frac {k\langle p\rangle }{1-\langle p\rangle }},

Se puede identificar un conjunto isomórfico de ecuaciones con los parámetros de una densidad de corriente relativista de un conjunto canónico de partículas masivas, a través de

c^{2}\langle \rho ^{2}\rangle -\langle j^{2}\rangle =c^{2}\rho _{0}^{2},\quad \quad \quad \langle \beta _{v}^{2}\rangle ={\frac {\langle j^{2}\rangle }{c^{2}\langle \rho ^{2}\rangle }}\quad \quad \implies \quad \quad c^{2}\langle \rho ^{2}\rangle ={\frac {c^{2}\rho _{0}^{2}}{1-\langle \beta _{v}^{2}\rangle }},\quad \quad \quad \langle j^{2}\rangle ={\frac {c^{2}\rho _{0}^{2}\langle \beta _{v}^{2}\rangle }{1-\langle \beta _{v}^{2}\rangle }},

donde es la densidad en reposo , es la densidad cuadrática media relativista, es la densidad cuadrática media relativista de corriente, y , donde es la velocidad cuadrática media del conjunto de partículas y es la velocidad de la luz , de modo que se puede establecer el siguiente mapa biyectivo : $\rho _{0}$ $\langle \rho ^{2}\rangle$ $\langle j^{2}\rangle$ $\langle \beta _{v}^{2}\rangle =\langle v^{2}\rangle /c^{2}$ $\langle v^{2}\rangle$ $c$

c^{2}\rho _{0}^{2}\mapsto k,\quad \quad \langle \beta _{v}^{2}\rangle \mapsto \langle p\rangle ,\quad \quad c^{2}\langle \rho ^{2}\rangle \mapsto \langle {\mathcal {n}}\rangle ,\quad \quad \langle j^{2}\rangle \mapsto \langle r\rangle .

También se ha demostrado una prueba alternativa rigurosa de la correspondencia anterior mediante la mecánica cuántica mediante la integral de trayectoria de Feynman . ^[47]

Historia

Esta distribución fue estudiada por primera vez en 1713 por Pierre Remond de Montmort en su Ensayo de análisis sobre los juegos de azar , como la distribución del número de ensayos necesarios en un experimento para obtener un número determinado de éxitos. ^[48] Ya había sido mencionado previamente por Pascal . ^[49]

Ver también

Referencias

^ DeGroot, Morris H. (1986). Probabilidad y Estadística (Segunda ed.). Addison-Wesley. págs. 258-259. ISBN 0-201-11366-X. LCCN 84006269. OCLC 10605205.
^ abc Weisstein, Eric. "Distribución binomial negativa". Wolfram MathWorld . Investigación Wolfram . Consultado el 11 de octubre de 2020 .
^ por ejemplo, Lloyd-Smith, JO; Schreiber, SJ; Kopp, PE; Getz, WM (2005). "Superpropagación y el efecto de la variación individual en la aparición de enfermedades". Naturaleza . 438 (7066): 355–359. Código Bib :2005Natur.438..355L. doi : 10.1038/naturaleza04153 . PMC 7094981 . PMID 16292310.
El parámetro de sobredispersión generalmente se indica con la letra en epidemiología, en lugar de como aquí. $k$ $r$
^ Casella, George; Berger, Roger L. (2002). Inferencia estadística (2ª ed.). Aprendizaje Thomson. pag. 95.ISBN 0-534-24312-6.
^ abc Cook, John D. "Notas sobre la distribución binomial negativa" (PDF) .
^ Morris KW (1963), Una nota sobre el muestreo directo e inverso, Biometrika, 50, 544–545.
^ "Mathworks: distribución binomial negativa".
^ Saha, Abhishek. "Introducción a la probabilidad / Fundamentos de la probabilidad: Conferencia 14" (PDF) .
^ SAS Institute , "Distribución binomial negativa", Funciones y rutinas de CALL de SAS(R) 9.4: referencia, cuarta edición , SAS Institute, Cary, NC, 2016.
^ ab Crawley, Michael J. (2012). El libro R. Wiley. ISBN 978-1-118-44896-0.
^ ab "Teoría de conjuntos: Sección 3.2.5 - Distribución binomial negativa" (PDF) .
^ "Randomservices.org, Capítulo 10: Ensayos de Bernoulli, Sección 4: La distribución binomial negativa".
^ "Stat Trek: distribución binomial negativa".
^ Wroughton, Jacqueline. "Distinguir entre distribuciones binomiales, hipergeométricas y binomiales negativas" (PDF) .
^ ab Hilbe, Joseph M. (2011). Regresión binomial negativa (Segunda ed.). Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-19815-8.
^ Lloyd-Smith, JO (2007). "Estimación de máxima verosimilitud del parámetro de dispersión binomial negativo para datos muy dispersos, con aplicaciones a enfermedades infecciosas". Más uno . 2 (2): e180. Código Bib : 2007PLoSO...2..180L. doi : 10.1371/journal.pone.0000180 . PMC 1791715 . PMID 17299582.
^ Carter, EM, Potts, HWW (4 de abril de 2014). "Predecir la duración de la estadía a partir de un sistema de registro electrónico de pacientes: un ejemplo primario de reemplazo total de rodilla". BMC Informática Médica y Toma de Decisiones . 14 : 26. doi : 10.1186/1472-6947-14-26 . PMC 3992140 . PMID 24708853. {{cite journal}}: CS1 maint: multiple names: authors list (link)
^ Orooji, Arezoo; Nazar, Eisa; Sadeghi, Masoumeh; Moradi, Ali; Jafari, Zahra; Esmaily, Habibollah (30 de abril de 2021). "Factores asociados con la duración de la estancia hospitalaria en pacientes de edad avanzada mediante modelos de regresión de recuento". Revista Médica de la República Islámica del Irán . 35 : 5. doi : 10.47176/mjiri.35.5. PMC 8111647 . PMID 33996656.
^ Madera verde, M.; Navidad, GU (1920). "Una investigación sobre la naturaleza de las distribuciones de frecuencia representativas de múltiples acontecimientos con especial referencia a múltiples ataques de enfermedades o accidentes repetidos". JR Stat Soc . 83 (2): 255–279. doi :10.2307/2341080. JSTOR 2341080.
^ Haldane, JBS (1945). "Sobre un método de estimación de frecuencias". Biometrika . 33 (3): 222–225. doi :10.1093/biomet/33.3.222. hdl : 10338.dmlcz/102575 . JSTOR 2332299. PMID 21006837.
^ ab Aramidis, K. (1999). "Un algoritmo EM para estimar parámetros binomiales negativos". Revista de estadística de Australia y Nueva Zelanda . 41 (2): 213–221. doi : 10.1111/1467-842X.00075 . S2CID 118758171.
^ Endrit Dheskali. Generación de un proceso fractal recurrente utilizando distribuciones uniformes discretas, 26 de febrero de 2024, PREPRINT (Versión 1) disponible en Research Square [1]
^ Villarini, G.; Vecchi, GA; Smith, JA (2010). "Modelado de la dependencia del recuento de tormentas tropicales en la cuenca del Atlántico norte de los índices climáticos". Revisión meteorológica mensual . 138 (7): 2681–2705. Código Bib : 2010MWRv..138.2681V. doi : 10.1175/2010MWR3315.1 .
^ Mailier, PJ; Stephenson, DB; Ferro, CAT; Hodges, KI (2006). "Agrupación en serie de ciclones extratropicales". Revisión meteorológica mensual . 134 (8): 2224–2240. Código Bib : 2006MWRv..134.2224M. doi : 10.1175/MWR3160.1 .
^ Vitolo, R.; Stephenson, DB; Cocinero, Ian M.; Mitchell-Wallace, K. (2009). "Agrupación en serie de intensas tormentas europeas". Meteorologische Zeitschrift . 18 (4): 411–424. Código Bib : 2009MetZe..18..411V. doi :10.1127/0941-2948/2009/0393. S2CID 67845213.
^ McCullagh, Pedro ; Nelder, John (1989). Modelos lineales generalizados (Segunda ed.). Boca Ratón: Chapman y Hall/CRC. ISBN 978-0-412-31760-6.
^ Cameron, Adrián C.; Trivedi, Pravin K. (1998). Análisis de regresión de datos de recuento . Prensa de la Universidad de Cambridge. ISBN 978-0-521-63567-7.
^ Stoklosa, J.; Blakey, RV; Hui, FKC (2022). "Una descripción general de las aplicaciones modernas del modelado binomial negativo en ecología y biodiversidad". Diversidad . 14 (5): 320. doi : 10.3390/d14050320 .
^ Robinson, médico; Smyth, GK (2007). "Pruebas estadísticas moderadas para evaluar diferencias en la abundancia de etiquetas". Bioinformática . 23 (21): 2881–2887. doi : 10.1093/bioinformática/btm453 . PMID 17881408.
^ "Análisis diferencial de datos de recuento: el" (PDF) .
^ Airoldi, EM; Cohen, WW; Fienberg, SE (junio de 2005). "Modelos bayesianos para términos frecuentes en texto". Actas de las reuniones anuales de la Sociedad de Clasificación de América del Norte y de INTERFACE . vol. 990. San Luis, MO, Estados Unidos. pag. 991.
^ Chen, Yunshun; Davis, McCarthy (25 de septiembre de 2014). "edgeR: análisis de expresión diferencial de datos de expresión génica digital" (PDF) . Consultado el 14 de octubre de 2014 .
^ Lloyd-Smith, JO; Schreiber, SJ; Kopp, PE; Getz, WM (2005). "Superpropagación y el efecto de la variación individual en la aparición de enfermedades". Naturaleza . 438 (7066): 355–359. Código Bib :2005Natur.438..355L. doi : 10.1038/naturaleza04153. PMC 7094981 . PMID 16292310.
^ Grosse-Oetringhaus, Jan Fiete; Reygers, Klaus (1 de agosto de 2010). "Multiplicidad de partículas cargadas en colisiones protón-protón". Revista de Física G: Física Nuclear y de Partículas . 37 (8): 083001. arXiv : 0912.0023 . doi :10.1088/0954-3899/37/8/083001. ISSN 0954-3899. S2CID 119233810.
^ Rybczyński, Maciej; Wilk, Grzegorz; Włodarczyk, Zbigniew (31 de mayo de 2019). "Propiedades intrigantes de las distribuciones de multiplicidad". Revisión física D. 99 (9): 094045. arXiv : 1811.07197 . Código Bib : 2019PhRvD..99i4045R. doi : 10.1103/PhysRevD.99.094045 . ISSN 2470-0010.
^ Tarnowsky, Terence J.; Páramos de Poniente, Gary D. (9 de julio de 2013). "Primer estudio de la distribución binomial negativa aplicada a momentos superiores de distribuciones de multiplicidad neta de protones y carga neta". Letras de Física B. 724 (1): 51–55. arXiv : 1210.8102 . Código Bib : 2013PhLB..724...51T. doi : 10.1016/j.physletb.2013.05.064 . ISSN 0370-2693.
^ Torre de perforación, M.; Gan, KK; Kooijman, P.; Loos, JS; Musgrave, B.; Precio, LE; Responder, J.; Schlereth, J.; Sugano, K.; Weiss, JM; Madera, DE; Baranko, G.; Blockus, D.; Brabson, B.; Brom, JM (1 de diciembre de 1986). "Estudio de la fragmentación de quarks en ${e}^{+}$${e}^{\mathrm{\ensuremath{-}}}$ aniquilación a 29 GeV: multiplicidad de partículas cargadas y distribuciones de rapidez de partículas individuales". Revisión física D. 34 (11): 3304–3320. doi : 10.1103/PhysRevD.34.3304. hdl : 1808/15222 . PMID 9957066.
^ Zborovský, I. (10 de octubre de 2018). "Distribución de multiplicidad de tres componentes, oscilación de combinantes y propiedades de clanes en colisiones de pp en el LHC". La revista física europea C. 78 (10): 816. arXiv : 1811.11230 . Código Bib : 2018EPJC...78..816Z. doi : 10.1140/epjc/s10052-018-6287-x . ISSN 1434-6052.
^ Kittel, Wolframio; De Wolf, Eddi A (2005). Dinámica suave multihardon . Científico mundial.
^ Schaeffer, R (1984). "Determinación de la función de correlación de puntos N de galaxias". Astronomía y Astrofísica . 134 (2): L15. Código Bib : 1984A y A...134L..15S.
^ Schaeffer, R (1985). "La función generadora de probabilidad para la agrupación de galaxias". Astronomía y Astrofísica . 144 (1): L1–L4. Código Bib : 1985A y A...144L...1S.
^ Pérez, Lucía A.; Malhotra, Sangeeta; Rhoads, James E.; Tilvi, Vithal (7 de enero de 2021). "Función de probabilidad nula de estudios simulados de emisores Ly α de alto corrimiento al rojo". La revista astrofísica . 906 (1): 58. arXiv : 2011.03556 . Código Bib : 2021ApJ...906...58P. doi : 10.3847/1538-4357/abc88b . ISSN 1538-4357.
^ Hurtado-Gil, Lluís; Martínez, Vicente J.; Arnalte-Mur, Pablo; Pons-Bordería, María-Jesús; Pareja-Flores, Cristóbal; Paredes, Silvestre (01-05-2017). "El mejor ajuste para la función de distribución de recuentos en células de galaxias observada". Astronomía y Astrofísica . 601 : A40. arXiv : 1703.01087 . Código Bib : 2017A&A...601A..40H. doi : 10.1051/0004-6361/201629097 . ISSN 0004-6361.
^ Elizalde, E.; Gaztanaga, E. (enero 1992). "Probabilidad de vacío en función de la forma del vacío y los modelos invariantes de escala". Avisos mensuales de la Real Sociedad Astronómica . 254 (2): 247–256. doi : 10.1093/mnras/254.2.247 . hdl : 2060/19910019799 . ISSN 0035-8711.
^ Hamida, M; Plastino, Ángel; Rocca, MC (1 de marzo de 2021). "Distribuciones de Poisson generalizadas para sistemas con interacciones de dos partículas". Notas científicas de la PIO . 2 (1): 015003. Código bibliográfico : 2021IOPSN...2a5003H. doi : 10.1088/2633-1357/abec9f . hdl : 11336/181371 . ISSN 2633-1357.
^ Giovannini, A. (junio de 1973). ""Caos térmico "y" coherencia "en distribuciones de multiplicidad a altas energías". Il Nuovo Cimento A. 15 (3): 543–551. Código Bib : 1973NCimA..15..543G. doi :10.1007/bf02734689. ISSN 0369-3546. S2CID 118805136.
^ ab Tezlaf, Scott V. (29 de septiembre de 2023). "Importancia de la distribución binomial negativa en los fenómenos de multiplicidad". Escritura física . 98 (11). arXiv : 2310.03776 . Código Bib : 2023PhyS...98k5310T. doi :10.1088/1402-4896/acfead. ISSN 0031-8949. S2CID 263300385.
^ Montmort PR de (1713) Essai d'analyse sur les jeux de hasard. 2da ed. Quillau, París
^ Pascal B (1679) Varia Opera Mathematica. D. Petri de Fermat. tolosae