Distribución beta binomial

En teoría de la probabilidad y estadística , la distribución beta-binomial es una familia de distribuciones de probabilidad discretas sobre un soporte finito de números enteros no negativos que surgen cuando la probabilidad de éxito en cada uno de un número fijo o conocido de ensayos de Bernoulli es desconocida o aleatoria. La distribución beta-binomial es la distribución binomial en la que la probabilidad de éxito en cada uno de los n ensayos no es fija sino que se extrae aleatoriamente de una distribución beta . Se utiliza con frecuencia en estadística bayesiana , métodos empíricos de Bayes y estadística clásica para capturar la sobredispersión en datos distribuidos de tipo binomial.

La beta-binomial es una versión unidimensional de la distribución multinomial de Dirichlet, ya que las distribuciones binomial y beta son versiones univariadas de las distribuciones multinomial y de Dirichlet , respectivamente. El caso especial en el que α y β son números enteros también se conoce como distribución hipergeométrica negativa .

Motivación y derivación.

Como distribución compuesta

La distribución Beta es una distribución conjugada de la distribución binomial . Este hecho conduce a una distribución compuesta analíticamente manejable en la que se puede pensar que el parámetro de la distribución binomial se extrae aleatoriamente de una distribución beta. Supongamos que estuviéramos interesados en predecir el número de cabezas en ensayos futuros. Esto está dado por $p$ $x$ $n$

{\begin{aligned}f(x\mid n,\alpha ,\beta )&=\int _{0}^{1}\mathrm {Bin} (x|n,p)\mathrm {Beta} (p\mid \alpha ,\beta )\,dp\\[6pt]&={n \choose x}{\frac {1}{\mathrm {B} (\alpha ,\beta )}}\int _{0}^{1}p^{x+\alpha -1}(1-p)^{n-x+\beta -1}\,dp\\[6pt]&={n \choose x}{\frac {\mathrm {B} (x+\alpha ,n-x+\beta )}{\mathrm {B} (\alpha ,\beta )}}.\end{aligned}}

Usando las propiedades de la función beta , esto también se puede escribir

f(x\mid n,\alpha ,\beta )={\frac {\Gamma (n+1)}{\Gamma (x+1)\Gamma (n-x+1)}}{\frac {\Gamma (x+\alpha )\Gamma (n-x+\beta )}{\Gamma (n+\alpha +\beta )}}{\frac {\Gamma (\alpha +\beta )}{\Gamma (\alpha )\Gamma (\beta )}}

Como modelo de urna

La distribución beta-binomial también se puede motivar mediante un modelo de urna para valores enteros positivos de α y β , conocido como modelo de urna de Pólya . Específicamente, imagine una urna que contiene α bolas rojas y β bolas negras, donde se realizan sorteos al azar. Si se observa una bola roja, se devuelven dos bolas rojas a la urna. Del mismo modo, si se extrae una bola negra, se devuelven dos bolas negras a la urna. Si esto se repite n veces, entonces la probabilidad de observar x bolas rojas sigue una distribución beta binomial con parámetros n , α y β .

Por el contrario, si los sorteos aleatorios se realizan con reemplazo simple (no se agregan a la urna bolas por encima de la bola observada), entonces la distribución sigue una distribución binomial y si los sorteos aleatorios se realizan sin reemplazo, la distribución sigue una distribución hipergeométrica. .

Momentos y propiedades

Los primeros tres momentos crudos son

{\begin{aligned}\mu _{1}&={\frac {n\alpha }{\alpha +\beta }}\\[8pt]\mu _{2}&={\frac {n\alpha [n(1+\alpha )+\beta ]}{(\alpha +\beta )(1+\alpha +\beta )}}\\[8pt]\mu _{3}&={\frac {n\alpha [n^{2}(1+\alpha )(2+\alpha )+3n(1+\alpha )\beta +\beta (\beta -\alpha )]}{(\alpha +\beta )(1+\alpha +\beta )(2+\alpha +\beta )}}\end{aligned}}

y la curtosis es

\beta _{2}={\frac {(\alpha +\beta )^{2}(1+\alpha +\beta )}{n\alpha \beta (\alpha +\beta +2)(\alpha +\beta +3)(\alpha +\beta +n)}}\left[(\alpha +\beta )(\alpha +\beta -1+6n)+3\alpha \beta (n-2)+6n^{2}-{\frac {3\alpha \beta n(6-n)}{\alpha +\beta }}-{\frac {18\alpha \beta n^{2}}{(\alpha +\beta )^{2}}}\right].

Observemos , sugerentemente, que la media se puede escribir como $p={\frac {\alpha }{\alpha +\beta }}\!$

\mu ={\frac {n\alpha }{\alpha +\beta }}=np\!

y la varianza como

\sigma ^{2}={\frac {n\alpha \beta (\alpha +\beta +n)}{(\alpha +\beta )^{2}(\alpha +\beta +1)}}=np(1-p){\frac {\alpha +\beta +n}{\alpha +\beta +1}}=np(1-p)[1+(n-1)\rho ]\!

dónde . El parámetro se conoce como correlación "intra clase" o "intra grupo". Es esta correlación positiva la que da lugar a la sobredispersión. Tenga en cuenta que cuando , no hay información disponible para distinguir entre la variación beta y binomial, y los dos modelos tienen varianzas iguales. $\rho ={\tfrac {1}{\alpha +\beta +1}}\!$ $\rho \;\!$ $n=1$

Momentos factoriales

El $r$ -ésimo momento factorial de una variable aleatoria Beta-binomial $X$ es

\operatorname {E} {\bigl [}(X)_{r}{\bigr ]}={\frac {n!}{(n-r)!}}{\frac {B(\alpha +r,\beta )}{B(\alpha ,\beta )}}=(n)_{r}{\frac {B(\alpha +r,\beta )}{B(\alpha ,\beta )}}

Estimaciones puntuales

Método de momentos

El método de estimación de momentos se puede obtener observando el primer y segundo momento del beta-binomial y estableciéndolos iguales a los momentos muestrales y . Encontramos $m_{1}$ $m_{2}$

{\begin{aligned}{\widehat {\alpha }}&={\frac {nm_{1}-m_{2}}{n({\frac {m_{2}}{m_{1}}}-m_{1}-1)+m_{1}}}\\[5pt]{\widehat {\beta }}&={\frac {(n-m_{1})(n-{\frac {m_{2}}{m_{1}}})}{n({\frac {m_{2}}{m_{1}}}-m_{1}-1)+m_{1}}}.\end{aligned}}

Estas estimaciones pueden ser negativas sin sentido, lo que demuestra que los datos no están dispersos o están insuficientemente dispersos en relación con la distribución binomial. En este caso, la distribución binomial y la distribución hipergeométrica son candidatas alternativas respectivamente.

Estimación de máxima verosimilitud

Si bien las estimaciones de máxima verosimilitud en forma cerrada no son prácticas, dado que la función de probabilidad consta de funciones comunes (función gamma y/o funciones Beta), se pueden encontrar fácilmente mediante optimización numérica directa. Las estimaciones de máxima verosimilitud a partir de datos empíricos se pueden calcular utilizando métodos generales para ajustar distribuciones multinomiales de Pólya, cuyos métodos se describen en (Minka 2003). El paquete R VGAM a través de la función vglm, vía máxima verosimilitud, facilita el ajuste de modelos tipo glm con respuestas distribuidas según la distribución beta-binomial. No es necesario que n sea fijo en todas las observaciones.

Ejemplo: heterogeneidad de la proporción de sexos

Los siguientes datos dan el número de hijos varones entre los primeros 12 niños de una familia de tamaño 13 en 6115 familias tomadas de registros hospitalarios en la Sajonia del siglo XIX (Sokal y Rohlf, p. 59 de Lindsey). Se ignora al decimotercer hijo para mitigar el efecto de que las familias se detengan de forma no aleatoria cuando se alcanza el género deseado.

Los primeros dos momentos de muestra son

{\begin{aligned}m_{1}&=6.23\\m_{2}&=42.31\\n&=12\end{aligned}}

y por lo tanto el método de estimaciones de momentos son

{\begin{aligned}{\widehat {\alpha }}&=34.1350\\{\widehat {\beta }}&=31.6085.\end{aligned}}

Las estimaciones de máxima verosimilitud se pueden encontrar numéricamente.

{\begin{aligned}{\widehat {\alpha }}_{\mathrm {mle} }&=34.09558\\{\widehat {\beta }}_{\mathrm {mle} }&=31.5715\end{aligned}}

y la probabilidad logarítmica maximizada es

\log {\mathcal {L}}=-12492.9

de donde encontramos el AIC

{\mathit {AIC}}=24989.74.

El AIC para el modelo binomial competidor es AIC = 25070,34 y, por lo tanto, vemos que el modelo beta-binomial proporciona un ajuste superior a los datos, es decir, hay evidencia de sobredispersión. Trivers y Willard postulan una justificación teórica para la heterogeneidad en la propensión al género entre las crías de mamíferos .

El ajuste superior es evidente especialmente entre las colas.

Papel en las estadísticas bayesianas

La distribución beta-binomial juega un papel destacado en la estimación bayesiana de la probabilidad de éxito de Bernoulli que deseamos estimar en función de los datos. Sea una muestra de variables aleatorias de Bernoulli independientes e idénticamente distribuidas . Supongamos que nuestro conocimiento de , al estilo bayesiano, es incierto y está modelado por la distribución previa . Si entonces, a través de la capitalización , la distribución predictiva previa de $p$ $\mathbf {X} =\{X_{1},X_{2},\cdots X_{n_{1}}\}$ $X_{i}\sim {\text{Bernoulli}}(p)$ $p$ $p\sim {\text{Beta}}(\alpha ,\beta )$ $Y_{1}=\sum _{i=1}^{n_{1}}X_{i}$

Y_{1}\sim {\text{BetaBin}}(n_{1},\alpha ,\beta )

Después de observar observamos que la distribución posterior para $Y_{1}$ $p$

{\begin{aligned}f(p|\mathbf {X} ,\alpha ,\beta )&\propto \left(\prod _{i=1}^{n_{1}}p^{x_{i}}(1-p)^{1-x_{i}}\right)p^{\alpha -1}(1-p)^{\beta -1}\\&=Cp^{\sum x_{i}+\alpha -1}(1-p)^{n_{1}-\sum x_{i}+\beta -1}\\&=Cp^{y_{1}+\alpha -1}(1-p)^{n_{1}-y_{1}+\beta -1}\end{aligned}}

donde es una constante de normalización. Reconocemos la distribución posterior como . $C$ $\mathrm {Beta} (y_{1}+\alpha ,n_{1}-y_{1}+\beta )$

Así, nuevamente mediante la capitalización, encontramos que la distribución predictiva posterior de una suma de una muestra futura de tamaño de variables aleatorias es $n_{2}$ $\mathrm {Bernoulli} (p)$

Y_{2}\sim \mathrm {BetaBin} (n_{2},y_{1}+\alpha ,n_{1}-y_{1}+\beta )

Generando variaciones aleatorias

Para dibujar una variable aleatoria beta-binomial simplemente dibuja y luego dibuja . $X\sim \mathrm {BetaBin} (n,\alpha ,\beta )$ $p\sim \mathrm {Beta} (\alpha ,\beta )$ $X\sim \mathrm {B} (n,p)$

Distribuciones relacionadas

$\mathrm {BetaBin} (1,\alpha ,\beta )\sim \mathrm {Bernoulli} (p)\,$ dónde . $p={\frac {\alpha }{\alpha +\beta }}\,$
$\mathrm {BetaBin} (n,1,1)\sim U(0,n)\,$ ¿Dónde está la distribución uniforme discreta ? $U(a,b)\,$
$\lim _{s\rightarrow \infty }\mathrm {BetaBin} (n,ps,(1-p)s)\sim \mathrm {B} (n,p)\,$ donde y y es la distribución binomial . $p={\frac {\alpha }{\alpha +\beta }}\,$ $s=\alpha +\beta \,$ $\mathrm {B} (n,p)\,$
$\lim _{n\rightarrow \infty }\mathrm {BetaBin} (n,\alpha ,{\frac {np}{(1-p)}})\sim \mathrm {NB} (\alpha ,p)\,$ donde está la distribución binomial negativa . $\mathrm {NB} (\alpha ,p)\,$

Ver también

Distribución multinomial de Dirichlet

Referencias

Minka, Thomas P. (2003). Estimación de una distribución de Dirichlet. Informe técnico de Microsoft.

enlaces externos

Uso de la distribución Beta-binomial para evaluar el rendimiento de un dispositivo de identificación biométrica
Fastfit contiene código Matlab para ajustar distribuciones Beta-binomiales (en forma de distribuciones Pólya bidimensionales) a los datos.
Gráfico interactivo: Relaciones de distribución univariadas
Funciones beta-binomiales en el paquete VGAM R
Distribución beta-binomial en la biblioteca Java de Sandia National Labs Cognitive Foundry