Distribución beta-binomial

En teoría de probabilidad y estadística , la distribución beta-binomial es una familia de distribuciones de probabilidad discretas sobre un soporte finito de números enteros no negativos que surgen cuando la probabilidad de éxito en cada uno de un número fijo o conocido de ensayos de Bernoulli es desconocida o aleatoria. La distribución beta-binomial es la distribución binomial en la que la probabilidad de éxito en cada uno de n ensayos no es fija sino que se extrae aleatoriamente de una distribución beta . Se utiliza con frecuencia en estadística bayesiana , métodos bayesianos empíricos y estadística clásica para capturar la sobredispersión en datos distribuidos de tipo binomial.

La distribución beta-binomial es una versión unidimensional de la distribución multinomial de Dirichlet , ya que las distribuciones binomial y beta son versiones univariadas de las distribuciones multinomial y de Dirichlet, respectivamente. El caso especial en el que α y β son números enteros también se conoce como distribución hipergeométrica negativa .

Motivación y derivación

Como una distribución compuesta

La distribución Beta es una distribución conjugada de la distribución binomial . Este hecho conduce a una distribución compuesta analíticamente manejable donde se puede pensar que el parámetro en la distribución binomial se extrae aleatoriamente de una distribución beta. Supongamos que nos interesa predecir la cantidad de caras en ensayos futuros. Esto viene dado por $p$ $x$ $n$

{\begin{aligned}f(x\mid n,\alpha ,\beta )&=\int _{0}^{1}\mathrm {Bin} (x|n,p)\mathrm {Beta} (p\mid \alpha ,\beta )\,dp\\[6pt]&={n \choose x}{\frac {1}{\mathrm {B} (\alpha ,\beta )}}\int _{0}^{1}p^{x+\alpha -1}(1-p)^{n-x+\beta -1}\,dp\\[6pt]&={n \choose x}{\frac {\mathrm {B} (x+\alpha ,n-x+\beta )}{\mathrm {B} (\alpha ,\beta )}}.\end{aligned}}

Usando las propiedades de la función beta , esto se puede escribir alternativamente

f(x\mid n,\alpha ,\beta )={\frac {\Gamma (n+1)\Gamma (x+\alpha )\Gamma (n-x+\beta )}{\Gamma (n+\alpha +\beta )\Gamma (x+1)\Gamma (n-x+1)}}{\frac {\Gamma (\alpha +\beta )}{\Gamma (\alpha )\Gamma (\beta )}}

Como modelo de urna

La distribución beta-binomial también puede motivarse a través de un modelo de urna para valores enteros positivos de α y β , conocido como el modelo de urna de Pólya . Específicamente, imagine una urna que contiene α bolas rojas y β bolas negras, donde se realizan extracciones aleatorias. Si se observa una bola roja, entonces se devuelven dos bolas rojas a la urna. Del mismo modo, si se extrae una bola negra, entonces se devuelven dos bolas negras a la urna. Si esto se repite n veces, entonces la probabilidad de observar x bolas rojas sigue una distribución beta-binomial con parámetros n , α y β .

Por el contrario, si los sorteos aleatorios se realizan con reposición simple (no se añaden a la urna bolas adicionales a la bola observada), entonces la distribución sigue una distribución binomial y si los sorteos aleatorios se realizan sin reposición, la distribución sigue una distribución hipergeométrica .

Momentos y propiedades

Los primeros tres momentos crudos son

{\begin{aligned}\mu _{1}&={\frac {n\alpha }{\alpha +\beta }}\\[8pt]\mu _{2}&={\frac {n\alpha [n(1+\alpha )+\beta ]}{(\alpha +\beta )(1+\alpha +\beta )}}\\[8pt]\mu _{3}&={\frac {n\alpha [n^{2}(1+\alpha )(2+\alpha )+3n(1+\alpha )\beta +\beta (\beta -\alpha )]}{(\alpha +\beta )(1+\alpha +\beta )(2+\alpha +\beta )}}\end{aligned}}

y la curtosis es

\beta _{2}={\frac {(\alpha +\beta )^{2}(1+\alpha +\beta )}{n\alpha \beta (\alpha +\beta +2)(\alpha +\beta +3)(\alpha +\beta +n)}}\left[(\alpha +\beta )(\alpha +\beta -1+6n)+3\alpha \beta (n-2)+6n^{2}-{\frac {3\alpha \beta n(6-n)}{\alpha +\beta }}-{\frac {18\alpha \beta n^{2}}{(\alpha +\beta )^{2}}}\right].

Observamos , sugerentemente, que la media puede escribirse como $p={\frac {\alpha }{\alpha +\beta }}\!$

\mu ={\frac {n\alpha }{\alpha +\beta }}=np\!

y la varianza como

\sigma ^{2}={\frac {n\alpha \beta (\alpha +\beta +n)}{(\alpha +\beta )^{2}(\alpha +\beta +1)}}=np(1-p){\frac {\alpha +\beta +n}{\alpha +\beta +1}}=np(1-p)[1+(n-1)\rho ]\!

donde . El parámetro se conoce como correlación "intraclase" o "intragrupo". Es esta correlación positiva la que da lugar a la sobredispersión. Obsérvese que cuando , no hay información disponible para distinguir entre la variación beta y binomial, y los dos modelos tienen varianzas iguales. $\rho ={\tfrac {1}{\alpha +\beta +1}}\!$ $\rho \;\!$ $n=1$

Momentos factoriales

El momento factorial $r$ -ésimo de una variable aleatoria Beta-binomial $X$ es

\operatorname {E} {\bigl [}(X)_{r}{\bigr ]}={\frac {n!}{(n-r)!}}{\frac {B(\alpha +r,\beta )}{B(\alpha ,\beta )}}=(n)_{r}{\frac {B(\alpha +r,\beta )}{B(\alpha ,\beta )}}

Estimaciones puntuales

Método de momentos

El método de estimación de momentos se puede obtener anotando el primer y segundo momento del beta-binomial y estableciéndolos iguales a los momentos de muestra y . Encontramos $m_{1}$ $m_{2}$

{\begin{aligned}{\widehat {\alpha }}&={\frac {nm_{1}-m_{2}}{n({\frac {m_{2}}{m_{1}}}-m_{1}-1)+m_{1}}}\\[5pt]{\widehat {\beta }}&={\frac {(n-m_{1})(n-{\frac {m_{2}}{m_{1}}})}{n({\frac {m_{2}}{m_{1}}}-m_{1}-1)+m_{1}}}.\end{aligned}}

Estas estimaciones pueden ser negativas sin sentido, lo que demuestra que los datos no están dispersos o están subdispersos en relación con la distribución binomial. En este caso, la distribución binomial y la distribución hipergeométrica son candidatas alternativas, respectivamente.

Estimación de máxima verosimilitud

Si bien las estimaciones de máxima verosimilitud en forma cerrada son poco prácticas, dado que la función de densidad de probabilidad consta de funciones comunes (función gamma y/o funciones Beta), se pueden encontrar fácilmente mediante optimización numérica directa. Las estimaciones de máxima verosimilitud a partir de datos empíricos se pueden calcular utilizando métodos generales para ajustar distribuciones Pólya multinomiales, métodos para los cuales se describen en (Minka 2003). El paquete R VGAM a través de la función vglm, mediante máxima verosimilitud, facilita el ajuste de modelos de tipo glm con respuestas distribuidas de acuerdo con la distribución beta-binomial. No existe ningún requisito de que n sea fijo a lo largo de las observaciones.

Ejemplo: heterogeneidad de la proporción de sexos

Los siguientes datos indican el número de hijos varones entre los primeros 12 hijos de una familia de tamaño 13 en 6115 familias tomadas de registros hospitalarios en Sajonia en el siglo XIX (Sokal y Rohlf, p. 59 de Lindsey). Se ignora al decimotercer hijo para atenuar el efecto de que las familias dejen de ser aleatorias cuando se alcanza el género deseado.

Los dos primeros momentos de muestra son

{\begin{aligned}m_{1}&=6.23\\m_{2}&=42.31\\n&=12\end{aligned}}

y por lo tanto el método de estimaciones de momentos son

{\begin{aligned}{\widehat {\alpha }}&=34.1350\\{\widehat {\beta }}&=31.6085.\end{aligned}}

Las estimaciones de máxima verosimilitud se pueden encontrar numéricamente

{\begin{aligned}{\widehat {\alpha }}_{\mathrm {mle} }&=34.09558\\{\widehat {\beta }}_{\mathrm {mle} }&=31.5715\end{aligned}}

y la verosimilitud logarítmica maximizada es

\log {\mathcal {L}}=-12492.9

De donde encontramos el AIC

{\mathit {AIC}}=24989.74.

El AIC del modelo binomial en competencia es AIC = 25070,34 y, por lo tanto, vemos que el modelo beta-binomial proporciona un ajuste superior a los datos, es decir, hay evidencia de sobredispersión. Trivers y Willard postulan una justificación teórica para la heterogeneidad en la propensión al género entre las crías de mamíferos .

El ajuste superior es evidente especialmente entre las colas.

Papel en la estadística bayesiana

La distribución beta-binomial juega un papel destacado en la estimación bayesiana de una probabilidad de éxito de Bernoulli que deseamos estimar en base a los datos. Sea una muestra de variables aleatorias de Bernoulli independientes e idénticamente distribuidas . Supongamos que nuestro conocimiento de -en el estilo bayesiano- es incierto y está modelado por la distribución previa . Si entonces, a través de la capitalización , la distribución predictiva previa de $p$ $\mathbf {X} =\{X_{1},X_{2},\cdots X_{n_{1}}\}$ $X_{i}\sim {\text{Bernoulli}}(p)$ $p$ $p\sim {\text{Beta}}(\alpha ,\beta )$ $Y_{1}=\sum _{i=1}^{n_{1}}X_{i}$

Y_{1}\sim {\text{BetaBin}}(n_{1},\alpha ,\beta )

Después de observar, notamos que la distribución posterior para $Y_{1}$ $p$

{\begin{aligned}f(p|\mathbf {X} ,\alpha ,\beta )&\propto \left(\prod _{i=1}^{n_{1}}p^{x_{i}}(1-p)^{1-x_{i}}\right)p^{\alpha -1}(1-p)^{\beta -1}\\&=Cp^{\sum x_{i}+\alpha -1}(1-p)^{n_{1}-\sum x_{i}+\beta -1}\\&=Cp^{y_{1}+\alpha -1}(1-p)^{n_{1}-y_{1}+\beta -1}\end{aligned}}

donde es una constante normalizadora. Reconocemos la distribución posterior como . $C$ $\mathrm {Beta} (y_{1}+\alpha ,n_{1}-y_{1}+\beta )$

Así, nuevamente a través de la composición, encontramos que la distribución predictiva posterior de una suma de una muestra futura de tamaño de variables aleatorias es $n_{2}$ $\mathrm {Bernoulli} (p)$

Y_{2}\sim \mathrm {BetaBin} (n_{2},y_{1}+\alpha ,n_{1}-y_{1}+\beta )

Generando variables aleatorias

Para dibujar una variable aleatoria beta-binomial simplemente dibuje y luego dibuje . $X\sim \mathrm {BetaBin} (n,\alpha ,\beta )$ $p\sim \mathrm {Beta} (\alpha ,\beta )$ $X\sim \mathrm {B} (n,p)$

Distribuciones relacionadas

$\mathrm {BetaBin} (1,\alpha ,\beta )\sim \mathrm {Bernoulli} (p)\,$ dónde . $p={\frac {\alpha }{\alpha +\beta }}\,$
$\mathrm {BetaBin} (n,1,1)\sim U(0,n)\,$ ¿Dónde está la distribución uniforme discreta ? $U(a,b)\,$
$\lim _{s\rightarrow \infty }\mathrm {BetaBin} (n,ps,(1-p)s)\sim \mathrm {B} (n,p)\,$ donde y y es la distribución binomial . $p={\frac {\alpha }{\alpha +\beta }}\,$ $s=\alpha +\beta \,$ $\mathrm {B} (n,p)\,$
$\lim _{n\rightarrow \infty }\mathrm {BetaBin} (n,\alpha ,{\frac {np}{(1-p)}})\sim \mathrm {NB} (\alpha ,p)\,$ ¿Dónde está la distribución binomial negativa ? $\mathrm {NB} (\alpha ,p)\,$

Véase también

Distribución multinomial de Dirichlet

Referencias

Minka, Thomas P. (2003). Estimación de una distribución de Dirichlet. Informe técnico de Microsoft.

Enlaces externos

Uso de la distribución Beta-binomial para evaluar el rendimiento de un dispositivo de identificación biométrica
Fastfit contiene código Matlab para ajustar distribuciones Beta-Binomiales (en forma de distribuciones Pólya bidimensionales) a los datos.
Gráfico interactivo: Relaciones de distribución univariadas
Funciones beta-binomiales en el paquete VGAM R
Distribución beta-binomial en la biblioteca Java de Sandia National Labs Cognitive Foundry