stringtranslate.com

Modelo de urna Pólya

En estadística , un modelo de urna de Pólya (también conocido como esquema de urna de Pólya o simplemente como urna de Pólya ), llamado así en honor a George Pólya , es una familia de modelos de urna que se pueden utilizar para interpretar muchos modelos estadísticos de uso común .

El modelo representa objetos de interés (como átomos, personas, coches, etc.) como bolas de colores en una urna . En el modelo básico de urna de Pólya, el experimentador coloca x bolas blancas e y negras en una urna. En cada paso, se extrae una bola uniformemente al azar de la urna y se observa su color; luego se devuelve a la urna y se agrega a la urna una bola adicional del mismo color.

Si por casualidad se extraen más bolas negras que blancas en los primeros sorteos, sería más probable que se extrajeran más bolas negras más adelante. Lo mismo ocurre con las bolas blancas. Por tanto, la urna tiene una propiedad de refuerzo (" los ricos se hacen más ricos "). Es lo opuesto al muestreo sin reemplazo , donde cada vez que se observa un valor particular, es menos probable que se vuelva a observar, mientras que en un modelo de urna Pólya, es más probable que se vuelva a observar un valor observado. En un modelo de urna de Pólya, los sucesivos actos de medición a lo largo del tiempo tienen cada vez menos efecto en mediciones futuras, mientras que en el muestreo sin reemplazo ocurre lo contrario: después de un cierto número de mediciones de un valor particular, ese valor nunca volverá a verse. .

También se diferencia del muestreo con reposición, donde la bola se devuelve a la urna pero sin añadir bolas nuevas. En este caso, no hay ni autorrefuerzo ni anti-autorrefuerzo.

Resultados básicos

Cuestiones de interés son la evolución de la población de urnas y la secuencia de colores de las bolas extraídas.

Después de los sorteos, la probabilidad de que la urna contenga bolas blancas y negras es , donde la barra superior indica un factorial creciente . Esto se puede demostrar dibujando el triángulo de Pascal de todas las configuraciones posibles.

De manera más general, si la urna comienza con bolas de color , con , luego de los sorteos, la probabilidad de que la urna contenga bolas de color es

coeficiente multinomial

Con la condición de que la urna termine con bolas de color después de los sorteos, existen diferentes trayectorias que podrían haber llevado a ese estado final. La probabilidad condicional de cada trayectoria es la misma: .

Interpretación

Una de las razones del interés en este modelo de urna bastante elaborado (es decir, con duplicación y luego reemplazo de cada bola extraída) es que proporciona un ejemplo en el que el recuento (inicialmente x negro e y blanco) de bolas en la urna no es oculto, que es capaz de aproximarse a la actualización correcta de las probabilidades subjetivas apropiadas para un caso diferente en el que el contenido original de la urna está oculto mientras se realiza un muestreo ordinario con reemplazo (sin la duplicación de bolas de Pólya). Debido al simple esquema de "muestreo con reemplazo" en este segundo caso, el contenido de la urna ahora es estático , pero esta mayor simplicidad se compensa con la suposición de que el contenido de la urna ahora es desconocido para el observador. Se puede realizar un análisis bayesiano de la incertidumbre del observador sobre el contenido inicial de la urna, utilizando una elección particular de distribución previa (conjugada). Específicamente, supongamos que un observador sabe que la urna contiene solo bolas idénticas, cada una de ellas de color blanco o negro, pero no sabe el número absoluto de bolas presentes, ni la proporción que son de cada color. Supongamos que tienen creencias previas sobre estas incógnitas: para ellos, la distribución de probabilidad del contenido de la urna se aproxima bien mediante alguna distribución previa para el número total de bolas en la urna, y una distribución beta previa con parámetros (x,y) para la proporción inicial de estos que son negros, proporción que se considera (para ellos) aproximadamente independiente del número total. Entonces, el proceso de resultados de una sucesión de extracciones de la urna (con reemplazo pero sin duplicación) tiene aproximadamente la misma ley de probabilidad que el esquema Pólya anterior en el que el contenido real de la urna no estaba oculto para ellos. El error de aproximación aquí se relaciona con el hecho de que una urna que contiene un número finito conocido de bolas , por supuesto, no puede tener una proporción desconocida de bolas negras exactamente distribuida en beta, ya que el dominio de valores posibles para esa proporción se limita a ser múltiplos de , en lugar de tener total libertad para asumir cualquier valor en el intervalo unitario continuo, como lo haría una proporción exactamente distribuida beta. Esta explicación ligeramente informal se proporciona por motivos de motivación y puede hacerse más precisa matemáticamente.

Este modelo básico de urna Pólya se ha generalizado de muchas maneras.

Distribuciones relacionadas con la urna Pólya

Intercambiabilidad

La Urna de Polya es un ejemplo por excelencia de un proceso intercambiable .

Supongamos que tenemos una urna que contiene bolas blancas y bolas negras. Procedemos a sacar bolas al azar de la urna. En el -ésimo sorteo, definimos una variable aleatoria, , por si la bola es negra y no. Luego devolvemos la bola a la urna, con una bola adicional del mismo color. Para un dado , si tenemos eso para muchos , entonces es más probable que sea así , porque se han agregado más bolas negras a la urna. Por tanto, estas variables no son independientes entre sí.

Sin embargo, la secuencia exhibe la propiedad más débil de intercambiabilidad. [2] Recuerde que una secuencia (finita o infinita) de variables aleatorias se llama intercambiable si su distribución conjunta es invariante bajo permutaciones de índices.

Para mostrar la intercambiabilidad de la secuencia , supongamos que se recogen bolas de la urna y que, de estas bolas, las bolas son blancas y negras. En el primer sorteo, el número de bolas en la urna es ; en el segundo sorteo lo es y así sucesivamente. En el sorteo -ésimo, el número de bolas será . La probabilidad de que saquemos primero todas las bolas negras y luego todas las blancas está dada por

Ahora debemos demostrar que si se permuta el orden de las bolas blancas y negras, no hay cambio en la probabilidad. Como en la expresión anterior, incluso después de permutar los sorteos, el enésimo denominador siempre será , ya que este es el número de bolas en la urna en esa ronda.

Si vemos la -ésima bola negra en la ronda , la probabilidad será igual a , es decir, el numerador será igual a . Con el mismo argumento podemos calcular la probabilidad de las bolas blancas. Por lo tanto, para cualquier secuencia en la que ocurre veces y ocurre veces (es decir, una secuencia con bolas negras y blancas extraídas en algún orden) la probabilidad final será igual a la siguiente expresión, donde aprovechamos la conmutatividad de la multiplicación en el numerador:

Esta probabilidad no está relacionada con el orden en que se ven las bolas blancas y negras y solo depende del número total de bolas blancas y del número total de bolas negras. [2]

Según el teorema de De Finetti , debe haber una distribución previa única tal que la distribución conjunta de observar la secuencia sea una mezcla bayesiana de las probabilidades de Bernoulli. Se puede demostrar que esta distribución previa es una distribución beta con parámetros . En el teorema de De Finetti, si reemplazamos por , obtenemos la ecuación anterior: [2]



En esta ecuación .

Ver también

Referencias

  1. ^ Hoppe, Fred (1984). "Las urnas tipo Pólya y la fórmula de muestreo de los Ewen". Revista de biología matemática . 20 : 91. doi : 10.1007/BF00275863. hdl : 2027.42/46944 . S2CID  122994288.
  2. ^ abc Hoppe, Fred M (1984). "Las urnas tipo Polya y la fórmula de muestreo de los Ewen". Revista de biología matemática . 20 (1): 91–94. doi :10.1007/bf00275863. hdl : 2027.42/46944 . ISSN  0303-6812. S2CID  122994288.[ enlace muerto ]

Otras lecturas

Bibliografía