stringtranslate.com

El problema del cobrador de cupones

Gráfica del número de cupones, n versus el número esperado de intentos (es decir, tiempo) necesarios para recolectarlos todos, E  ( T  )

En teoría de la probabilidad , el problema del recolector de cupones se refiere al análisis matemático de los concursos de "recoge todos los cupones y gana". Plantea la siguiente pregunta: si cada caja de un producto determinado (por ejemplo, cereales para el desayuno) contiene un cupón y hay n tipos diferentes de cupones, ¿cuál es la probabilidad de que sea necesario comprar más de t cajas para recolectar los n cupones? ? Una afirmación alternativa es: dados n cupones, ¿cuántos cupones espera que necesitará retirar con reemplazo antes de haber extraído cada cupón al menos una vez? El análisis matemático del problema revela que el número esperado de ensayos necesarios crece a medida que . [a] Por ejemplo, cuando n  = 50, se necesitan alrededor de 225 [b] ensayos en promedio para recolectar los 50 cupones.

Solución

A través de funciones generadoras

Por definición de los números de Stirling del segundo tipo , la probabilidad de que se necesiten exactamente T sorteos es

T
k

Calculando la expectativa

Sea el tiempo T el número de sorteos necesarios para recolectar todos los n cupones, y sea t i el tiempo para recolectar el i -ésimo cupón después de que  se hayan recolectado i − 1 cupones. Entonces . Piense en T y t i como variables aleatorias . Observe que la probabilidad de cobrar un nuevo cupón es . Por tanto, tiene distribución geométrica con expectativa . Por la linealidad de las expectativas tenemos:

Aquí H n es el n -ésimo número armónico . Usando las asintóticas de los números armónicos obtenemos:

¿Dónde está la constante de Euler-Mascheroni ?

Usando la desigualdad de Markov para limitar la probabilidad deseada:

Lo anterior se puede modificar ligeramente para manejar el caso en el que ya hayamos recolectado algunos de los cupones. Sea k el número de cupones ya cobrados, entonces:

Y cuando obtengamos el resultado original.

Calculando la varianza

Usando la independencia de variables aleatorias ti , obtenemos:

desde (ver problema de Basilea ).

Limite la probabilidad deseada utilizando la desigualdad de Chebyshev :

Estimaciones de cola

Una estimación de cola más fuerte para la cola superior se obtiene de la siguiente manera. Denotemos el evento en el que el -ésimo cupón no se eligió en las primeras pruebas. Entonces

Así, para , tenemos . A través de una unión unida sobre los cupones, obtenemos

Extensiones y generalizaciones

que es una distribución de Gumbel . En la siguiente sección se ofrece una prueba sencilla mediante martingalas.
Aquí m está fijo. Cuando m = 1 obtenemos la fórmula anterior para la expectativa.
Esto es igual a
donde m denota el número de cupones a recolectar y P J denota la probabilidad de obtener cualquier cupón del conjunto de cupones J.

martingalas

Esta sección se basa en. [3]

Defina un proceso aleatorio discreto dejando ser el número de cupones que aún no se ven después de los sorteos. El proceso aleatorio es solo una secuencia generada por una cadena de Markov con estados y probabilidades de transición.

martingala

De manera más general, cada uno es un proceso de martingala, que nos permite calcular todos los momentos de . Por ejemplo,

Sea la variable aleatoria con distribución límite. Tenemos

En el límite tenemos , que es precisamente lo que establece la ley del límite.

Al tomar la derivada varias veces, encontramos que es una distribución de Poisson .

Ver también

Notas

  1. ^ Aquí y a lo largo de este artículo, "log" se refiere al logaritmo natural en lugar de a un logaritmo con alguna otra base. El uso de Θ aquí invoca la notación O grande .
  2. ^ E(50) = 50(1 + 1/2 + 1/3 + ... + 1/50) = 224,9603, el número esperado de pruebas para recolectar los 50 cupones. La aproximación para este número esperado da en este caso .

Referencias

  1. ^ Mitzenmacher, Michael (2017). Probabilidad y computación: aleatorización y técnicas probabilísticas en algoritmos y análisis de datos . Eli Upfal (2ª ed.). Cambridge, Reino Unido. Teorema 5.13. ISBN 978-1-107-15488-9. OCLC  960841613.{{cite book}}: CS1 maint: location missing publisher (link)
  2. ^ Flajolet, Philippe; Gardy, Danièle; Thimonier, Loÿs (1992), "Paradoja del cumpleaños, recolectores de cupones, algoritmos de almacenamiento en caché y búsqueda autoorganizada", Matemáticas aplicadas discretas , 39 (3): 207–229, CiteSeerX 10.1.1.217.5965 , doi :10.1016/0166-218x (92)90177-c 
  3. ^ Kan, Dakota del Norte (1 de mayo de 2005). "Enfoque martingala para el problema del cobro de cupones". Revista de Ciencias Matemáticas . 127 (1): 1737-1744. doi :10.1007/s10958-005-0134-y. ISSN  1573-8795.

enlaces externos