En teoría de la decisión , el algoritmo de probabilidades (o algoritmo de Bruss ) es un método matemático para calcular estrategias óptimas para una clase de problemas que pertenecen al dominio de los problemas de parada óptima . Su solución se deriva de la estrategia de probabilidades , y la importancia de la estrategia de probabilidades radica en su optimización, como se explica a continuación.
El algoritmo de probabilidades se aplica a una clase de problemas llamados problemas del último éxito . Formalmente, el objetivo en estos problemas es maximizar la probabilidad de identificar en una secuencia de eventos independientes observados secuencialmente el último evento que satisface un criterio específico (un "evento específico"). Esta identificación debe realizarse en el momento de la observación. No se permite revisar las observaciones anteriores. Por lo general, quien toma las decisiones define un evento específico como un evento que es de verdadero interés en vista de "detenerse" para realizar una acción bien definida. Estos problemas se encuentran en varias situaciones.
Dos situaciones diferentes ejemplifican el interés por maximizar la probabilidad de detenerse en un último evento específico.
Considere una secuencia de eventos independientes . Asocie con esta secuencia otra secuencia de eventos independientes con valores 1 o 0. Aquí , llamado éxito, representa el evento en el que la k-ésima observación es interesante (según lo define quien toma las decisiones) y no es interesante. Estas variables aleatorias se observan secuencialmente y el objetivo es seleccionar correctamente el último éxito cuando se observa.
Sea la probabilidad de que el k-ésimo evento sea interesante. Además deja y . Tenga en cuenta que representa las probabilidades de que el k-ésimo evento resulte interesante, lo que explica el nombre del algoritmo de probabilidades.
El algoritmo de probabilidades suma las probabilidades en orden inverso
hasta que esta suma alcance o supere el valor 1 por primera vez. Si esto sucede en el índice s , guarda s y la suma correspondiente.
Si la suma de las probabilidades no llega a 1, establece s = 1. Al mismo tiempo calcula
La salida es
La estrategia de probabilidades es la regla de observar los eventos uno tras otro y detenerse en el primer evento interesante desde el índice s en adelante (si lo hay), donde s es el umbral de parada de la salida a.
La importancia de la estrategia de probabilidades y, por tanto, del algoritmo de probabilidades, radica en el siguiente teorema de probabilidades.
El teorema de las probabilidades establece que
El algoritmo de probabilidades calcula la estrategia óptima y la probabilidad óptima de ganar al mismo tiempo. Además, el número de operaciones del algoritmo de probabilidades es (sub)lineal en n. Por lo tanto, no puede existir ningún algoritmo más rápido para todas las secuencias, de modo que el algoritmo de probabilidades sea, al mismo tiempo, óptimo como algoritmo.
Bruss 2000 ideó el algoritmo de probabilidades y acuñó su nombre. También se le conoce como algoritmo de Bruss (estrategia). Se pueden encontrar implementaciones gratuitas en la web.
Las aplicaciones van desde preguntas médicas en ensayos clínicos sobre problemas de ventas, problemas de secretaria , selección de cartera , estrategias de búsqueda (unidireccionales), problemas de trayectoria y problema de estacionamiento hasta problemas de mantenimiento en línea y otros.
Existe, con el mismo espíritu, un teorema de probabilidades para procesos de llegada en tiempo continuo con incrementos independientes , como el proceso de Poisson (Bruss 2000). En algunos casos, las probabilidades no necesariamente se conocen de antemano (como en el ejemplo 2 anterior), por lo que la aplicación del algoritmo de probabilidades no es directamente posible. En este caso, cada paso puede utilizar estimaciones secuenciales de las probabilidades. Esto es significativo si el número de parámetros desconocidos no es grande en comparación con el número n de observaciones. Sin embargo, la cuestión de la optimización es más complicada y requiere estudios adicionales. Las generalizaciones del algoritmo de probabilidades permiten diferentes recompensas por no detenerse y por detenerse incorrectamente, así como reemplazar los supuestos de independencia por otros más débiles (Ferguson (2008)).
Bruss y Paindaveine 2000 discutieron el problema de seleccionar los últimos éxitos.
Tamaki 2010 demostró un teorema de probabilidades multiplicativas que aborda el problema de detenerse en cualquiera de los últimos éxitos. Matsui & Ano (2014) obtienen un límite inferior ajustado de probabilidad de ganar.
Matsui & Ano 2017 discutió el problema de seleccionar entre los últimos éxitos y obtuvo un límite inferior ajustado de probabilidad de ganar. Cuando el problema es equivalente al problema de probabilidades de Bruss. Si el problema es equivalente al de Bruss & Paindaveine 2000. Un problema discutido por Tamaki 2010 se obtiene configurando
A un jugador se le permiten opciones y gana si alguna de ellas es el último éxito. Para el problema clásico de la secretaria, Gilbert y Mosteller 1966 analizaron los casos . El problema de las probabilidades se analiza en Ano, Kakinuma y Miyoshi 2010. Para más casos de problemas de probabilidades, consulte Matsui y Ano 2016.
Una estrategia óptima para este problema pertenece a la clase de estrategias definidas por un conjunto de números umbral , donde .
Específicamente, imagine que tiene cartas de aceptación etiquetadas desde hasta . Tendría oficiales de solicitud, cada uno con una letra. Continúa entrevistando a los candidatos y clasificándolos en un cuadro que todos los funcionarios de solicitudes pueden ver. Ahora el oficial enviaría su carta de aceptación al primer candidato que sea mejor que todos los candidatos . (Las cartas de aceptación no enviadas se entregan por defecto a los últimos solicitantes, al igual que en el problema estándar de secretaria).
Cuando Ano, Kakinuma y Miyoshi (2010) demostraron que el límite inferior estricto de la probabilidad de ganar es igual a Para un entero positivo general , Matsui y Ano (2016) demostraron que el límite inferior estricto de la probabilidad de ganar es la probabilidad de ganar de la variante del problema de secretaria en la que se debe Elija los k candidatos principales utilizando solo k intentos .
Cuando , los estrechos límites inferiores de las probabilidades de ganar son iguales a , y respectivamente.
Para más casos numéricos para y un algoritmo para casos generales, consulte Matsui & Ano 2016.