El problema de la secretaria demuestra un escenario que involucra la teoría de parada óptima [1] [2] que se estudia ampliamente en los campos de la probabilidad aplicada , la estadística y la teoría de la decisión . También se le conoce como el problema del matrimonio , el problema de la dote del sultán , el problema del pretendiente quisquilloso , el juego del googol y el problema de la mejor elección . Su solución también se conoce como regla del 37% . [3]
La forma básica del problema es la siguiente: imaginemos un administrador que quiere contratar a la mejor secretaria entre candidatos clasificados para un puesto. Los solicitantes son entrevistados uno por uno en orden aleatorio. Se debe tomar una decisión sobre cada solicitante en particular inmediatamente después de la entrevista. Una vez rechazado, un solicitante no puede ser revocado. Durante la entrevista, el administrador obtiene información suficiente para clasificar al solicitante entre todos los solicitantes entrevistados hasta el momento, pero desconoce la calidad de los solicitantes aún no vistos. La pregunta es sobre la estrategia óptima ( regla de detención ) para maximizar la probabilidad de seleccionar al mejor solicitante. Si la decisión se puede aplazar hasta el final, esto se puede resolver mediante el simple algoritmo de selección máxima de seguimiento del máximo actual (y quién lo alcanzó) y seleccionando el máximo general al final. La dificultad es que la decisión debe tomarse de inmediato.
La prueba rigurosa más corta conocida hasta ahora la proporciona el algoritmo de probabilidades . Implica que la probabilidad óptima de ganar es siempre al menos (donde e es la base del logaritmo natural ), y que este último se cumple incluso en una generalidad mucho mayor. La regla de parada óptima prescribe rechazar siempre a los primeros solicitantes que sean entrevistados y luego detenerse en el primer solicitante que sea mejor que todos los solicitantes entrevistados hasta el momento (o continuar hasta el último solicitante si esto nunca ocurre). A veces, esta estrategia se denomina regla de detención, porque la probabilidad de detenerse en el mejor candidato con esta estrategia ya es aproximadamente para valores moderados de . Una de las razones por las que el problema de la secretaria ha recibido tanta atención es que la política óptima para el problema (la regla de detención) es simple y selecciona al mejor candidato alrededor del 37% de las veces, independientemente de si hay 100 o 100 millones de solicitantes.
Aunque existen muchas variaciones, el problema básico se puede plantear de la siguiente manera:
Un candidato se define como un solicitante que, cuando es entrevistado, es mejor que todos los solicitantes entrevistados anteriormente. Saltar se utiliza para significar "rechazar inmediatamente después de la entrevista". Dado que el objetivo del problema es seleccionar al mejor solicitante, solo se considerarán los candidatos para su aceptación. El "candidato" en este contexto corresponde al concepto de registro en permutación.
La política óptima para el problema es una regla de detención . Según él, el entrevistador rechaza a los primeros r − 1 solicitantes (deje que el solicitante M sea el mejor solicitante entre estos r − 1 solicitantes) y luego selecciona al primer solicitante posterior que sea mejor que el solicitante M. Se puede demostrar que la estrategia óptima se encuentra en esta clase de estrategias. [ cita necesaria ] (Tenga en cuenta que nunca debemos elegir un solicitante que no sea el mejor que hemos visto hasta ahora, ya que no puede ser el mejor solicitante en general). Para un límite arbitrario r , la probabilidad de que se seleccione al mejor solicitante es
La suma no está definida para r = 1, pero en este caso la única política factible es seleccionar al primer solicitante y, por tanto, P (1) = 1/ n . Esta suma se obtiene observando que si el solicitante i es el mejor solicitante, entonces se selecciona si y sólo si el mejor solicitante entre los primeros i − 1 solicitantes está entre los primeros r − 1 solicitantes que fueron rechazados. Dejando que n tienda al infinito, escribiendo como el límite de (r−1) / n , usando t para (i−1) / n y dt para 1/ n , la suma se puede aproximar mediante la integral
Tomando la derivada de P ( x ) con respecto a , estableciéndola en 0 y resolviendo x , encontramos que la x óptima es igual a 1/ e . Por lo tanto, el límite óptimo tiende a n / e a medida que n aumenta, y el mejor solicitante se selecciona con probabilidad 1/ e .
Para valores pequeños de n , la r óptima también se puede obtener mediante métodos de programación dinámica estándar . Los umbrales óptimos r y la probabilidad de seleccionar la mejor alternativa P para varios valores de n se muestran en la siguiente tabla. [nota 1]
La probabilidad de seleccionar al mejor candidato en el problema clásico de la secretaria converge hacia .
Este problema y varias modificaciones pueden resolverse (incluida la prueba de optimidad) de manera sencilla mediante el algoritmo de probabilidades , que también tiene otras aplicaciones. Las modificaciones del problema de la secretaria que pueden resolverse con este algoritmo incluyen disponibilidades aleatorias de los solicitantes, hipótesis más generales para que los solicitantes sean de interés para quien toma las decisiones, entrevistas grupales para los solicitantes, así como ciertos modelos para un número aleatorio de solicitantes. [ cita necesaria ]
La solución del problema de la secretaria sólo tiene sentido si está justificado suponer que los solicitantes no tienen conocimiento de la estrategia de decisión empleada, porque los primeros solicitantes no tienen ninguna posibilidad y, de lo contrario, es posible que no se presenten.
Un inconveniente importante para las aplicaciones de la solución del problema clásico de la secretaria es que se debe conocer de antemano el número de solicitantes, lo que rara vez ocurre. Una forma de superar este problema es suponer que el número de solicitantes es una variable aleatoria con una distribución conocida (Presman y Sonin, 1972). Sin embargo, para este modelo, la solución óptima es en general mucho más difícil. Además, la probabilidad óptima de éxito ya no es de alrededor de 1/ e , sino que suele ser inferior. Esto puede entenderse en el contexto de tener un "precio" que pagar por no saber el número de solicitantes. Sin embargo, en este modelo el precio es elevado. Dependiendo de la elección de la distribución de , la probabilidad óptima de ganar puede acercarse a cero. La búsqueda de formas de afrontar este nuevo problema condujo a un nuevo modelo que produjo la llamada ley 1/e de la mejor elección.
La esencia del modelo se basa en la idea de que la vida es secuencial y que los problemas del mundo real se plantean en tiempo real. Además, es más fácil estimar los tiempos en que eventos específicos (llegadas de solicitantes) deberían ocurrir con mayor frecuencia (si es que ocurren) que estimar la distribución del número de eventos específicos que ocurrirán. Esta idea condujo al siguiente enfoque, el llamado enfoque unificado (1984):
El modelo se define de la siguiente manera: un solicitante debe ser seleccionado en algún intervalo de tiempo entre un número desconocido de solicitantes clasificables. El objetivo es maximizar la probabilidad de seleccionar sólo los mejores bajo la hipótesis de que todos los pedidos de llegada de diferentes rangos son igualmente probables. Supongamos que todos los solicitantes tienen la misma, pero independientes entre sí, densidad de tiempo de llegada y denotamos la función de distribución de tiempo de llegada correspondiente, es decir
Sea tal que considere la estrategia de esperar y observar a todos los solicitantes hasta el momento y luego seleccionar, si es posible, el primer candidato después del tiempo que sea mejor que todos los anteriores. Entonces esta estrategia, llamada estrategia 1/e , tiene las siguientes propiedades:
La estrategia 1/e
La ley 1/e, demostrada en 1984 por F. Thomas Bruss , fue una sorpresa. La razón fue que antes se consideraba que un valor de aproximadamente 1/e estaba fuera de alcance en un modelo para desconocido , mientras que este valor 1/e ahora se alcanzaba como límite inferior para la probabilidad de éxito, y esto en un modelo con posiblemente hipótesis mucho más débiles (ver, por ejemplo, Math. Reviews 85:m).
Sin embargo, hay muchas otras estrategias que logran (i) y (ii) y, además, funcionan estrictamente mejor que la estrategia 1/e simultáneamente para todos >2. Un ejemplo simple es la estrategia que selecciona (si es posible) al primer candidato relativamente mejor después de un tiempo, siempre que al menos un solicitante haya llegado antes de este tiempo, y en caso contrario selecciona (si es posible) al segundo candidato relativamente mejor después de un tiempo . [4]
La ley 1/e a veces se confunde con la solución al problema clásico de la secretaria descrito anteriormente debido al papel similar del número 1/e. Sin embargo, en la Ley 1/e, este papel es más general. El resultado también es más sólido, ya que es válido para un número desconocido de solicitantes y dado que el modelo basado en una distribución del tiempo de llegada F es más manejable para las solicitudes.
En el artículo "¿Quién resolvió el problema del Secretario?" ( Ferguson , 1989) [1] , se afirma que el problema de la secretaria apareció impreso por primera vez en la columna Mathematical Games de febrero de 1960 de Martin Gardner en Scientific American :
Pídale a alguien que tome tantas hojas de papel como quiera y en cada hoja escriba un número positivo diferente. Los números pueden variar desde pequeñas fracciones de 1 hasta un número del tamaño de un googol (1 seguido de cien ceros) o incluso mayores. Estas hojas se ponen boca abajo y se barajan sobre la parte superior de una mesa. Uno a la vez, pones las tiras boca arriba. El objetivo es dejar de girar cuando llegues al número que supones que es el mayor de la serie. No puedes regresar y recoger un papelito previamente entregado. Si entregas todas las tiras, entonces, por supuesto, debes elegir la última que se volteó. [5]
Ferguson señaló que el juego de la secretaria seguía sin resolverse, ya que era un juego de suma cero con dos jugadores antagónicos. [1] En este juego:
La diferencia con el problema básico de la secretaria son dos:
Alice primero escribe n números, que luego se mezclan. Entonces, su orden no importa, lo que significa que los números de Alice deben ser una secuencia de variables aleatorias intercambiables . La estrategia de Alice es entonces simplemente elegir la secuencia de variables aleatorias intercambiables más complicada.
La estrategia de Bob se puede formalizar como una regla de detención de la secuencia .
Decimos que una regla de detención para Bob es una estrategia de detención de rango relativo si depende sólo de los rangos relativos de y no de sus valores numéricos. En otras palabras, es como si alguien interviniera en secreto después de que Alice escogiera sus números y cambiara cada número a su rango relativo (rompiendo empates al azar). Por ejemplo, se cambia a o con igual probabilidad. Esto hace que sea como si Alice jugara una permutación aleatoria intercambiable . Ahora, dado que la única permutación aleatoria intercambiable en es simplemente la distribución uniforme sobre todas las permutaciones en , la estrategia de parada de rango relativo óptima es la regla de parada óptima para el problema de la secretaria, dada anteriormente, con una probabilidad de ganar. El objetivo de Alice entonces es asegurarse de que Bob No hay nada mejor que la estrategia de parada de rango relativo.
Según las reglas del juego, la secuencia de Alice debe ser intercambiable, pero para tener un buen desempeño en el juego, Alice no debe elegirla para que sea independiente. Si Alice toma muestras de los números independientemente de alguna distribución fija, le permitiría a Bob hacerlo mejor. Para ver esto intuitivamente, imagina si , y Alice debe elegir ambos números de la distribución normal , de forma independiente. Entonces, si Bob voltea un número y ve , entonces puede voltear con bastante confianza el segundo número, y si Bob voltea un número y ve , entonces puede escoger con bastante confianza el primer número. Alice puede hacerlo mejor seleccionando aquellas que estén correlacionadas positivamente.
Entonces la declaración completamente formal es la siguiente:
¿Existe una secuencia intercambiable de variables aleatorias , tal que para cualquier regla de detención , ?
Por ejemplo , si Bob juega la estrategia óptima de parada de rango relativo, entonces Bob tiene una probabilidad de ganar de 1/2. Sorprendentemente, Alice no tiene una estrategia minimax , lo que está estrechamente relacionado con la paradoja de T. Cover [6] y la paradoja de las dos envolturas . Concretamente, Bob puede jugar esta estrategia: muestrear un número aleatorio . Si , entonces elige , si no, elige . Ahora, Bob puede ganar con una probabilidad estrictamente mayor que 1/2. Supongamos que los números de Alice son diferentes, entonces condicional a que Bob gane con probabilidad 1/2, pero condicional a que Bob gane con probabilidad 1.
Tenga en cuenta que el número aleatorio se puede muestrear a partir de cualquier distribución aleatoria, siempre que tenga una probabilidad distinta de cero.
Sin embargo, para cualquier , Alice puede construir una secuencia intercambiable tal que la probabilidad de ganar de Bob sea como máximo . [1]
Pero para , la respuesta es sí: Alice puede elegir números aleatorios (que son variables aleatorias dependientes) de tal manera que Bob no puede jugar mejor que usando la estrategia clásica de parada basada en los rangos relativos. [7]
El resto del artículo trata nuevamente del problema de la secretaria para un número conocido de solicitantes.
Stein, Seale y Rapoport (2003) derivaron las probabilidades de éxito esperadas para varias heurísticas psicológicamente plausibles que podrían emplearse en el problema de la secretaria. Las heurísticas que examinaron fueron:
Cada heurística tiene un único parámetro y . La figura (que se muestra a la derecha) muestra las probabilidades de éxito esperadas para cada heurística como una función de y para problemas con n = 80.
Encontrar al mejor candidato puede parecer un objetivo bastante estricto. Se puede imaginar que el entrevistador preferiría contratar a un solicitante de mayor valor que a uno de menor valor, y no preocuparse sólo por conseguir lo mejor. Es decir, el entrevistador obtendrá algún valor al seleccionar un solicitante que no es necesariamente el mejor, y el valor derivado aumenta con el valor del candidato seleccionado.
Para modelar este problema, supongamos que los solicitantes tienen valores "verdaderos" que son variables aleatorias X extraídas de una distribución uniforme en [0, 1]. De manera similar al problema clásico descrito anteriormente, el entrevistador solo observa si cada solicitante es el mejor hasta el momento (un candidato), debe aceptar o rechazar a cada uno en el momento y debe aceptar al último si lo alcanzan. (Para ser claros, el entrevistador no conoce el rango relativo real de cada solicitante. Sólo aprende si el solicitante tiene el rango relativo 1). Sin embargo, en esta versión la recompensa viene dada por el valor real del solicitante seleccionado. Por ejemplo, si selecciona un solicitante cuyo valor real es 0,8, ganará 0,8. El objetivo del entrevistador es maximizar el valor esperado del solicitante seleccionado.
Dado que los valores del solicitante iid se obtienen de una distribución uniforme en [0, 1], el valor esperado del t ésimo solicitante dado que está dado por
Como en el problema clásico, la política óptima viene dada por un umbral, que para este problema denotaremos por , en el cual el entrevistador debería comenzar a aceptar candidatos. Bearden demostró que c es o . [8] (De hecho, lo que sea más cercano a .) Esto se desprende del hecho de que, dado un problema con los solicitantes, la recompensa esperada para algún umbral arbitrario es
Derivando con respecto a c , se obtiene
Dado que para todos los valores permitidos de , encontramos que se maximiza en . Dado que V es convexo en , el umbral óptimo con valores enteros debe ser o . Por lo tanto, para la mayoría de los valores, el entrevistador comenzará a aceptar solicitantes antes en la versión de pago cardinal que en la versión clásica, donde el objetivo es seleccionar al mejor solicitante. Tenga en cuenta que este no es un resultado asintótico: es válido para todos . Sin embargo, esta no es la política óptima para maximizar el valor esperado de una distribución conocida. En el caso de una distribución conocida, el juego óptimo se puede calcular mediante programación dinámica.
Una forma más general de este problema introducida por Palley y Kremer (2014) [9] supone que a medida que llega cada nuevo solicitante, el entrevistador observa su clasificación en relación con todos los solicitantes que han sido observados anteriormente. Este modelo es consistente con la noción de que un entrevistador aprende a medida que continúa el proceso de búsqueda acumulando un conjunto de puntos de datos pasados que puede utilizar para evaluar nuevos candidatos a medida que llegan. Un beneficio de este llamado modelo de información parcial es que las decisiones y los resultados obtenidos dada la información de rango relativo se pueden comparar directamente con las decisiones y resultados óptimos correspondientes si al entrevistador se le hubiera dado información completa sobre el valor de cada solicitante. Este problema de información completa, en el que los solicitantes se seleccionan independientemente de una distribución conocida y el entrevistador busca maximizar el valor esperado del solicitante seleccionado, fue resuelto originalmente por Moser (1956), [10] Sakaguchi (1961), [11] y Karlin (1962).
Existen varias variantes del problema de la secretaria que también tienen soluciones sencillas y elegantes.
Una variante reemplaza el deseo de elegir lo mejor por el deseo de elegir lo segundo mejor. [12] [13] [14] Robert J. Vanderbei llama a esto el problema del "postdoctorado", argumentando que los "mejores" irán a Harvard. Para este problema, la probabilidad de éxito para un número par de solicitantes es exactamente . Esta probabilidad tiende a 1/4 cuando n tiende a infinito, lo que ilustra el hecho de que es más fácil elegir el mejor que el segundo mejor.
Considere el problema de elegir las k mejores secretarias entre n candidatos, utilizando k intentos.
En general, el método de decisión óptimo comienza observando a los candidatos sin elegir a ninguno de ellos, luego elige a todos los candidatos que sean mejores que los primeros candidatos hasta que nos quedemos sin candidatos o selecciones. Si se mantiene constante mientras , entonces la probabilidad de éxito converge a . [15] Según Vanderbei 1980, si , entonces la probabilidad de éxito es .
En esta variante, al jugador se le permiten opciones y gana si alguna de las opciones es la mejor. Una estrategia óptima para este problema pertenece a la clase de estrategias definidas por un conjunto de números umbral , donde .
Específicamente, imagine que tiene cartas de aceptación etiquetadas desde hasta . Tendría oficiales de solicitud, cada uno con una letra. Continúa entrevistando a los candidatos y clasificándolos en un cuadro que todos los funcionarios de solicitudes pueden ver. Ahora el oficial enviaría su carta de aceptación al primer candidato que sea mejor que todos los candidatos . (Las cartas de aceptación no enviadas se entregan por defecto a los últimos solicitantes, al igual que en el problema estándar de secretaria) .
En el límite, cada uno , para algún número racional . [17]
Cuando , la probabilidad de ganar converge a . De manera más general, para números enteros positivos , la probabilidad de ganar converge a , donde . [17]
[16] calculado hasta , con .
Matsui & Ano 2016 dieron un algoritmo general. Por ejemplo, .
Los psicólogos y economistas experimentales han estudiado el comportamiento de decisión de personas reales en situaciones problemáticas de secretaria. [18] En gran parte, este trabajo ha demostrado que las personas tienden a dejar de buscar demasiado pronto. Esto puede explicarse, al menos en parte, por el costo de evaluar a los candidatos. En entornos del mundo real, esto podría sugerir que las personas no buscan lo suficiente cuando se enfrentan a problemas en los que las alternativas de decisión se encuentran secuencialmente. Por ejemplo, al intentar decidir en qué gasolinera de una carretera detenerse para repostar, es posible que las personas no busquen lo suficiente antes de detenerse. De ser cierto, entonces tenderían a pagar más por la gasolina que si hubieran buscado por más tiempo. Lo mismo puede ocurrir cuando la gente busca billetes de avión en línea. La investigación experimental sobre problemas como el problema de la secretaria a veces se denomina investigación de operaciones conductuales .
Si bien existe un cuerpo sustancial de investigación en neurociencia sobre la integración de información, o la representación de creencias, en tareas de toma de decisiones perceptuales que utilizan sujetos animales [19] [20] y humanos, [21] se sabe relativamente poco sobre cómo se toma la decisión. se llega a dejar de recopilar información.
Los investigadores han estudiado las bases neuronales para resolver el problema de la secretaria en voluntarios sanos mediante resonancia magnética funcional . [22] Se utilizó un proceso de decisión de Markov (MDP) para cuantificar el valor de continuar buscando versus comprometerse con la opción actual. Las decisiones de tomar o rechazar una opción involucraron las cortezas prefrontales parietales y dorsolaterales , así como el cuerpo estriado ventral , la ínsula anterior y el cingulado anterior . Por lo tanto, las regiones del cerebro previamente implicadas en la integración de evidencia y la representación de recompensas codifican cruces de umbrales que desencadenan decisiones para comprometerse con una elección.
El problema de la secretaria fue aparentemente introducido en 1949 por Merrill M. Flood , quien lo llamó el problema de la prometida en una conferencia que dio ese año. Se refirió a él varias veces durante la década de 1950, por ejemplo, en una conferencia en Purdue el 9 de mayo de 1958, y finalmente se hizo ampliamente conocido en el folklore, aunque no se publicó nada en ese momento. En 1958 envió una carta a Leonard Gillman , con copias a una docena de amigos, entre ellos Samuel Karlin y J. Robbins, esbozando una prueba de la estrategia óptima, con un apéndice de R. Palermo que demostró que todas las estrategias están dominadas por una estrategia de la forma "rechazar incondicionalmente la primera p , luego aceptar al siguiente candidato que sea mejor". [23]
Al parecer, la primera publicación fue de Martin Gardner en Scientific American, febrero de 1960. Se había enterado de ello por John H. Fox Jr. y L. Gerald Marnie, quienes de forma independiente habían ideado un problema equivalente en 1958; Lo llamaron el "juego de googol". Fox y Marnie no conocían la solución óptima; Gardner pidió consejo a Leo Moser , quien (junto con J.R. Pounder) proporcionó un análisis correcto para su publicación en la revista. Poco después, varios matemáticos escribieron a Gardner para contarle sobre el problema equivalente que habían escuchado a través de los rumores, todo lo cual probablemente se remonta al trabajo original de Flood. [24]
La ley 1/ e de mejor elección se debe a F. Thomas Bruss . [25]
Ferguson tiene una extensa bibliografía y señala que un problema similar (pero diferente) había sido considerado por Arthur Cayley en 1875 e incluso por Johannes Kepler mucho antes, quien pasó dos años investigando a 11 candidatos al matrimonio durante 1611-1613 después de la muerte. de su primera esposa. [26]
El problema de la secretaria se puede generalizar al caso en que hay varios trabajos diferentes. Nuevamente, los solicitantes llegan en orden aleatorio. Cuando llega un candidato, revela un conjunto de números no negativos. Cada valor especifica su calificación para uno de los trabajos. El administrador no sólo tiene que decidir si acepta o no a la solicitante sino que, en caso afirmativo, también tiene que asignarla permanentemente a uno de los puestos de trabajo. El objetivo es encontrar una tarea donde la suma de calificaciones sea la mayor posible. Este problema es idéntico a encontrar una coincidencia de peso máximo en un gráfico bipartito ponderado por bordes donde los nodos de un lado llegan en línea en orden aleatorio. Por tanto, se trata de un caso especial del problema de emparejamiento bipartito en línea .
Mediante una generalización del algoritmo clásico para el problema de la secretaria, es posible obtener una asignación en la que la suma esperada de calificaciones sea sólo un factor menor que una asignación óptima (fuera de línea). [27]
{{cite journal}}
: CS1 maint: date and year (link){{cite press release}}
: CS1 maint: location (link)importar numpy como np importar pandas como pd# Defina la función para la cual desea encontrar la función de definición máxima ( r , n ): si r == 1 : devuelve 0, de lo contrario : devuelve ( r - 1 ) / n * np . suma ([ 1 / ( i - 1 ) para i en el rango ( r , n + 1 )]) # Definir una función para resolver el problema para un n específico resolver ( n ): valores = [ func ( r , n ) para r en el rango ( 1 , n + 1 ) ] r_max = np . argmax ( valores ) + 1 devuelve r_max , valores [ r_max - 1 ] # Definir una función para imprimir los resultados como una tabla Markdown def print_table ( n_max ): # Preparar datos para la tabla data = [ solve ( n ) for n in range ( 1 , n_max + 1 )] df = pd . Marco de datos ( datos , columnas = [ 'r' , 'Valor máximo' ], índice = rango ( 1 , n_max + 1 )) df . índice . nombre = 'n' # Convierta el DataFrame a Markdown e imprima print ( df . transpose () . to_markdown ())# Imprime la tabla para n del 1 al 10 print_table ( 10 )