Rompecabezas de inducción

Los acertijos de inducción son acertijos lógicos , que son ejemplos de razonamiento multiagente , donde la solución evoluciona junto con el principio de inducción . ^[1]^[2]

En un escenario de rompecabezas siempre participan varios jugadores con la misma capacidad de razonamiento, que pasan por los mismos pasos de razonamiento. Según el principio de inducción, la solución del caso más simple hace obvia la solución del siguiente caso complicado. Una vez que se resuelve el caso más simple del rompecabezas de inducción, se resuelve el rompecabezas completo.

Las características típicas de estos rompecabezas incluyen cualquier rompecabezas en el que cada participante tiene una pieza dada de información (generalmente como conocimiento común ) sobre todos los demás participantes pero no sobre sí mismos. Además, generalmente, se da algún tipo de pista para sugerir que los participantes pueden confiar en la inteligencia de los demás: son capaces de aplicar la teoría de la mente (que "cada participante sabe modus ponens " es de conocimiento común). ^[3] Además, la inacción de un participante es una comunicación no verbal de la falta de conocimiento de ese participante, que luego se convierte en conocimiento común para todos los participantes que observaron la inacción.

El rompecabezas de los niños embarrados es el rompecabezas de inducción que aparece con mayor frecuencia en la literatura científica sobre lógica epistémica . ^[4]^[5]^[6] El rompecabezas de los niños embarrados es una variante de los conocidos rompecabezas de los hombres sabios o de las esposas/maridos infieles. ^[7]

Los rompecabezas del sombrero son variaciones de los rompecabezas de inducción que datan de 1961. ^[8] En muchas variaciones, los rompecabezas del sombrero se describen en el contexto de prisioneros. ^[9]^[10] En otros casos, los rompecabezas del sombrero se describen en el contexto de hombres sabios. ^[11]^[12]

Rompecabezas de niños embarrados

Descripción

A un grupo de niños atentos se les dice que algunos de ellos tienen la cara embarrada. Cada niño puede ver la cara de los demás, pero no puede decir si la suya está embarrada. Se les dice a los niños que aquellos con la cara embarrada deben dar un paso adelante, pero cualquier niño con la cara limpia que dé un paso adelante será castigado. A la cuenta de tres, todos los niños que crean que su cara está embarrada deben dar un paso adelante simultáneamente; cualquier niño que haga señales a otro de cualquier manera será castigado. Si algún niño con la cara embarrada no ha dado un paso adelante, se repetirá el proceso. ^[4]^[5]^[13]

Solución lógica

Suponiendo que cada niño tiene (y sabe que cada uno de los otros tiene) una lógica perfecta, todos los niños con caras embarradas ( ) darán un paso adelante juntos en el turno . Los niños tienen información diferente, dependiendo de si su propia cara está embarrada o no. Cada miembro de ve caras embarradas y sabe que esos niños darán un paso adelante en su turno si son los únicos caras embarradas. Cuando eso no ocurre, cada miembro de sabe que él o ella también es miembro de , y da un paso adelante en el turno . Cada no miembro de ve caras embarradas y no esperará que nadie dé un paso adelante hasta al menos el turno . ${\estilo de visualización X}$ ${\estilo de visualización X}$ ${\estilo de visualización X}$ ${\estilo de visualización X-1}$ ${\estilo de visualización X-1}$ ${\estilo de visualización X}$ ${\estilo de visualización X}$ ${\estilo de visualización X}$ ${\estilo de visualización X}$ ${\estilo de visualización X}$ ${\estilo de visualización X}$

Supongamos que hay dos niños, Alice y Bob, y que solo Alice está sucia ( ). Alice sabe que "algunos" niños tienen la cara sucia pero que la de los demás no la tiene, lo que significa que su propia cara debe estar sucia y da un paso adelante en el primer turno. Bob, al ver la cara sucia de Alice, no tiene forma de saber en el primer turno si su propia cara está sucia o no hasta que Alice da un paso adelante (lo que indica que su propia cara debe estar limpia). Si tanto Alice como Bob están sucios ( ), cada uno está en la posición de Bob cuando : ninguno puede dar un paso adelante en el primer turno. Sin embargo, en el segundo turno Bob sabe que Alice debe haber visto que su cara está sucia (porque no dio un paso adelante en el primer turno), por lo que da un paso adelante en el segundo turno. Usando la misma lógica, Alice también da un paso adelante en el segundo turno. $X=1$ ${\estilo de visualización X=2}$ $X=1$

Supongamos que hay un tercer niño, Charlie. Si solo Alice está embarrada ( ), no verá caras embarradas y dará un paso adelante en el turno uno. Si tanto Alice como Bob están embarrados ( ), ninguno puede dar un paso adelante en el turno uno, pero cada uno sabrá en el turno dos que el otro vio una cara embarrada, que pueden ver que no es la de Charlie, por lo que su propia cara debe estar embarrada y ambos darán un paso adelante en el turno dos. Charlie, al ver dos caras embarradas, no sabe en el turno dos si su propia cara está embarrada o no hasta que Alice y Bob den un paso adelante (lo que indica que su propia cara está limpia). Si los tres están embarrados ( ), cada uno está en la posición de Charlie cuando : cuando dos personas no dan un paso adelante en el turno dos, cada uno sabe que el otro ve dos caras embarradas, lo que significa que su propia cara debe estar embarrada, y cada uno da un paso adelante en el turno tres. $X=1$ ${\estilo de visualización X=2}$ $X=3$ ${\estilo de visualización X=2}$

Se puede demostrar que los niños embarrados darán un paso adelante en el turno . ^[4]^[14] ${\estilo de visualización X}$ ${\estilo de visualización X}$

Solución de teoría de juegos

Representación del juego Muddy Children Puzzle para dos jugadores en forma ampliada . El movimiento preliminar por naturaleza está coloreado en verde. Alice está coloreada en rojo y Bob está coloreado en azul. Este juego tiene un solo equilibrio de Nash . Las acciones predichas por este equilibrio están coloreadas en negro.

El rompecabezas de los niños embarrados también se puede resolver utilizando la inducción hacia atrás de la teoría de juegos . ^[13] El rompecabezas de los niños embarrados se puede representar como un juego de forma extensiva de información imperfecta . Cada jugador tiene dos acciones: quedarse atrás y dar un paso adelante. Hay un movimiento por naturaleza al comienzo del juego, que determina los niños con y sin caras embarradas. Los niños no se comunican como en los juegos no cooperativos . Cada golpe es un movimiento simultáneo de los niños. Es un juego secuencial de duración ilimitada. La solución de la teoría de juegos necesita algunas suposiciones adicionales:

Todos los niños son racionales y la racionalidad de todos ellos es de conocimiento público . Esto significa que Alicia es racional, Alicia sabe que Bob es racional y Alicia sabe que Bob sabe que Charly es racional, y así sucesivamente, y viceversa.
Dar un paso adelante sin tener la cara embarrada conlleva una gran penalización.
Dar un paso adelante con la cara embarrada tendrá como resultado una recompensa.
Cada golpe da como resultado una penalización negativa menor, también conocida como factor de descuento, para cada niño hasta que alguno de ellos se presente. Cualquier múltiplo de la penalización menor siempre es un mal menor que la penalización mayor.

Si sólo Alice está embarrada, la última suposición hace que sea irracional que ella dude. Si Alice y Bob están embarrados, Alice sabe que la única razón de Bob para quedarse atrás después del primer golpe es el temor de recibir la gran penalización de dar un paso adelante sin la cara embarrada. En el caso de los niños embarrados, recibir la penalización menor es aún mejor que la penalización grande. ${\estilo de visualización X}$ ${\estilo de visualización X}$

Puzzle del sombrero de los Reyes Magos

Descripción

El rey convocó a los tres hombres más sabios del país a su corte para decidir quién sería su nuevo consejero. Puso un sombrero en la cabeza de cada uno de ellos, de modo que cada uno pudiera ver todos los demás sombreros, pero ninguno de ellos pudiera ver el suyo. Cada sombrero era blanco o azul. El rey dio su palabra a los sabios de que al menos uno de ellos llevaría un sombrero azul; en otras palabras, podría haber uno, dos o tres sombreros azules, pero no ninguno. El rey también anunció que el concurso sería justo para los tres hombres. A los sabios también se les prohibió hablar entre ellos. El rey declaró que el hombre que se levantara primero y anunciara correctamente el color de su propio sombrero sería su nuevo consejero. Los sabios se sentaron durante mucho tiempo antes de que uno se levantara y anunciara correctamente la respuesta. ¿Qué dijo y cómo la calculó? ^[15]

Solución

Los Reyes Magos es uno de los acertijos de inducción más sencillos y uno de los indicadores más claros del método utilizado.

Supongamos que hubiera un sombrero azul. La persona con ese sombrero vería dos sombreros blancos y, como el rey especificó que hay al menos un sombrero azul, ese sabio sabría inmediatamente el color de su sombrero. Sin embargo, los otros dos verían un sombrero azul y uno blanco y no podrían inferir inmediatamente ninguna información de sus observaciones. Por lo tanto, este escenario violaría la especificación del rey de que la competencia sería justa para ambos. Por lo tanto, debe haber al menos dos sombreros azules.
Supongamos entonces que hubiera dos sombreros azules. Cada sabio con un sombrero azul vería un sombrero azul y uno blanco. Suponiendo que ya se han dado cuenta de que no puede haber solo uno (usando el escenario anterior), sabrían que debe haber al menos dos sombreros azules y, por lo tanto, sabrían de inmediato que cada uno lleva un sombrero azul. Sin embargo, el hombre con el sombrero blanco vería dos sombreros azules y no podría inferir inmediatamente ninguna información de sus observaciones. Este escenario, entonces, también violaría la especificación de que el concurso sería justo para ambos. Por lo tanto, debe haber tres sombreros azules.

Como debe haber tres sombreros azules, el primer hombre que lo descubra se levantará y dirá azul.

Solución alternativa: Esto no requiere la regla de que el concurso sea justo para todos. Más bien se basa en el hecho de que todos son hombres sabios y que lleva algún tiempo antes de que lleguen a una solución. Solo puede haber tres escenarios: un sombrero azul, dos sombreros azules o tres sombreros azules. Si solo hubiera un sombrero azul, entonces el portador de ese sombrero vería dos sombreros blancos y sabría rápidamente que tiene que tener un sombrero azul, por lo que se pondría de pie y lo anunciaría de inmediato. Como esto no ha sucedido, entonces debe haber al menos dos sombreros azules. Si hubiera dos sombreros azules, entonces cualquiera de los que usan un sombrero azul miraría hacia el otro lado y vería un sombrero azul y un sombrero blanco, pero no sabría el color de su propio sombrero. Si el primer portador del sombrero azul supusiera que tenía un sombrero blanco, sabría que el otro portador del sombrero azul estaría viendo dos sombreros blancos y, por lo tanto, el segundo portador del sombrero azul ya se habría levantado y anunciado que usaba un sombrero azul. Por lo tanto, como esto no ha sucedido, el primer usuario del sombrero azul sabría que llevaba un sombrero azul y podría ponerse de pie y anunciarlo. Como es tan fácil resolver uno o dos sombreros azules y nadie se ha levantado rápidamente, entonces todos deben llevar sombreros azules.

El problema de Josefina

Descripción

En el Reino de Josefina, cada mujer tiene que pasar un examen de lógica antes de que se le permita casarse. ^[16] Toda mujer casada sabe acerca de la fidelidad de todos los hombres del Reino, excepto de su propio marido, y la etiqueta exige que a ninguna mujer se le diga acerca de la fidelidad de su marido. Además, un disparo en cualquier casa del Reino se oirá en cualquier otra casa. La Reina Josefina anunció que se había descubierto al menos a un hombre infiel en el Reino, y que cualquier mujer que supiera que su marido era infiel debía dispararle a la medianoche siguiente al día siguiente de descubrir su infidelidad. ¿Cómo se las arreglaban las esposas para lograr esto?

Solución

El problema de Josefina es otro buen ejemplo de un caso general.

Si sólo hay un marido infiel, entonces todas las mujeres del reino lo saben, excepto su esposa, que cree que todos son fieles. Por lo tanto, tan pronto como escucha de boca de la reina que existen hombres infieles, sabe que su marido debe ser infiel y lo mata.
Si hay dos maridos infieles, entonces ambas esposas creen que sólo hay un marido infiel (el otro). Por lo tanto, esperarán que se dé el caso anterior y que la esposa del otro marido le dispare a medianoche al día siguiente. Cuando no se oiga ningún disparo, se darán cuenta de que el caso anterior no se da , por lo que debe haber más de un marido infiel y (como saben que todos los demás son fieles) el que sobra debe ser su propio marido.
Si hay 3 maridos infieles, cada una de sus esposas cree que solo hay 2, por lo que esperarán que se aplique el caso anterior y que ambos maridos sean fusilados el segundo día. Cuando no escuchen ningún disparo, se darán cuenta de que el caso anterior no se aplica, por lo que debe haber más de 2 maridos infieles y, como antes, su propio marido es el único candidato a ser el extra.
En general, si hay n maridos infieles, cada una de sus esposas creerá que hay n-1 y esperará oír un disparo a medianoche del día n-1 . Cuando no lo hagan, sabrán que su propio marido fue el n -ésimo.

Este problema también se conoce como el problema de los maridos infieles, el problema de las esposas infieles o el problema de los niños embarrados. Es lógicamente idéntico al problema de los ojos azules .

Este problema también aparece como un problema que involucra sombreros negros y sombreros blancos en el clásico libro de texto de CL Liu 'Elementos de matemáticas discretas'. ^[17]

Alicia en la Convención de Lógicos

Descripción

En la Convención Secreta de Lógicos, el Maestro Lógico colocó una banda en la cabeza de cada asistente, de modo que todos los demás pudieran verla, pero ellos no. Había bandas de muchos colores diferentes. Todos los Lógicos se sentaron en círculo, y el Maestro les indicó que debía sonar una campana en el bosque a intervalos regulares: en el momento en que un Lógico supiera el color de su propia frente, debía irse al sonar la siguiente campana. Se les indicó que no hablaran, ni usaran un espejo o una cámara, ni evitaran usar la lógica para determinar el color de su banda. En caso de que algún impostor se hubiera infiltrado en la convención, cualquiera que no se fuera a tiempo sería expulsado bruscamente en el momento correcto. De manera similar, cualquiera que intentara irse temprano sería retenido bruscamente en su lugar y expulsado en el momento correcto. El Maestro tranquilizó al grupo afirmando que el rompecabezas no sería imposible para ningún Lógico Verdadero presente. ¿Cómo lo hicieron? ^[18]

Solución

Alicia en la convención de Lógicos es una inducción general más un salto de lógica.

Salto de lógica: cada color debe aparecer al menos dos veces alrededor del círculo. Esto se debe a que el Maestro afirmó que no sería imposible para cualquier lógico resolver el rompecabezas. Si un color existiera solo una vez alrededor del círculo, el lógico que lo llevara no tendría forma de saber que el color existía en el problema y le sería imposible responderlo.
Cada uno de los Lógicos puede mirar alrededor del círculo y contar el número de veces que ve cada color. Supongamos que usted es uno de los Lógicos y ve otro color sólo una vez. Como sabe que cada color debe existir al menos dos veces alrededor del círculo, la única explicación para un color único es que es el color de su propia banda. Por la misma razón, sólo puede haber un color único, por lo que se marcharía cuando suene la primera campana.
De la misma manera, cualquier lógico que vea otro color sólo una vez debería poder determinar su propio color y se marcharía con dignidad o sería expulsado como infiltrado. De manera equivalente, cualquier color para el cual sólo haya dos bandas de ese color será eliminado después de que suene la primera campana. A partir de entonces, deben quedar al menos tres bandas de cualquier color restante.
Supongamos que no ves ningún color una vez, pero sí ves un color dos veces. Si estas fueran las únicas bandas de ese color, entonces estos dos lógicos deberían haberse ido al sonar la primera campanada. Como no lo hicieron, eso sólo puede deberse a que tu propia banda es del mismo color, por lo que puedes irte al sonar la segunda campanada.
Por lo tanto, cada lógico observaría hasta que un grupo de un color dado que esperaba que saliera no lo hiciera. Entonces sabría que tenía ese color y se iría al sonar la siguiente campana.
Cuando sólo quedaba un color, todos los de ese color saldrían en la siguiente campana, porque sabrían que no podrían tener ningún otro color (ya que entonces les sería imposible saber su color).

Rompecabezas básico del sombrero

Descripción

Varios jugadores llevan un sombrero, que puede ser de varios colores específicos. Los jugadores pueden ver los colores de los sombreros de al menos algunos de los otros jugadores, pero no los de ellos mismos. Con una comunicación muy restringida o nula, algunos de los jugadores deben adivinar el color de su sombrero. El problema es encontrar una estrategia para que los jugadores determinen los colores de sus sombreros basándose en los sombreros que ven y en lo que hacen los otros jugadores. En algunas versiones, compiten para ser los primeros en adivinar correctamente; en otras, pueden elaborar una estrategia de antemano para cooperar y maximizar la probabilidad de acertar. ^[19]

Una variación recibió nueva publicidad como resultado de la tesis de doctorado de Todd Ebert en 1998 en la Universidad de California, Santa Bárbara . ^[20] Es una pregunta de estrategia sobre un juego cooperativo , que tiene conexiones con la teoría de codificación algebraica . ^[21]

A tres jugadores se les dice que cada uno de ellos recibirá un sombrero rojo o un sombrero azul. Deben levantar la mano si ven un sombrero rojo en otro jugador mientras están parados en un círculo uno frente al otro. El primero que adivine correctamente el color de su sombrero gana.

Los tres jugadores levantan la mano. Después de que los jugadores se hayan visto durante unos minutos sin adivinar, un jugador anuncia "Rojo" y gana. ¿Cómo lo hizo el ganador y de qué color es el sombrero de todos?

Solución

En primer lugar, si dos personas tuvieran sombreros azules, no todos habrían levantado la mano. A continuación, si el jugador 1 hubiera visto un sombrero azul en el jugador 2 y un sombrero rojo en el jugador 3, entonces el jugador 1 habría sabido inmediatamente que su propio sombrero debía ser rojo. Por lo tanto, cualquier jugador que vea un sombrero azul puede adivinar de inmediato. Finalmente, el ganador se da cuenta de que, como nadie adivina de inmediato, no debe haber sombreros azules, por lo que todos los sombreros deben ser rojos. ^[22]

En el caso en que cada jugador tenga que adivinar, pero sea libre de elegir cuándo adivinar, existe una estrategia cooperativa que permite a cada jugador adivinar correctamente a menos que todos los sombreros sean del mismo color. Cada jugador debe actuar de la siguiente manera:

Cuenta los números b de sombreros azules y r de sombreros rojos que ves.
Espere b segundos o r segundos, lo que ocurra primero.
Si nadie ha hablado todavía, adivina que tu sombrero es azul si puedes ver menos sombreros azules que sombreros rojos, o rojo si puedes ver menos sombreros rojos que sombreros azules.
Si aún no has hablado, imagina que tu sombrero es del color opuesto al de una de las primeras personas en hablar.

Supongamos que en total hay B sombreros azules y R sombreros rojos. Hay tres casos.

Si B = R, entonces los jugadores que llevan sombreros azules ven B−1 sombreros azules y B sombreros rojos, por lo que esperan B −1 segundos y luego adivinan correctamente que llevan un sombrero azul. De manera similar, los jugadores que llevan un sombrero rojo esperarán R −1 segundos antes de adivinar correctamente que llevan un sombrero rojo. Por lo tanto, todos los jugadores adivinan correctamente al mismo tiempo.

Si B < R, entonces los que llevan un sombrero azul verán B −1 sombreros azules y R sombreros rojos, mientras que los que llevan un sombrero rojo verán B sombreros azules y R −1 sombreros rojos. Como B −1 < B ≤ R −1, los jugadores que llevan un sombrero azul serán los primeros en hablar, adivinando correctamente que su sombrero es azul. Los demás jugadores adivinarán entonces correctamente que su sombrero es rojo.

El caso donde R < B es similar.

Variante de dos sombreros

Descripción

Cuatro prisioneros son arrestados por un crimen , pero el juez ofrece librarlos del castigo si pueden resolver un acertijo de lógica. ^[23]

Tres de los hombres se colocan en fila. A mira hacia la pared, B mira hacia A y C mira hacia B y A. Un cuarto hombre se coloca detrás de una pared. Los cuatro hombres llevan sombreros; hay dos sombreros negros y dos sombreros blancos, cada prisionero lleva uno de los sombreros, y cada uno de los prisioneros solo ve los sombreros que tiene frente a él, pero no los que lleva sobre sí mismo ni detrás de él. El cuarto hombre detrás de la pantalla no puede ver ni ser visto por ningún otro prisionero. No se permite la comunicación entre los prisioneros. Si algún prisionero puede averiguar de qué color es el sombrero que tiene en la cabeza con un 100% de certeza (sin adivinar), debe anunciarlo y los cuatro prisioneros quedan libres.

Solución

Los prisioneros saben que sólo hay dos sombreros de cada color. Por lo tanto, si C observa que A y B tienen sombreros del mismo color, C deducirá que su propio sombrero es del color opuesto. Sin embargo, si A y B tienen sombreros de diferentes colores, entonces C no puede decir nada. La clave es que el prisionero B, después de permitir un intervalo apropiado, y sabiendo lo que haría C, puede deducir que si C no dice nada, los sombreros de A y B deben ser diferentes; al poder ver el sombrero de A, puede deducir el color de su propio sombrero.

Al igual que muchos rompecabezas de este tipo, la solución se basa en el supuesto de que todos los participantes son lo suficientemente racionales e inteligentes como para hacer las deducciones apropiadas.

Después de resolver este rompecabezas, se puede obtener una idea de la naturaleza de la comunicación al reflexionar sobre si el silencio significativo del prisionero C viola la regla de "No comunicación" (dado que la comunicación suele definirse como la "transferencia de información"). ^{[ cita requerida ]}

Variante de tres sombreros

Descripción

En esta variante hay 3 prisioneros y 3 sombreros. A cada prisionero se le asigna un sombrero al azar, ya sea rojo o azul. Cada persona puede ver los sombreros de otros dos, pero no el suyo. Cuando se le dé una señal, cada uno debe adivinar el color de su sombrero o pasar. Ganan la liberación si al menos una persona adivinó correctamente y ninguna se equivocó (pasar no es ni correcto ni incorrecto).

Solución

Este rompecabezas no tiene una estrategia ganadora del 100%, pero se puede ganar con un 75% de posibilidades. Al considerar los colores de los sombreros como bits, este problema se puede resolver utilizando la teoría de codificación , por ejemplo, con códigos de Hamming . ^[24]

Variante de cuatro sombreros

Descripción

En una variante de este rompecabezas, los prisioneros saben que hay 2 sombreros negros y 2 sombreros blancos, y hay una pared entre A y B, pero los prisioneros B, C y D pueden ver quién está frente a ellos, es decir, D ve a B, C y la pared, B ve la pared y C ve a B y la pared. (A nuevamente no puede ser visto y solo está allí para usar uno de los sombreros negros). ¿Cómo pueden deducir los colores de todos ellos sin comunicarse?

Solución

Hay dos casos: en el caso trivial, dos de los cuatro prisioneros llevan sombreros negros. Cada uno de los otros dos prisioneros puede ver que un prisionero lleva el sombrero de un color diferente. En el caso no trivial, dos de los cuatro prisioneros llevan sombreros del mismo color, mientras que A y C llevan los sombreros negros. Después de un tiempo, los cuatro prisioneros deberían poder deducir que, como D y B no pudieron decir el color de su propio sombrero, A y C deben llevar los sombreros negros.

Variante de cinco sombreros

Descripción

En otra variante, sólo participan tres prisioneros y cinco sombreros de colores conocidos (en este ejemplo, dos negros y tres blancos). Se ordena a los tres prisioneros que se coloquen en línea recta mirando hacia el frente, con A al frente y C atrás. Se les dice que habrá dos sombreros negros y tres sombreros blancos. A continuación, se coloca un sombrero en la cabeza de cada prisionero; cada prisionero sólo puede ver los sombreros de las personas que tiene frente a él y no en el suyo propio. El primer prisionero que sea capaz de anunciar correctamente el color de su sombrero será liberado. No se permite la comunicación entre los prisioneros.

Solución

Supongamos que A lleva un sombrero negro:

Si B también usa un sombrero negro, C puede saber inmediatamente que usa un sombrero blanco después de mirar los dos sombreros negros frente a él.
Si B lleva un sombrero blanco, C no podrá distinguir el color de su sombrero (porque hay uno negro y uno blanco). Por lo tanto, B puede deducir rápidamente del sombrero negro de A y de la falta de respuesta de C que él (B) lleva un sombrero blanco.

Entonces, si A usa un sombrero negro, habrá una respuesta bastante rápida de B o C.

Supongamos que A lleva un sombrero blanco:

C no ve dos sombreros negros, por lo que no puede distinguir el color de su sombrero.
B sólo ve un sombrero blanco, por lo que no puede decir nada sobre su sombrero.

En este caso A, B y C permanecerían en silencio durante algún tiempo, hasta que A finalmente deduce que debe tener un sombrero blanco porque C y B han permanecido en silencio durante algún tiempo.

Como se mencionó, en total hay tres sombreros blancos y dos sombreros negros, y los tres prisioneros lo saben. En este acertijo, puedes asumir que los tres prisioneros son muy listos y astutos. Si C no pudo adivinar el color de su propio sombrero es porque vio dos sombreros blancos o uno de cada color. Si vio dos sombreros negros, podría haber deducido que llevaba un sombrero blanco.

Variante de diez sombreros

Descripción

En esta variante hay 10 prisioneros y 10 sombreros. A cada prisionero se le asigna un sombrero al azar, ya sea rojo o azul, pero los prisioneros desconocen el número de cada color. Los prisioneros se alinean en una sola fila, de modo que cada uno puede ver los sombreros que tiene delante, pero no detrás. Empezando por el prisionero que está al final de la fila y avanzando hacia adelante, cada uno, por turno, debe decir solo una palabra que debe ser "rojo" o "azul". Si la palabra coincide con el color de su sombrero, son liberados; si no, son asesinados en el acto. Un guardia comprensivo les advierte de esta prueba una hora antes y les dice que pueden formular un plan según el cual, siguiendo las reglas establecidas, 9 de los 10 prisioneros sobrevivirán con seguridad y 1 tendrá una probabilidad de supervivencia del 50/50. ¿Cuál es el plan para lograr el objetivo?

Solución

Los prisioneros acuerdan que si el primer prisionero ve un número impar de sombreros rojos, dirá "rojo". De esta manera, los otros nueve prisioneros sabrán el color de su sombrero después de que el prisionero que está detrás de ellos responda.

Variante de diez sombreros sin audición

Descripción

Como antes, hay 10 prisioneros y 10 sombreros. A cada prisionero se le asigna un sombrero al azar, ya sea rojo o azul, pero los prisioneros desconocen el número de cada color. Los prisioneros se distribuyen en la habitación de tal manera que puedan ver los sombreros de los demás, pero no el suyo. Ahora, cada uno, simultáneamente, debe decir una sola palabra que debe ser "rojo" o "azul". Si la palabra coincide con el color de su sombrero, son liberados, y si suficientes prisioneros recuperan su libertad, pueden rescatar a los demás. Un guardia comprensivo les advierte de esta prueba una hora antes. Si pueden formular un plan siguiendo las reglas establecidas, 5 de los 10 prisioneros serán liberados definitivamente y podrán rescatar a los demás. ¿Cuál es el plan para lograr el objetivo?

Solución

Los prisioneros se forman en parejas. En una pareja (A, B) de prisioneros, A dice el color que ve en la cabeza de B, quien dice el color opuesto que ve en la cabeza de A. Luego, si ambos usan sombreros del mismo color, A queda libre (y B no), si los colores son diferentes, B queda libre (y A no). En total, 5 prisioneros responden correctamente y 5 no. Esto supone que la pareja puede comunicarse quién es A y quién es B, lo que puede no estar permitido.

Otra posibilidad es que los prisioneros formen dos grupos de 5. Un grupo supone que el número de sombreros rojos es par, el otro supone que hay un número impar de sombreros rojos. De manera similar a la variante con la audición, pueden deducir el color de su sombrero a partir de esta suposición. Exactamente un grupo tendrá razón, por lo que 5 prisioneros responden correctamente y 5 no.

Obsérvese que los prisioneros no pueden encontrar una estrategia que garantice la liberación de más de 5 prisioneros. De hecho, para un solo prisionero, hay tantas distribuciones de colores de sombreros donde dice la respuesta correcta como donde no la dice. Por lo tanto, hay tantas distribuciones de colores de sombreros donde 6 o más prisioneros dicen la respuesta correcta que donde 4 o menos lo hacen.

Variante de sombrero infinito contable sin audición

Descripción

En esta variante, un número infinito de prisioneros, cada uno con un sombrero rojo o azul desconocido y asignado aleatoriamente, se alinean en una sola fila. Cada prisionero está de espaldas al principio de la fila y puede ver todos los sombreros que tiene delante y ninguno de los que tiene detrás. Empezando desde el principio de la fila, cada prisionero debe identificar correctamente el color de su sombrero o será asesinado en el acto. Como antes, los prisioneros tienen la oportunidad de conocerse de antemano, pero a diferencia de antes, una vez en la fila, ningún prisionero puede escuchar lo que dicen los demás prisioneros. La pregunta es: ¿hay alguna manera de garantizar que solo mueran un número finito de prisioneros?

Solución

Si se acepta el axioma de elección y se supone que cada prisionero tiene la capacidad (irrealista) de memorizar una cantidad infinita e incontable de información y realizar cálculos con una complejidad computacional infinita e incontable , la respuesta es sí. De hecho, incluso si permitimos una cantidad incontable de colores diferentes para los sombreros y una cantidad incontable de prisioneros, el axioma de elección proporciona una solución que garantiza que solo un número finito de prisioneros debe morir siempre que cada prisionero pueda ver los sombreros de todos los demás prisioneros (no solo los que están delante de ellos en una fila), o al menos que cada prisionero pueda ver todos los sombreros excepto un número finito. La solución para el caso de dos colores es la siguiente, y la solución para el caso de colores infinitos e incontables es esencialmente la misma:

Los prisioneros que están en la fila forman una secuencia de 0 y 1, donde 0 representa el azul y 1 el rojo. Antes de que los pongan en la fila, los prisioneros definen la siguiente relación de equivalencia sobre todas las posibles secuencias en las que podrían ser colocados: Dos secuencias son equivalentes si son idénticas después de un número finito de entradas. A partir de esta relación de equivalencia, los prisioneros obtienen una colección de clases de equivalencia. Suponiendo el axioma de elección, existe un conjunto de secuencias representativas, una de cada clase de equivalencia. ( Casi todos los valores específicos son imposibles de calcular, pero el axioma de elección implica que existe algún conjunto de valores, por lo que suponemos que los prisioneros tienen acceso a un oráculo ).

Cuando se los pone en su fila, cada prisionero puede ver todos los sombreros excepto un número finito y, por lo tanto, puede ver a qué clase de equivalencia pertenece la secuencia real de sombreros. (Esto supone que cada prisionero puede realizar un número infinito incontable de comparaciones para encontrar una coincidencia, y que cada comparación de clase requiere un número infinito incontable de comparaciones de sombreros individuales). Luego proceden a adivinar el color de su sombrero como si estuvieran en la secuencia representativa de la clase de equivalencia apropiada. Debido a que la secuencia real y la secuencia representativa están en la misma clase de equivalencia, sus entradas son las mismas después de un número finito N de prisioneros. Todos los prisioneros después de estos primeros N prisioneros se salvan.

Como los prisioneros no tienen información sobre el color de su propio sombrero y harían la misma suposición sea cual sea el color, cada prisionero tiene un 50% de posibilidades de ser asesinado. Puede parecer paradójico que un número infinito de prisioneros tengan la misma probabilidad de ser asesinados y, sin embargo, sea seguro que solo un número finito de prisioneros sean asesinados. La solución a esta paradoja radica en el hecho de que la función empleada para determinar la suposición de cada prisionero no es Función medible .

Para ver esto, considere el caso de cero prisioneros asesinados. Esto sucede si y solo si la secuencia real es una de las secuencias representativas seleccionadas. Si las secuencias de 0 y 1 se consideran como representaciones binarias de un número real entre 0 y 1, las secuencias representativas forman un conjunto no medible . (Este conjunto es similar a un conjunto de Vitali , la única diferencia es que las clases de equivalencia se forman con respecto a números con representaciones binarias finitas en lugar de todos los números racionales). Por lo tanto, no se puede asignar ninguna probabilidad al evento de cero prisioneros asesinados. El argumento es similar para otros números finitos de prisioneros asesinados, correspondientes a un número finito de variaciones de cada representante.

Problema del sombrero infinito contable con la audición

Descripción

Esta variante es igual a la anterior, salvo que los prisioneros pueden oír los colores que dicen los demás prisioneros. La pregunta es: ¿cuál es la estrategia óptima para los prisioneros de modo que mueran la menor cantidad posible de ellos en el peor de los casos?

Solución

Resulta que, si se permite a los prisioneros escuchar los colores gritados por los otros prisioneros, es posible garantizar la vida de todos los prisioneros excepto del primero, que muere con una probabilidad del 50%.

Para ello, definimos la misma relación de equivalencia que antes y seleccionamos de nuevo una secuencia representativa de cada clase de equivalencia. Ahora, etiquetamos cada secuencia de cada clase con un 0 o un 1. Primero, etiquetamos la secuencia representativa con un 0. Luego, etiquetamos cualquier secuencia que difiera de la secuencia representativa en un número par de lugares con un 0, y cualquier secuencia que difiera de la secuencia representativa en un número impar de lugares con un 1. De esta manera, hemos etiquetado cada posible secuencia infinita con un 0 o un 1 con la importante propiedad de que cualesquiera dos secuencias que difieren en un solo dígito tienen etiquetas opuestas.

Ahora bien, cuando el alcaide le pide a la primera persona que diga un color, o en nuestra nueva interpretación, un 0 o un 1, simplemente dice en voz alta la etiqueta de la secuencia que ve. Dada esta información, todos los que están después de él pueden determinar exactamente cuál es su propio color de sombrero. La segunda persona ve todo menos el primer dígito de la secuencia que ve la primera persona. Por lo tanto, hasta donde sabe, hay dos posibles secuencias que la primera persona podría haber etiquetado: una que comience con un 0 y otra que comience con un 1. Debido a nuestro esquema de etiquetado, estas dos secuencias recibirían etiquetas opuestas, por lo que, en función de lo que diga la primera persona, la segunda persona puede determinar cuál de las dos posibles cadenas vio la primera persona y, por lo tanto, puede determinar su propio color de sombrero. De manera similar, cada persona posterior en la fila conoce todos los dígitos de la secuencia excepto el correspondiente a su propio color de sombrero. Conoce a los que están antes de él porque fueron nombrados, y a los que están después de él porque puede verlos. Con esta información, puede usar la etiqueta nombrada por la primera persona para determinar su propio color de sombrero. De esta forma, todos, excepto la primera persona, siempre aciertan.

La versión de Ebert y los códigos de Hamming

Descripción

La versión de Ebert del problema establece que todos los jugadores que adivinen deben hacerlo en el mismo momento predeterminado, pero que no todos los jugadores están obligados a hacerlo. Ahora bien, no todos los jugadores pueden adivinar correctamente, por lo que los jugadores ganan si al menos un jugador adivina y todos los que adivinan lo hacen correctamente. ¿Cómo pueden los jugadores maximizar sus posibilidades de ganar?

Solución

Una estrategia para resolver esta versión del problema del sombrero emplea los códigos de Hamming , que se utilizan habitualmente para detectar y corregir errores en la transmisión de datos . La probabilidad de ganar será mucho mayor que el 50%, dependiendo del número de jugadores en la configuración del rompecabezas: por ejemplo, una probabilidad de ganar del 87,5% para 7 jugadores.

Se pueden aplicar estrategias similares a equipos de tamaño N = 2 ^k −1 y lograr una tasa de victorias (2 ^k -1)/2 ^k . Por lo tanto, la estrategia del código de Hamming produce mayores tasas de victorias para valores mayores de N .

En esta versión del problema, cada intento individual tiene un 50% de posibilidades de ser correcto. Sin embargo, el método del código de Hamming funciona concentrando los intentos erróneos en determinadas distribuciones de sombreros. En algunos casos, todos los jugadores adivinarán incorrectamente, mientras que en otros casos, solo un jugador adivinará, pero correctamente. Si bien la mitad de todos los intentos siguen siendo incorrectos, esto hace que los jugadores ganen más del 50% de las veces.

Un ejemplo sencillo de este tipo de solución con tres jugadores es ilustrativo. Con tres jugadores, hay ocho posibilidades; en dos de ellas, todos los jugadores tienen el sombrero del mismo color, y en las otras seis, dos jugadores tienen un color y el otro jugador tiene el otro color.

Los jugadores pueden garantizar que ganen en los últimos casos (75% de las veces) con la siguiente estrategia:

Cualquier jugador que observe dos sombreros de dos colores diferentes permanece en silencio.
Cualquier jugador que observe dos sombreros del mismo color adivina el color opuesto.

En los dos casos en que los tres jugadores tienen el mismo color de sombrero, todos adivinarán incorrectamente, pero en los otros seis casos, sólo un jugador adivinará, y correctamente, que su sombrero es el opuesto al de sus compañeros. ^[25]

Véase también

Referencias

^ Stuhlmüller, A.; Goodman, ND (junio de 2014). "Razonamiento sobre razonamiento mediante condicionamiento anidado: modelado de la teoría de la mente con programas probabilísticos". Investigación de sistemas cognitivos . 28 : 80–99. CiteSeerX 10.1.1.361.5043 . doi :10.1016/j.cogsys.2013.07.003. S2CID 7602205.
^ Lucci, Stephen; Kopec, Danny (2015). Inteligencia artificial en el siglo XXI. Stylus Publishing, LLC. ISBN 978-1-944534-53-0.
^ Tagiew, Rustam (2008). "El escenario más simple para el modelado mutuo anidado en la interacción hombre-máquina". KI 2008: Avances en inteligencia artificial . Apuntes de clase en informática. Vol. 5243. Springer. págs. 364–371. doi :10.1007/978-3-540-85845-4_45. ISBN . 978-3-540-85844-7.
^ abc Fagin, Ronald ; Halpern, Joseph Y. ; Moses, Yoram; Vardi, Moshe Y. (marzo de 1999). "Revisitando el conocimiento común". Anales de lógica pura y aplicada . 96 (1–3): 89–105. arXiv : cs/9809003 . doi :10.1016/S0168-0072(98)00033-5. S2CID 59551.
^ ab van der Hoek, Wiebe; van Ditmarsch, Hans (2007). Lógica epistémica dinámica. Saltador. ISBN 978-1-4020-5838-7.
^ "Google Scholar "Muddy Children Puzzle"". scholar.google.com . Consultado el 11 de febrero de 2020 .
^ Fagin, Ronald ; Halpern, Joseph Y. ; Moses, Yoram; Vardi, Moshe (2004). Razonamiento sobre el conocimiento . MIT Press. ISBN 978-0262562003.
^ Hardin, Christopher; Taylor, Alan D. (2008). "Una introducción a los problemas de sombrero infinito" (PDF) . Mathematical Intelligencer . 30 (4): 20–25. doi :10.1007/BF03038092. S2CID 24613564. Archivado desde el original (PDF) el 2012-04-05.
^ "Los sombreros de los prisioneros: acertijos y adivinanzas". www.puzzlesandriddles.com .
^ "Rompecabezas de prisioneros y sombreros". CrazyforCode . 13 de agosto de 2013.
^ "Los robots pasan el 'rompecabezas de los sabios' para demostrar un grado de autoconciencia". techxplore.com .
^ Leite, João (2005). Computational Logic in Multi-Agent Systems: 5th International Workshop, CLIMA V, Lisboa, Portugal, 29-30 de septiembre de 2004, Artículos seleccionados y por invitación revisados. Springer Science & Business Media. ISBN 978-3-540-28060-6.
^ ab Tagiew, Rustam (2011). Strategische Interaktion realer Agenten Ganzheitliche Konzeptualisierung und Softwarekomponenten einer interdisziplinären Forschungsinfrastruktur (en alemán). Südwestdeutscher Verlag für Hochschulschriften. págs. 90–95. ISBN 978-3838125121.
^ Weber, Roberto A. (1 de diciembre de 2001). "Comportamiento y aprendizaje en el juego de las "caras sucias"". Economía experimental . 4 (3): 229–242. doi :10.1023/A:1013217320474. ISSN 1573-6938. S2CID 123369018.
^ Huth, Michael; Ryan, Mark (26 de agosto de 2004). Lógica en informática: modelado y razonamiento sobre sistemas . Cambridge : Cambridge University Press . ISBN 978-0-521-54310-1.
^ Moses, Yoram; Dolet, Danny; HaIpern, Joseph Y. (1985). "Cheating husbands and other stories (Preliminary version)" (PDF) . Actas del cuarto simposio anual de la ACM sobre Principios de computación distribuida - PODC '85 . págs. 215–223. doi :10.1145/323596.323616. ISBN 0897911687. Número de identificación del sujeto 2519017.
^ Liu, Chung Laung (1985). Elementos de Matemáticas Discretas (2 ed.). McGraw-Hil. págs. 16-17. ISBN 9780071005449.
^ Charatonik, Włodzimierz J. (2010). «Alicia en la convención de lógicos» (PDF) . Universidad de Ciencia y Tecnología de Missouri . Archivado desde el original (PDF) el 5 de julio de 2010. Consultado el 31 de julio de 2015 .
^ Brown, Ezra; Tanton, James (abril de 2009). "A Dozen Hat Problems" (PDF) . Math Horizons . 16 (4): 22–25. doi :10.1080/10724117.2009.11974827. S2CID 123345434. Archivado desde el original (PDF) el 2017-07-17 . Consultado el 2011-10-08 .
^ Winkler, Peter (2004). Rompecabezas matemáticos: una colección para entendidos . AK Peters. págs. 125-126. rompecabezas de sombrero todd.
^ Biografía de Todd Ebert en la Universidad Estatal de California, Long Beach
^ Gardner, Martin (1978). ¡Ajá! Insight. Scientific American. pág. 102. ISBN 0-89454-001-7. Consultado el 8 de octubre de 2011 .
^ "US Nuclear Regulatory Commission Vol. 1 No. 4" (PDF) . Comisión Reguladora Nuclear . 2011 . Consultado el 17 de octubre de 2024 .
^ Guo, Wenge; Kasala, Subramanyam; Rao, M. Bhaskara; Tucker, Brian. "El problema del sombrero y algunas variaciones" (PDF) .
^ Havil, Julian (2008). ¿Imposible? Soluciones sorprendentes a enigmas contraintuitivos. Princeton University Press. pp. 50–59. ISBN 9780691131313. Consultado el 8 de octubre de 2011 .