stringtranslate.com

El problema de los tres prisioneros

El problema de los tres prisioneros apareció en la columna " Juegos matemáticos " de Martin Gardner en Scientific American en 1959. [1] [2] Es matemáticamente equivalente al problema de Monty Hall en el que el coche y la cabra se reemplazan respectivamente por libertad y ejecución. [3]

Problema

Tres prisioneros, A, B y C, están en celdas separadas y condenados a muerte. El gobernador ha seleccionado al azar a uno de ellos para que sea indultado. El director sabe cuál es el indultado, pero no puede decirlo. El prisionero A ruega al alcaide que le haga saber la identidad de uno de los dos que van a ser ejecutados. "Si B va a ser perdonado, dame el nombre de C. Si C va a ser perdonado, dame el nombre de B. Y si voy a ser perdonado, lanza una moneda en secreto para decidir si nombrar a B o C".

El director le dice a A que B va a ser ejecutado. El prisionero A está contento porque cree que su probabilidad de sobrevivir ha aumentado de1/3a1/2, como ocurre ahora entre él y C. El prisionero A le cuenta la noticia en secreto a C, quien razona que las posibilidades de que A sea indultado no cambian en1/3, pero está contento porque su propia oportunidad ha llegado a2/3. ¿Qué prisionero tiene razón?

Solución

La respuesta es que el prisionero A no obtuvo ninguna información sobre su propio destino, puesto que ya sabía que el alcaide le daría el nombre de otra persona. El prisionero A, antes de escuchar al director, estima que sus posibilidades de ser indultado son1/3, lo mismo que B y C. Como el director dice que B será ejecutado, es porque C será indultado (1/3oportunidad), o A será indultado (1/3oportunidad) y la moneda para decidir si nombrar B o C que lanzó el alcaide salió B (1/2oportunidad; para un general1/2×1/3=1/6posibilidad de que B haya sido nombrado porque A será indultado). Por lo tanto, después de enterarse de que B será ejecutado, la estimación de las posibilidades de A de ser indultado es la mitad que la de C. Esto significa que sus posibilidades de ser indultado, ahora sabiendo que B no lo es, nuevamente son1/3, pero C tiene un2/3posibilidades de ser indultado.

Mesa

La explicación anterior se puede resumir en la siguiente tabla. Cuando A le pregunta al alcaide, él sólo puede responder a B o C para ser ejecutado (o "no perdonado").

Como el director ha respondido que B no será indultado, la solución proviene de la segunda columna "no B". Parece que las probabilidades de que A vs. C sean indultados son 1:2.

formulación matemática

Call , y los eventos de que el prisionero correspondiente será indultado, y el evento de que el alcaide le diga a A que el prisionero B va a ser ejecutado, entonces, usando el teorema de Bayes , la probabilidad posterior de que A sea indultado es: [4]

Por otra parte, la probabilidad de que C sea indultado es:

La diferencia crucial que hace que A y C sean desiguales es que pero . Si A es indultado, el alcaide puede decirle a A que B o C deben ser ejecutados, y por tanto ; mientras que si C va a ser indultado, el director sólo puede decirle a A que B ha sido ejecutado, por lo que ...

Una explicación intuitiva

El prisionero A sólo tiene un1/3posibilidad de perdón. Saber si B o C serán ejecutados no cambia sus posibilidades. Después de escuchar que B será ejecutado, el prisionero A se da cuenta de que si él mismo no obtiene el perdón, solo debe ir a C. Eso significa que hay 2/3 de posibilidades de que C obtenga el perdón. Esto es comparable al problema de Monty Hall .

Enumeración de posibles casos.

Pueden surgir los siguientes escenarios:

  1. A es indultado y el director menciona que B será ejecutado:1/3×1/2=1/6de los casos
  2. A es indultado y el director menciona que C será ejecutado:1/3×1/2=1/6de los casos
  3. B es indultado y el director menciona que C será ejecutado:1/3de los casos
  4. C es indultado y el director menciona que B será ejecutado:1/3de los casos

Con la estipulación de que el alcaide elegirá al azar, en el1/3del momento en que A va a ser indultado, hay un1/2posibilidad de que diga B y1/2probabilidad de que diga C. Esto significa que, en general,1/6del tiempo (1/3[que A sea indultado] ×1/2[ese alcaide dice B]), el alcaide dirá B porque A será indultado, y1/6del tiempo (1/3[que A sea indultado] ×1/2[ese alcaide dice C]) dirá C porque A está siendo indultado. Esto suma el total de1/3del tiempo (1/6+1/6) A está siendo indultado, lo cual es exacto.

Ahora está claro que si el director responde B a A (1/2de todos los casos), entonces1/3del momento en que C es indultado y A seguirá siendo ejecutado (caso 4), y sólo1/6del momento en que A es indultado (caso 1). Por tanto, las posibilidades de C son (1/3)/(1/2) =2/3y las A son (1/6)/(1/2) =1/3.

La clave de este problema es que el director no puede revelar el nombre de un preso que será indultado. Si eliminamos este requisito, podemos demostrar el problema original de otra manera. El único cambio en este ejemplo es que el prisionero A le pide al director que revele el destino de uno de los otros prisioneros (sin especificar uno que será ejecutado). En este caso, el alcaide lanza una moneda y elige uno de B y C para revelar su destino. Los casos son los siguientes:

  1. A perdonado, el director dice: B ejecutado (1/6)
  2. Un guardián indultado dice: C ejecutado (1/6)
  3. B perdonado, el director dice: B perdonado (1/6)
  4. B indultado, el director dice: C ejecutado (1/6)
  5. C indultado, el director dice: B ejecutado (1/6)
  6. C perdonado, el director dice: C perdonado (1/6)

Cada escenario tiene un1/6probabilidad. El problema original de los tres prisioneros se puede ver desde esta perspectiva: el alcaide en ese problema todavía tiene estos seis casos, cada uno con un1/6probabilidad de ocurrir. Sin embargo, el director del caso original no puede revelar la suerte corrida por un prisionero indultado. Por lo tanto, en el caso 3, por ejemplo, dado que decir "B es indultado" no es una opción, el director dice en su lugar "C es ejecutado" (lo mismo que en el caso 4). Eso deja a los casos 4 y 5 cada uno con un1/3probabilidad de ocurrir y nos deja con la misma probabilidad que antes.

¿Por qué la paradoja?

La tendencia de las personas a dar la respuesta 1/2 probablemente se deba a una tendencia a ignorar el contexto que puede parecer sin impacto. Por ejemplo, la forma en que se plantea la pregunta al director puede afectar la respuesta. Esto se puede demostrar considerando un caso modificado, donde todo lo demás sobre el problema sigue siendo el mismo. [4] Utilizando el teorema de Bayes una vez más:

Sin embargo, si A simplemente pregunta si B será ejecutado y el director responde "sí", la probabilidad de que A sea indultado es:

[4]

Una suposición similar es que A planea de antemano pedirle esta información al director. Un caso similar al anterior surge si A no planea preguntarle nada al director y el director simplemente le informa que ejecutará a B. [5]

Otro supuesto que probablemente se pasa por alto es que el director tiene una elección probabilística. Definamos como la probabilidad condicional de que el director nombre a B dado que C será ejecutado. La probabilidad condicional se puede expresar entonces como: [6]

Si asumimos que , es decir, que no tomamos en cuenta que el director está haciendo una elección probabilística, entonces . Sin embargo, la realidad del problema es que el alcaide está lanzando una moneda ( ), entonces . [5]

Judea Pearl (1988) utilizó una variante de este ejemplo para demostrar que las actualizaciones de las creencias deben depender no sólo de los hechos observados sino también del experimento (es decir, la consulta) que condujo a esos hechos. [7]

Problemas y aplicaciones relacionados

Referencias

  1. ^ Gardner, Martín (octubre de 1959). "Juegos matemáticos: problemas que involucran cuestiones de probabilidad y ambigüedad". Científico americano . 201 (4): 174–182. doi : 10.1038/scientificamerican1059-174.
  2. ^ Gardner, Martín (1959). "Juegos matemáticos: cómo tres matemáticos modernos refutaron una célebre conjetura de Leonhard Euler". Científico americano . 201 (5): 188. doi : 10.1038/scientificamerican1159-181.
  3. ^ Bailey, hierba (2000). "Monty Hall utiliza una estrategia mixta". Revista Matemáticas . 73 (2): 135-141. JSTOR  2691085.
  4. ^ abc Shimojo, Shinsuke; Ichikawa, Shin'Ichi (agosto de 1990). "Razonamiento intuitivo sobre probabilidad: Análisis teóricos y experimentales del "problema de los tres presos"". Cognición . 36 (2): 205. doi :10.1016/0010-0277(89)90012-7. PMID  2752704. S2CID  45658299.
  5. ^ ab Wechsler, Sergio; Esteves, LG; Simonis, A.; Peixoto, C. (febrero de 2005). "Indiferencia, neutralidad e informatividad: generalizando la paradoja de los tres prisioneros". Síntesis . 143 (3): 255–272. doi :10.1007/s11229-005-7016-1. JSTOR  20118537. S2CID  16773272 . Consultado el 15 de diciembre de 2021 .
  6. ^ Billingsley, Patricio (1995). Probabilidad y medida . Serie Wiley en probabilidad y estadística matemática (Tercera edición de la edición original de 1979). Nueva York: John Wiley & Sons, Inc. Ejercicio 33.3, págs. 441 y 576. ISBN 0-471-00710-2. SEÑOR  1324786.
  7. ^ Perla, J. (1988). Razonamiento probabilístico en sistemas inteligentes: redes de inferencia plausible (Primera ed.). San Mateo, California: Morgan Kaufmann.

Otras lecturas