Dilema del prisionero

En el dilema del prisionero iterado, la cooperación puede obtenerse como un resultado de equilibrio.

Así, el incentivo para defraudar puede ser superado por la amenaza del castigo, lo que conduce a un resultado cooperativo.

Por desgracia para los prisioneros, esto conduce a un resultado regular, en el que ambos confiesan y ambos reciben largas condenas.

Si has tenido una oportunidad para castigar al otro jugador por confesar, entonces un resultado cooperativo puede mantenerse.

En el mismo artículo, Hofstadter también observó que la matriz de pagos del dilema del prisionero puede, de hecho, escribirse de múltiples formas, siempre que se adhiera al siguiente principio: donde T es la tentación para traicionar (esto es, lo que obtienes cuando desertas y el otro jugador coopera); R es la recompensa por la cooperación mutua; C es el castigo por la deserción mutua; y P es la paga del primo (esto es, lo que obtienes cuando cooperas y el otro jugador deserta).

Suele también cumplirse que (T + P)/2 < R, y esto se requiere en el caso iterado.

Siguiendo este principio, y simplificando el dilema del prisionero al escenario del cambio de bolsas anterior (o a un juego de dos jugadores tipo Axelrod — ver más abajo), obtendremos la siguiente matriz de pagos canónica para el dilema del prisionero, esto es, la que se suele mostrar en la literatura sobre este tema: En terminología "ganancia-ganancia" la tabla sería similar a esta: En el tratamiento del Dilema del Prisionero por lo general solo se considera una matriz con los resultados individuales o egoístas pero no con los resultados conjuntos o de bien común, esto es, la suma de los resultados individuales.

Los mensajes éticos producto de la sabiduría humana, desde los albores del hombre, son vigentes.

La ironía está en que ambos estados parecen actuar racionalmente, pero el resultado es completamente irracional.

Los dos ciclistas trabajan a menudo conjuntamente (cooperación mutua) compartiendo la pesada carga de la posición delantera, donde no se pueden refugiar del viento.

Si ninguno de los ciclistas hace un esfuerzo para permanecer delante, el pelotón les alcanzará rápidamente (deserción mutua).

Un ejemplo adicional se puede observar en las intersecciones de dos vías por donde circulan autos y donde ninguna tiene una preferencia sobre la otra: si todos los conductores colaboran y hacen turnos para pasar, la pequeña espera se justifica por el beneficio de no generar una congestión en el medio.

Por último, cuando nadie quiere colaborar y tratan de pasar primero, se genera una gran congestión donde todos pierden mucho tiempo.

Los programas que participaron variaban ampliamente en la complejidad del algoritmo: hostilidad inicial, capacidad de perdón y similares.

Usó esto para mostrar un posible mecanismo que explicase lo que antes había sido un difícil punto en la teoría de la evolución: ¿cómo puede evolucionar un comportamiento altruista desde mecanismos puramente egoístas en la selección natural?

La estrategia consiste simplemente en cooperar en la primera iteración del juego, y después de eso elegir lo que el oponente eligió la ronda anterior.

Por ejemplo, considérese una población donde todo el mundo deserta siempre, excepto por un único individuo que sigue la estrategia Toma y daca.

Esto se prueba fácilmente por inducción: El jugador A puede desertar la última ronda, ya que B no tendrá oportunidad de castigarle.

El juego se repite un número infinito de rondas, y la puntuación es la media (calculada apropiadamente).

En la suposición de que las transacciones entre dos personas que requieran confianza pueden ser modelizadas por el dilema del prisionero, el comportamiento cooperativo en poblaciones puede ser modelado por una versión para varios jugadores e iterada del juego.

Una estimación no demasiado actualizada (Grofman and Pool, 1975) sitúa el número de artículos dedicados al mismo sobre 2000.

[5]​ Estos cambios están reflejados en supresiones de actividad delta, la cual ha sido asociada al procesamiento motivacional y homeostático,[6]​ posiblemente propiciando el atajo hacia la celda (C,C) del juego.

Si no identificaban al otro algoritmo como perteneciente a la sociedad tras ver sus jugadas iniciales, todas las variantes le traicionaban siempre para bajar en lo posible su puntuación.

Existen algunas variantes del juego, con diferencias sutiles pero importantes en las matrices de pago, que se muestran a continuación: Otro importante juego de suma no nula se llama "gallina".

El sistema puede ser mantenido adecuadamente por una persona, pero ambos granjeros se benefician de ello.

A mayor confianza mayor es el pago que se genera para el segundo jugador, quien debe después decidir si corresponde la confianza con una decisión que es mutuamente benéfica para los dos.

"Amigo o enemigo" (Friend or Foe) es un juego que se está emitiendo actualmente en el canal de cable y satélite estadounidense Game Show Network.

Esto hace que "ambos desertan" sea un equilibrio neutral, comparado con el dilema del prisionero estándar.

En cierto modo, "amigo o enemigo" se encuentra entre el dilema del prisionero y gallina.

En suma, el gran número de participantes es para Parfit tanto causa como garantía de que la no cooperación sea una solución estable, y la hace permanente e inevitable (para agentes racionales que busquen satisfacer su propio interés).

¿Cooperarán los dos prisioneros para minimizar la pérdida total de libertad o uno de ellos, confiando en la cooperación del otro, lo traicionará para quedar en libertad?
Un gráfico que muestra la utilidad de cada opción.