El dilema del prisionero

El dilema del prisionero es un experimento mental de teoría de juegos que involucra a dos agentes racionales , cada uno de los cuales puede cooperar para beneficio mutuo o traicionar a su socio ("defecto") para obtener una recompensa individual. Este dilema fue planteado originalmente por Merrill Flood y Melvin Dresher en 1950 mientras trabajaban en RAND Corporation . ^[1] Albert W. Tucker posteriormente formalizó el juego estructurando las recompensas en términos de sentencias de prisión y lo llamó el "dilema del prisionero". ^[2]

El dilema del prisionero modela muchas situaciones del mundo real que implican un comportamiento estratégico. En un uso informal, la etiqueta "dilema del prisionero" puede aplicarse a cualquier situación en la que dos entidades podrían obtener importantes beneficios de cooperar o sufrir por no hacerlo, pero les resulta difícil o costoso coordinar sus actividades.

Premisa

William Poundstone describió esta "versión típica contemporánea" del juego en su libro de 1993 El dilema del prisionero :

Dos miembros de una banda criminal son arrestados y encarcelados. Cada prisionero está en régimen de aislamiento sin posibilidad de hablar o intercambiar mensajes con el otro. La policía admite que no tiene pruebas suficientes para condenar a la pareja por el cargo principal. Planean sentenciar a ambos a un año de prisión por un cargo menor. Al mismo tiempo, la policía ofrece a cada prisionero un trato fáustico . Si testifica contra su socio, quedará en libertad mientras que el socio recibirá tres años de prisión por el cargo principal. Oh, sí, hay una trampa... Si ambos prisioneros testifican entre sí, ambos serán sentenciados a dos años de cárcel. A los prisioneros se les da un poco de tiempo para reflexionar sobre esto, pero en ningún caso ninguno de los dos puede saber lo que el otro ha decidido hasta que haya tomado su decisión irrevocablemente. A cada uno se le informa que al otro prisionero se le ofrece el mismo trato. A cada prisionero sólo le preocupa su propio bienestar, es decir, minimizar su propia pena de prisión. ^[3]

Esto lleva a cuatro resultados posibles diferentes para los prisioneros A y B:

Si A y B guardan silencio, cada uno cumplirá un año de prisión.
Si A testifica contra B pero B permanece en silencio, A será puesto en libertad mientras B cumple tres años de prisión.
Si A permanece en silencio pero B testifica contra A, A cumplirá tres años de prisión y B quedará en libertad.
Si A y B testifican entre sí, cumplirán una condena de dos años cada uno.

Estrategia para el dilema del prisionero

Dos presos están separados en habitaciones individuales y no pueden comunicarse entre sí. Se supone que ambos prisioneros entienden la naturaleza del juego, no tienen lealtad mutua y no tendrán oportunidad de retribución o recompensa fuera del juego. El juego normal se muestra a continuación: ^[4]

Independientemente de lo que decida el otro, cada prisionero obtiene una recompensa mayor al traicionar al otro ("desertar"). El razonamiento implica analizar las mejores respuestas de ambos jugadores : B cooperará o desertará. Si B coopera, A debería desertar, porque quedar en libertad es mejor que cumplir 1 año. Si B deserta, A también debería desertar, porque cumplir 2 años es mejor que cumplir 3. Entonces, de cualquier manera, A debería desertar, ya que desertar es la mejor respuesta de A, independientemente de la estrategia de B. Un razonamiento paralelo demostrará que B debería desertar.

La deserción siempre resulta en una mejor recompensa que la cooperación, por lo que es una estrategia estrictamente dominante para ambos jugadores. La deserción mutua es el único equilibrio fuerte de Nash en el juego. Dado que el resultado colectivamente ideal de la cooperación mutua es irracional desde el punto de vista del interés propio, este equilibrio de Nash no es eficiente en el sentido de Pareto .

Forma generalizada

La estructura del dilema del prisionero tradicional puede generalizarse a partir de su entorno original del prisionero. Supongamos que los dos jugadores están representados por los colores rojo y azul y que cada jugador elige "cooperar" o "desertar".

Si ambos jugadores cooperan, ambos reciben la recompensa por cooperar. Si ambos jugadores desertan, ambos reciben el pago del castigo . Si Azul deserta mientras Rojo coopera, entonces Azul recibe la recompensa de la tentación , mientras que Rojo recibe la recompensa del "tonto" . De manera similar, si Azul coopera mientras Rojo deserta, entonces Azul recibe la recompensa del tonto , mientras que Rojo recibe la recompensa de la tentación . $R$ $P$ $T$ $S$ $S$ $T$

Esto se puede expresar en forma normal :

y para ser un juego de dilema del prisionero en el sentido fuerte, la siguiente condición debe cumplirse para los pagos:

T>R>P>S

La relación de recompensa implica que la cooperación mutua es superior a la deserción mutua, mientras que las relaciones de recompensa implican que la defección es la estrategia dominante para ambos agentes. $R>P$ $T>R$ $P>S$

El dilema del prisionero repetido

Si dos jugadores juegan el dilema del prisionero más de una vez seguida, recuerdan las acciones anteriores de su oponente y pueden cambiar su estrategia en consecuencia, el juego se llama dilema del prisionero iterado.

Además de la forma general anterior, la versión iterativa también requiere que , para evitar que la cooperación y la deserción se alternen, se obtenga una recompensa mayor que la cooperación mutua. $2R>T+S$

El dilema del prisionero reiterado es fundamental para algunas teorías de la cooperación y la confianza humanas. Suponiendo que el juego modele eficazmente las transacciones entre dos personas que requieren confianza, el comportamiento cooperativo en las poblaciones se puede modelar mediante una versión iterada del juego para varios jugadores. En 1975, Grofman y Pool estimaron el número de artículos académicos dedicados a este tema en más de 2.000. El dilema del prisionero iterativo también se denomina " juego de la guerra y la paz ". ^[5]^[6]

estrategia general

Si el dilema del prisionero repetido se juega un número finito de veces y ambos jugadores lo saben, entonces la estrategia dominante y el equilibrio de Nash es desertar en todas las rondas. La prueba es inductiva : uno podría también desertar en el último turno, ya que el oponente no tendrá oportunidad de contraatacar más tarde. Por lo tanto, ambos desertarán en el último turno. Por lo tanto, el jugador también podría desertar en el penúltimo turno, ya que el oponente desertará en el último sin importar lo que se haga, y así sucesivamente. Lo mismo se aplica si se desconoce la duración del juego pero tiene un límite superior conocido. ^{[ cita necesaria ]}

Para que surja la cooperación entre jugadores racionales, el número de rondas debe ser desconocido o infinito. En ese caso, "siempre fallar" puede que ya no sea una estrategia estrictamente dominante sino sólo un equilibrio de Nash. Como lo demostró Robert Aumann en un artículo de 1959, ^[7] los jugadores racionales que interactúan repetidamente durante juegos indefinidamente largos pueden mantener la cooperación. Específicamente, un jugador puede estar menos dispuesto a cooperar si su contraparte no cooperó muchas veces, lo que genera decepción. Por el contrario, a medida que transcurre el tiempo, la probabilidad de cooperación tiende a aumentar debido al establecimiento de un "acuerdo tácito" entre los actores participantes. Otro aspecto del dilema del prisionero iterado es que este acuerdo tácito entre jugadores siempre se ha establecido con éxito incluso cuando el número de iteraciones se hace público a ambas partes.

Según un estudio experimental de 2019 en American Economic Review que probó qué estrategias utilizaron los sujetos de la vida real en situaciones repetidas de dilema del prisionero con un seguimiento perfecto, la mayoría de las estrategias elegidas fueron siempre desertar, ojo por ojo y gatillo sombrío . La estrategia que eligieron los sujetos dependía de los parámetros del juego. ^[8]

El torneo de Axelrod y las condiciones estratégicas exitosas

El interés en el dilema del prisionero iterado fue despertado por Robert Axelrod en su libro de 1984 La evolución de la cooperación , en el que informa sobre un torneo que organizó sobre el dilema del prisionero de N pasos (con N fijo) en el que los participantes tienen que elegir su estrategia. repetidamente y recordar sus encuentros anteriores. Axelrod invitó a colegas académicos de todo el mundo a idear estrategias informáticas para competir en un torneo iterado del dilema del prisionero. Los programas que se ingresaron variaron ampliamente en complejidad algorítmica, hostilidad inicial, capacidad de perdón, etc.

Axelrod descubrió que cuando estos encuentros se repetían durante un largo período de tiempo con muchos jugadores, cada uno con diferentes estrategias, las estrategias codiciosas tendían a funcionar muy mal a largo plazo, mientras que las estrategias más altruistas funcionaban mejor, a juzgar únicamente por el interés propio. Utilizó esto para mostrar un posible mecanismo para la evolución del comportamiento altruista a partir de mecanismos inicialmente puramente egoístas, por selección natural .

La estrategia determinista ganadora fue el ojo por ojo , desarrollada y presentada en el torneo por Anatol Rapoport . Era el más simple de todos los programas presentados, contenía sólo cuatro líneas de BASIC , y ganó el concurso. La estrategia es simplemente cooperar en la primera iteración del juego; después de eso, el jugador hace lo que hizo su oponente en el movimiento anterior. Dependiendo de la situación, una estrategia ligeramente mejor puede ser "ojo por ojo con perdón": cuando el oponente deserta, en el siguiente movimiento, el jugador a veces coopera de todos modos, con una pequeña probabilidad (alrededor del 1 al 5%, dependiendo de la alineación). de oponentes). Esto permite recuperarse ocasionalmente de quedar atrapado en un ciclo de deserciones.

Después de analizar las estrategias con mayor puntuación, Axelrod planteó varias condiciones necesarias para que una estrategia tenga éxito:

Niza : la estrategia no fallará antes que su oponente (a esto a veces se lo denomina algoritmo "optimista"). Casi todas las estrategias de mayor puntuación fueron buenas. Una estrategia puramente egoísta no "engañará" a su oponente por razones puramente de interés propio.
Tomar represalias : La estrategia a veces debe tomar represalias. Un ejemplo de estrategia sin represalias es Cooperar siempre, una muy mala elección que con frecuencia será explotada por estrategias "desagradables".
Perdonar : Las estrategias exitosas deben ser perdonar. Aunque los jugadores tomarán represalias, cooperarán nuevamente si el oponente no continúa desertando. Esto puede detener largas rachas de venganza y contravenganza, maximizando los puntos.
No envidioso : La estrategia no debe esforzarse en marcar más que el oponente.

A diferencia del antiguo juego del dilema del prisionero, la estrategia óptima en el dilema del prisionero repetido depende de las estrategias de los probables oponentes y de cómo reaccionarán ante las deserciones y la cooperación. Por ejemplo, si una población está formada enteramente por jugadores que siempre desertan, excepto uno que sigue la estrategia de ojo por ojo, esa persona está en ligera desventaja debido a la pérdida en el primer turno. En una población así, la estrategia óptima es desertar siempre. De manera más general, dada una población con un cierto porcentaje de desertores permanentes y el resto jugadores de ojo por ojo, la estrategia óptima depende del porcentaje y el número de iteraciones jugadas.

Otras estrategias

Generalmente, la estrategia óptima se obtiene de dos maneras:

Equilibrio bayesiano de Nash : si se puede determinar la distribución estadística de las estrategias opuestas, se puede derivar analíticamente una contraestrategia óptima. ^[a]
Se han realizado simulaciones de poblaciones de Monte Carlo , donde los individuos con puntuaciones bajas mueren y los que tienen puntuaciones altas se reproducen (un algoritmo genético para encontrar una estrategia óptima). La combinación de algoritmos en la población final generalmente depende de la combinación en la población inicial. La introducción de mutaciones (variación aleatoria durante la reproducción) disminuye la dependencia de la población inicial; Los experimentos empíricos con tales sistemas tienden a producir jugadores de ojo por ojo, ^{[ se necesita aclaración ]} , pero no existe prueba analítica de que esto vaya a ocurrir siempre. ^[10]

En la estrategia llamada ganar-quedarse, perder-cambiar , ante una falta de cooperación, el jugador cambia de estrategia en el siguiente turno. ^[11] En determinadas circunstancias, ^{[ especifique ]} Pavlov supera todas las demás estrategias al dar un trato preferencial a los compañeros que utilizan una estrategia similar.

Aunque el ojo por ojo se considera la estrategia básica más sólida , un equipo de la Universidad de Southampton en Inglaterra introdujo una estrategia más exitosa en la competencia iterativa del dilema del prisionero del vigésimo aniversario. Se basó en la colusión entre programas para lograr el mayor número de puntos para un solo programa. La universidad presentó al concurso 60 programas, que estaban diseñados para reconocerse entre sí mediante una serie de cinco a diez movimientos al inicio. ^[12] Una vez realizado este reconocimiento, un programa siempre cooperaría y el otro siempre desertaría, asegurando el máximo número de puntos para el desertor. Si el programa se diera cuenta de que estaba jugando contra un jugador que no era de Southampton, desertaría continuamente en un intento de minimizar la puntuación del programa competidor. Como resultado, los resultados del Torneo del Dilema del Prisionero de 2004 muestran las estrategias de la Universidad de Southampton en los primeros tres lugares (y varias posiciones hacia el final), a pesar de tener menos victorias y muchas más derrotas que la estrategia GRIM. La estrategia de Southampton aprovecha el hecho de que se permitían múltiples inscripciones en esta competición en particular y que el rendimiento de un equipo se medía por el del jugador con mayor puntuación (lo que significa que el uso de jugadores sacrificados era una forma de minmaxing ).

Debido a esta nueva regla, esta competencia también tiene poca importancia teórica cuando se analizan estrategias de agente único en comparación con el torneo seminal de Axelrod. Pero proporcionó una base para analizar cómo lograr estrategias cooperativas en marcos de múltiples agentes, especialmente en presencia de ruido.

Mucho antes de que se jugara este torneo con nuevas reglas, Dawkins, en su libro The Selfish Gene , señaló la posibilidad de que tales estrategias ganaran si se permitieran múltiples entradas, pero comentó que lo más probable es que Axelrod no las hubiera permitido si se hubieran presentado. También se basa en eludir la regla de que no se permite la comunicación entre jugadores, lo que posiblemente hicieron los programas de Southampton con su "baile de diez movimientos" preprogramado para reconocerse entre sí, lo que refuerza cuán valiosa puede ser la comunicación para cambiar el equilibrio del juego.

Incluso sin una colusión implícita entre estrategias de software , el ojo por ojo no siempre es el ganador absoluto de un torneo determinado; más precisamente, sus resultados a largo plazo en una serie de torneos superan a sus rivales, pero eso no significa que sea el más exitoso a corto plazo. Lo mismo se aplica al ojo por ojo con el perdón y otras estrategias óptimas.

Esto también se puede ilustrar utilizando la simulación darwiniana de ESS . En tal simulación, el ojo por ojo casi siempre llegará a dominar, aunque las estrategias desagradables entrarán y saldrán de la población porque una población de ojo por ojo es penetrable por estrategias agradables que no toman represalias, que a su vez son fáciles. presa de las estrategias desagradables. Dawkins demostró que aquí ninguna combinación estática de estrategias forma un equilibrio estable y el sistema siempre oscilará entre límites. ^{[ cita necesaria ]}

El dilema del prisionero iterado estocástico

En un juego estocástico del dilema del prisionero, las estrategias se especifican en términos de "probabilidades de cooperación". ^[13] En un encuentro entre el jugador X y el jugador Y , la estrategia de X está especificada por un conjunto de probabilidades P de cooperar con Y. P es una función de los resultados de sus encuentros anteriores o algún subconjunto de los mismos. Si P es función únicamente de sus n encuentros más recientes, se denomina estrategia de "memoria-n". Una estrategia de memoria-1 se especifica entonces mediante cuatro probabilidades de cooperación: , donde P _cd es la probabilidad de que X coopere en el encuentro actual dado que el encuentro anterior se caracterizó por que X cooperara e Y desertara. Si cada una de las probabilidades es 1 o 0, la estrategia se llama determinista. Un ejemplo de estrategia determinista es la estrategia de ojo por ojo escrita como , en la que X responde como lo hizo Y en el encuentro anterior. Otra es la estrategia de cambio ganar-quedarse, perder escrita como . Se ha demostrado que para cualquier estrategia de memoria n existe una estrategia de memoria 1 correspondiente que proporciona los mismos resultados estadísticos, de modo que sólo es necesario considerar las estrategias de memoria 1. ^[13] $P=\{P_{cc},P_{cd},P_{dc},P_{dd}\}$ $P=\{1,0,1,0\}$ $P=\{1,0,0,1\}$

Si se define como el vector estratégico de 4 elementos de X anterior y como el vector estratégico de 4 elementos de Y (donde los índices son desde el punto de vista de Y ), se puede definir una matriz de transición M para X cuyo ij -ésimo La entrada es la probabilidad de que el resultado de un encuentro particular entre X e Y sea j dado que el encuentro anterior fue i , donde i y j son uno de los cuatro índices de resultados: cc , cd , dc o dd . Por ejemplo, desde el punto de vista de X , la probabilidad de que el resultado del encuentro actual sea cd dado que el encuentro anterior fue cd es igual a . Según estas definiciones, el dilema del prisionero iterado califica como un proceso estocástico y M es una matriz estocástica , lo que permite aplicar toda la teoría de los procesos estocásticos. ^[13] $P$ $Q=\{Q_{cc},Q_{cd},Q_{dc},Q_{dd}\}$ $M_{cd,cd}=P_{cd}(1-Q_{dc})$

Un resultado de la teoría estocástica es que existe un vector estacionario v para la matriz v tal que . Sin pérdida de generalidad, se puede especificar que v está normalizado de modo que la suma de sus cuatro componentes es la unidad. La entrada ij -ésima dará la probabilidad de que el resultado de un encuentro entre X e Y sea j dado que el encuentro n pasos previo es i . En el límite, cuando n se acerca al infinito, M convergerá a una matriz con valores fijos, dando las probabilidades a largo plazo de un encuentro que produzca j independiente de i . En otras palabras, las filas de serán idénticas, dando al resultado de equilibrio a largo plazo las probabilidades del dilema del prisionero iterado sin la necesidad de evaluar explícitamente un gran número de interacciones. Se puede ver que v es un vector estacionario para y particularmente , de modo que cada fila de será igual a v . Por tanto, el vector estacionario especifica las probabilidades de resultado de equilibrio para X. Al definir y como vectores de pagos a corto plazo para los resultados { cc,cd,dc,dd } (desde el punto de vista de X), los pagos de equilibrio para X e Y ahora se pueden especificar como y , permitiendo las dos estrategias P y Q para comparar sus beneficios a largo plazo. $v\cdot M=v$ $M^{n}$ $M^{\infty }$ $M^{n}$ $M^{\infty }$ $M^{\infty }$ $S_{x}=\{R,S,T,P\}$ $S_{y}=\{R,T,S,P\}$ $s_{x}=v\cdot S_{x}$ $s_{y}=v\cdot S_{y}$

Estrategias de determinante cero

En 2012, William H. Press y Freeman Dyson publicaron una nueva clase de estrategias para el dilema del prisionero estocástico iterado llamadas estrategias de "determinante cero" (ZD). ^[13] Los pagos a largo plazo para los encuentros entre X e Y se pueden expresar como el determinante de una matriz que es función de las dos estrategias y los vectores de pagos a corto plazo: y , que no involucran el vector estacionario v . Dado que la función determinante es lineal en , se deduce que (donde ). Cualquier estrategia para la cual es, por definición, una estrategia ZD, y los beneficios a largo plazo obedecen a la relación . $s_{x}=D(P,Q,S_{x})$ $s_{y}=D(P,Q,S_{y})$ $s_{y}=D(P,Q,f)$ $f$ $\alpha s_{x}+\beta s_{y}+\gamma =D(P,Q,\alpha S_{x}+\beta S_{y}+\gamma U)$ $U=\{1,1,1,1\}$ $D(P,Q,\alpha S_{x}+\beta S_{y}+\gamma U)=0$ $\alpha s_{x}+\beta s_{y}+\gamma =0$

El ojo por ojo es una estrategia ZD que es "justa", en el sentido de no obtener ventaja sobre el otro jugador. Pero el espacio ZD también contiene estrategias que, en el caso de dos jugadores, pueden permitir que un jugador establezca unilateralmente la puntuación del otro o, alternativamente, obligar a un jugador evolutivo a lograr un pago en algún porcentaje menor que el suyo. El jugador extorsionado podría desertar, pero con ello se perjudicaría al obtener una recompensa menor. Así, las soluciones de extorsión convierten el repetido dilema del prisionero en una especie de juego de ultimátum . Específicamente, X puede elegir una estrategia para la cual , estableciendo unilateralmente a s _y en un valor específico dentro de un rango particular de valores, independientemente de la estrategia de Y , ofrece una oportunidad para que X "extorsione" al jugador Y (y viceversa). . Pero si X intenta establecer s _x en un valor particular, el rango de posibilidades es mucho menor y consiste sólo en una cooperación total o una deserción total. ^[13] $D(P,Q,\beta S_{y}+\gamma U)=0$

Una extensión del dilema del prisionero iterado es un dilema del prisionero iterado estocástico evolutivo, en el que se permite que cambie la abundancia relativa de estrategias particulares, y las estrategias más exitosas aumentan relativamente. Este proceso se puede lograr haciendo que los jugadores menos exitosos imiten las estrategias más exitosas, o eliminando del juego a los jugadores menos exitosos, mientras se multiplican los más exitosos. Se ha demostrado que las estrategias ZD injustas no son evolutivamente estables . La intuición clave es que una estrategia evolutivamente estable no sólo debe ser capaz de invadir otra población (lo que pueden hacer las estrategias ZD extorsionadoras) sino que también debe funcionar bien contra otros jugadores del mismo tipo (lo que los jugadores ZD extorsionadores hacen mal porque reducen las posibilidades de cada uno). superávit). ^[14]

La teoría y las simulaciones confirman que más allá de un tamaño de población crítico, la extorsión ZD pierde en la competencia evolutiva frente a estrategias más cooperativas y, como resultado, la recompensa promedio en la población aumenta cuando la población es mayor. Además, hay algunos casos en los que los extorsionadores pueden incluso catalizar la cooperación ayudando a salir de un enfrentamiento entre desertores uniformados y agentes en los que todos ganan, se quedan y pierden . ^[15]

Si bien las estrategias ZD extorsionadoras no son estables en poblaciones grandes, otra clase de ZD llamada estrategias "generosas" es estable y sólida. Cuando la población no es demasiado pequeña, estas estrategias pueden suplantar cualquier otra estrategia ZD e incluso funcionar bien frente a una amplia gama de estrategias genéricas para el dilema del prisionero iterado, incluyendo ganar-quedarse, perder-cambiar. Esto fue demostrado específicamente para el juego de donaciones por Alexander Stewart y Joshua Plotkin en 2013. ^[16] Las estrategias generosas cooperarán con otros jugadores cooperativos y, ante la deserción, el jugador generoso pierde más utilidad que su rival. Las estrategias generosas son la intersección de las estrategias ZD y las llamadas estrategias "buenas", que fueron definidas por Ethan Akin como aquellas en las que el jugador responde a la cooperación mutua pasada con la cooperación futura y divide los pagos esperados en partes iguales si recibe al menos la cooperación. recompensa esperada. ^[17] Entre las buenas estrategias, el subconjunto generoso (ZD) funciona bien cuando la población no es demasiado pequeña. Si la población es muy pequeña, las estrategias de deserción tienden a dominar. ^[dieciséis]

El dilema del prisionero que se repite continuamente

La mayor parte del trabajo sobre el dilema del prisionero iterado se ha centrado en el caso discreto, en el que los jugadores cooperan o desertan, porque este modelo es relativamente sencillo de analizar. Sin embargo, algunos investigadores han analizado modelos del dilema del prisionero iterado continuamente, en el que los jugadores pueden hacer una contribución variable al otro jugador. Le y Boyd ^[18] descubrieron que en tales situaciones, la cooperación es mucho más difícil de desarrollar que en el dilema del prisionero iterado discreto. En un dilema del prisionero continuo, si una población comienza en un equilibrio no cooperativo, los jugadores que son sólo marginalmente más cooperativos que los no cooperadores obtienen pocos beneficios al enfrentarse entre sí. Por el contrario, en un dilema del prisionero discreto, los cooperadores de ojo por ojo obtienen un gran aumento de beneficios al agruparse entre sí en un equilibrio no cooperativo, en relación con los no cooperadores. Dado que se puede decir que la naturaleza ofrece más oportunidades para una cooperación variable en lugar de una dicotomía estricta de cooperación o deserción, el dilema continuo del prisionero puede ayudar a explicar por qué los ejemplos de cooperación tipo ojo por ojo en la vida real son extremadamente raros ^[19] a pesar de que for-tat parece robusto en los modelos teóricos.

Ejemplos de la vida real

Muchos casos de interacción humana y procesos naturales tienen matrices de resultados como el dilema del prisionero. Es por tanto de interés para las ciencias sociales , como la economía , la política y la sociología , así como para las ciencias biológicas, como la etología y la biología evolutiva . Muchos procesos naturales se han abstraído en modelos en los que los seres vivos participan en interminables juegos del dilema del prisionero.

Estudios ambientales

En los estudios ambientales , el dilema es evidente en crisis como la del cambio climático global . Se argumenta que todos los países se beneficiarán de un clima estable, pero ninguno de ellos suele dudar a la hora de frenar las emisiones de CO ₂ . El beneficio inmediato para cualquier país de mantener el comportamiento actual se percibe como mayor que el supuesto beneficio final para ese país si se cambiara el comportamiento de todos los países, lo que explica el estancamiento relativo al cambio climático en 2007. ^[20]

Una diferencia importante entre la política del cambio climático y el dilema del prisionero es la incertidumbre; Se desconoce el alcance y el ritmo al que la contaminación puede cambiar el clima. Por lo tanto, el dilema que enfrentan los gobiernos es diferente del dilema del prisionero en que se desconocen los beneficios de la cooperación. Esta diferencia sugiere que los estados cooperarán mucho menos que en un dilema del prisionero iterado real, de modo que la probabilidad de evitar una posible catástrofe climática es mucho menor que la sugerida por un análisis de la situación mediante teoría de juegos utilizando un dilema del prisionero iterado real. ^[21]

Thomas Osang y Arundhati Nandy proporcionan una explicación teórica con pruebas de una situación en la que todos ganan impulsada por la regulación, siguiendo la línea de la hipótesis de Michael Porter , en la que la regulación gubernamental de las empresas competidoras es sustancial. ^[22]

animales

El comportamiento cooperativo de muchos animales puede entenderse como un ejemplo del dilema del prisionero repetido. A menudo los animales entablan asociaciones a largo plazo; por ejemplo, los guppies inspeccionan a los depredadores de forma cooperativa en grupos y se cree que castigan a los inspectores que no cooperan. ^[23]

Los murciélagos vampiros son animales sociales que participan en el intercambio recíproco de alimentos. Aplicar los resultados del dilema del prisionero puede ayudar a explicar este comportamiento. ^[24]

Psicología

En investigación sobre adicciones y economía del comportamiento , George Ainslie señala que la adicción puede plantearse como un problema intertemporal del dilema del prisionero entre el yo presente y el futuro del adicto. En este caso, "desertar" significa recaer, donde no recaer ni hoy ni en el futuro es, con diferencia, el mejor resultado. El caso en el que uno se abstiene hoy pero recae en el futuro es el peor resultado: en cierto sentido, la disciplina y el autosacrificio involucrados en la abstinencia hoy han sido "desperdiciados" porque la recaída futura significa que el adicto vuelve al punto de partida y habrá que empezar de nuevo. Recaer hoy y mañana es un resultado ligeramente "mejor", porque aunque el adicto todavía es adicto, no se ha esforzado en intentar dejar de hacerlo. El último caso, en el que uno se involucra en el comportamiento adictivo hoy mientras se abstiene mañana, tiene el problema de que (como en otros dilemas del prisionero) hay un beneficio obvio en desertar "hoy", pero mañana uno enfrentará el mismo dilema del prisionero, y el El mismo beneficio obvio estará presente entonces, lo que en última instancia conducirá a una serie interminable de deserciones. ^[25]

En The Science of Trust , John Gottman define las buenas relaciones como aquellas en las que los socios saben que no deben adoptar un comportamiento de deserción mutua, o al menos no quedarse atrapados dinámicamente en un bucle. En neurociencia cognitiva , la señalización cerebral rápida asociada con el procesamiento de diferentes rondas puede indicar opciones en la siguiente ronda. Los resultados de la cooperación mutua implican cambios en la actividad cerebral que predicen la rapidez con la que una persona cooperará de la misma manera en la próxima oportunidad; ^[26] esta actividad puede estar vinculada a procesos homeostáticos y motivacionales básicos, posiblemente aumentando la probabilidad de atajos hacia la cooperación mutua.

Ciencias económicas

El dilema del prisionero ha sido llamado el E. coli de la psicología social y se ha utilizado ampliamente para investigar diversos temas como la competencia oligopólica y la acción colectiva para producir un bien colectivo. ^[27]

A veces se cita la publicidad como un ejemplo real del dilema del prisionero. Cuando la publicidad de cigarrillos era legal en los Estados Unidos, los fabricantes de cigarrillos competidores tenían que decidir cuánto dinero gastar en publicidad. La eficacia de la publicidad de la empresa A estuvo parcialmente determinada por la publicidad realizada por la empresa B. Del mismo modo, el beneficio derivado de la publicidad de la empresa B se ve afectado por la publicidad realizada por la empresa A. Si tanto la empresa A como la empresa B deciden hacer publicidad durante un período determinado período, entonces la publicidad de cada empresa anula la de la otra, los ingresos permanecen constantes y los gastos aumentan debido al costo de la publicidad. Ambas empresas se beneficiarían de una reducción de la publicidad. Sin embargo, si la empresa B decide no hacer publicidad, la empresa A podría beneficiarse enormemente con la publicidad. Sin embargo, la cantidad óptima de publicidad de una empresa depende de cuánta publicidad realice la otra. Como la mejor estrategia depende de lo que elija la otra empresa, no existe una estrategia dominante, lo que la diferencia ligeramente del dilema del prisionero. Sin embargo, el resultado es similar en el sentido de que ambas empresas estarían mejor si publicitaran menos que en el equilibrio.

A veces, los comportamientos cooperativos surgen en situaciones comerciales. Por ejemplo, los fabricantes de cigarrillos respaldaron la elaboración de leyes que prohibieran la publicidad de cigarrillos, entendiendo que esto reduciría los costos y aumentaría las ganancias en toda la industria. ^[28]^[b]

Sin acuerdos ejecutables, los miembros de un cártel también se ven envueltos en un dilema del prisionero (multijugador). ^[29] "Cooperar" normalmente significa aceptar un precio mínimo , mientras que "desertar" significa vender por debajo de este nivel mínimo, quitando instantáneamente negocios a otros miembros del cártel. Las autoridades antimonopolio quieren que los posibles miembros del cártel deserten mutuamente, asegurando los precios más bajos posibles para los consumidores.

Deporte

El dopaje en el deporte se ha citado como ejemplo del dilema del prisionero. Dos atletas que compiten tienen la opción de utilizar una droga ilegal y/o peligrosa para mejorar su rendimiento. Si ninguno de los atletas toma la droga, ninguno obtiene ventaja. Si sólo uno lo hace, entonces ese atleta obtiene una ventaja significativa sobre el competidor, reducida por los peligros legales y/o médicos de haber tomado la droga. Pero si ambos atletas toman la droga, los beneficios se anulan y sólo quedan los peligros, lo que los coloca a ambos en peor posición que si ninguno se hubiera dopado. ^[30]

Politica internacional

En la teoría de las relaciones internacionales , el dilema del prisionero se utiliza a menudo para demostrar por qué la cooperación falla en situaciones en las que la cooperación entre estados es colectivamente óptima pero individualmente subóptima. ^[31]^[32] Un ejemplo clásico es el dilema de seguridad , mediante el cual un aumento en la seguridad de un estado (como el aumento de su fuerza militar) lleva a otros estados a temer por su propia seguridad por miedo a una acción ofensiva. ^[33] En consecuencia, las medidas para aumentar la seguridad pueden provocar tensiones, una escalada o un conflicto con una o más partes, produciendo un resultado que ninguna de las partes realmente desea. ^[34]^[33]^[35]^[36]^[37] El dilema de seguridad es particularmente intenso en situaciones en las que es difícil distinguir las armas ofensivas de las defensivas, y la ofensiva tiene ventaja sobre la defensa en cualquier conflicto. ^[33]

El dilema del prisionero ha sido utilizado con frecuencia por teóricos realistas de las relaciones internacionales para demostrar por qué todos los Estados (independientemente de sus políticas internas o ideología profesada) bajo una anarquía internacional tendrán dificultades para cooperar entre sí incluso cuando todos se beneficien de dicha cooperación.

Los críticos del realismo sostienen que la iteración y la ampliación de la sombra del futuro son soluciones al dilema del prisionero. Cuando los actores interpretan el dilema del prisionero una vez, tienen incentivos para desertar, pero cuando esperan representarlo repetidamente, tienen mayores incentivos para cooperar. ^[38]

Dilemas multijugador

Muchos dilemas de la vida real involucran a varios actores. ^[39] Aunque metafórica, la tragedia de los comunes de Garrett Hardin puede verse como un ejemplo de una generalización multijugador del dilema del prisionero: cada aldeano toma una decisión para obtener beneficio o moderación personal. La recompensa colectiva por la deserción unánime o frecuente son pagos muy bajos y la destrucción de los bienes comunes.

Los bienes comunes no siempre son explotados: William Poundstone , en un libro sobre el dilema del prisionero, describe una situación en Nueva Zelanda donde las cajas de periódicos se dejan abiertas. Es posible que la gente acepte un documento sin pagar (desertar), pero muy pocos lo hacen, sintiendo que si ellos no pagan, los demás tampoco lo harán, destruyendo el sistema. ^[40] Una investigación posterior realizada por Elinor Ostrom , ganadora del Premio Nobel de Ciencias Económicas en 2009 , planteó la hipótesis de que la tragedia de los bienes comunes está demasiado simplificada y que el resultado negativo está influido por influencias externas. Sin presiones complicadas, los grupos comunican y gestionan los bienes comunes entre ellos para su beneficio mutuo, haciendo cumplir normas sociales para preservar el recurso y lograr el máximo bien para el grupo, un ejemplo de cómo lograr el mejor resultado para el dilema del prisionero. ^[41]^[42]

Juegos relacionados

Intercambio de bolsa cerrada

Douglas Hofstadter ^[43] sugirió que las personas a menudo encuentran que problemas como el dilema del prisionero son más fáciles de entender cuando se ilustran en forma de un juego simple o compensación. Uno de los varios ejemplos que utilizó fue el de "intercambio de bolsa cerrada":

Dos personas se encuentran e intercambian bolsas cerradas, en el entendido de que una de ellas contiene dinero y la otra una compra. Cualquiera de los jugadores puede optar por cumplir el trato poniendo en su bolsa lo que acordó, o puede desertar entregando una bolsa vacía.

¿Amigo o enemigo?

¿Amigo o enemigo? es un programa de juegos que se emitió de 2002 a 2003 en Game Show Network en Estados Unidos. En el programa de juegos, compiten tres parejas de personas. Cuando una pareja es eliminada, juegan un juego similar al dilema del prisionero para determinar cómo se dividen las ganancias. Si ambos cooperan (Amigo), comparten las ganancias al 50%. Si uno coopera y el otro deserta (enemigo), el desertor obtiene todas las ganancias y el cooperador no obtiene nada. Si ambos desertan, ambos se van sin nada. Tenga en cuenta que la matriz de recompensas es ligeramente diferente de la estándar dada anteriormente, ya que las recompensas para los casos de "ambos fallan" y "cooperan mientras el oponente falla" son idénticas. Esto hace que el caso de "ambos defectos" sea un equilibrio débil, en comparación con el equilibrio estricto del dilema del prisionero estándar. Si un concursante sabe que su oponente va a votar "Enemigo", entonces su propia elección no afecta sus propias ganancias. En un sentido específico, Amigo o Enemigo tiene un modelo de recompensas entre el dilema del prisionero y el juego de la Gallina .

Esta es la matriz de recompensas:

Esta matriz de pagos también se ha utilizado en los programas de televisión británicos Trust Me , Shafted , The Bank Job y Golden Balls , y en los programas de juegos estadounidenses Take It All , así como para la pareja ganadora de los reality shows Bachelor Pad y Love Island. . Un equipo de economistas analizó los datos del juego de la serie Golden Balls^{y descubrió que la cooperación era "sorprendentemente alta" para cantidades de dinero que parecerían importantes en el mundo real pero que eran comparativamente bajas en el contexto del juego. [44]}

Ventisquero iterado

Investigadores de la Universidad de Lausana y la Universidad de Edimburgo han sugerido que el "Juego iterado de Snowdrift" puede reflejar más fielmente situaciones sociales del mundo real, aunque este modelo es en realidad un juego de gallina . En este modelo, el riesgo de ser explotado mediante la deserción es menor y los individuos siempre salen ganando al tomar la decisión cooperativa. El juego del ventisquero imagina a dos conductores atrapados en lados opuestos de un ventisquero , a cada uno de los cuales se le da la opción de palear nieve para despejar el camino o permanecer en su coche. La mayor recompensa de un jugador proviene de dejar que el oponente limpie toda la nieve por sí solo, pero el oponente sigue siendo nominalmente recompensado por su trabajo.

Esto puede reflejar mejor escenarios del mundo real, los investigadores dan el ejemplo de dos científicos que colaboran en un informe, los cuales se beneficiarían si el otro trabajara más duro. "Pero cuando su colaborador no hace ningún trabajo, probablemente sea mejor que usted haga todo el trabajo usted mismo. Aún así terminará con un proyecto terminado". ^[45]

juegos de coordinacion

En los juegos de coordinación, los jugadores deben coordinar sus estrategias para obtener un buen resultado. Un ejemplo son dos coches que se encuentran abruptamente en una tormenta de nieve; cada uno debe elegir si desviarse hacia la izquierda o hacia la derecha. Si ambos se desvían hacia la izquierda o hacia la derecha, los coches no chocan. El convenio local sobre circulación por la izquierda y por la derecha ayuda a coordinar sus acciones.

Los juegos de coordinación simétricos incluyen la caza del ciervo y Bach o Stravinsky .

Los dilemas del prisionero asimétricos

Un conjunto más general de juegos es asimétrico. Como en el dilema del prisionero, el mejor resultado es la cooperación y existen motivos para la deserción. Sin embargo, a diferencia del dilema del prisionero simétrico, un jugador tiene más que perder y/o más que ganar que el otro. Algunos de estos juegos se han descrito como el dilema del prisionero en el que un prisionero tiene una coartada , de ahí el término "juego de coartada". ^[46]

En experimentos, los jugadores que obtienen pagos desiguales en juegos repetidos pueden intentar maximizar las ganancias, pero sólo bajo la condición de que ambos jugadores reciban pagos iguales; esto puede conducir a una estrategia de equilibrio estable en la que el jugador desfavorecido abandona cada juego X, mientras que el otro siempre coopera. Tal comportamiento puede depender de las normas sociales del experimento en torno a la justicia. ^[47]

Software

Se han creado varios paquetes de software para ejecutar simulaciones y torneos del dilema del prisionero, algunos de los cuales tienen disponible su código fuente:

El código fuente del segundo torneo dirigido por Robert Axelrod (escrito por Axelrod y muchos contribuyentes en Fortran ) está disponible en línea.
Prison, una biblioteca escrita en Java , actualizada por última vez en 1998
Axelrod-Python, escrito en Python
Evoplex, un programa de modelado rápido basado en agentes lanzado en 2018 por Marcos Cardinot

En ficción

Hannu Rajaniemi sitúa la escena inicial de su trilogía The Quantum Thief en una "prisión de dilemas". El tema principal de la serie ha sido descrito como la "insuficiencia de un universo binario" y el antagonista final es un personaje llamado All-Defector. El primer libro de la serie se publicó en 2010, con las dos secuelas, The Fractal Prince y The Causal Angel , publicadas en 2012 y 2014, respectivamente.

Un juego inspirado en el dilema del prisionero iterado es un foco central del videojuego Zero Escape: Virtue's Last Reward de 2012 y una parte menor en su secuela de 2016 Zero Escape: Zero Time Dilemma .

En La misteriosa sociedad Benedict y el dilema del prisionero de Trenton Lee Stewart , los personajes principales comienzan jugando una versión del juego y escapando de la "prisión" por completo. Más tarde, se convierten en verdaderos prisioneros y escapan una vez más.

En The Adventure Zone : Balance durante el subarco The Suffering Game , a los personajes jugadores se les presenta dos veces el dilema del prisionero durante su estancia en el dominio de dos liches, una vez cooperando y otra desertando.

En la octava novela del autor James SA Corey Tiamat's Wrath , Winston Duarte explica el dilema del prisionero a su hija de 14 años, Teresa, para entrenarla en pensamiento estratégico. ^{[ cita necesaria ]}

La película de 2008 The Dark Knight incluye una escena basada libremente en el problema en el que el Joker manipula dos ferries, uno con prisioneros y el otro con civiles, armando a ambos grupos con los medios para detonar la bomba en los ferries del otro, amenazando con detonarlos. ambos si dudan. ^[48]^[49]

En filosofía moral

El dilema del prisionero se utiliza comúnmente como herramienta de pensamiento en filosofía moral como ilustración de la tensión potencial entre el beneficio del individuo y el beneficio de la comunidad.

Tanto el dilema del prisionero de una sola vez como el dilema del prisionero iterado tienen aplicaciones en la filosofía moral. De hecho, muchas de las situaciones morales, como el genocidio , no se repiten fácilmente más de una vez. Además, en muchas situaciones, los jugadores desconocen los resultados de las rondas anteriores, ya que no son necesariamente los mismos (por ejemplo, interacción con un mendigo en la calle). ^[50]

El filósofo David Gauthier utiliza el dilema del prisionero para mostrar cómo la moralidad y la racionalidad pueden entrar en conflicto. ^[51]

Algunos teóricos de juegos han criticado el uso del dilema del prisionero como herramienta de pensamiento en filosofía moral. ^[51] Kenneth Binmore argumentó que el dilema del prisionero no describe con precisión el juego jugado por la humanidad, que, según él, está más cerca de un juego de coordinación . Brian Skyrms comparte esta perspectiva.

Steven Kuhn sugiere que estos puntos de vista pueden conciliarse considerando que el comportamiento moral puede modificar la matriz de resultados de un juego, transformándolo de un dilema del prisionero a otros juegos. ^[51]

El dilema del prisionero puro e impuro

El dilema del prisionero se considera "impuro" si una estrategia mixta puede dar mejores resultados esperados que una estrategia pura. Esto crea la interesante posibilidad de que la acción moral desde una perspectiva utilitaria (es decir, apuntar a maximizar el bien de una acción) pueda requerir una aleatorización de la estrategia, como cooperar con un 80% de probabilidad y desertar con un 20% de probabilidad. ^[52]

Ver también

Notas

^ Por ejemplo, consulte el estudio de 2003 ^[9] para analizar el concepto y si puede aplicarse en situaciones económicas o estratégicas reales.
^ Este argumento para el desarrollo de la cooperación a través de la confianza se da en La sabiduría de las multitudes , donde se sostiene que el capitalismo a larga distancia pudo formarse alrededor de un núcleo de cuáqueros , que siempre trataron honorablemente con sus socios comerciales. (En lugar de desertar e incumplir promesas, un fenómeno que había desalentado anteriores contratos a largo plazo inaplicables en el extranjero). Se argumenta que los tratos con comerciantes confiables permitieron que el meme de la cooperación se extendiera a otros comerciantes, quienes lo extendieron aún más hasta que un alto grado de cooperación se convirtió en una estrategia rentable en el comercio general.

Referencias

^ "El dilema del prisionero". Enciclopedia de Filosofía de Stanford . Consultado el 10 de marzo de 2024 .
^ Poundstone 1993, págs.8, 117.
^ Poundstone 1993, pag. 118: "Una versión contemporánea típica de la historia es la siguiente: dos miembros de una banda criminal son arrestados y encarcelados. Cada prisionero está en régimen de aislamiento sin medios para hablar o intercambiar mensajes con el otro. La policía admite que no". No tienen pruebas suficientes para condenar a la pareja por el cargo principal. Planean sentenciar a ambos a un año de prisión por un cargo menor. Al mismo tiempo, la policía ofrece a cada prisionero un trato fáustico: si testifica contra su compañero, saldrá libre. mientras que el compañero recibirá tres años de prisión por el cargo principal. Ah, sí, hay un problema... Si ambos presos testifican entre sí, ambos serán condenados a dos años de cárcel. Los presos recibirán un poco de tiempo. pensar sobre esto, pero en ningún caso pueden saber lo que el otro ha decidido hasta que haya tomado su decisión irrevocablemente. Cada uno de ellos está informado de que al otro prisionero se le ofrece exactamente el mismo trato. Cada prisionero sólo se preocupa por su propio bienestar. con minimizar su propia sentencia de prisión".
^ Poundstone 1993, pag. 118.
^ Grofman, Bernard; Piscina, Jonathan (enero de 1977). "Cómo hacer de la cooperación la estrategia de optimización en un juego de dos personas". La Revista de Sociología Matemática . 5 (2): 173–186. doi :10.1080/0022250x.1977.9989871. ISSN 0022-250X.
^ Tímido, Oz (1995). Organización industrial: teoría y aplicaciones. Prensa del Instituto de Tecnología de Massachusetts. ISBN 978-0262193665. Consultado el 27 de febrero de 2013 .
^ Aumann, Robert J. (2 de marzo de 2016), "16. Puntos aceptables en juegos cooperativos generales de n personas", 16. Puntos aceptables en juegos cooperativos generales de n personas , Princeton University Press, págs. doi :10.1515/9781400882168-018, ISBN 978-1-4008-8216-8, recuperado el 14 de mayo de 2024
^ Dal Bó, Pedro; Fréchette, Guillaume R. (2019). "Elección de estrategia en el dilema del prisionero infinitamente repetido". Revista económica estadounidense . 109 (11): 3929–3952. doi :10.1257/aer.20181480. ISSN 0002-8282. S2CID 216726890.
^ "Equilibrio bayesiano de Nash; una prueba estadística de la hipótesis" (PDF) . Universidad de Tel Aviv . Archivado desde el original (PDF) el 2 de octubre de 2005.
^ Wu, Jiadong; Zhao, Chengye (2019), Sun, Xiaoming; Él, Kun; Chen, Xiaoyun (eds.), "Cooperación sobre la regla de Montecarlo: juego del dilema del prisionero en la red", Informática teórica , Comunicaciones en informática y ciencias de la información, vol. 1069, Springer Singapur, págs. 3-15, doi :10.1007/978-981-15-0105-0_1, ISBN 978-981-15-0104-3, S2CID 118687103
^ Wedekind, C.; Milinski, M. (2 de abril de 1996). "Cooperación humana en el dilema del prisionero simultáneo y alterno: Pavlov versus generoso ojo por ojo". Procedimientos de la Academia Nacional de Ciencias . 93 (7): 2686–2689. Código bibliográfico : 1996PNAS...93.2686W. doi : 10.1073/pnas.93.7.2686 . PMC 39691 . PMID 11607644.
^ "El equipo de la Universidad de Southampton gana el concurso Prisoner's Dilemma" (Presione soltar). Universidad de Southampton. 7 de octubre de 2004. Archivado desde el original el 21 de abril de 2014.
^ Prensa abcde, WH; Dyson, FJ (26 de junio de 2012). "El dilema del prisionero iterado contiene estrategias que dominan a cualquier oponente evolutivo". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 109 (26): 10409–13. Código Bib : 2012PNAS..10910409P. doi : 10.1073/pnas.1206569109 . PMC 3387070 . PMID 22615375.
^ Adami, Christoph; Arend Hintze (2013). "La inestabilidad evolutiva de las estrategias de Determinante Cero demuestra que ganar no lo es todo". Comunicaciones de la naturaleza . 4 : 3. arXiv : 1208.2666 . Código Bib : 2013NatCo...4.2193A. doi : 10.1038/ncomms3193. PMC 3741637 . PMID 23903782.
^ Hilbe, cristiano; Martín A. Nowak; Karl Sigmund (abril de 2013). "Evolución de la extorsión en los juegos iterados del dilema del prisionero". PNAS . 110 (17): 6913–18. arXiv : 1212.1067 . Código Bib : 2013PNAS..110.6913H. doi : 10.1073/pnas.1214834110 . PMC 3637695 . PMID 23572576.
^ ab Stewart, Alexander J.; Joshua B. Plotkin (2013). "De la extorsión a la generosidad, evolución en el dilema del prisionero iterado". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 110 (38): 15348–53. Código Bib : 2013PNAS..11015348S. doi : 10.1073/pnas.1306246110 . PMC 3780848 . PMID 24003115.
^ Parecido, Ethan (2013). "Soluciones cooperativas estables para el dilema del prisionero iterativo". pag. 9. arXiv : 1211.0969 [matemáticas.DS]. Código Bib : 2012arXiv1211.0969A
^ Le S, Boyd R (2007). "Dinámica evolutiva del dilema del prisionero iterado continuo". Revista de Biología Teórica . 245 (2): 258–67. Código Bib : 2007JThBi.245..258L. doi :10.1016/j.jtbi.2006.09.016. PMID 17125798.
^ Hammerstein, P. (2003). ¿Por qué la reciprocidad es tan rara en los animales sociales? Un llamamiento protestante. En: P. Hammerstein, editor, Evolución genética y cultural de la cooperación, MIT Press. págs. 83–94.
^ "Mercados y datos". El economista . 2007-09-27.
^ Rehmeyer, Julie (29 de octubre de 2012). "La teoría de juegos sugiere que las negociaciones climáticas actuales no evitarán una catástrofe". Noticias de ciencia . Sociedad para la ciencia y el público.
^ Osang, Thomas; Nandyyz, Arundhati (agosto de 2003). Regulación ambiental de empresas contaminantes: revisión de la hipótesis de Porter (PDF) (artículo). Archivado (PDF) desde el original el 2 de julio de 2010.
^ Brosnan, Sarah F.; Earley, Ryan L.; Dugatkin, Lee A. (octubre de 2003). "Aprendizaje observacional e inspección de depredadores en guppies (Poecilia reticulata): aprendizaje social en guppies". Etología . 109 (10): 823–833. doi : 10.1046/j.0179-1613.2003.00928.x .
^ Dawkins, Richard (1976). El gen egoísta . Prensa de la Universidad de Oxford.
^ Ainslie, George (2001). Desintegración de la Voluntad . Prensa de la Universidad de Cambridge. ISBN 978-0-521-59694-7.
^ Cervantes Constantino, Garat, Nicolaisen, Paz, Martínez-Montes, Kessel, Cabana y Gradin (2020). "El procesamiento neuronal de los resultados repetidos del dilema del prisionero indica la elección de la siguiente ronda y la velocidad para corresponder la cooperación". Neurociencia Social . 16 (2): 103–120. doi :10.1080/17470919.2020.1859410. PMID 33297873. S2CID 228087900.{{cite journal}}: CS1 maint: multiple names: authors list (link)
^ Axelrod, Robert (1980). "Elección efectiva en el dilema del prisionero". La Revista de Resolución de Conflictos . 24 (1): 3–25. doi :10.1177/002200278002400101. ISSN 0022-0027. JSTOR 173932. S2CID 143112198.
^ Henriksen, Lisa (marzo de 2012). "Restricciones integrales a la comercialización del tabaco: promoción, envasado, precio y plaza". Control del Tabaco . 21 (2): 147-153. doi :10.1136/tobaccocontrol-2011-050416. PMC 4256379 . PMID 22345238.
^ Nicholson, Walter (2000). Microeconomía intermedia y su aplicación (8ª ed.). Fort Worth, TX: Dryden Press: Harcourt College Publishers. ISBN 978-0-030-25916-6.
^ Schneier, Bruce (26 de octubre de 2012). "Lance Armstrong y el dilema del dopaje de los prisioneros en los deportes profesionales | Opinión cableada". Cableado . Cableado.com . Consultado el 29 de octubre de 2012 .
^ Snyder, Glenn H. (1971). ""El dilema del prisionero "y los modelos" del pollo "en la política internacional". Estudios Internacionales Trimestrales . 15 (1): 66-103. doi :10.2307/3013593. ISSN 0020-8833. JSTOR 3013593.
^ Jervis, Robert (1978). "Cooperación bajo el dilema de seguridad". Politica mundial . 30 (2): 167–214. doi :10.2307/2009958. hdl : 2027/uc1.31158011478350 . ISSN 1086-3338. JSTOR 2009958. S2CID 154923423.
^ a b C Jervis, Robert (1978). "Cooperación bajo el dilema de seguridad". Politica mundial . 30 (2): 167–214. doi :10.2307/2009958. hdl : 2027/uc1.31158011478350 . ISSN 0043-8871. JSTOR 2009958. S2CID 154923423.
^ Herz, John H. (1950). El internacionalismo idealista y el dilema de la seguridad . págs. 157–180.
^ Snyder, Glenn H. (1984). "El dilema de seguridad en la política de alianzas". Politica mundial . 36 (4): 461–495. doi :10.2307/2010183. ISSN 0043-8871. JSTOR 2010183. S2CID 154759602.
^ Jervis, Robert (1976). Percepción y percepción errónea en la política internacional. Prensa de la Universidad de Princeton. págs. 58-113. ISBN 978-0-691-10049-4.
^ Glaser, Charles L. (2010). Teoría racional de la política internacional. Prensa de la Universidad de Princeton. ISBN 9780691143729.
^ Axelrod, Robert; Hamilton, William D. (1981). "La Evolución de la Cooperación". Ciencia . 211 (4489): 1390-1396. Código bibliográfico : 1981 Ciencia... 211.1390A. doi : 10.1126/ciencia.7466396. ISSN 0036-8075. PMID 7466396.
^ Gokhale CS, Traulsen A. Juegos evolutivos en el multiverso. Procedimientos de la Academia Nacional de Ciencias. 23 de marzo de 2010. 107(12):5500–04.
^ Poundstone 1993, págs. 126-127.
^ "La conspiración de Volokh "Elinor Ostrom y la tragedia de los comunes". Volokh.com. 2009-10-12 . Consultado el 17 de diciembre de 2011 .
^ Ostrom, Elinor (2015) [1990]. Gobernar los bienes comunes: la evolución de las instituciones para la acción colectiva . Prensa de la Universidad de Cambridge. doi :10.1017/CBO9781316423936. ISBN 978-1-107-56978-2.
^ Hofstadter, Douglas R. (1985). "Capítulo 29 Los torneos informáticos del dilema del prisionero y la evolución de la cooperación ". Temas metamágicos: búsqueda de la esencia de la mente y el patrón . Grupo de pubs Bantam Dell. ISBN 978-0-465-04566-2.
^ Van den Assem, Martijn J. (enero de 2012). "¿Dividir o robar? Comportamiento cooperativo cuando hay mucho en juego". Ciencias de la gestión . 58 (1): 2–20. doi :10.1287/mnsc.1110.1413. hdl : 1765/31292 . S2CID 1371739. SSRN 1592456.
^ Kümmerli, Rolf. "El juego 'Snowdrift' supera a 'Prisoner's Dilemma' al explicar la cooperación" . Consultado el 11 de abril de 2012 .
^ Robinson, DR; Goforth, DJ (5 de mayo de 2004). Juegos de coartada: los dilemas del prisionero asimétrico (PDF) . Reuniones de la Asociación Canadiense de Economía, Toronto, 4 al 6 de junio de 2004. Archivado (PDF) desde el original el 6 de diciembre de 2004.
^ Beckenkamp, Martín; Hennig-Schmidt, Heike; Maier-Rigaud, Frank P. (4 de marzo de 2007). "Cooperación en juegos del dilema del prisionero simétricos y asimétricos" (PDF) . Instituto Max Planck de Investigación sobre Bienes Colectivos . Archivado (PDF) desde el original el 2 de septiembre de 2019.
^ Romain, Lindsey (18 de julio de 2018). "El único personaje redimible del Caballero Oscuro es el criminal que salva los ferries". Polígono . Consultado el 6 de enero de 2024 .
^ "The Dark Knight: Teoría de juegos: Blog del curso de redes para INFO 2040/CS 2850/Econ 2040/SOC 2090" . Consultado el 6 de enero de 2024 .
^ Kuhn, Steven T. (1 de julio de 2004). "Reflexiones sobre Ética y Teoría de Juegos". Síntesis . 141 (1): 1–44. doi :10.1023/B:SYNT.0000035846.91195.cb. ISSN 1573-0964.
^ abc Kuhn, Steven (diciembre de 2016). "Gauthier y el dilema del prisionero". Diálogo . 55 (4): 659–676. doi :10.1017/S0012217316000603. ISSN 0012-2173.
^ Kuhn, Steven T.; Moresi, Serge (octubre de 1995). "Los dilemas del prisionero puro y utilitario". Economía y Filosofía . 11 (2): 333–343. doi :10.1017/S0266267100003424. ISSN 0266-2671.

Bibliografía

Poundstone, William (1993). El dilema del prisionero (primera edición de Anchor Books). Nueva York: ancla. ISBN 0-385-41580-X.

Otras lecturas

Amadae, S. (2016). “El dilema del prisionero”, Prisioneros de la Razón . Cambridge University Press , Nueva York, págs. 24–61.
Aumann, Robert (1959). "Puntos aceptables en juegos cooperativos generales para n personas". En Luce, RD; Tucker, AW (eds.). Aportes a la Teoría 23 de Juegos IV . Estudio de Anales de Matemáticas. vol. 40. Princeton Nueva Jersey: Princeton University Press. págs. 287–324. SEÑOR 0104521.
Axelrod, R. (1984). La evolución de la cooperación . ISBN 0-465-02121-2
Bicchieri, Cristina (1993). Racionalidad y Coordinación. Prensa de la Universidad de Cambridge .
Ajedrez, David M. (diciembre de 1988). "Simulando la evolución del comportamiento: el problema del dilema de los prisioneros iterados" (PDF) . Sistemas complejos . 2 (6): 663–70. Archivado (PDF) desde el original el 30 de mayo de 2015.
Collins, Rory W. (marzo de 2022). "La paradoja del dilema del prisionero: racionalidad, moralidad y reciprocidad". Piensa: Filosofía para todos . 21 (61): 45–55. doi : 10.1017/S1477175621000464 .
Dresher, M. (1961). Las matemáticas de los juegos de estrategia: teoría y aplicaciones Prentice-Hall , Englewood Cliffs, Nueva Jersey.
Greif, A. (2006). Las instituciones y el camino hacia la economía moderna: lecciones del comercio medieval. Cambridge University Press, Cambridge , Reino Unido.
Kopelman, Shirli (febrero de 2020). "Ojo por ojo y más allá: el trabajo legendario de Anatol Rapoport". Investigación en Negociación y Gestión de Conflictos . 13 (1): 60–84. doi : 10.1111/ncmr.12172 . hdl : 2027.42/153763 .
Rapoport, Anatol y Albert M. Chammah (1965). El dilema del prisionero . Prensa de la Universidad de Michigan .
Schneider, Marcos; Shields, Timothy W. (junio de 2022). "Motivos para la cooperación en el dilema del prisionero de una sola vez". Revista de finanzas conductuales . 23 (4): 438–456. doi :10.1080/15427560.2022.2081974. S2CID 249903572.

enlaces externos

Medios relacionados con el dilema del prisionero en Wikimedia Commons
El dilema del Bowerbird El dilema del prisionero en ornitología: caricatura matemática de Larry Gonick.
Dixit, Avinash ; Nalebuff, Barry (2008). "El dilema del prisionero". En David R. Henderson (ed.). Enciclopedia concisa de economía (2ª ed.). Indianápolis: Biblioteca de Economía y Libertad . ISBN 978-0865976658. OCLC 237794267.
Dawkins: Los buenos chicos terminan primeros
Biblioteca Python del dilema del prisionero iterado de Axelrod
Juega El dilema del prisionero en oTree (N/A 5-11-17)
Evolution of Trust de Nicky Case, un ejemplo del juego de las donaciones
Juego en línea Iterado El dilema del prisionero de Wayne Davis
Lo que el dilema del prisionero revela sobre la vida, el universo y todo por Veritasium