stringtranslate.com

Superracionalidad

En economía y teoría de juegos , se considera que un participante tiene superracionalidad (o racionalidad renormalizada ) si tiene racionalidad perfecta (y, por lo tanto, maximiza su utilidad ) pero supone que todos los demás jugadores también son superracionales y que un individuo superracional siempre ideará la misma estrategia que cualquier otro pensador superracional cuando se enfrente al mismo problema. Aplicando esta definición, un jugador superracional que juega contra un oponente superracional en un dilema del prisionero cooperará, mientras que un jugador racionalmente interesado en sí mismo desertará.

Esta regla de decisión no es un modelo convencional en la teoría de juegos y fue sugerida por Douglas Hofstadter en su artículo, serie y libro Metamagical Themas [1] como un tipo alternativo de toma de decisiones racional diferente de la ampliamente aceptada en la teoría de juegos . Hofstadter proporcionó esta definición: "Los pensadores superracionales, por definición recursiva, incluyen en sus cálculos el hecho de que están en un grupo de pensadores superracionales". [1]

A diferencia del supuesto " humano recíproco ", el pensador supraracional no siempre buscará el equilibrio que maximice la utilidad social total y, por lo tanto, no es un filántropo .

El dilema del prisionero

La idea de la superracionalidad es que dos pensadores lógicos que analizan el mismo problema pensarán en la misma respuesta correcta. Por ejemplo, si dos personas son buenas en matemáticas y a ambas se les ha dado el mismo problema complicado para resolver, ambas obtendrán la misma respuesta correcta. En matemáticas, saber que las dos respuestas serán las mismas no cambia el valor del problema, pero en la teoría de juegos, saber que la respuesta será la misma puede cambiar la respuesta en sí.

El dilema del prisionero suele formularse en términos de sentencias de cárcel para los criminales, pero también puede formularse con premios en efectivo. A dos jugadores se les da la opción de cooperar (C) o desertar (D). Los jugadores eligen sin saber qué hará el otro. Si ambos cooperan, cada uno recibirá 100 dólares. Si ambos desertan, cada uno recibirá 1 dólar. Si uno coopera y el otro deserta, entonces el jugador desertor recibirá 150 dólares, mientras que el jugador que coopera no recibirá nada.

A continuación se enumeran los cuatro resultados y el pago para cada jugador.

Una forma válida para que los jugadores razonen es la siguiente:

  1. Suponiendo que el otro jugador deserta, si coopero no obtengo nada y si deserto obtengo un dólar.
  2. Suponiendo que el otro jugador coopera, obtengo $100 si coopero y $150 si deserto.
  3. Así que, independientemente de lo que haga el otro jugador, mi recompensa aumenta si deserto, aunque sea solo en un dólar.

La conclusión es que lo racional es desertar. Este tipo de razonamiento define la racionalidad de la teoría de juegos y dos jugadores racionales de la teoría de juegos que juegan este juego desertan y reciben un dólar cada uno.

La superracionalidad es un método alternativo de razonamiento. En primer lugar, se supone que la respuesta a un problema simétrico será la misma para todos los jugadores superracionales. Por lo tanto, la igualdad se tiene en cuenta antes de saber cuál será la estrategia. La estrategia se encuentra maximizando la recompensa para cada jugador, suponiendo que todos usan la misma estrategia. Como el jugador superracional sabe que el otro jugador superracional hará lo mismo, sea lo que sea, solo hay dos opciones para dos jugadores superracionales. Ambos cooperarán o ambos desertarán dependiendo del valor de la respuesta superracional. Por lo tanto, los dos jugadores superracionales cooperarán, ya que esta respuesta maximiza su recompensa. Dos jugadores superracionales que jueguen a este juego se irán cada uno con $100.

Obsérvese que un jugador superracional que juega contra un jugador racional basado en la teoría de juegos desertará, ya que la estrategia solo supone que los jugadores superracionales estarán de acuerdo. Un jugador superracional que juega contra un jugador de superracionalidad incierta a veces desertará y a veces cooperará, en función de la probabilidad de que el otro jugador sea superracional. [ cita requerida ]

Aunque la teoría de juegos estándar asume un conocimiento común de la racionalidad, lo hace de una manera diferente. El análisis de la teoría de juegos maximiza los pagos al permitir que cada jugador cambie de estrategia independientemente de los demás, aunque al final, supone que la respuesta en un juego simétrico será la misma para todos. Esta es la definición de un equilibrio de Nash de la teoría de juegos , que define una estrategia estable como aquella en la que ningún jugador puede mejorar los pagos cambiando unilateralmente el curso. El equilibrio superracional en un juego simétrico es aquel en el que las estrategias de todos los jugadores se ven obligadas a ser las mismas antes del paso de maximización. (Aunque no hay una extensión acordada del concepto de superracionalidad a los juegos asimétricos, véase § Juegos asimétricos para más información).

Algunos sostienen [¿ quiénes? ] que la superracionalidad implica una especie de pensamiento mágico en el que cada jugador supone que su decisión de cooperar hará que el otro jugador coopere, aunque no haya comunicación. Hofstadter señala que el concepto de "elección" no se aplica cuando el objetivo del jugador es resolver algo, y que la decisión no hace que el otro jugador coopere, sino que la misma lógica conduce a la misma respuesta independientemente de la comunicación o la causa y el efecto. Este debate es sobre si es razonable que los seres humanos actúen de manera superracional, no sobre qué significa la superracionalidad, y es similar a los argumentos sobre si es razonable que los seres humanos actúen de manera "racional", como se describe en la teoría de juegos (en la que pueden averiguar lo que otros jugadores harán o han hecho al preguntarse qué haría yo si fuera ellos, y aplicar la inducción hacia atrás y la eliminación iterada de las estrategias dominadas ).

Estrategias probabilísticas

Para simplificar, la explicación anterior de la superracionalidad ignoró las estrategias mixtas : la posibilidad de que la mejor opción pudiera ser lanzar una moneda al aire o, de manera más general, elegir diferentes resultados con cierta probabilidad . En el dilema del prisionero , es superracional cooperar con una probabilidad de 1 incluso cuando se admiten estrategias mixtas, porque el pago promedio cuando un jugador coopera y el otro deserta es el mismo que cuando ambos cooperan y, por lo tanto, desertar aumenta el riesgo de que ambos deserten, lo que disminuye el pago esperado. Pero en algunos casos, la estrategia superracional es mixta.

Por ejemplo, si los pagos son los siguientes:

CC – $100/$100
CD – $0/$1,000,000
DC – $1,000,000/$0
DD – $1/$1

Para que desertar tenga una recompensa enorme, la estrategia superracional es desertar con una probabilidad de 499.900/999.899 o un poco más del 49,995%. A medida que la recompensa aumenta hasta el infinito, la probabilidad solo se acerca a 1/2 más, y las pérdidas por adoptar la estrategia más simple de 1/2 (que ya son mínimas) se acercan a 0. En un ejemplo menos extremo, si la recompensa para un cooperador y un desertor fue $400 y $0, respectivamente, el mundo de la estrategia mixta superracional sería desertar con una probabilidad de 100/299 o aproximadamente 1/3.

En situaciones similares con más jugadores, el uso de un mecanismo de aleatorización puede ser esencial. Un ejemplo analizado por Hofstadter es el dilema de Platonia : un billonario excéntrico se pone en contacto con 20 personas y les dice que si una y sólo una de ellas le envía un telegrama (que se supone que no cuesta nada) antes del mediodía del día siguiente, esa persona recibirá mil millones de dólares. Si reciben más de un telegrama o ninguno, nadie recibirá dinero y la comunicación entre jugadores está prohibida. En esta situación, lo superracional que se debe hacer (si se sabe que los 20 son superracionales) es enviar un telegrama con probabilidad p = 1/20, es decir, cada destinatario básicamente lanza un dado de 20 caras y sólo envía un telegrama si sale "1". Esto maximiza la probabilidad de que se reciba exactamente un telegrama.

Sin embargo, hay que tener en cuenta que esta no es la solución del análisis convencional de la teoría de juegos. Veinte jugadores racionales en teoría de juegos enviarían cada uno telegramas y, por lo tanto, no recibirían nada. Esto se debe a que enviar telegramas es la estrategia dominante : si un jugador individual envía telegramas, tiene la posibilidad de recibir dinero, pero si no envía ningún telegrama, no puede obtener nada. (Si se garantizara que todos los telegramas llegarían, solo enviarían uno, y nadie esperaría recibir dinero).

Juegos asimétricos

El trabajo académico que extiende el concepto de superracionalidad a los juegos asimétricos es todavía incipiente.

Uno de estos trabajos, desarrollado por Ghislain Fourny, [2] propone un algoritmo de decisión que, cuando es ejecutado por un conjunto de agentes, conducirá a lo que él llamó un Equilibrio Perfectamente Transparente:

El equilibrio generalizado se denomina Equilibrio Perfectamente Transparente (ETP). [...] si bien no siempre existe, cuando existe, siempre es único, siempre es Pareto-óptimo y coincide con el equilibrio de Hofstadter en juegos simétricos.

Este algoritmo puede entenderse informalmente como la siguiente secuencia de pasos:

  1. Determinar, dadas las opciones que podrían estar disponibles para los jugadores, qué resultado se alcanzaría si cada uno de ellos ejecutara la regla de decisión maximin . Llamar a este resultado m .
  2. Eliminar de la consideración cualquier resultado que no domine en el sentido de Pareto m .
  3. Repita los pasos 1 y 2 hasta que solo quede un resultado o se eliminen más resultados.

El resultado que sobreviva a este proceso de eliminación, si lo hay, será el PTE.

Formalizaciones y conceptos relacionados

La cuestión de si se debe cooperar en un dilema del prisionero de una sola vez en algunas circunstancias también ha surgido en la literatura de teoría de la decisión, impulsada por el problema de Newcomb . La teoría de la decisión causal sugiere que la superracionalidad es irracional, mientras que la teoría de la decisión evidencial aprueba líneas de razonamiento similares a la superracionalidad y recomienda la cooperación en un dilema del prisionero contra un oponente similar. [3] [4]

El equilibrio del programa se ha propuesto como un modelo mecanicista de superracionalidad. [5] [6] [7]

Véase también

Referencias

  1. ^ ab Hofstadter, Douglas (junio de 1983). "Dilemas para pensadores superracionales que conducen a una lotería tentadora". Scientific American . 248 (6).– reimpreso en: Hofstadter, Douglas (1985). Metamagical Themas . Basic Books. págs. 737–755. ISBN. 0-465-04566-9.
  2. ^ Fourny, Ghislain (junio de 2020). "Predicción perfecta en forma normal: pensamiento superracional extendido a juegos no simétricos". Revista de psicología matemática . 96 . doi :10.1016/j.jmp.2020.102332.
  3. ^ Lewis, David (1979). "El dilema del prisionero es un problema de Newcomb". Filosofía y asuntos públicos . 8 (3): 235–240. doi :10.1093/0195036468.003.0011. JSTOR  2265034.
  4. ^ Brams, Steven J. (1975). "El problema de Newcomb y el dilema del prisionero". Revista de resolución de conflictos . 19 (4): 596–612.
  5. ^ Howard, JV (mayo de 1988). "Cooperación en el dilema del prisionero". Teoría y decisión . 24 (3): 203–213. doi :10.1007/BF00148954.
  6. ^ Barasz, M.; Christiano, P .; Fallenstein, B.; Herreshoff, M.; LaVictoire, P.; Yudkowsky, E. (2014). "Cooperación robusta en el dilema del prisionero: equilibrio del programa mediante lógica de demostrabilidad". arXiv : 1401.5577 [cs.GT].
  7. ^ Oesterheld, Caspar; Treutlein, Johannes; Grosse, Roger; Conitzer, Vincent; Foerster, Jakob (2023). "Equilibrio cooperativo basado en similitud". Actas de los Sistemas de procesamiento de información neuronal (NeurIPS) .