stringtranslate.com

Equilibrio bayesiano perfecto

En teoría de juegos , un equilibrio bayesiano perfecto (PBE) es una solución con probabilidad bayesiana para un juego por turnos con información incompleta. Más específicamente, es un concepto de equilibrio que utiliza la actualización bayesiana para describir el comportamiento del jugador en juegos dinámicos con información incompleta . Los equilibrios bayesianos perfectos se utilizan para resolver el resultado de juegos en los que los jugadores se turnan pero no están seguros del "tipo" de su oponente, lo que ocurre cuando los jugadores no conocen la preferencia de su oponente entre movimientos individuales. Un ejemplo clásico de un juego dinámico con tipos es un juego de guerra en el que el jugador no está seguro de si su oponente es un tipo " halcón " que toma riesgos o un tipo " paloma " pacifista . Los equilibrios bayesianos perfectos son un refinamiento del equilibrio de Nash bayesiano (BNE), que es un concepto de solución con probabilidad bayesiana para juegos que no se basan en turnos.

Cualquier equilibrio bayesiano perfecto tiene dos componentes: estrategias y creencias :

Las estrategias y creencias también deben satisfacer las siguientes condiciones:

Un equilibrio bayesiano perfecto es siempre un equilibrio de Nash.

Ejemplos de equilibrios bayesianos perfectos

Juego de regalo 1

Consideremos el siguiente juego:

Para cualquier valor de Equilibrio 1 existe un equilibrio de agrupación en el que ambos tipos de emisores eligen la misma acción:

Equilibrio 1. Emisor: No dar , ya sea del tipo amigo o del tipo enemigo. Receptor: No aceptar , con las creencias de que Prob(Amigo|No dar) = p y Prob(Amigo|Dar) = x, eligiendo un valor

El emisor prefiere el pago de 0 por no dar al pago de -1 por enviar y no ser aceptado. Por lo tanto, Dar tiene probabilidad cero en equilibrio y la Regla de Bayes no restringe la creencia Prob(Amigo|Dar) en absoluto. Esa creencia debe ser lo suficientemente pesimista como para que el receptor prefiera el pago de 0 por rechazar un regalo al pago esperado de aceptar, por lo que el requisito de que la estrategia del receptor maximice su pago esperado dadas sus creencias requiere que Prob(Amigo|Dar). Por otro lado, Prob(Amigo|No dar) = p es requerido por la Regla de Bayes, ya que ambos tipos toman esa acción y no es informativo sobre el tipo del emisor.

Si , existe un segundo equilibrio de agrupación además del Equilibrio 1, basado en diferentes creencias:

Equilibrio 2. Emisor: Dar , ya sea del tipo amigo o del tipo enemigo. Receptor: Aceptar, con la creencia de que Prob(Amigo|Dar) = p y Prob(Amigo|No dar) = x , eligiendo cualquier valor para

El emisor prefiere la recompensa de 1 por dar a la recompensa de 0 por no dar, esperando que su regalo sea aceptado. En equilibrio, la regla de Bayes requiere que el receptor tenga la creencia Prob(Amigo|Dar) = p , ya que ambos tipos realizan esa acción y no es informativa sobre el tipo del emisor en este equilibrio. La creencia fuera de equilibrio no importa, ya que el emisor no querría desviarse a No dar sin importar qué respuesta tendría el receptor.

El equilibrio 1 es perverso si el juego pudiera tener , por lo que es muy probable que el remitente sea un amigo, pero el receptor aún rechazaría cualquier regalo porque piensa que es mucho más probable que los enemigos den regalos que los amigos. Esto muestra cómo las creencias pesimistas pueden resultar en un equilibrio malo para ambos jugadores, uno que no es eficiente en el sentido de Pareto . Sin embargo, estas creencias parecen poco realistas y los teóricos de juegos a menudo están dispuestos a rechazar algunos equilibrios bayesianos perfectos por improbables.

Los equilibrios 1 y 2 son los únicos equilibrios que podrían existir, pero también podemos verificar los dos posibles equilibrios de separación , en los que los dos tipos de emisor eligen acciones diferentes, y ver por qué no existen como equilibrios bayesianos perfectos:

  1. Supongamos que la estrategia del emisor es: dar si es un amigo, no dar si es un enemigo. Las creencias del receptor se actualizan en consecuencia: si recibe un regalo, cree que el emisor es un amigo; de lo contrario, cree que el emisor es un enemigo. Por lo tanto, el receptor responderá con Aceptar . Sin embargo, si el receptor elige Aceptar , el emisor enemigo se desviará a   Dar , para aumentar su recompensa de 0 a 1, por lo que esto no puede ser un equilibrio.
  2. Supongamos que la estrategia del remitente es: No dar si es un amigo, Dar si es un enemigo. Las creencias del receptor se actualizan en consecuencia: si recibe un regalo, cree que el remitente es un enemigo; de lo contrario, cree que el remitente es un amigo. La mejor estrategia de respuesta del receptor es Rechazar. Sin embargo, si el receptor elige Rechazar , el remitente enemigo se desviará a   No dar , para aumentar su recompensa de -1 a 0, por lo que esto no puede ser un equilibrio.

Concluimos que en este juego no existe equilibrio separador.

Juego de regalo 2

En el siguiente ejemplo, [1] el conjunto de PBE es estrictamente menor que el conjunto de SPE y BNE. Es una variante del juego de regalos anterior, con el siguiente cambio en la utilidad del receptor:

Nótese que en esta variante, aceptar es una estrategia débilmente dominante para el receptor.

De manera similar al ejemplo 1, no existe un equilibrio de separación. Veamos los siguientes posibles equilibrios de agrupación:

  1. La estrategia del emisor es: dar siempre. Las creencias del receptor no se actualizan: sigue creyendo en la probabilidad a priori de que el emisor es un amigo con probabilidad y un enemigo con probabilidad . La recompensa que obtiene al aceptar es siempre mayor que al rechazar, por lo que acepta (independientemente del valor de ). Esta es una PBE: es la mejor respuesta tanto para el emisor como para el receptor.
  2. La estrategia del emisor es: nunca dar. Supongamos que la creencia del receptor al recibir un regalo es que el emisor es un amigo con probabilidad , donde es cualquier número en . Independientemente de , la estrategia óptima del receptor es: aceptar. Esto NO es una EBP, ya que el emisor puede mejorar su recompensa de 0 a 1 al dar un regalo.
  3. La estrategia del emisor es: nunca dar, y la del receptor es: rechazar. Esto NO es una PBE, ya que para cualquier creencia del receptor, rechazar no es la mejor respuesta.

Nótese que la opción 3 es un equilibrio de Nash. Si ignoramos las creencias, entonces rechazar puede considerarse la mejor respuesta para el receptor, ya que no afecta su pago (ya que de todos modos no hay regalo). Además, la opción 3 es incluso una SPE, ya que el único subjuego aquí es el juego completo. Tales equilibrios improbables también podrían surgir en juegos con información completa, pero pueden eliminarse aplicando el equilibrio de Nash perfecto en subjuegos . Sin embargo, los juegos bayesianos a menudo contienen conjuntos de información que no son únicos y, dado que los subjuegos deben contener conjuntos de información completos, a veces solo hay un subjuego (el juego completo) y, por lo tanto, cada equilibrio de Nash es trivialmente perfecto en subjuegos. Incluso si un juego tiene más de un subjuego, la incapacidad de la perfección en subjuegos para atravesar conjuntos de información puede dar como resultado que no se eliminen los equilibrios improbables.

En resumen: en esta variante del juego del regalo, hay dos EPE: o bien el emisor siempre da y el receptor siempre acepta, o bien el emisor siempre no da y el receptor siempre rechaza. De estos, sólo el primero es un EPE; el otro no es un EPE ya que no puede ser respaldado por ningún sistema de creencias.

Más ejemplos

Para más ejemplos, véase el juego de señalización#Examples . Véase también [2] para más ejemplos. Existe una aplicación reciente de este concepto en el póquer, por Loriente y Diez (2023). [3]

PBE en juegos de múltiples etapas

Un juego de varias etapas es una secuencia de juegos simultáneos que se juegan uno tras otro. Estos juegos pueden ser idénticos (como en los juegos repetidos ) o diferentes.

Juego repetido de bien público

El siguiente juego [4] : ​​sección 6.2  es una representación simple del problema del polizón . Hay dos jugadores, cada uno de los cuales puede construir un bien público o no construirlo. Cada jugador gana 1 si se construye el bien público y 0 si no; además, si el jugador construye el bien público, tiene que pagar un costo de . Los costos son información privada : cada jugador conoce su propio costo pero no el costo del otro. Solo se sabe que cada costo se extrae independientemente al azar de alguna distribución de probabilidad. Esto hace que este juego sea un juego bayesiano .

En el juego de una etapa, cada jugador construye si y solo si su costo es menor que su ganancia esperada de la construcción. La ganancia esperada de la construcción es exactamente 1 veces la probabilidad de que el otro jugador NO construya. En equilibrio, para cada jugador , hay un costo umbral , tal que el jugador contribuye si y solo si su costo es menor que . Este costo umbral se puede calcular en función de la distribución de probabilidad de los costos de los jugadores. Por ejemplo, si los costos se distribuyen uniformemente en , entonces hay un equilibrio simétrico en el que el costo umbral de ambos jugadores es 2/3. Esto significa que un jugador cuyo costo está entre 2/3 y 1 no contribuirá, aunque su costo sea menor que el beneficio, debido a la posibilidad de que el otro jugador contribuya.

Ahora, supongamos que este juego se repite dos veces. [4] : sección 8.2.3  Las dos jugadas son independientes, es decir, cada día los jugadores deciden simultáneamente si construir un bien público en ese día, obtener un pago de 1 si el bien se construye en ese día y pagar su costo si lo construyeron ese día. La única conexión entre los juegos es que, al jugar en el primer día, los jugadores pueden revelar alguna información sobre sus costos, y esta información puede afectar la jugada en el segundo día.

Buscamos un PBE simétrico. Denotemos el costo umbral de ambos jugadores en el día 1 (por lo tanto, en el día 1, cada jugador construye si y solo si su costo es como máximo ). Para calcular , trabajamos al revés y analizamos las acciones de los jugadores en el día 2. Sus acciones dependen del historial (= las dos acciones en el día 1), y hay tres opciones:

  1. En el día 1, ningún jugador construyó. Por lo tanto, ahora ambos jugadores saben que el costo de su oponente es superior a . Actualizan su creencia en consecuencia y concluyen que hay una menor probabilidad de que su oponente construya en el día 2. Por lo tanto, aumentan su costo umbral y el costo umbral en el día 2 es .
  2. En el día 1, ambos jugadores construyeron. Por lo tanto, ahora ambos jugadores saben que el costo de su oponente es menor a . Actualizan su creencia en consecuencia y concluyen que hay una mayor probabilidad de que su oponente construya en el día 2. Por lo tanto, disminuyen su costo umbral y el costo umbral en el día 2 es .
  3. En el día 1, exactamente un jugador construyó; supongamos que es el jugador 1. Por lo tanto, ahora se sabe que el costo del jugador 1 es menor y el costo del jugador 2 es mayor . Existe un equilibrio en el que las acciones del día 2 son idénticas a las del día 1: el jugador 1 construye y el jugador 2 no.

Es posible calcular el pago esperado del "jugador umbral" (un jugador con un costo exactamente ) en cada una de estas situaciones. Dado que el jugador umbral debería ser indiferente entre contribuir o no contribuir, es posible calcular el costo umbral del día 1 . Resulta que este umbral es menor que el umbral en el juego de una etapa. Esto significa que, en un juego de dos etapas, los jugadores están menos dispuestos a construir que en el juego de una etapa. Intuitivamente, la razón es que, cuando un jugador no contribuye en el primer día, hace creer al otro jugador que su costo es alto, y esto hace que el otro jugador esté más dispuesto a contribuir en el segundo día.

Subasta de salto

En una subasta inglesa a viva voz , los postores pueden aumentar el precio actual en pequeños pasos (por ejemplo, en $1 cada vez). Sin embargo, a menudo hay pujas de salto : algunos postores aumentan el precio actual mucho más que el incremento mínimo. Una explicación de esto es que sirve como señal para los demás postores. Hay una PBE en la que cada postor salta si, y solo si, su valor está por encima de un cierto umbral. Consulte Pujas de salto#señalización .

Véase también

Referencias

  1. ^ James Peck. "Perfect Bayesian Equilibrium" (PDF) . Universidad Estatal de Ohio . Consultado el 6 de diciembre de 2021 .
  2. ^ Zack Grossman. "Perfect Bayesian Equilibrium" (PDF) . Universidad de California . Consultado el 2 de septiembre de 2016 .
  3. ^ Loriente, Martín Iñaki & Diez, Juan Cruz (2023). "Equilibrio bayesiano perfecto en Kuhn Poker". Universidad de San Andrés.
  4. ^ ab Fudenberg, Drew ; Tirole, Jean (1991). Teoría de juegos. Cambridge, Massachusetts: MIT Press . ISBN 9780262061414.Vista previa del libro.