stringtranslate.com

Equilibrio correlacionado

En teoría de juegos , un equilibrio correlacionado es un concepto de solución que es más general que el conocido equilibrio de Nash . Fue discutido por primera vez por el matemático Robert Aumann en 1974. [1] [2] La idea es que cada jugador elija su acción de acuerdo con su observación privada del valor de la misma señal pública. Una estrategia asigna una acción a cada observación posible que pueda hacer un jugador. Si ningún jugador quisiera desviarse de su estrategia (suponiendo que los demás tampoco se desvíen), la distribución de la que se extraen las señales se denomina equilibrio correlacionado.

Definicion formal

Un juego estratégico de jugadores se caracteriza por un conjunto de acciones y una función de utilidad para cada jugador . Cuando el jugador elige la estrategia y los jugadores restantes eligen un perfil de estrategia descrito por la tupla , entonces la utilidad del jugador es .

Una modificación de estrategia para el jugador es una función . Es decir, le dice al jugador que modifique su comportamiento realizando una acción cuando se le indique que juegue .

Sea un espacio de probabilidad contable . Para cada jugador , sea su partición de información, sea la posterior y let , asignando el mismo valor a los estados en la misma celda de la partición de información. Entonces existe un equilibrio correlacionado del juego estratégico si para cada jugador y para cada modificación de estrategia :

En otras palabras, es un equilibrio correlacionado si ningún jugador puede mejorar su utilidad esperada mediante una modificación de la estrategia.

Un ejemplo

Considere el juego de la gallina que se muestra en la imagen. En este juego, dos personas se desafían mutuamente en una competencia en la que cada uno puede atreverse o acobardarse . Si uno se va a atrever, más vale que el otro se acobarde. Pero si uno se va a acobardar, más vale que el otro se atreva. Esto lleva a una situación interesante en la que cada uno quiere atreverse, pero sólo si el otro se acobarda.

En este juego hay tres equilibrios de Nash . Los dos equilibrios de Nash de estrategia pura son ( D , C ) y ( C , D ). También existe un equilibrio de estrategia mixta en el que ambos jugadores se acobardan con una probabilidad de 2/3.

Ahora considere un tercero (o algún evento natural) que roba una de las tres cartas etiquetadas: ( C , C ), ( D , C ) y ( C , D ), con la misma probabilidad, es decir, probabilidad 1/3 para cada una. tarjeta. Después de robar la carta, el tercero informa a los jugadores de la estrategia que se les ha asignado en la carta (pero no de la estrategia asignada a su oponente). Supongamos que a un jugador se le asigna D , no querrá desviarse suponiendo que el otro jugador haya jugado su estrategia asignada, ya que obtendrá 7 (el pago más alto posible). Supongamos que a un jugador se le asigna C. Luego el otro jugador jugará C con probabilidad 1/2 y D con probabilidad 1/2. La utilidad esperada de Daring es 7(1/2) + 0(1/2) = 3,5 y la utilidad esperada de acobardarse es 2(1/2) + 6(1/2) = 4. Entonces, el jugador Prefiero acobardarme.

Dado que ninguno de los jugadores tiene incentivos para desviarse, éste es un equilibrio correlacionado. El pago esperado para este equilibrio es 7(1/3) + 2(1/3) + 6(1/3) = 5, que es mayor que el pago esperado del equilibrio de Nash con estrategias mixtas.

El siguiente equilibrio correlacionado tiene un beneficio aún mayor para ambos jugadores: recomendar ( C , C ) con probabilidad 1/2, y ( D , C ) y ( C , D ) con probabilidad 1/4 cada uno. Entonces, cuando a un jugador se le recomienda jugar C , sabe que el otro jugador jugará D con probabilidad (condicional) 1/3 y C con probabilidad 2/3, y obtendrá el pago esperado 14/3, que es igual a (no menos que) el pago esperado cuando juegan D . En este equilibrio correlacionado, ambos jugadores obtienen 5,25 de expectativa. Se puede demostrar que éste es el equilibrio correlacionado con la suma máxima de pagos esperados para los dos jugadores.

Aprendizaje de equilibrios correlacionados

Una de las ventajas de los equilibrios correlacionados es que son computacionalmente menos costosos que los equilibrios de Nash . Esto puede reflejarse en el hecho de que calcular un equilibrio correlacionado solo requiere resolver un programa lineal, mientras que resolver un equilibrio de Nash requiere encontrar su punto fijo por completo. [3] Otra forma de ver esto es que es posible que dos jugadores respondan a las jugadas históricas del otro en un juego y terminen convergiendo hacia un equilibrio correlacionado. [4]

Referencias

  1. ^ Aumann, Robert (1974). "Subjetividad y correlación en estrategias aleatorias". Revista de Economía Matemática . 1 (1): 67–96. CiteSeerX  10.1.1.120.1740 . doi :10.1016/0304-4068(74)90037-8.
  2. ^ Aumann, Robert (1987). "Equilibrio correlacionado como expresión de la racionalidad bayesiana". Econométrica . 55 (1): 1–18. CiteSeerX 10.1.1.295.4243 . doi :10.2307/1911154. JSTOR  1911154. S2CID  18649722. 
  3. ^ Papadimitriou, Christos H.; Jardín áspero, Tim (2008). "Calcular equilibrios correlacionados en juegos multijugador". J. ACM . 55 (3): 14:1–14:29. CiteSeerX 10.1.1.335.2634 . doi :10.1145/1379759.1379762. S2CID  53224027. 
  4. ^ Foster, Dean P.; Vohra, Rakesh V. (1996). "Aprendizaje calibrado y equilibrio correlacionado". Juegos y comportamiento económico .

Fuentes