stringtranslate.com

Selección de equilibrio

La selección de equilibrio es un concepto de la teoría de juegos que busca abordar las razones por las que los jugadores de un juego seleccionan un determinado equilibrio en lugar de otro. El concepto es especialmente relevante en la teoría de juegos evolutiva , donde los diferentes métodos de selección de equilibrio responden a diferentes ideas de qué equilibrios serán estables y persistentes para que un jugador juegue incluso ante las desviaciones (y mutaciones) de los otros jugadores. Esto es importante porque existen varios conceptos de equilibrio y, para muchos conceptos particulares, como el equilibrio de Nash , muchos juegos tienen múltiples equilibrios.

Selección de equilibrio con juegos repetidos

Un juego de etapa es un juego de n jugadores en el que los jugadores eligen entre un conjunto finito de acciones y existe un perfil de recompensas para sus elecciones. Un juego repetido es jugar una serie de repeticiones de un juego de etapa en períodos de tiempo discretos (Watson, 2013). La reputación de un jugador afecta las acciones y el comportamiento de los otros jugadores. En otras palabras, la forma en que un jugador se comporta en las rondas anteriores determina las acciones de sus oponentes en las rondas posteriores. Un ejemplo es la interacción entre un empleado y un empleador donde el empleado elude su responsabilidad por una ganancia a corto plazo y luego pierde la bonificación que el empleador suspende después de observar el comportamiento del empleado (Watson, 2013). La dinámica de la selección de equilibrio para juegos repetidos se puede ilustrar con un juego de dos períodos. Con cada acción de los jugadores en un período, se inicia un nuevo subjuego basado en ese perfil de acción. Para el Equilibrio de Nash de todo el juego, se requiere un equilibrio perfecto de subjuegos de cada juego. Por lo tanto, en el último período de un juego repetido, los jugadores elegirán un Equilibrio de Nash en el juego de etapa. Las acciones estipuladas en Equilibrio que no sean estrategias de Equilibrio de Nash en el juego de etapa aún se admiten. Esto se puede lograr estableciendo una reputación de "cooperación" en los períodos anteriores que lleve al oponente a seleccionar una estrategia de Equilibrio de Nash más favorable en el período final. Si un jugador se gana la reputación de desviarse en lugar de cooperar, entonces el oponente puede "castigarlo" eligiendo un Equilibrio menos favorable en el período final del juego repetido.

Punto focal

Otro concepto que puede ayudar a seleccionar un equilibrio es el de punto focal . Este concepto fue introducido por primera vez por Thomas Schelling, un teórico de juegos ganador del premio Nobel, en su libro La estrategia del conflicto en 1960 (Schelling, 1960). Cuando los participantes están en un juego de coordenadas donde los jugadores no tienen la oportunidad de discutir sus estrategias de antemano, el punto focal es una solución que de alguna manera se destaca como la respuesta natural.  

Por ejemplo, en un experimento realizado en 1990 por Mehta et al. (1994), los investigadores pidieron a los participantes que respondieran a un cuestionario que contenía la pregunta "nombrar un año" o "nombrar una ciudad de Inglaterra". Se pidió a los participantes que dieran la primera respuesta que les viniera a la mente y muchos indicaron su año de nacimiento o su ciudad natal.

Sin embargo, cuando se les ofreció el incentivo de coordinarse (se les dijo a los participantes que recibirían un pago si lograban responder la pregunta de la misma manera que un compañero anónimo), la mayoría de ellos eligió 1990 (el año en ese momento) y Londres (la ciudad más grande del Reino Unido). Estas no son las primeras respuestas que les vinieron a la mente, pero son las mejores apuestas después de deliberar mientras intentaban encontrar un compañero sin discusión previa. En este caso, el año 1990, o la ciudad de Londres, es el punto focal de este juego, para ayudar a los jugadores a seleccionar el mejor equilibrio en este juego de coordenadas.

Además, incluso en la situación en la que a los jugadores del juego se les permite comunicarse entre sí, como en una negociación, el punto focal aún puede ser útil para seleccionar un equilibrio apropiado: cuando la negociación está a punto de terminar, cada jugador debe tomar la decisión de último momento sobre cuán agresivo debe ser y hasta qué punto debe confiar en sus oponentes (Hyde, 2017).

Simetrías

Varios autores han estudiado juegos con simetrías (sobre jugadores o acciones), especialmente en el caso de juegos totalmente cooperativos. Por ejemplo, se ha considerado el juego de equipo Hanabi , en el que los diferentes jugadores y palos son simétricos. En relación con esto, algunos autores han considerado cómo se relaciona la selección de equilibrio entre juegos isomorfos. En general, se ha argumentado que un grupo de jugadores no debería elegir estrategias que rompan arbitrariamente estas simetrías, es decir, deberían jugar estrategias simétricas para apuntar a equilibrios simétricos. [1] De manera similar, deberían jugar juegos isomorfos de manera isomorfa. [2] Por ejemplo, en Hanabi, las pistas correspondientes a los diferentes palos deberían tener significados análogos (simétricos). En los juegos de equipo, la estrategia simétrica óptima también es un equilibrio de Nash (simétrico). [3] Si bien romper las simetrías puede permitir utilidades mayores, da como resultado estrategias antinaturales e inhumanas. [1] Todo juego simétrico finito (incluidos los juegos que no son de equipo) tiene un equilibrio de Nash simétrico. [4]

Ejemplos de conceptos de selección de equilibrio

Dominio del riesgo y la rentabilidad

Definición : Consideremos una situación en la que un juego tiene múltiples equilibrios de Nash (EN), el equilibrio se puede clasificar en dos categorías:

Explicación: Se elige una NE con predominio del riesgo cuando el jugador quiere evitar grandes pérdidas, mientras que se considera una NE con predominio de los pagos para una solución de pago óptima. Tenga en cuenta que tanto la NE con predominio del riesgo como la NE con predominio de los pagos son tipos típicos de NE.

Ejemplo: tomemos como ejemplo la matriz de pagos en forma normal de un juego:

En este juego hay dos estrategias de estrategia en juego, es decir (U, L) y (D, R). Aquí (U, L) es una estrategia de estrategia en la que predominan los pagos, ya que esta estrategia puede generar un pago general óptimo. Sin embargo, dada la incertidumbre de la acción del oponente, uno de los jugadores puede considerar una estrategia más conservadora (D para el jugador 1 y R para el jugador 2), que puede evitar la situación de "una gran pérdida", es decir, obtener un pago cero una vez que el oponente se desvíe. Por lo tanto, (D, R) es una estrategia de estrategia en la que predominan los riesgos.

1/2 dominio

Véase también

Referencias

  1. ^ ab Hu, Hengyuan; Lerer, Adam; Peysakhovich, Alex; Foerster, Jakob (2020). "'Otro juego' para la coordinación de disparo cero". Actas de la 37ª Conferencia Internacional sobre Aprendizaje Automático . arXiv : 2003.02979 .
  2. ^ Harsanyi, John C.; Selten, Reinhard (1988). Una teoría general de la selección del equilibrio . Prensa del MIT.
  3. ^ Emmons, Scott; Oesterheld, Caspar; Critch, Andrew; Conitzer, Vincent; Russell, Stuart (2022). "Para el aprendizaje en equipos simétricos, los óptimos locales son equilibrios de Nash globales". Actas de la 39.ª Conferencia internacional sobre aprendizaje automático . págs. 5924–5943.
  4. ^ Nash, John (1951). "Juegos no cooperativos". Anales de Matemáticas . 54 (2): 286–295. doi :10.2307/1969529. JSTOR  1969529.