stringtranslate.com

Dominio estratégico

En teoría de juegos , una estrategia dominante es una estrategia que es mejor que cualquier otra estrategia para un jugador, sin importar cómo juegue el oponente de ese jugador. Algunos juegos muy simples se pueden resolver utilizando el dominio.

Terminología

Un jugador puede comparar dos estrategias, A y B, para determinar cuál es mejor. El resultado de la comparación es uno de los siguientes:

Esta noción puede generalizarse más allá de la comparación de dos estrategias.

Estrategia: Un plan contingente completo para un jugador en el juego. Un plan contingente completo es una especificación completa del comportamiento de un jugador, que describe cada acción que un jugador tomaría en cada posible punto de decisión. Debido a que los conjuntos de información representan puntos en un juego donde un jugador debe tomar una decisión, la estrategia de un jugador describe lo que ese jugador hará en cada conjunto de información. [2]

Racionalidad: la suposición de que cada jugador actúa de una manera que está diseñada para lograr lo que más prefiere dadas las probabilidades de varios resultados; von Neumann y Morgenstern demostraron que si estas preferencias satisfacen ciertas condiciones, esto es matemáticamente equivalente a maximizar una recompensa. Un ejemplo sencillo de maximización de una recompensa es el de la ganancia monetaria, pero para el propósito de un análisis de teoría de juegos, esta recompensa puede tomar cualquier resultado deseado: una recompensa en efectivo, la minimización del esfuerzo o la incomodidad, o la promoción de la justicia, todas pueden modelarse como la acumulación de una “utilidad” general para el jugador. La suposición de racionalidad establece que los jugadores siempre actuarán de la manera que mejor satisfaga su orden del mejor al peor de varios resultados posibles. [2]

Conocimiento común : la suposición de que cada jugador tiene conocimiento del juego, conoce las reglas y las recompensas asociadas con cada curso de acción y se da cuenta de que todos los demás jugadores tienen el mismo nivel de comprensión. Esta es la premisa que permite a un jugador hacer un juicio de valor sobre las acciones de otro jugador, respaldado por el supuesto de racionalidad, al tomarlo en cuenta al seleccionar una acción. [2]

Dominancia y equilibrios de Nash

Si existe una estrategia estrictamente dominante para un jugador en un juego, ese jugador utilizará esa estrategia en cada uno de los equilibrios de Nash del juego . Si ambos jugadores tienen una estrategia estrictamente dominante, el juego tiene un único equilibrio de Nash, conocido como "equilibrio de estrategia dominante". Sin embargo, ese equilibrio de Nash no es necesariamente "eficiente", lo que significa que puede haber resultados del juego que no sean de equilibrio y que sean mejores para ambos jugadores. El juego clásico que se utiliza para ilustrar esto es el dilema del prisionero .

Las estrategias estrictamente dominadas no pueden formar parte de un equilibrio de Nash y, por lo tanto, es irracional que cualquier jugador las utilice. Por otro lado, las estrategias débilmente dominadas pueden formar parte de los equilibrios de Nash. Por ejemplo, considere la matriz de pagos que se muestra a la derecha.

La estrategia C domina débilmente a la estrategia D. Considere jugar C : si el oponente juega C, uno obtiene 1; si el oponente juega D, uno obtiene 0. Compare esto con D, donde uno obtiene 0 independientemente. Dado que en un caso, uno obtiene mejores resultados jugando C en lugar de D y nunca obtiene peores resultados, C domina débilmente a D . A pesar de esto, ⁠ ⁠ es un equilibrio de Nash. Suponga que ambos jugadores eligen D . Ninguno de los jugadores obtendrá mejores resultados al desviarse unilateralmente: si un jugador cambia a jugar C, seguirá obteniendo 0. Esto también satisface los requisitos de un equilibrio de Nash. Suponga que ambos jugadores eligen C. Ninguno de los jugadores obtendrá mejores resultados al desviarse unilateralmente: si un jugador cambia a jugar D, obtendrá 0. Esto también satisface los requisitos de un equilibrio de Nash.

Eliminación iterada de estrategias estrictamente dominadas

La eliminación iterativa (o eliminación, o remoción) de estrategias dominadas (también denominada IESDS, o IDSDS, o IRSDS) es una técnica común para resolver juegos que implica la eliminación iterativa de estrategias dominadas. En el primer paso, todas las estrategias dominadas se eliminan del espacio de estrategias de cada uno de los jugadores, ya que ningún jugador racional utilizaría nunca estas estrategias. Esto da como resultado un juego nuevo, más pequeño. Algunas estrategias, que no estaban dominadas antes, pueden estar dominadas en el juego más pequeño. El primer paso se repite, creando un nuevo juego aún más pequeño, y así sucesivamente.

Este proceso es válido ya que se supone que la racionalidad entre los jugadores es de conocimiento común , es decir, cada jugador sabe que el resto de jugadores son racionales, y cada jugador sabe que el resto de jugadores saben que él sabe que el resto de jugadores son racionales, y así sucesivamente hasta el infinito (véase Aumann, 1976).

Véase también

Referencias

  1. ^ Leyton-Brown, Kevin; Shoham, Yoav (enero de 2008). "Fundamentos de la teoría de juegos: una introducción multidisciplinaria concisa". Synthesis Lectures on Artificial Intelligence and Machine Learning . 2 (1): 36. doi :10.2200/S00108ED1V01Y200802AIM003.
  2. ^ abc Joel, Watson (9 de mayo de 2013). Estrategia: Introducción a la teoría de juegos (tercera edición). Nueva York. ISBN 9780393918380.OCLC 842323069  .{{cite book}}: Mantenimiento de CS1: falta la ubicación del editor ( enlace )
Este artículo incorpora material de Estrategia dominante en PlanetMath , que se encuentra bajo la licencia Creative Commons Attribution/Share-Alike License .