stringtranslate.com

Dominio estratégico

En teoría de juegos , el dominio estratégico (comúnmente llamado simplemente dominio ) ocurre cuando una estrategia es mejor que otra para un jugador, sin importar cómo jueguen los oponentes de ese jugador. Muchos juegos sencillos se pueden resolver utilizando la dominancia. Lo contrario, la intransitividad , ocurre en juegos donde una estrategia puede ser mejor o peor que otra estrategia para un jugador, dependiendo de cómo jueguen los oponentes del jugador.

Terminología

Cuando un jugador intenta elegir la "mejor" estrategia entre una multitud de opciones, ese jugador puede comparar dos estrategias A y B para ver cuál es mejor. El resultado de la comparación es uno de:

Esta noción puede generalizarse más allá de la comparación de dos estrategias.

Estrategia: Un plan de contingencia completo para un jugador del juego. Un plan de contingencia completo es una especificación completa del comportamiento de un jugador, que describe cada acción que tomaría en cada punto de decisión posible. Debido a que los conjuntos de información representan puntos en un juego donde un jugador debe tomar una decisión, la estrategia de un jugador describe lo que ese jugador hará en cada conjunto de información. [2]

Racionalidad: el supuesto de que cada jugador actúa de una manera diseñada para lograr lo que más prefiere, dadas las probabilidades de diversos resultados; von Neumann y Morgenstern demostraron que si estas preferencias satisfacen ciertas condiciones, esto es matemáticamente equivalente a maximizar un beneficio. Un ejemplo sencillo de maximizar la recompensa es el de la ganancia monetaria, pero a los efectos de un análisis de la teoría de juegos, esta recompensa puede tener cualquier resultado deseado. Por ejemplo, recompensa en efectivo, minimización del esfuerzo o malestar, promoción de la justicia o acumulación de “utilidad” general: el supuesto de racionalidad establece que los jugadores siempre actuarán de la manera que mejor satisfaga su orden de mejor a peor de los diversos resultados posibles. [2]

Conocimiento común : la suposición de que cada jugador tiene conocimiento del juego, conoce las reglas y los beneficios asociados con cada curso de acción y se da cuenta de que todos los demás jugadores tienen el mismo nivel de comprensión. Esta es la premisa que permite a un jugador realizar un juicio de valor sobre las acciones de otro jugador, respaldado por el supuesto de racionalidad, que debe tenerse en cuenta a la hora de seleccionar una acción. [2]

Equilibrios de dominancia y Nash

Si existe una estrategia estrictamente dominante para un jugador en un juego, ese jugador jugará esa estrategia en cada uno de los equilibrios de Nash del juego . Si ambos jugadores tienen una estrategia estrictamente dominante, el juego tiene sólo un equilibrio de Nash único, denominado "equilibrio de estrategia dominante". Sin embargo, ese equilibrio de Nash no es necesariamente "eficiente", lo que significa que puede haber resultados del juego fuera del equilibrio que serían mejores para ambos jugadores. El juego clásico utilizado para ilustrar esto es el dilema del prisionero .

Las estrategias estrictamente dominadas no pueden ser parte de un equilibrio de Nash y, como tal, es irracional que cualquier jugador las utilice. Por otro lado, las estrategias débilmente dominadas pueden ser parte de los equilibrios de Nash. Por ejemplo, considere la matriz de pagos que se muestra a la derecha.

La estrategia C domina débilmente la estrategia D. Considere jugar C : si el oponente juega C, obtiene 1; si el oponente juega D, uno obtiene 0. Compare esto con D, donde uno obtiene 0 independientemente. Dado que en un caso a uno le va mejor jugando C en lugar de D y nunca le va peor, C domina débilmente a D. A pesar de esto, se trata de un equilibrio de Nash. Supongamos que ambos jugadores eligen D . Ninguno de los jugadores obtendrá mejores resultados si se desvía unilateralmente: si un jugador cambia a jugar C, igual obtendrá 0. Esto satisface los requisitos de un equilibrio de Nash. Supongamos que ambos jugadores eligen C. A ninguno de los jugadores le irá mejor si se desvía unilateralmente: si un jugador cambia a jugar D, obtendrá 0. Esto también satisface los requisitos de un equilibrio de Nash.

Eliminación iterada de estrategias estrictamente dominadas (IESDS)

La eliminación iterativa (o eliminación o eliminación) de estrategias dominadas (también denominada IESDS, IDSDS o IRSDS) es una técnica común para resolver juegos que implica eliminar iterativamente estrategias dominadas. En el primer paso, como máximo se elimina una estrategia dominada del espacio estratégico de cada uno de los jugadores, ya que ningún jugador racional jamás jugaría estas estrategias. Esto da como resultado un juego nuevo y más pequeño. Algunas estrategias (que antes no estaban dominadas) pueden estar dominadas en el juego menor. Se repite el primer paso, creando un nuevo juego aún más pequeño, y así sucesivamente. El proceso se detiene cuando no se encuentra ninguna estrategia dominada para ningún jugador. Este proceso es válido ya que se supone que la racionalidad entre los jugadores es de conocimiento común , es decir, cada jugador sabe que el resto de los jugadores son racionales, y cada jugador sabe que el resto de los jugadores sabe que él sabe que el resto de los jugadores. los jugadores son racionales, y así hasta el infinito (véase Aumann, 1976).

Hay dos versiones de este proceso. Una versión implica únicamente eliminar las estrategias estrictamente dominadas. Si, después de completar este proceso, solo queda una estrategia para cada jugador, ese conjunto de estrategias es el equilibrio único de Nash. [3] Además, la eliminación iterada de estrategias estrictamente dominadas es independiente del camino. Es decir, si en algún punto del proceso hay múltiples estrategias estrictamente dominadas, entonces no importa para el resultado final qué estrategias eliminamos primero. [4]

Ejemplo paso a paso de eliminación de dominio estricto:

  1. C está estrictamente dominado por A para el jugador 1. Por lo tanto, el jugador 1 nunca jugará la estrategia C. El jugador 2 lo sabe. (ver IESDS Figura 1)
  2. De las estrategias restantes (ver Figura 2 de IESDS), Z está estrictamente dominada por Y y X para el Jugador 2. Por lo tanto, el Jugador 2 nunca jugará la estrategia Z. El Jugador 1 lo sabe.
  3. De las estrategias restantes (ver Figura 3 de IESDS), B está estrictamente dominada por A para el Jugador 1. Por lo tanto, el Jugador 1 nunca jugará contra B. El Jugador 2 lo sabe.
  4. De las estrategias restantes (ver Figura 4 de IESDS), Y está estrictamente dominada por X para el Jugador 2. Por lo tanto, el Jugador 2 nunca jugará con Y. El Jugador 1 lo sabe.
  5. Sólo queda una estrategia racionalizable {A,X} que da como resultado un pago de (10,4). Este es el único equilibrio de Nash para este juego.

Otra versión implica eliminar las estrategias tanto estrictamente como débilmente dominadas. Si al final del proceso hay una única estrategia para cada jugador, este conjunto de estrategias es también un equilibrio de Nash . Sin embargo, a diferencia del primer proceso, la eliminación de estrategias débilmente dominadas puede eliminar algunos equilibrios de Nash. Como resultado, el equilibrio de Nash encontrado eliminando estrategias débilmente dominadas puede no ser el único equilibrio de Nash. (En algunos juegos, si eliminamos las estrategias débilmente dominadas en un orden diferente, podemos terminar con un equilibrio de Nash diferente.)

Ejemplo paso a paso de eliminación de dominio débil:

  1. O está estrictamente dominado por N para el jugador 1. Por lo tanto, el jugador 1 nunca jugará la estrategia O. El jugador 2 lo sabe. (ver IESDS Figura 5)
  2. U está débilmente dominado por T para el jugador 2. Si el jugador 2 elige T, entonces el equilibrio final es (N,T)

  1. O está estrictamente dominado por N para el jugador 1. Por lo tanto, el jugador 1 nunca jugará la estrategia O. El jugador 2 lo sabe. (ver IESDS Figura 6)
  2. T está débilmente dominado por U para el jugador 2. Si el jugador 2 elige U, entonces el equilibrio final es (N,U)

En cualquier caso, si por eliminación iterativa de estrategias dominadas solo queda una estrategia para cada jugador, el juego se llama juego con solución de dominancia .

Eliminación iterada por estrategia mixta.

Hay casos en los que no existe una estrategia pura que domine a otra estrategia pura, pero una mezcla de dos o más estrategias puras puede dominar otra estrategia. Esto se llama estrategias mixtas estrictamente dominantes. Algunos autores permiten de esta manera eliminar estrategias dominadas por una estrategia mixta.

Ejemplo 1:

En este escenario, para el jugador 1, no existe una estrategia pura que domine a otra estrategia pura. Definamos la probabilidad de que el jugador 1 juegue como p, y sea p = ½. Podemos establecer una estrategia mixta donde el jugador 1 juega arriba y abajo con probabilidades (½,½). Cuando el jugador 2 juega hacia la izquierda, entonces el pago para el jugador 1 que juega la estrategia mixta de arriba y hacia abajo es 1, cuando el jugador 2 juega hacia la derecha, el pago para el jugador 1 que juega la estrategia mixta es 0,5. Por lo tanto, independientemente de si el jugador 2 elige izquierda o derecha, el jugador 1 obtiene más jugando esta estrategia mixta entre arriba y abajo que si el jugador jugara la estrategia intermedia. En este caso, deberíamos eliminar la estrategia intermedia para el jugador 1 ya que ha estado dominada por la estrategia mixta de jugar arriba y abajo con probabilidad (½,½).


Ejemplo 2:

Podemos demostrar los mismos métodos en un juego más complejo y resolver las estrategias racionales. En este escenario, el color azul representa los números dominantes en la estrategia particular.












Resolución paso a paso:

Para el Jugador 2, X está dominado por la estrategia mixta ½Y y ½Z.
El pago esperado por jugar la estrategia ½Y + ½Z debe ser mayor que el pago esperado por jugar la estrategia X pura, asignando ½ y ½ como valores de prueba. El argumento a favor de la dominancia de la estrategia mixta puede plantearse si existe al menos una estrategia mixta que permita la dominancia.

Al probar con ½ y ½ se obtiene lo siguiente:
Pago promedio esperado de ½ Estrategia Y: ½(4+0+4) = 4
Pago promedio esperado de ½ Estrategia Z: ½(0+5+5) = 5
Pago promedio esperado de estrategia X: (1+1+3) = 5

Establezca la desigualdad para determinar si la estrategia mixta dominará la estrategia pura en función de los resultados esperados.
u ½Y + u ½Z ⩼ u X
4 + 5 > 5
La estrategia mixta ½Y y ½Z dominará la estrategia pura X para el jugador 2 y, por lo tanto, X puede eliminarse de las estrategias racionalizables para P2.

Para el jugador 1, U está dominado por la estrategia pura D.

Para el jugador 2, Y está dominado por la estrategia pura Z.

Esto deja a M dominando a D para el jugador 1.

La única estrategia racionalizable para los jugadores 1 y 2 es entonces (M,Z) o (3,5).

Ver también

Referencias

  1. ^ Leyton-Brown, Kevin; Shoham, Yoav (enero de 2008). "Fundamentos de la teoría de juegos: una introducción multidisciplinaria concisa". Conferencias de Síntesis sobre Inteligencia Artificial y Aprendizaje Automático . 2 (1): 36. doi :10.2200/S00108ED1V01Y200802AIM003.
  2. ^ abc Joel, Watson (9 de mayo de 2013). Estrategia: una introducción a la teoría de juegos (tercera ed.). Nueva York. ISBN 9780393918380. OCLC  842323069.{{cite book}}: Mantenimiento CS1: falta el editor de la ubicación ( enlace )
  3. ^ Joel., Watson,. Estrategia: una introducción a la teoría de juegos (Segunda ed.). Nueva York. ISBN 9780393929348
  4. ^ Gilboa, yo; Kalai, E.; Zemel, E. (1990). «Sobre el orden de eliminar estrategias dominadas» (PDF) . Cartas de investigación operativa . 9 (2): 85–89. doi :10.1016/0167-6377(90)90046-8.
Este artículo incorpora material de la estrategia Dominant en PlanetMath , que tiene la licencia Creative Commons Attribution/Share-Alike License .