stringtranslate.com

Estrategia dominada por Max

En teoría de juegos, una estrategia dominada por el máximo es una estrategia que no es la mejor respuesta a ningún perfil de estrategia de los otros jugadores. Esta es una extensión del concepto de estrategias estrictamente dominadas , que también están dominadas por el máximo.

Definición

Estrategias dominadas por Max

Una estrategia de un jugador está dominada por el máximo si para cada perfil de estrategia de los otros jugadores existe una estrategia tal que . Esta definición significa que no es la mejor respuesta a ningún perfil de estrategia , ya que para cada perfil de estrategia de ese tipo existe otra estrategia que ofrece una utilidad mayor que para el jugador .

Si una estrategia está estrictamente dominada por la estrategia, entonces también está dominada por el máximo , ya que para cada perfil de estrategia de los otros jugadores , es la estrategia para la cual .

Incluso si está estrictamente dominado por una estrategia mixta, también está dominado por el máximo .

Estrategias débilmente dominadas por el máximo

Una estrategia de un jugador está débilmente dominada por el máximo si para cada perfil de estrategia de los otros jugadores existe una estrategia tal que . Esta definición significa que no es la mejor respuesta o no es la única mejor respuesta a cualquier perfil de estrategia , ya que para cada perfil de estrategia de ese tipo existe otra estrategia que brinda al menos la misma utilidad que para el jugador .

Si una estrategia está débilmente dominada por la estrategia , entonces también está débilmente dominada al máximo , ya que para cada perfil de estrategia de los otros jugadores , es la estrategia para la cual .

Incluso si está débilmente dominado por una estrategia mixta, también está débilmente dominado por el máximo .

Juegos con máxima resolución

Definición

Se dice que un juego es de máxima solución si, mediante la eliminación iterada de las estrategias dominadas por el máximo, solo queda un perfil de estrategia al final.

Más formalmente decimos que es máx. resoluble si existe una secuencia de juegos tales que:

Obviamente, cada juego de máxima solución tiene un equilibrio de Nash puro único , que es el perfil de estrategia que queda en .

Al igual que en la parte anterior, se puede definir respectivamente la noción de juegos débilmente max-solubles , que son juegos para los cuales se puede llegar a un juego con un único perfil de estrategia eliminando las estrategias débilmente max-dominadas . La principal diferencia sería que los juegos débilmente max-dominados pueden tener más de un equilibrio de Nash puro , y que el orden de eliminación podría dar como resultado diferentes equilibrios de Nash.

Ejemplo

El dilema del prisionero es un ejemplo de un juego de máxima resolución (ya que también es de dominio). La estrategia cooperar está dominada al máximo por la estrategia desertar para ambos jugadores, ya que jugar desertar siempre le da al jugador una utilidad mayor, sin importar lo que juegue el otro jugador. Para ver esto, tenga en cuenta que si el jugador de la fila juega cooperar, entonces el jugador de la columna preferiría jugar desertar y quedar libre que jugar cooperar y cumplir un año en prisión. Si el jugador de la fila juega desertar, entonces el jugador de la columna preferiría jugar desertar y cumplir tres años en prisión en lugar de jugar cooperar y cumplir cinco años en prisión.

Juegos con máxima resolución y dinámica de mejor respuesta

En cualquier juego de máxima resolución, la dinámica de mejor respuesta conduce en última instancia al único equilibrio de Nash puro del juego. Para ver esto, todo lo que necesitamos hacer es notar que si es una secuencia de eliminación del juego (lo que significa que primero se elimina del espacio de estrategias de algún jugador ya que está dominado por el máximo, luego se elimina, y así sucesivamente), entonces en la dinámica de mejor respuesta nunca será jugado por su jugador después de una iteración de mejores respuestas, nunca será jugado por su jugador después de dos iteraciones de mejores respuestas y así sucesivamente. La razón de esto es que no es una mejor respuesta a ningún perfil de estrategia de los otros jugadores, por lo que después de una iteración de mejores respuestas su jugador debe haber elegido una estrategia diferente. Dado que entendemos que nunca volveremos a en ninguna iteración de las mejores respuestas, podemos tratar el juego después de una iteración de mejores respuestas como si hubiera sido eliminado del juego y completar la prueba por inducción.

Puede resultar sorprendente entonces que los juegos débilmente resolubles al máximo no necesariamente convergen a un equilibrio de Nash puro cuando se utiliza la dinámica de mejor respuesta , como se puede ver en el juego de la derecha. Si el juego comienza en la celda inferior izquierda de la matriz, entonces es posible la siguiente dinámica de mejor repetición: el jugador de la fila se mueve una fila hacia arriba hasta la fila central, el jugador de la columna se mueve a la columna de la derecha, el jugador de la fila se mueve de nuevo a la fila inferior, el jugador de la columna se mueve de nuevo a la columna de la izquierda y así sucesivamente. Obviamente, esto nunca converge al único equilibrio de Nash puro del juego (que es la celda superior izquierda en la matriz de pagos ).

Véase también

Dominancia (teoría de juegos)

Enlaces externos y referencias