Juego en forma normal

En teoría de juegos , la forma normal es una descripción de un juego . A diferencia de la forma extensiva , las representaciones en forma normal no son gráficas per se , sino que representan el juego por medio de una matriz . Si bien este enfoque puede ser de mayor utilidad para identificar estrategias estrictamente dominadas y equilibrios de Nash , se pierde cierta información en comparación con las representaciones en forma extensiva. La representación en forma normal de un juego incluye todas las estrategias perceptibles y concebibles , y sus correspondientes pagos, para cada jugador.

En juegos estáticos de información completa y perfecta , una representación en forma normal de un juego es una especificación de los espacios de estrategia y las funciones de pago de los jugadores. Un espacio de estrategia para un jugador es el conjunto de todas las estrategias disponibles para ese jugador, mientras que una estrategia es un plan de acción completo para cada etapa del juego, independientemente de si esa etapa realmente surge en el juego. Una función de pago para un jugador es una aplicación del producto vectorial de los espacios de estrategia de los jugadores al conjunto de pagos de ese jugador (normalmente el conjunto de números reales, donde el número representa una utilidad cardinal u ordinal , a menudo cardinal en la representación en forma normal) de un jugador, es decir, la función de pago de un jugador toma como entrada un perfil de estrategia (que es una especificación de estrategias para cada jugador) y produce una representación de pago como salida.

Un ejemplo

La matriz proporcionada es una representación en forma normal de un juego en el que los jugadores se mueven simultáneamente (o al menos no observan el movimiento del otro jugador antes de hacer el suyo) y reciben los pagos especificados para las combinaciones de acciones realizadas. Por ejemplo, si el jugador 1 juega arriba y el jugador 2 juega a la izquierda, el jugador 1 recibe 4 y el jugador 2 recibe 3. En cada celda, el primer número representa el pago para el jugador de la fila (en este caso, el jugador 1) y el segundo número representa el pago para el jugador de la columna (en este caso, el jugador 2).

Otras representaciones

Una topología parcial de juegos de dos jugadores y dos estrategias, incluidos juegos como el dilema del prisionero , la caza del ciervo y el juego de la gallina.

A menudo, los juegos simétricos (en los que los pagos no dependen de qué jugador elige cada acción) se representan con un solo pago. Este es el pago para el jugador de la fila. Por ejemplo, las matrices de pagos de la derecha y la izquierda a continuación representan el mismo juego.

También se puede representar el espacio topológico de los juegos con matrices de pagos relacionadas, donde los juegos adyacentes tienen las matrices más similares. Esto muestra cómo los cambios incrementales de incentivos pueden cambiar el juego.

Usos de la forma normal

Estrategias dominadas

La matriz de pagos facilita la eliminación de estrategias dominadas y se suele utilizar para ilustrar este concepto. Por ejemplo, en el dilema del prisionero , podemos ver que cada prisionero puede "cooperar" o "desertar". Si exactamente un prisionero deserta, sale fácilmente y el otro prisionero es encerrado durante mucho tiempo. Sin embargo, si ambos desertan, ambos serán encerrados durante un tiempo más corto. Se puede determinar que Cooperar está estrictamente dominado por Desertar . Se deben comparar los primeros números de cada columna, en este caso 0 > −1 y −2 > −5. Esto muestra que no importa lo que elija el jugador de la columna, el jugador de la fila obtiene mejores resultados al elegir Desertar . De manera similar, se compara el segundo pago en cada fila; nuevamente 0 > −1 y −2 > −5. Esto muestra que no importa lo que haga la fila, la columna obtiene mejores resultados al elegir Desertar . Esto demuestra que el equilibrio de Nash único de este juego es ( Defecto , Defecto ).

Juegos secuenciales en forma normal

Estas matrices sólo representan juegos en los que los movimientos son simultáneos (o, de forma más general, la información es imperfecta ). La matriz anterior no representa el juego en el que el jugador 1 mueve primero, observado por el jugador 2, y luego mueve el jugador 2, porque no especifica cada una de las estrategias del jugador 2 en este caso. Para representar este juego secuencial debemos especificar todas las acciones del jugador 2, incluso en contingencias que nunca pueden surgir en el transcurso del juego. En este juego, el jugador 2 tiene acciones, como antes, Izquierda y Derecha . A diferencia de antes, tiene cuatro estrategias, contingentes a las acciones del jugador 1. Las estrategias son:

Izquierda si el jugador 1 juega Arriba y Izquierda en caso contrario
Izquierda si el jugador 1 juega Arriba y Derecha en caso contrario
Derecha si el jugador 1 juega Arriba y Izquierda en caso contrario
Derecha si el jugador 1 juega Arriba y Derecha en caso contrario

A la derecha está la representación en forma normal de este juego.

Formulación general

Para que un juego funcione con normalidad, contamos con los siguientes datos:

Hay un conjunto finito I de jugadores, cada jugador se denota por i . Cada jugador i tiene un número finito k de estrategias puras.

S_{i}=\{1,2,\ldots ,k\}.

AEl perfil de estrategia pura es una asociación de estrategias a los jugadores, es decir, unaI-tupla.

{\vec {s}}=(s_{1},s_{2},\ldots ,s_{I})

de tal manera que

s_{1}\en S_{1},s_{2}\en S_{2},\ldots ,s_{I}\en S_{I}

ALa función de pago es una función

u_{i}:S_{1}\times S_{2}\times \ldots \times S_{I}\rightarrow \mathbb {R} .

cuya interpretación pretendida es la recompensa que se otorga a un solo jugador al obtener el resultado del juego. En consecuencia, para especificar completamente un juego, la función de pago debe especificarse para cada jugador en el conjunto de jugadores I = {1, 2, ..., I }.

Definición : Un juego en forma normal es una estructura

\mathrm {T} =\langle I,\mathbf {S} ,\mathbf {u} \rangle

dónde:

I=\{1,2,\lpuntos ,I\}

es un conjunto de jugadores,

\mathbf {S} =\{S_{1},S_{2},\ldots ,S_{I}\}

es una I -tupla de conjuntos de estrategias puras, uno para cada jugador, y

\mathbf {u} =\{u_{1},u_{2},\ldots ,u_{I}\}

es una I -tupla de funciones de pago.

Referencias

Fudenberg, D.; Tirole , J. (1991). Teoría de juegos . MIT Press. ISBN 0-262-06141-4.
Leyton-Brown, Kevin; Shoham, Yoav (2008). Fundamentos de la teoría de juegos: una introducción concisa y multidisciplinaria. San Rafael, CA: Morgan & Claypool Publishers. ISBN 978-1-59829-593-1.Introducción matemática de 88 páginas; disponible en línea gratuita en muchas universidades.
Luce, RD ; Raiffa, H. (1989). Juegos y decisiones . Publicaciones de Dover. ISBN 0-486-65943-7.
Shoham, Yoav; Leyton-Brown, Kevin (2009). Sistemas multiagente: fundamentos algorítmicos, lógicos y de teoría de juegos. Nueva York: Cambridge University Press . ISBN 978-0-521-89943-7.. Una referencia completa desde una perspectiva computacional; consulte el Capítulo 3. Descargable gratuitamente en línea.
Weibull, J. (1996). Teoría de juegos evolutiva . MIT Press. ISBN 0-262-23181-6.
J. von Neumann y O. Morgenstern , Teoría de juegos y comportamiento económico , John Wiley Science Editions, 1964. Que fue publicado originalmente en 1944 por Princeton University Press.