Conjunto de información (teoría de juegos)

El conjunto de información es la base para la toma de decisiones en un juego, que incluye las acciones disponibles para ambos lados y los beneficios de cada acción. El conjunto de información es un concepto importante en los juegos no perfectos. En la teoría de juegos , un conjunto de información es el conjunto de todas las acciones posibles en el juego para un jugador determinado, construido sobre sus observaciones y un conjunto para un jugador particular que, dado lo que ese jugador ha observado, muestra los vértices de decisión disponibles para el jugador que son indistinguibles para ellos en el punto actual del juego . Para una mejor idea sobre los vértices de decisión, consulte la Figura 1. Si el juego tiene información perfecta , cada conjunto de información contiene solo un miembro, es decir, el punto realmente alcanzado en esa etapa del juego, ya que cada jugador conoce la combinación exacta de movimientos aleatorios y estrategias del jugador hasta el punto actual del juego. De lo contrario, es el caso de que algunos jugadores no pueden estar seguros de cuál es el estado del juego; por ejemplo, no saben qué sucedió exactamente en el pasado o qué se debe hacer ahora mismo.

Los conjuntos de información se utilizan en juegos de forma extensiva y a menudo se representan en árboles de juego . Los árboles de juego muestran el camino desde el inicio de un juego y los caminos posteriores que se pueden realizar dependiendo del siguiente movimiento de cada jugador. Para los problemas de juegos con información no perfecta, existe información oculta. Es decir, cada jugador no tiene conocimiento completo de la información del oponente, como las cartas que no aparecen en un juego de póquer. Por lo tanto, al construir un árbol de juego, es difícil determinar con precisión dónde se encuentra un nodo basándose únicamente en la información conocida, ya que no conocemos cierta información sobre nuestro oponente. Solo podemos estar seguros de que estamos en uno de un rango de nodos posibles. Esta incapacidad para distinguir el conjunto de nodos en el árbol de juego de un jugador en particular se conoce como "conjunto de información". Los conjuntos de información se pueden representar fácilmente en árboles de juego para mostrar los posibles movimientos de cada jugador, generalmente utilizando líneas de puntos, círculos o incluso simplemente etiquetando los vértices que muestran las opciones de un jugador en particular en la etapa actual del juego, como se muestra en la Figura 1.

Más específicamente, en la forma extensiva, un conjunto de información es un conjunto de nodos de decisión tales que:

Cada nodo del conjunto pertenece a un jugador.
Cuando el juego llega al conjunto de información, el jugador que tiene que mover no puede diferenciar entre los nodos dentro del conjunto de información, es decir, si un conjunto de información contiene múltiples nodos, los participantes asociados con ese conjunto de información no están seguros de qué nodo seleccionar para su movimiento.

Los juegos en formato extensivo a menudo implican que cada jugador pueda realizar múltiples movimientos, lo que da como resultado la formación de múltiples conjuntos de información también. Un jugador debe tomar decisiones en cada uno de estos vértices en función de las opciones en el conjunto de información. Esto se conoce como la estrategia del jugador y puede proporcionar el camino del jugador desde el comienzo del juego hasta el final, que también se conoce como el juego del juego. A partir del juego, el resultado siempre se conocerá en función de la estrategia de cada jugador, a menos que se trate de movimientos aleatorios, en cuyo caso no siempre habrá un resultado singular. No todos los juegos se basan en estrategias, ya que también pueden implicar movimientos aleatorios. Cuando se trata de movimientos aleatorios, un vector de estrategias puede dar como resultado la distribución de probabilidad de los múltiples resultados de los juegos que podrían ocurrir. Se pueden crear múltiples resultados de los juegos cuando se trata del azar, ya que es probable que los movimientos sean diferentes cada vez. Sin embargo, en función de la fuerza de la estrategia, algunos resultados podrían tener mayores probabilidades que otros.

Suponiendo que hay múltiples conjuntos de información en un juego, el juego se transforma de un juego estático a un juego dinámico. La clave para resolver un juego dinámico es calcular el conjunto de información de cada jugador y tomar decisiones basadas en sus elecciones en diferentes etapas. Por ejemplo, cuando el jugador A elige primero, el jugador B tomará la mejor decisión para él basándose en la elección de A. El jugador A, a su vez, puede predecir la reacción de B y tomar una decisión a su favor. El concepto de conjunto de información fue introducido por John von Neumann , motivado por el estudio del juego de póquer .

Ejemplo

A la derecha se muestran dos versiones del juego de la batalla de los sexos , en forma ampliada . A continuación, se muestra también la forma normal de ambos juegos.

El primer juego es simplemente secuencial: cuando el jugador 2 hace una elección, ambas partes ya saben si el jugador 1 ha elegido O(pera) o F(útbol).

El segundo juego también es secuencial, pero la línea de puntos muestra el conjunto de información del jugador 2. Esta es la forma común de mostrar que cuando el jugador 2 se mueve, no es consciente de lo que hizo el jugador 1.

Esta diferencia también lleva a predicciones diferentes para los dos juegos. En el primer juego, el jugador 1 tiene la ventaja. Sabe que puede elegir O(pera) con seguridad porque una vez que el jugador 2 sabe que el jugador 1 ha elegido ópera, el jugador 2 preferirá optar por o(pera) y obtener 2 que elegir f(útbol) y obtener 0. Formalmente, eso es aplicar la perfección del subjuego para resolver el juego.

En el segundo juego, el jugador 2 no puede observar lo que hizo el jugador 1, por lo que bien podría tratarse de un juego simultáneo . Por lo tanto, la perfección del subjuego no nos proporciona nada que el equilibrio de Nash no pueda proporcionarnos, y tenemos los 3 equilibrios posibles estándar:

Ambos eligen la ópera
Ambos eligen el fútbol
o ambos usan una estrategia mixta , con el jugador 1 eligiendo O(pera) 3/5 del tiempo, y el jugador 2 eligiendo f(útbol) 2/5 del tiempo

Véase también

Equilibrio autoconfirmante

Referencias

Binmore, Ken (2007). Teoría de juegos: una introducción muy breve. Oxford University Press. pp. 88–89. ISBN 978-0-19-921846-2.