Juego simultáneo

En teoría de juegos , un juego simultáneo o juego estático ^[1] es un juego en el que cada jugador elige su acción sin saber las acciones elegidas por los otros jugadores. ^[2] Los juegos simultáneos contrastan con los juegos secuenciales , que se juegan por turnos (los movimientos se alternan entre los jugadores). En otras palabras, ambos jugadores normalmente actúan al mismo tiempo en un juego simultáneo. Incluso si los jugadores no actúan al mismo tiempo, ambos jugadores no están informados del movimiento del otro mientras toman sus decisiones. ^{[3] Las representaciones} en forma normal se utilizan generalmente para juegos simultáneos. ^[4] Dado un juego continuo , los jugadores tendrán diferentes conjuntos de información si el juego es simultáneo que si es secuencial porque tienen menos información sobre la que actuar en cada paso del juego. Por ejemplo, en un juego continuo de dos jugadores que es secuencial, el segundo jugador puede actuar en respuesta a la acción realizada por el primer jugador. Sin embargo, esto no es posible en un juego simultáneo donde ambos jugadores actúan al mismo tiempo.

Características

En los juegos secuenciales, los jugadores observan lo que sus rivales han hecho en el pasado y hay un orden de juego específico. ^[5] Sin embargo, en los juegos simultáneos, todos los jugadores seleccionan estrategias sin observar las elecciones de sus rivales y los jugadores eligen exactamente al mismo tiempo. ^[5]

Un ejemplo sencillo es el de piedra, papel o tijera, en el que todos los jugadores toman sus decisiones exactamente al mismo tiempo. Sin embargo, no siempre se toma en serio que los jugadores se muevan exactamente al mismo tiempo, sino que los jugadores pueden moverse sin poder ver las decisiones de los otros jugadores. ^[5] Un ejemplo sencillo es una elección en la que no todos los votantes votarán literalmente al mismo tiempo, sino que cada votante votará sin saber lo que ha elegido el resto.

Dado que quienes toman las decisiones son racionales, también lo es la racionalidad individual. Un resultado es individualmente racional si le otorga a cada jugador al menos su nivel de seguridad. ^[6] El nivel de seguridad para el jugador i es la cantidad max min Hi (s) que el jugador puede garantizarse unilateralmente, es decir, sin considerar las acciones de los demás jugadores.

Representación

En un juego simultáneo, los jugadores realizarán sus movimientos simultáneamente, determinarán el resultado del juego y recibirán sus pagos.

La representación más común de un juego simultáneo es la forma normal (forma matricial). En un juego de dos jugadores, un jugador selecciona una fila y el otro selecciona una columna exactamente al mismo tiempo. Tradicionalmente, dentro de una celda, la primera entrada es el pago del jugador de la fila, la segunda entrada es el pago del jugador de la columna. La “celda” que se elige es el resultado del juego. ^[4] Para determinar qué “celda” se elige, se deben comparar los pagos tanto del jugador de la fila como del jugador de la columna respectivamente. Cada jugador está mejor donde su pago es mayor.

Piedra, papel o tijera , un juego de manos muy popular, es un ejemplo de juego simultáneo. Ambos jugadores toman una decisión sin saber la decisión del oponente y revelan sus manos al mismo tiempo. Hay dos jugadores en este juego y cada uno de ellos tiene tres estrategias diferentes para tomar su decisión; la combinación de perfiles de estrategia (un conjunto completo de las posibles estrategias de cada jugador) forma una tabla de 3x3. Mostraremos las estrategias del Jugador 1 como filas y las estrategias del Jugador 2 como columnas. En la tabla, los números en rojo representan la recompensa para el Jugador 1, los números en azul representan la recompensa para el Jugador 2. Por lo tanto, la recompensa para un juego de piedra, papel o tijera para 2 jugadores se verá así: ^[4]

Otra representación común de un juego simultáneo es la forma extensiva ( árbol de juego ). Los conjuntos de información se utilizan para enfatizar la información imperfecta. Aunque no es simple, es más fácil utilizar árboles de juego para juegos con más de 2 jugadores. ^[4]

Aunque los juegos simultáneos suelen representarse en forma normal, también pueden representarse en forma extensiva. Si bien en la forma extensiva la decisión de un jugador debe ser empatada antes que la del otro, por definición, dicha representación no se corresponde con el momento real de las decisiones de los jugadores en un juego simultáneo. La clave para modelar juegos simultáneos en la forma extensiva es obtener los conjuntos de información correctos. Una línea discontinua entre nodos en la representación en forma extensiva de un juego representa la asimetría de la información y especifica que, durante el juego, una parte no puede distinguir entre los nodos, ^[7] debido a que la parte no es consciente de la decisión de la otra parte (por definición de "juego simultáneo").

El juego simultáneo de piedra, papel y tijera modelado en forma extensiva ^[7]

Algunas variantes del ajedrez que pertenecen a esta clase de juegos incluyen el ajedrez sincrónico y el ajedrez de paridad. ^[8]

Juego Bimatrix

En un juego simultáneo, los jugadores solo tienen un movimiento y todos los movimientos de los jugadores se realizan simultáneamente. Se debe estipular el número de jugadores en un juego y se deben enumerar todos los movimientos posibles para cada jugador. Cada jugador puede tener diferentes roles y opciones de movimientos. ^[9] Sin embargo, cada jugador tiene un número finito de opciones disponibles para elegir.

Dos jugadores

Un ejemplo de un juego simultáneo para 2 jugadores:

En una ciudad hay dos empresas, A y B, que actualmente ganan 8.000.000 dólares cada una y necesitan determinar si deben anunciarse. La siguiente tabla muestra los patrones de pago; las filas son opciones de A y las columnas son opciones de B. Las entradas son los pagos de A y B, respectivamente, separados por una coma. ^[9]

Dos jugadores (suma cero)

Un juego de suma cero es aquel en el que la suma de los pagos es igual a cero para cualquier resultado, es decir, los perdedores pagan las ganancias de los ganadores. En un juego de suma cero con dos jugadores, no es necesario mostrar el pago del jugador A, ya que es el negativo del pago del jugador B. ^[9]

Un ejemplo de un juego simultáneo de suma cero para dos jugadores:

Dos amigos, A y B, juegan a piedra, papel o tijera por 10 dólares. La primera celda representa un pago de 0 para ambos jugadores. La segunda celda representa un pago de 10 para A, que debe pagar B, por lo que el pago es de -10 para B.

Tres o más jugadores

Un ejemplo de un juego simultáneo para 3 jugadores:

Se lleva a cabo una votación en clase para decidir si se les debe o no dar más tiempo libre. El jugador A elige la matriz, el jugador B elige la fila y el jugador C elige la columna. ^[9] Los pagos son:

Juegos simétricos

Todos los ejemplos anteriores han sido simétricos. Todos los jugadores tienen las mismas opciones, de modo que si intercambian sus movimientos, también intercambian sus ganancias. Por diseño, los juegos simétricos son justos, en los que a cada jugador se le dan las mismas oportunidades. ^[9]

Estrategias - La mejor opción

La teoría de juegos debería brindar a los jugadores consejos sobre cómo encontrar cuál es la mejor jugada. Estas estrategias se conocen como “la mejor respuesta”. ^[10]

Estrategia pura vs estrategia mixta

Las estrategias puras son aquellas en las que los jugadores eligen solo una estrategia de entre sus mejores respuestas. Una estrategia pura determina todos los movimientos posibles en un juego, es un plan completo para un jugador en un juego determinado. Las estrategias mixtas son aquellas en las que los jugadores eligen al azar estrategias en su conjunto de mejores respuestas. Estas tienen probabilidades asociadas con cada conjunto de estrategias. ^[10]

En los juegos simultáneos, los jugadores suelen seleccionar estrategias mixtas y, en muy raras ocasiones, estrategias puras. La razón de esto es que, en un juego en el que los jugadores no saben qué elegirá el otro, es mejor elegir la opción que probablemente le proporcione el mayor beneficio con el menor riesgo, dado que el otro jugador podría elegir cualquier opción ^[10] , es decir, si elige su mejor opción pero el otro jugador también elige la suya, alguien sufrirá.

Estrategia dominante vs estrategia dominada

Una estrategia dominante ofrece al jugador la mayor recompensa posible para cualquier estrategia de los otros jugadores. En partidas simultáneas, la mejor jugada que puede hacer un jugador es seguir su estrategia dominante, si existe alguna. ^[11]

Al analizar un juego simultáneo:

En primer lugar, hay que identificar las estrategias dominantes de todos los jugadores. Si cada jugador tiene una estrategia dominante, los jugadores utilizarán esa estrategia; sin embargo, si hay más de una estrategia dominante, cualquiera de ellas es posible. ^[11]

En segundo lugar, si no hay ninguna estrategia dominante, se identifican todas las estrategias dominadas por otras estrategias. Luego se eliminan las estrategias dominadas y las restantes son las estrategias que los jugadores utilizarán. ^[11]

Estrategia de Maximin

Algunas personas siempre esperan lo peor y creen que los demás quieren derribarlas cuando, en realidad, lo que quieren es maximizar sus ganancias. Sin embargo, el jugador A se concentrará en obtener la menor ganancia posible, creyendo que eso es lo que obtendrá, y elegirá la opción con el valor más alto. Esta opción es la jugada (estrategia) maximin , ya que maximiza la ganancia mínima posible. Por lo tanto, el jugador puede estar seguro de obtener una ganancia de al menos el valor maximin, independientemente de cómo jueguen los demás. El jugador no tiene que conocer las ganancias de los otros jugadores para elegir la jugada maximin, por lo tanto, los jugadores pueden elegir la estrategia maximin en un juego simultáneo independientemente de lo que elijan los otros jugadores. ^[10]

Equilibrio de Nash

Un equilibrio de Nash puro es aquel en el que nadie puede obtener una mayor recompensa desviándose de su movimiento, siempre que los demás se mantengan fieles a sus elecciones originales. Los equilibrios de Nash son contratos que se ejecutan por sí solos, en los que la negociación se produce antes de que se juegue el juego en el que cada jugador se mantiene fiel a su movimiento negociado. En un equilibrio de Nash, cada jugador responde mejor a las elecciones del otro jugador. ^[11]

El dilema del prisionero

El dilema del prisionero se originó con Merrill Flood y Melvin Dresher y es uno de los juegos más famosos de la teoría de juegos. El juego suele presentarse de la siguiente manera:

La policía ha detenido a dos miembros de una banda criminal. Ambos individuos se encuentran ahora en régimen de aislamiento. Los fiscales tienen las pruebas necesarias para encarcelar a ambos presos por cargos menores, pero no poseen las pruebas necesarias para condenarlos por los cargos principales. Por lo tanto, la fiscalía ofrece simultáneamente a ambos presos un trato en el que pueden elegir cooperar entre sí guardando silencio o pueden elegir la traición, lo que significa que pueden testificar en contra de su compañero y recibir una sentencia reducida. Cabe mencionar que los presos no pueden comunicarse entre sí. ^[12] Por lo tanto, el resultado es la siguiente matriz de pagos:

Este juego da como resultado una estrategia dominante clara de traición donde el único equilibrio de Nash fuerte es que ambos prisioneros confiesen. Esto se debe a que asumimos que ambos prisioneros son racionales y no poseen lealtad hacia el otro. Por lo tanto, la traición proporciona una mayor recompensa para la mayoría de los resultados potenciales. ^[12] Si B coopera, A debería elegir la traición, ya que cumplir 3 meses es mejor que cumplir 1 año. Además, si B elige la traición, entonces A también debería elegir la traición ya que cumplir 2 años es mejor que cumplir 3. La elección de cooperar claramente proporciona un mejor resultado para los dos prisioneros, sin embargo, desde una perspectiva de interés propio, esta opción se consideraría irracional. La opción de cooperación mencionada anteriormente presenta el menor tiempo total pasado en prisión, cumpliendo 2 años en total. Este total es significativamente menor que el total de equilibrio de Nash, donde ambos cooperan, de 4 años. Sin embargo, dadas las restricciones de que los prisioneros A y B están motivados individualmente, siempre elegirán la traición. Lo hacen seleccionando la mejor opción para ellos mismos mientras consideran cada una de las posibles decisiones del otro prisionero.

La batalla de los sexos

En el juego de la batalla de los sexos , una esposa y un esposo deciden independientemente si van a un partido de fútbol o al ballet. A cada uno le gusta hacer algo junto con el otro, pero el esposo prefiere el fútbol y la esposa el ballet. Los dos equilibrios de Nash, y por lo tanto las mejores respuestas para el esposo y la esposa, son que ambos elijan la misma actividad de ocio, por ejemplo (ballet, ballet) o (fútbol, fútbol). ^[11] La siguiente tabla muestra el beneficio para cada opción:

Resultados socialmente deseables

Los juegos simultáneos están diseñados para fundamentar decisiones estratégicas en entornos competitivos y no cooperativos. Sin embargo, es importante señalar que los equilibrios de Nash y muchas de las estrategias mencionadas anteriormente generalmente no producen resultados socialmente deseables.

Optimalidad de Pareto

La eficiencia de Pareto es una noción que tiene sus raíces en el concepto teórico de competencia perfecta . El concepto, que se originó con el economista italiano Vilfredo Pareto, se refiere a un estado en el que una economía ha maximizado la eficiencia en términos de asignación de recursos. La eficiencia de Pareto está estrechamente vinculada a la optimalidad de Pareto , que es un ideal de la economía del bienestar y a menudo implica una noción de consideración ética. Por ejemplo, se dice que un juego simultáneo alcanza la optimalidad de Pareto si no hay un resultado alternativo que pueda hacer que al menos un jugador esté en mejor situación y que todos los demás jugadores estén al menos igual de bien. Por lo tanto, estos resultados se conocen como resultados socialmente deseables. ^[13]

La caza del ciervo

La caza del ciervo, del filósofo Jean-Jacques Rousseau, es un juego simultáneo en el que participan dos jugadores. La decisión que se debe tomar es si cada jugador desea cazar un ciervo o una liebre. Naturalmente, cazar un ciervo proporcionará una mayor utilidad en comparación con cazar una liebre. Sin embargo, para cazar un ciervo, ambos jugadores deben trabajar juntos. Por otro lado, cada jugador es perfectamente capaz de cazar una liebre solo. El dilema resultante es que ninguno de los jugadores puede estar seguro de lo que el otro elegirá hacer. Por lo tanto, existe la posibilidad de que un jugador no reciba ninguna recompensa si es el único que elige cazar un ciervo. ^[14] Por lo tanto, el resultado es la siguiente matriz de recompensas:

El juego está diseñado para ilustrar una optimización clara de Pareto en la que ambos jugadores cooperan para cazar un ciervo. Sin embargo, debido al riesgo inherente del juego, dicho resultado no siempre se concreta. Es imperativo señalar que la optimización de Pareto no es una solución estratégica para juegos simultáneos. Sin embargo, el ideal informa a los jugadores sobre el potencial de resultados más eficientes. Además, potencialmente proporciona información sobre cómo los jugadores deberían aprender a jugar con el tiempo. ^[15]

Véase también

Referencias

^ Pepall, Lynne, 1952- (28 de enero de 2014). Organización industrial: teoría contemporánea y aplicaciones empíricas . Richards, Daniel Jay., Norman, George, 1946- (Quinta edición). Hoboken, NJ. ISBN 978-1-118-25030-3.OCLC 788246625 .{{cite book}}: CS1 maint: location missing publisher (link) CS1 maint: multiple names: authors list (link) CS1 maint: numeric names: authors list (link)
^ http://www-bcf.usc.edu El camino hacia el equilibrio en juegos secuenciales y simultáneos (Brocas, Carrillo, Sachdeva; 2016).
^ Economía gerencial: 3.ª edición . McGraw Hill Education (India) Private Limited. 2018. ISBN 978-93-87067-63-9.
^ abcd Mailath, George J.; Samuelson, Larry; Swinkels, Jeroen M. (1993). "Razonamiento de forma extensiva en juegos de forma normal". Econometrica . 61 (2): 273–302. doi :10.2307/2951552. ISSN 0012-9682. JSTOR 2951552. S2CID 9876487.
^ abc Sun, C., 2019. Elección simultánea y secuencial en un juego simétrico para dos jugadores con pagos en forma de cañón. Japanese Economic Review, [en línea] Disponible en: <https://www.researchgate.net/publication/332377544_Simultaneous_and_Sequential_Choice_in_a_Symmetric_Two-Player_Game_with_Canyon-Shaped_Payoffs> [Consultado el 30 de octubre de 2020].
^ Vernengo, Matías; Caldentey, Esteban Pérez; Rosser Jr, Barkley J, eds. (2020). Inicio de sesión web de UM. doi :10.1057/978-1-349-95121-5. ISBN 978-1-349-95121-5. S2CID 261084293 . Consultado el 20 de noviembre de 2021 . {{cite book}}: |website=ignorado ( ayuda )
^ ab Watson, Joel. (9 de mayo de 2013). Estrategia: una introducción a la teoría de juegos (tercera edición). Nueva York. ISBN 978-0-393-91838-0.OCLC 842323069 .{{cite book}}: CS1 maint: location missing publisher (link)
^ AV, Murali (7 de octubre de 2014). "Ajedrez paritario". Blogger . Consultado el 15 de enero de 2017 .
^ abcde Prisner, E., 2014. Game Theory Through Examples. Mathematical Association of America Inc. [en línea] Suiza: The Mathematical Association of America, pp.25-30. Disponible en: <https://www.maa.org/sites/default/files/pdf/ebooks/GTE_sample.pdf> [Consultado el 30 de octubre de 2020].
^ abcd Ross, D., 2019. Game Theory. Stanford Encyclopedia of Philosophy, [en línea] pp.7-80. Disponible en: <https://plato.stanford.edu/entries/game-theory> [Consultado el 30 de octubre de 2020].
^ abcde Munoz-Garcia, F. y Toro-Gonzalez, D., 2016. Pure Strategy Nash Equilibrium and Simultaneous-Move Games with Complete Information. Strategy and Game Theory, [en línea] pp.25-60. Disponible en: <https://link.springer.com/chapter/10.1007/978-3-319-32963-5_2> [Consultado el 30 de octubre de 2020].
^ ab M., Amadae, S. (2016). Prisioneros de la razón: teoría de juegos y economía política neoliberal. Cambridge University Press. ISBN 978-1-107-67119-5.OCLC 946968759 .{{cite book}}: CS1 maint: multiple names: authors list (link)
^ Berthonnet, Irène; Delclite, Thomas (10 de octubre de 2014), "Pareto-Optimalidad o Pareto-Eficiencia: ¿Mismo concepto, nombres diferentes? Un análisis a lo largo de un siglo de literatura económica", A Research Annual , Emerald Group Publishing Limited, págs. 129-145, doi :10.1108/s0743-415420140000032005, ISBN 978-1-78441-154-1, consultado el 25 de abril de 2021
^ Vanderschraaf, Peter (2016). "En una estrategia débilmente dominada está la fuerza: evolución de la optimalidad en la caza del ciervo aumentada con una opción de castigo". Filosofía de la ciencia . 83 (1): 29–59. doi :10.1086/684166. ISSN 0031-8248. S2CID 124619436.
^ Hao, Jianye; Leung, Ho-Fung (2013). "Logro de resultados socialmente óptimos en sistemas multiagente con aprendizaje social reforzado". ACM Transactions on Autonomous and Adaptive Systems . 8 (3): 1–23. doi :10.1145/2517329. ISSN 1556-4665. S2CID 7496856.

Bibliografía

Pritchard, DB (2007). Beasley, John (ed.). La enciclopedia clasificada de variantes del ajedrez . John Beasley. ISBN 978-0-9555168-0-1.