stringtranslate.com

Juego simultáneo

Piedra, papel y tijera es un ejemplo de juego simultáneo.

En teoría de juegos , un juego simultáneo o juego estático [1] es un juego donde cada jugador elige su acción sin conocimiento de las acciones elegidas por los demás jugadores. [2] Los juegos simultáneos contrastan con los juegos secuenciales , en los que los jugadores juegan por turnos (los movimientos se alternan entre los jugadores). Es decir, normalmente ambos jugadores actúan al mismo tiempo en un juego simultáneo. Incluso si los jugadores no actúan al mismo tiempo, ambos jugadores no están informados del movimiento del otro mientras toman sus decisiones. [3] Las representaciones en forma normal se suelen utilizar para juegos simultáneos. [4] Dado un juego continuo , los jugadores tendrán diferentes conjuntos de información si el juego es simultáneo que si es secuencial porque tienen menos información sobre la cual actuar en cada paso del juego. Por ejemplo, en un juego continuo de dos jugadores que es secuencial, el segundo jugador puede actuar en respuesta a la acción realizada por el primer jugador. Sin embargo, esto no es posible en un juego simultáneo donde ambos jugadores actúan al mismo tiempo.

Características

En los juegos secuenciales, los jugadores observan lo que han hecho los rivales en el pasado y hay un orden de juego específico. [5] Sin embargo, en los juegos simultáneos, todos los jugadores seleccionan estrategias sin observar las elecciones de sus rivales y los jugadores eligen exactamente al mismo tiempo. [5]

Un ejemplo sencillo es el de piedra, papel o tijera, en el que todos los jugadores hacen su elección exactamente al mismo tiempo. Sin embargo, moverse exactamente al mismo tiempo no siempre se toma literalmente, sino que los jugadores pueden moverse sin poder ver las opciones de otros jugadores. [5] Un ejemplo sencillo es una elección en la que no todos los votantes votarán literalmente al mismo tiempo, sino que cada votante votará sin saber qué ha elegido el resto.


Dado que quienes toman decisiones son racionales, también lo es la racionalidad individual. Un resultado es individualmente racional si proporciona a cada jugador al menos su nivel de seguridad. [6] El nivel de seguridad para el Jugador i es la cantidad max min Hi(s) que el jugador puede garantizarse unilateralmente, es decir, sin considerar las acciones de otros jugadores.

Representación

En un juego simultáneo, los jugadores harán sus movimientos simultáneamente, determinarán el resultado del juego y recibirán sus pagos.

La representación más común de un juego simultáneo es la forma normal (forma matricial). Para un juego de 2 jugadores; un jugador selecciona una fila y el otro jugador selecciona una columna exactamente al mismo tiempo. Tradicionalmente, dentro de una celda, la primera entrada es el pago del jugador de la fila, la segunda entrada es el pago del jugador de la columna. La “celda” que se elige es el resultado del juego. [4] Para determinar qué "celda" se elige, se deben comparar respectivamente los pagos del jugador de la fila y del jugador de la columna. Cada jugador está mejor cuando su pago es mayor.

Piedra, papel y tijera , un juego de manos muy jugado, es un ejemplo de juego simultáneo. Ambos jugadores toman una decisión sin conocer la decisión del oponente y revelan sus manos al mismo tiempo. Hay dos jugadores en este juego y cada uno de ellos tiene tres estrategias diferentes para tomar su decisión; la combinación de perfiles estratégicos (un conjunto completo de las posibles estrategias de cada jugador) forma una tabla de 3×3. Mostraremos las estrategias del Jugador 1 como filas y las estrategias del Jugador 2 como columnas. En la tabla, los números en rojo representan el pago para el jugador 1, los números en azul representan el pago para el jugador 2. Por lo tanto, el pago para un juego de 2 jugadores en piedra, papel y tijera se verá así: [4]

Otra representación común de un juego simultáneo es la forma extensiva ( árbol de juegos ). Los conjuntos de información se utilizan para enfatizar la información imperfecta. Aunque no es sencillo, es más fácil utilizar árboles de juego para partidas de más de 2 jugadores. [4]

Aunque los juegos simultáneos normalmente se representan en forma normal, también se pueden representar en forma extensiva. Si bien en forma extensiva la decisión de un jugador debe ser tomada antes que la del otro, por definición tal representación no corresponde al momento real de las decisiones de los jugadores en un juego simultáneo. La clave para modelar juegos simultáneos en forma extensiva es obtener los conjuntos de información correctos. Una línea discontinua entre nodos en una representación extensiva de un juego representa asimetría de información y especifica que, durante el juego, una parte no puede distinguir entre los nodos, [7] debido a que la parte desconoce la decisión de la otra parte (por definición de " juego simultáneo").

El juego simultáneo de piedra, papel y tijera modelado de forma extensiva [7]

Algunas variantes del ajedrez que pertenecen a esta clase de juegos incluyen el ajedrez sincrónico y el ajedrez paritario. [8]

Juego bimatriz

En un juego simultáneo, los jugadores solo tienen un movimiento y todos los movimientos de los jugadores se realizan simultáneamente. Se debe estipular el número de jugadores en un juego y enumerar todos los movimientos posibles para cada jugador. Cada jugador puede tener diferentes roles y opciones de movimientos. [9] Sin embargo, cada jugador tiene un número finito de opciones disponibles para elegir.

Dos jugadores

Un ejemplo de una partida simultánea de 2 jugadores:

Una ciudad tiene dos empresas, A y B, que actualmente ganan $8.000.000 cada una y necesitan determinar si deben anunciarse. La siguiente tabla muestra los patrones de pago; las filas son opciones de A y las columnas son opciones de B. Las entradas son pagos para A y B, respectivamente, separados por una coma. [9]

Dos jugadores (suma cero)

Un juego de suma cero es cuando la suma de los pagos es igual a cero para cualquier resultado, es decir, los perdedores pagan por las ganancias de los ganadores. Para un juego de suma cero de 2 jugadores, no es necesario mostrar el pago del jugador A, ya que es el negativo del pago del jugador B. [9]

Un ejemplo de un juego simultáneo de suma cero para 2 jugadores:

Dos amigos, A y B, juegan a piedra, papel y tijera por 10 dólares. La primera celda representa un pago de 0 para ambos jugadores. La segunda celda es un pago de 10 para A que debe ser pagado por B, por lo tanto, un pago de -10 para B.

Tres o más jugadores

Un ejemplo de una partida simultánea de 3 jugadores:

Se lleva a cabo una votación en el aula para determinar si deberían tener o no una mayor cantidad de tiempo libre. El jugador A selecciona la matriz, el jugador B selecciona la fila y el jugador C selecciona la columna. [9] Los pagos son:

Juegos simétricos

Todos los ejemplos anteriores han sido simétricos. Todos los jugadores tienen las mismas opciones, por lo que si intercambian sus movimientos, también intercambian sus pagos. Por diseño, los juegos simétricos son justos en los que todos los jugadores tienen las mismas oportunidades. [9]

Estrategias: la mejor opción

La teoría de juegos debería proporcionar a los jugadores consejos sobre cómo encontrar qué movimiento es mejor. Estas se conocen como estrategias de “mejor respuesta”. [10]

Estrategia pura versus mixta

Las estrategias puras son aquellas en las que los jugadores eligen sólo una estrategia entre su mejor respuesta. Una estrategia pura determina todos tus movimientos posibles en un juego, es un plan completo para un jugador en un juego determinado. Las estrategias mixtas son aquellas en las que los jugadores aleatorizan estrategias en su conjunto de mejores respuestas. Estos tienen probabilidades asociadas con cada conjunto de estrategias. [10]

Para los juegos simultáneos, los jugadores normalmente seleccionarán estrategias mixtas y, muy ocasionalmente, elegirán estrategias puras. La razón de esto es que en un juego donde los jugadores no saben qué elegirá el otro, es mejor elegir la opción que probablemente le brinde el mayor beneficio con el menor riesgo, dado que el otro jugador podría elegir cualquier cosa . 10] es decir, si eliges tu mejor opción pero el otro jugador también elige su mejor opción, alguien sufrirá.

Estrategia dominante versus dominada

Una estrategia dominante proporciona al jugador el mayor beneficio posible por cualquier estrategia de los demás jugadores. En juegos simultáneos, el mejor movimiento que puede hacer un jugador es seguir su estrategia dominante, si existe. [11]

Al analizar un juego simultáneo:

En primer lugar, identificar las estrategias dominantes para todos los actores. Si cada jugador tiene una estrategia dominante, entonces los jugadores jugarán esa estrategia; sin embargo, si hay más de una estrategia dominante, cualquiera de ellas es posible. [11]

En segundo lugar, si no hay estrategias dominantes, identifique todas las estrategias dominadas por otras estrategias. Luego elimina las estrategias dominadas y las restantes son estrategias que los jugadores jugarán. [11]

Estrategia maximina

Algunas personas siempre esperan lo peor y creen que otros quieren derribarlas cuando en realidad otros quieren maximizar sus beneficios. Aún así, el jugador A se concentrará en su pago más pequeño posible, creyendo que esto es lo que obtendrá el jugador A, elegirá la opción con el valor más alto. Esta opción es el movimiento maximin (estrategia), ya que maximiza el mínimo beneficio posible. Por lo tanto, al jugador se le puede asegurar una recompensa de al menos el valor máximo, independientemente de cómo jueguen los demás. El jugador no conoce los pagos de los otros jugadores para elegir el movimiento maximin, por lo tanto, los jugadores pueden elegir la estrategia maximin en un juego simultáneo independientemente de lo que elijan los otros jugadores. [10]

Equilibrio de Nash

Un equilibrio de Nash puro se produce cuando nadie puede obtener un mayor beneficio desviándose de su movimiento, siempre que los demás sigan con sus elecciones originales. Los equilibrios de Nash son contratos que se aplican a sí mismos, en los que la negociación se produce antes de que se juegue el juego y en el que cada jugador se apega mejor a su movimiento negociado. En un equilibrio de Nash, cada jugador responde mejor a las elecciones del otro jugador. [11]

El dilema del prisionero

El dilema del prisionero

El dilema del prisionero se originó con Merrill Flood y Melvin Dresher y es uno de los juegos más famosos de la teoría de juegos. El juego suele presentarse de la siguiente manera:

La policía ha detenido a dos miembros de una banda criminal. Ambos individuos se encuentran ahora en régimen de aislamiento. Los fiscales tienen las pruebas necesarias para encarcelar a ambos prisioneros por cargos menores. Sin embargo, no poseen las pruebas necesarias para condenar a los prisioneros por sus principales cargos. Por lo tanto, la fiscalía ofrece simultáneamente a ambos prisioneros un trato en el que pueden optar por cooperar entre sí guardando silencio, o pueden elegir la traición, lo que significa que testificarán contra su pareja y recibirán una sentencia reducida. Cabe mencionar que los prisioneros no pueden comunicarse entre sí. [12] Por lo tanto, se obtiene la siguiente matriz de pagos:

Este juego da como resultado una clara estrategia dominante de traición donde el único equilibrio de Nash fuerte es que ambos prisioneros confiesen. Esto se debe a que asumimos que ambos prisioneros son racionales y no poseen lealtad alguna hacia el otro. Por lo tanto, la traición proporciona una mayor recompensa por la mayoría de los resultados potenciales. [12] Si B coopera, A debería elegir la traición, ya que cumplir 3 meses es mejor que cumplir 1 año. Además, si B elige la traición, entonces A también debería elegir la traición, ya que cumplir 2 años es mejor que cumplir 3. La opción de cooperar claramente proporciona un mejor resultado para los dos prisioneros, sin embargo, desde una perspectiva de interés propio, esta opción se consideraría irracional. La opción de cooperación antes mencionada presenta el menor tiempo total de prisión, cumpliendo 2 años en total. Este total es significativamente menor que el total del Equilibrio de Nash, donde ambos cooperan, de 4 años. Sin embargo, dadas las limitaciones de que los Prisioneros A y B estén motivados individualmente, siempre elegirán la traición. Lo hacen seleccionando la mejor opción para ellos mientras consideran cada posible decisión del otro prisionero.

Batalla de los sexos

En el juego de la batalla de los sexos , la esposa y el marido deciden independientemente si van a un partido de fútbol o al ballet. A cada uno le gusta hacer algo junto con el otro, pero el marido prefiere el fútbol y la mujer el ballet. Los dos equilibrios de Nash, y por lo tanto las mejores respuestas tanto para el marido como para la mujer, son que ambos elijan la misma actividad de ocio, por ejemplo (ballet, ballet) o (fútbol, ​​fútbol americano). [11] La siguiente tabla muestra el pago de cada opción:

Resultados socialmente deseables

Vilfredo Pareto , sociólogo y economista italiano

Los juegos simultáneos están diseñados para informar decisiones estratégicas en entornos competitivos y no cooperativos. Sin embargo, es importante señalar que los equilibrios de Nash y muchas de las estrategias antes mencionadas generalmente no logran generar resultados socialmente deseables.

Optimidad de Pareto

La eficiencia de Pareto es una noción arraigada en la construcción teórica de la competencia perfecta . Originario del economista italiano Vilfredo Pareto, el concepto se refiere a un estado en el que una economía ha maximizado la eficiencia en términos de asignación de recursos. La eficiencia de Pareto está estrechamente vinculada a la optimización de Pareto , que es un ideal de la economía del bienestar y, a menudo, implica una noción de consideración ética. Por ejemplo, se dice que un juego simultáneo alcanza el óptimo de Pareto si no hay un resultado alternativo que pueda mejorar la situación de al menos un jugador y dejar a todos los demás jugadores al menos en la misma situación. Por lo tanto, estos resultados se denominan resultados socialmente deseables. [13]

La caza del ciervo

caza del ciervo

La caza del ciervo del filósofo Jean-Jacques Rousseau es un juego simultáneo en el que participan dos jugadores. La decisión que se debe tomar es si cada jugador desea o no cazar un ciervo o una liebre. Naturalmente, cazar un ciervo proporcionará una mayor utilidad en comparación con cazar una liebre. Sin embargo, para cazar un ciervo, ambos jugadores deben trabajar juntos. Por otro lado, cada jugador es perfectamente capaz de cazar una liebre en solitario. El dilema resultante es que ninguno de los jugadores puede estar seguro de lo que el otro elegirá hacer. Por lo tanto, brinda la posibilidad de que un jugador no reciba ninguna recompensa si es el único que elige cazar un ciervo. [14] Por lo tanto, se obtiene la siguiente matriz de pagos:

El juego está diseñado para ilustrar un claro óptimo de Pareto en el que ambos jugadores cooperan para cazar un ciervo. Sin embargo, debido al riesgo inherente al juego, ese resultado no siempre se materializa. Es imperativo señalar que el óptimo de Pareto no es una solución estratégica para juegos simultáneos. Sin embargo, el ideal informa a los jugadores sobre el potencial de obtener resultados más eficientes. Además, podría proporcionar información sobre cómo los jugadores deberían aprender a jugar con el tiempo. [15]

Ver también

Referencias

  1. ^ Pepall, Lynne, 1952- (28 de enero de 2014). Organización industrial: teoría contemporánea y aplicaciones empíricas . Richards, Daniel Jay., Norman, George, 1946- (Quinta ed.). Hoboken, Nueva Jersey. ISBN 978-1-118-25030-3. OCLC  788246625.{{cite book}}: CS1 maint: location missing publisher (link) CS1 maint: multiple names: authors list (link) CS1 maint: numeric names: authors list (link)
  2. ^ http://www-bcf.usc.edu El camino hacia el equilibrio en juegos secuenciales y simultáneos (Brocas, Carrillo, Sachdeva; 2016).
  3. ^ Economía empresarial: 3 edición . McGraw Hill Education (India) Private Limited. 2018.ISBN 978-93-87067-63-9.
  4. ^ abc Mailath, George J.; Samuelson, Larry; Swinkels, Jeroen M. (1993). "Razonamiento en forma extensa en juegos en forma normal". Econométrica . 61 (2): 273–302. doi :10.2307/2951552. ISSN  0012-9682. JSTOR  2951552. S2CID  9876487.
  5. ^ abc Sun, C., 2019. Elección simultánea y secuencial en un juego simétrico de dos jugadores con pagos en forma de cañón. Japanese Economic Review, [en línea] Disponible en: <https://www.researchgate.net/publication/332377544_Simultaneous_and_Sequential_Choice_in_a_Symmetric_Two-Player_Game_with_Canyon-Shaped_Payoffs> [Consultado el 30 de octubre de 2020].
  6. ^ Vernengo, Matías; Caldentey, Esteban Pérez; Rosser Jr, Barkley J, eds. (2020). Inicio de sesión web de UM. doi :10.1057/978-1-349-95121-5. ISBN 978-1-349-95121-5. S2CID  261084293 . Consultado el 20 de noviembre de 2021 . {{cite book}}: |website=ignorado ( ayuda )
  7. ^ ab Watson, Joel. (09 de mayo de 2013). Estrategia: una introducción a la teoría de juegos (Tercera ed.). Nueva York. ISBN 978-0-393-91838-0. OCLC  842323069.{{cite book}}: CS1 maint: location missing publisher (link)
  8. ^ AV, Murali (7 de octubre de 2014). "Ajedrez paritario". Blogger . Consultado el 15 de enero de 2017 .
  9. ^ abcde Prisner, E., 2014. Teoría de juegos a través de ejemplos. Mathematical Association of America Inc. [en línea] Suiza: The Mathematical Association of America, páginas 25-30. Disponible en: <https://www.maa.org/sites/default/files/pdf/ebooks/GTE_sample.pdf> [Consultado el 30 de octubre de 2020].
  10. ^ abcd Ross, D., 2019. Teoría de juegos. Enciclopedia de Filosofía de Stanford, [en línea] págs.7-80. Disponible en: <https://plato.stanford.edu/entries/game-theory> [Consultado el 30 de octubre de 2020].
  11. ^ abcde Muñoz-García, F. y Toro-González, D., 2016. Equilibrio de Nash de estrategia pura y juegos de movimientos simultáneos con información completa. Estrategia y teoría de juegos, [en línea] págs.25-60. Disponible en: <https://link.springer.com/chapter/10.1007/978-3-319-32963-5_2> [Consultado el 30 de octubre de 2020].
  12. ^ ab M., Amadae, S. (2016). Prisioneros de la razón: teoría de juegos y economía política neoliberal. Prensa de la Universidad de Cambridge. ISBN 978-1-107-67119-5. OCLC  946968759.{{cite book}}: CS1 maint: multiple names: authors list (link)
  13. ^ Berthonnet, Irène; Delclite, Thomas (10 de octubre de 2014), "Optimalidad de Pareto o eficiencia de Pareto: ¿mismo concepto, nombres diferentes? Un análisis de más de un siglo de literatura económica", Anual de investigación , Emerald Group Publishing Limited, págs. , doi :10.1108/s0743-415420140000032005, ISBN 978-1-78441-154-1, recuperado el 25 de abril de 2021
  14. ^ Vanderschraaf, Peter (2016). "En una estrategia débilmente dominada está la fuerza: la evolución de la optimización en la caza del ciervo aumentada con una opción de castigo". Filosofía de la Ciencia . 83 (1): 29–59. doi :10.1086/684166. ISSN  0031-8248. S2CID  124619436.
  15. ^ Hao, Jianye; Leung, Ho-Fung (2013). "Lograr resultados socialmente óptimos en sistemas multiagente con aprendizaje social de refuerzo". Transacciones ACM sobre sistemas autónomos y adaptativos . 8 (3): 1–23. doi :10.1145/2517329. ISSN  1556-4665. S2CID  7496856.

Bibliografía