stringtranslate.com

juego bayesiano

En teoría de juegos , un juego bayesiano es un modelo de toma de decisiones estratégicas que supone que los jugadores tienen información incompleta. Los jugadores poseen información privada relevante para el juego, lo que significa que los pagos no son de conocimiento común. [1] Los juegos bayesianos modelan el resultado de las interacciones de los jugadores utilizando aspectos de la probabilidad bayesiana . Se destacan porque permitieron, por primera vez en la teoría de juegos, especificar las soluciones a juegos con información incompleta .

El economista húngaro John C. Harsanyi introdujo el concepto de juegos bayesianos en tres artículos de 1967 y 1968: [2] [3] [4] Fue galardonado con el Premio Nobel de Ciencias Económicas por estas y otras contribuciones a la teoría de juegos en 1994. En términos generales, Harsanyi definió los juegos bayesianos de la siguiente manera: a los jugadores se les asigna por naturaleza al comienzo del juego un conjunto de características. Al asignar distribuciones de probabilidad a estas características y calcular el resultado del juego usando la probabilidad bayesiana, el resultado es un juego cuya solución es, por razones técnicas, mucho más fácil de calcular que un juego similar en un contexto no bayesiano. Por esas razones técnicas, consulte la sección Especificaciones de juegos de este artículo.

Juegos en forma normal con información incompleta.

Elementos

Un juego bayesiano se define por (N,A,T,p,u) , donde consta de los siguientes elementos: [5]

  1. Conjunto de jugadores, N : El conjunto de jugadores dentro del juego.
  2. Conjuntos de acciones, a i : El conjunto de acciones disponibles para el jugador i . Un perfil de acción a = (a 1 , . . . , a N ) es una lista de acciones, una para cada jugador
  3. Conjuntos de tipos, t i : El conjunto de tipos de jugadores i . Los "tipos" capturan la información privada que puede tener un jugador. Un perfil de tipo t = (t 1 , . . . , t N ) es una lista de tipos, uno para cada jugador
  4. Funciones de pago, u : Asigna un pago a un jugador según su tipo y sus perfiles de acción. Una función de pago, u= (u 1 , . . . , u N ) denota las utilidades del jugador i
  5. Antes, p : una distribución de probabilidad sobre todos los perfiles de tipo posibles, donde p(t) = p(t 1 , . . . ,t N ) es la probabilidad de que el jugador 1 tenga el tipo t 1 y el jugador N tenga el tipo t N.

Estrategias puras

En un juego estratégico, una estrategia pura es la elección de acción del jugador en cada punto en el que debe tomar una decisión. [6]

Tres etapas

Hay tres etapas de los juegos bayesianos, cada una de las cuales describe el conocimiento de los jugadores sobre los tipos dentro del juego.

  1. Juego de escenario ex ante. Los jugadores no conocen sus propios tipos ni los de otros jugadores. Un jugador reconoce los pagos como valores esperados basados ​​en una distribución previa de todos los tipos posibles.
  2. Juego de etapa intermedia. Los jugadores conocen su propio tipo, pero sólo una distribución de probabilidad de otros jugadores. Un jugador estudia el valor esperado del tipo del otro jugador al considerar los pagos.
  3. Juego de escenario ex-post. Los jugadores conocen sus propios tipos y los de otros jugadores. Los jugadores conocen los beneficios. [7]

Mejoras con respecto a los juegos no bayesianos

Hay dos aspectos importantes y novedosos de los juegos bayesianos que fueron especificados por Harsanyi. [8] La primera es que los juegos bayesianos deben considerarse y estructurarse de manera idéntica a los juegos de información completos. Excepto que, al asociar probabilidad al juego, el juego final funciona como si fuera un juego de información incompleta. Por lo tanto, se puede modelar esencialmente que los jugadores tienen información incompleta y el espacio de probabilidad del juego aún sigue la ley de probabilidad total . Los juegos bayesianos también son útiles porque no requieren cálculos secuenciales infinitos. Surgirían infinitos cálculos secuenciales donde los jugadores (esencialmente) intentan "meterse en la cabeza del otro". Por ejemplo, uno puede hacer preguntas y decidir: "Si espero alguna acción del jugador B, entonces el jugador B anticipará que espero esa acción, por lo que debo anticipar esa anticipación" ad infinitum . Los juegos bayesianos permiten calcular estos resultados en un solo movimiento asignando simultáneamente diferentes pesos de probabilidad a diferentes resultados. El efecto de esto es que los juegos bayesianos permiten modelar una serie de juegos que en un entorno no bayesiano sería irracional de calcular.

Equilibrio bayesiano de Nash

Un equilibrio Bayesiano-Nash de un juego bayesiano es un equilibrio de Nash de su juego de forma normal ex ante asociado.

En un juego no bayesiano, un perfil de estrategia es un equilibrio de Nash si cada estrategia de ese perfil es la mejor respuesta a todas las demás estrategias del perfil; es decir, no existe ninguna estrategia que un jugador pueda utilizar y que le proporcione un beneficio mayor, dadas todas las estrategias utilizadas por los demás jugadores.

Se puede definir un concepto análogo para un juego bayesiano, con la diferencia de que la estrategia de cada jugador maximiza su beneficio esperado dadas sus creencias sobre el estado de la naturaleza. Las creencias de un jugador sobre el estado de naturaleza se forman condicionando las probabilidades previas al propio tipo del jugador según la regla de Bayes.

Un equilibrio bayesiano de Nash (BNE) se define como un perfil de estrategia que maximiza el beneficio esperado para cada jugador dadas sus creencias y las estrategias seguidas por los demás jugadores. Es decir, un perfil de estrategia es un equilibrio bayesiano de Nash si y sólo si, para cada jugador que mantiene fijas las estrategias de los demás jugadores, la estrategia maximiza el pago esperado del jugador de acuerdo con sus creencias. [5]

Para juegos bayesianos finitos, es decir, tanto el espacio de acción como el de tipos son finitos, existen dos representaciones equivalentes. El primero se llama juego en forma de agente (ver Teorema 9.51 del libro Teoría de juegos [9] ) que expande el número de jugadores de a , es decir, cada tipo de cada jugador se convierte en un jugador. La segunda se llama forma normal inducida (consulte la Sección 6.3.3 de Sistemas multiagente [10] ) que todavía tiene jugadores pero expande el número de acciones de cada jugador i de a a , es decir, la política pura es una combinación de acciones que el jugador debe realizar. Tomar para diferentes tipos. El equilibrio de Nash (NE) se puede calcular en estas dos representaciones equivalentes, y el BNE se puede recuperar a partir del NE.

Juegos de forma extensa con información incompleta.

Elementos de juegos de forma extensiva.

Los juegos de forma extensiva con información perfecta o imperfecta, tienen los siguientes elementos: [12]

  1. conjunto de jugadores
  2. Conjunto de nodos de decisión
  3. Una función de jugador que asigna un jugador a cada nodo de decisión.
  4. Conjunto de acciones para cada jugador en cada uno de sus nodos de decisión.
  5. Conjunto de nodos terminales
  6. Una función de pago para cada jugador

Conjuntos de naturaleza e información.

El nodo de la naturaleza suele indicarse con un círculo vacío. Su estrategia es siempre especificada y siempre completamente mixta. Generalmente, la Naturaleza está en la raíz del árbol, sin embargo, la Naturaleza también puede moverse en otros puntos.

Un conjunto de información del jugador i es un subconjunto de nodos de decisión del jugador i entre los que no puede distinguir. Es decir, si el jugador i está en uno de sus nodos de decisión en un conjunto de información, no sabe en qué nodo del conjunto de información se encuentra.

Para que dos nodos de decisión estén en el mismo conjunto de información , deben [13]

  1. Pertenecen al mismo jugador; y
  2. Tener el mismo conjunto de acciones.

Los conjuntos de información se indican mediante líneas de puntos, que es la notación más común en la actualidad.

El papel de las creencias

En los juegos bayesianos, las creencias de los jugadores sobre el juego se indican mediante una distribución de probabilidad entre varios tipos.

Si los jugadores no tienen información privada, la distribución de probabilidad entre tipos se conoce como prior común . [14]

regla de bayes

Una evaluación de un juego en forma extensiva es un par <b, µ>

  1. Perfil de estrategia de comportamiento ; y
  2. Sistema de creencias

Una evaluación <b, µ> satisface la regla de Bayes si [15] µ(x|h i ) = Pr[x se alcanza dado b−i ] / Σ Pr[x' se alcanza dado b −i ] siempre que h i sea alcanzado con probabilidad estrictamente positiva según b −i .

Equilibrio bayesiano perfecto

Un equilibrio bayesiano perfecto en un juego en forma extensiva es una combinación de estrategias y una especificación de creencias tal que se satisfacen las dos condiciones siguientes: [16]

  1. Consistencia bayesiana: las creencias son consistentes con las estrategias consideradas;
  2. Racionalidad secuencial: los jugadores eligen de forma óptima dadas sus creencias.

El equilibrio bayesiano de Nash puede dar lugar a equilibrios inverosímiles en juegos dinámicos, donde los jugadores se mueven de forma secuencial en lugar de simultáneamente. Como en los juegos de información completa, estos pueden surgir a través de estrategias no creíbles fuera del camino del equilibrio. En los juegos de información incompleta existe también la posibilidad adicional de creencias no creíbles.

Para abordar estas cuestiones, el equilibrio bayesiano perfecto, según el equilibrio perfecto en subjuegos , requiere que, a partir de cualquier conjunto de información, el juego posterior sea óptimo. Requiere que las creencias se actualicen consistentemente con la regla de Bayes en cada camino del juego que ocurra con probabilidad positiva.

Juegos bayesianos estocásticos

Los juegos estocásticos bayesianos [17] combinan las definiciones de los juegos bayesianos y los juegos estocásticos para representar estados ambientales (por ejemplo, estados físicos del mundo) con transiciones estocásticas entre estados, así como incertidumbre sobre los tipos de diferentes jugadores en cada estado. El modelo resultante se resuelve mediante una combinación recursiva del equilibrio bayesiano de Nash y la ecuación de optimización de Bellman . Los juegos estocásticos bayesianos se han utilizado para abordar diversos problemas, incluida la planificación de defensa y seguridad, [18] ciberseguridad de plantas de energía, [19] conducción autónoma, [20] computación de borde móvil, [21] y autoestabilización en sistemas dinámicos. [22]

Información incompleta sobre agencia colectiva

La definición de juegos bayesianos y equilibrio bayesiano se ha ampliado para abordar la agencia colectiva . Un enfoque es seguir tratando a los jugadores individuales como si razonaran de forma aislada, pero permitirles, con cierta probabilidad, razonar desde la perspectiva de un colectivo. [23] Otro enfoque es asumir que los jugadores dentro de cualquier agente colectivo saben que el agente existe, pero que otros jugadores no lo saben, aunque lo sospechan con cierta probabilidad. [24] Por ejemplo, Alice y Bob a veces pueden optimizar como individuos y a veces confabularse como equipo, dependiendo del estado de la naturaleza, pero es posible que otros jugadores no sepan cuál de estos es el caso.

Ejemplo

El dilema del sheriff

Un sheriff se enfrenta a un sospechoso armado. Ambos deben decidir simultáneamente si disparar al otro o no.

El sospechoso puede ser del tipo "criminal" o del tipo "civil". El sheriff tiene un solo tipo. El sospechoso conoce su tipo y el tipo del Sheriff, pero el Sheriff no conoce el tipo del sospechoso. Por tanto, hay información incompleta (porque el sospechoso tiene información privada), lo que lo convierte en un juego bayesiano. Existe una probabilidad p de que el sospechoso sea un criminal y una probabilidad 1-p de que el sospechoso sea un civil; ambos jugadores son conscientes de esta probabilidad (supuesto previo común, que puede convertirse en un juego de información completa con información imperfecta ).

El sheriff preferiría defenderse y disparar si el sospechoso dispara, o no disparar si el sospechoso no lo hace (incluso si el sospechoso es un criminal). El sospechoso preferiría disparar si es un criminal, incluso si el sheriff no dispara, pero preferiría no disparar si es un civil, incluso si el sheriff dispara. Por lo tanto, la matriz de pagos de este juego en forma normal para ambos jugadores depende del tipo de sospechoso. Este juego está definido por (N,A,T,p,u) , donde:

Si ambos jugadores son racionales y ambos saben que ambos jugadores son racionales y todo lo que sabe cualquier jugador es conocido por todos los jugadores (es decir, el jugador 1 sabe que el jugador 2 sabe que el jugador 1 es racional y el jugador 2 lo sabe, etc. ad infinitumconocimiento común ), el juego será el siguiente según el equilibrio bayesiano perfecto: [25] [26]

Cuando el tipo es "criminal", la estrategia dominante del sospechoso es disparar, y cuando el tipo es "civil", la estrategia dominante del sospechoso es no disparar; De este modo se puede eliminar una estrategia alternativa estrictamente dominada. Dado esto, si el sheriff dispara, tendrá un pago de 0 con probabilidad p y un pago de -1 con probabilidad 1-p , es decir, un pago esperado de p-1 ; si el sheriff no dispara, tendrá un pago de -2 con probabilidad p y un pago de 0 con probabilidad 1-p , es decir, un pago esperado de -2p . Así, el Sheriff siempre disparará si p-1 > -2p , es decir, cuando p > 1/3 .

El mercado de los limones

El Mercado de Limones está relacionado con un concepto conocido como selección adversa .

Configuración

Hay un auto usado. El jugador 1 es un comprador potencial que está interesado en el coche. El jugador 2 es el dueño del auto y conoce el valor v del auto (qué tan bueno es, etc.). El jugador 1 no cree y cree que el valor v del automóvil para el propietario (jugador 2) se distribuye uniformemente entre 0 y 100 (es decir, cada uno de los dos subintervalos de valor de [0, 100] de igual longitud son igualmente probables). .

El jugador 1 puede hacer una oferta p entre 0 y 100 (inclusive). El jugador 2 puede entonces aceptar o rechazar la oferta. Los pagos son los siguientes:

Punto secundario: estrategia de corte

La estrategia del jugador 2: aceptar todas las ofertas por encima de un determinado límite P* y rechazar y ofertar por debajo de P* se conoce como estrategia de límite, donde P* se denomina límite.

Ingrese al mercado monopolizado

Una nueva empresa (jugador1) que quiera ingresar a un mercado que está monopolizado por una gran empresa se encontrará con dos tipos de monopolistas (jugador2), el tipo 1 está impedido y el tipo 2 está permitido. El jugador1 nunca tendrá información completa sobre el jugador2, pero puede inferir la probabilidad de que aparezcan tipo1 y tipo2 a partir de si la empresa anterior que ingresó al mercado estaba bloqueada; es un juego bayesiano. La razón de estos juicios es que existen costos de bloqueo para el jugador 2, que puede necesitar hacer recortes de precios significativos para evitar que el jugador 1 ingrese al mercado, por lo que bloqueará al jugador 1 cuando la ganancia que roba al ingresar al mercado sea mayor que los costos de bloqueo. .

Ver también

Referencias

  1. ^ Zamir, Shmuel (2009). "Juegos bayesianos: juegos con información incompleta" (PDF) . Enciclopedia de Complejidad y Ciencia de Sistemas : 426. doi :10.1007/978-0-387-30440-3_29. ISBN 978-0-387-75888-6. S2CID  14218591.
  2. ^ Harsanyi, John C., 1967/1968. "Juegos con información incompleta jugados por jugadores bayesianos, I-III". Ciencias de la gestión 14 (3): 159-183 (Parte I), 14 (5): 320-334 (Parte II), 14 (7): 486-502 (Parte III).
  3. ^ Harsanyi, John C. (1968). "Juegos con información incompleta jugados por jugadores" bayesianos ", I-III. Parte II. Puntos de equilibrio bayesiano". Ciencias de la gestión . 14 (5): 320–334. doi :10.1287/mnsc.14.5.320. ISSN  0025-1909. JSTOR  2628673.
  4. ^ Harsanyi, John C. (1968). "Juegos con información incompleta jugados por jugadores" bayesianos ", I-III. Parte III. La distribución de probabilidad básica del juego". Ciencias de la gestión . 14 (7): 486–502. doi :10.1287/mnsc.14.7.486. ISSN  0025-1909. JSTOR  2628894.
  5. ^ ab Kajii, A.; Morris, S. (1997). "La robustez de los equilibrios ante información incompleta". Econométrica . 65 (6): 1283-1309. doi :10.2307/2171737. JSTOR  2171737.
  6. ^ Grüne-Yanoff, hasta; Lehtinen, Aki (2012). "Filosofía de la teoría de juegos". Filosofía de la Economía : 532.
  7. ^ Koniorczyk, Mátyás; Bodor, András; Pintér, Miklós (29 de junio de 2020). "Equilibrios ex ante versus ex post en juegos bayesianos clásicos con un recurso no local". Revisión física A. 1 (6): 2–3. arXiv : 2005.12727 . Código Bib : 2020PhRvA.101f2115K. doi :10.1103/PhysRevA.101.062115. S2CID  218889282.
  8. ^ Harsanyi, John C. (2004). "Juegos con información incompleta jugados por jugadores" bayesianos ", I-III: Parte I. El modelo básico". Ciencias de la gestión . 50 (12): 1804–1817. doi :10.1287/mnsc.1040.0270. ISSN  0025-1909. JSTOR  30046151.
  9. ^ Maschler, Michael; Solan, Eilon; Zamir, Shmuel (2013). Teoría de juego. Cambridge: Prensa de la Universidad de Cambridge. doi :10.1017/cbo9780511794216. ISBN 978-0-511-79421-6.
  10. ^ Shoham, Yoav; Leyton-Brown, Kevin (2008). Sistemas multiagente . Cambridge: Prensa de la Universidad de Cambridge. doi :10.1017/cbo9780511811654. ISBN 978-0-511-81165-4.
  11. ^ Ponssard, J.-P.; Sorin, S. (junio de 1980). "La formulación LP de juegos finitos de suma cero con información incompleta". Revista Internacional de Teoría de Juegos . 9 (2): 99-105. doi :10.1007/bf01769767. ISSN  0020-7276. S2CID  120632621.
  12. ^ Narahari, Y (julio de 2012). "Juegos de forma extensa" (PDF) . Departamento de Informática y Automatización : 1.
  13. ^ "Juegos de forma estratégica", Teoría de juegos , Cambridge University Press, págs. 75-143, 21 de marzo de 2013, doi :10.1017/cbo9780511794216.005, ISBN 9780511794216, recuperado el 23 de abril de 2023
  14. ^ Zamir, Shmuel (2009). "Juegos bayesianos: juegos con información incompleta" (PDF) . Enciclopedia de Complejidad y Ciencia de Sistemas : 119. doi :10.1007/978-0-387-30440-3_29. ISBN 978-0-387-75888-6. S2CID  14218591.
  15. ^ "Regla de Bayes: una introducción tutorial al análisis bayesiano". Reseñas de opciones en línea . 51 (6): 51–3301–51-3301. 2014-01-21. doi : 10.5860/elección.51-3301. ISSN  0009-4978.
  16. ^ Peters, Hans (2015). Teoría de juego . Textos de Springer sobre economía y negocios. Berlín: Springer. pag. 60.doi : 10.1007 /978-3-662-46950-7. ISBN 978-3-662-46949-1.
  17. ^ Alberto, Stefano; Crandall, Jacob; Ramamoorthy, Subramanian (2016). "Creencia y verdad en comportamientos hipotéticos". Inteligencia artificial . 235 : 63–94. arXiv : 1507.07688 . doi :10.1016/j.artint.2016.02.004. S2CID  2599762.
  18. ^ Caballero, William N.; Bancos, David; Wu, Keru (8 de agosto de 2022). "Planificación de defensa y seguridad en condiciones de incertidumbre de recursos y compromisos de varios períodos". Logística de Investigación Naval (NRL) . 69 (7): 1009-1026. doi :10.1002/nav.22071. ISSN  0894-069X. S2CID  251461541.
  19. ^ Maccarone, Lee Tylor (2021). Juegos bayesianos estocásticos para la ciberseguridad de las centrales nucleares . Tesis doctoral, Universidad de Pittsburgh.
  20. ^ Bernhard, Julián; Pollok, Stefan; Loma, Alois (2019). "Abordar la incertidumbre inherente: generación de comportamientos sensibles al riesgo para la conducción automatizada mediante el aprendizaje por refuerzo distributivo". Simposio de vehículos inteligentes IEEE 2019 (IV) . París, Francia: IEEE. págs. 2148-2155. arXiv : 2102.03119 . doi :10.1109/IVS.2019.8813791. ISBN 978-1-7281-0560-4. S2CID  201811314.
  21. ^ Asheralieva, otras; Niyato, Dusit (2021). "Descarga computacional rápida y segura con computación de borde móvil codificada por Lagrange". Transacciones IEEE sobre tecnología vehicular . 70 (5): 4924–4942. doi :10.1109/TVT.2021.3070723. ISSN  0018-9545. S2CID  234331661.
  22. ^ Ramtin, Amir Reza; Towsley, Don (2021). "Un enfoque de teoría de juegos para la autoestabilización con agentes egoístas". arXiv : 2108.07362 [cs.DC].
  23. ^ Bacharach, M. (1999). "Razonamiento interactivo en equipo: una contribución a la teoría de la cooperación". Investigación en Economía . 53 (2): 117–47. doi :10.1006/reec.1999.0188.
  24. ^ Newton, J. (2019). "Equilibrio de agencia". Juegos . 10 (1): 14. doi : 10,3390/g10010014 . hdl : 10419/219237 .
  25. ^ "Cursera". Coursera . Consultado el 16 de junio de 2016 .
  26. ^ Hu, Yuhuang; Loo, Chu Kiong (17 de marzo de 2014). "Un modelo generalizado de toma de decisiones inspirado en lo cuántico para agentes inteligentes". La Revista del Mundo Científico . 2014 : 240983. doi : 10.1155/2014/240983 . ISSN  1537-744X. PMC 3977121 . PMID  24778580. 
  27. ^ Akerlof, George A. (agosto de 1970). "El mercado de los" limones ": la incertidumbre de la calidad y el mecanismo del mercado". La revista trimestral de economía . 84 (3): 488–500. doi :10.2307/1879431. JSTOR  1879431.

Otras lecturas