stringtranslate.com

Teorema de purificación

En teoría de juegos , el teorema de purificación fue propuesto por el premio Nobel John Harsanyi en 1973. [1] El teorema justifica un aspecto desconcertante de los equilibrios de Nash de estrategia mixta : cada jugador es completamente indiferente entre cada una de las acciones a las que asigna un peso distinto de cero, pero las mezcla de modo de hacer que todos los demás jugadores también sean indiferentes.

El teorema de purificación muestra cómo pueden surgir tales equilibrios de estrategia mixta incluso si cada jugador juega una estrategia pura, siempre que los jugadores tengan información incompleta sobre los pagos de sus oponentes. Tales estrategias surgen como el límite de una serie de equilibrios de estrategia pura para un juego perturbado de información incompleta , en el que los pagos de cada jugador son conocidos por ellos mismos pero no por sus oponentes. La idea es que la estrategia mixta predicha del juego original surge de las aproximaciones en constante mejora de un juego que no es observado por el teórico que diseñó el juego original idealizado .

La naturaleza aparentemente mixta de la estrategia es en realidad el resultado de que cada jugador juega una estrategia pura con valores límite que dependen de la distribución ex ante sobre el continuo de pagos que puede tener un jugador. A medida que ese continuo se reduce a cero, las estrategias de los jugadores convergen hacia los equilibrios de Nash previstos del juego original, imperturbable y con información completa .

El resultado también es un aspecto importante de las investigaciones modernas en la teoría de juegos evolutivos, donde los valores perturbados se interpretan como distribuciones sobre tipos de jugadores emparejados aleatoriamente en una población para jugar.

Ejemplo

Consideremos el juego Hawk-Dove que se muestra aquí. El juego tiene dos equilibrios de estrategia pura (Desertar, Cooperar) y (Cooperar, Dejar). También tiene un equilibrio mixto en el que cada jugador juega a Cooperar con una probabilidad de 2/3.

Supongamos que cada jugador i soporta un coste extra a i por jugar a Cooperar, que se distribuye uniformemente en [− AA ]. Los jugadores sólo conocen su propio valor de este coste. Así que este es un juego de información incompleta que podemos resolver utilizando el equilibrio de Nash bayesiano . La probabilidad de que a ia* es ( a* + A )/2 A . Si el jugador 2 Coopera cuando a 2a* , entonces la utilidad esperada del jugador 1 por Cooperar es a 1 + 3( a* + A )/2 A + 2(1 − ( a* + A )/2 A ) ; su utilidad esperada por Desertar es 4( a* + A )/2 A . Por lo tanto, él mismo debería Cooperar cuando a 1 ≤ 2 - 3( a* + A )/2 A . Buscando un equilibrio simétrico donde ambos jugadores cooperan si a ia* , resolvemos esto para a* = 1/(2 + 3/ A ). Ahora que hemos calculado a* , podemos calcular la probabilidad de que cada jugador juegue Cooperar como

Cuando A → 0, esto se aproxima a 2/3, la misma probabilidad que en la estrategia mixta en el juego de información completa.

Así, podemos pensar en el equilibrio de estrategia mixta como el resultado de estrategias puras seguidas por jugadores que tienen una pequeña cantidad de información privada sobre sus ganancias.

Detalles técnicos

La prueba de Harsanyi implica la fuerte suposición de que las perturbaciones de cada jugador son independientes de las de los otros jugadores. Sin embargo, se han intentado perfeccionar aún más el teorema para que sea más general. [2] [3]

El resultado principal del teorema es que todos los equilibrios de estrategias mixtas de un juego dado pueden purificarse utilizando la misma secuencia de juegos perturbados. Sin embargo, además de la independencia de las perturbaciones, se basa en que el conjunto de pagos para esta secuencia de juegos sea de medida completa. Hay juegos, de naturaleza patológica, para los cuales esta condición no se cumple.

El problema principal de estos juegos se puede clasificar en dos categorías: (1) las distintas estrategias mixtas del juego se purifican mediante diferentes secuencias de juegos perturbados y (2) algunas estrategias mixtas del juego implican estrategias débilmente dominadas. Ninguna estrategia mixta que implique una estrategia débilmente dominada puede purificarse utilizando este método porque si existe alguna probabilidad no negativa de que el oponente juegue una estrategia para la cual la estrategia débilmente dominada no es la mejor respuesta, entonces uno nunca deseará jugar la estrategia débilmente dominada. Por lo tanto, el límite no se cumple porque implica una discontinuidad. [4]

Referencias

  1. ^ Harsanyi, John C. (1973). "Juegos con pagos alterados aleatoriamente: una nueva justificación para los puntos de equilibrio de estrategias mixtas". Revista internacional de teoría de juegos . 2 : 1–23. doi :10.1007/BF01737554. S2CID  154484458.
  2. ^ Aumann, RJ ; Katznelson, Y. ; Radner, R. ; Rosenthal, RW ; Weiss, B. (1983). "Purificación aproximada de estrategias mixtas". Matemáticas de la investigación de operaciones . 8 (3): 327–341. CiteSeerX 10.1.1.422.3903 . doi :10.1287/moor.8.3.327. 
  3. ^ Govindan, Srihari; Reny, Philip J.; Robson, Arthur J. (2003). "Una breve demostración del teorema de purificación de Harsanyi". Juegos y comportamiento económico . 45 (2): 369–374. doi :10.1016/S0899-8256(03)00149-0.
  4. ^ Fudenberg, Drew ; Tirole, Jean (1991). Teoría de juegos . MIT Press. págs. 233–234. ISBN 9780262061414.