En teoría de juegos , un concepto de solución es una regla formal para predecir cómo se jugará un juego. Estas predicciones se denominan "soluciones" y describen qué estrategias adoptarán los jugadores y, por lo tanto, el resultado del juego. Los conceptos de solución más utilizados son los conceptos de equilibrio , siendo el más famoso el equilibrio de Nash .
Muchos conceptos de solución, para muchos juegos, darán como resultado más de una solución. Esto pone en duda cualquiera de las soluciones, por lo que un teórico de juegos puede aplicar un refinamiento para limitar las soluciones. Cada concepto de solución sucesivo presentado a continuación mejora a su predecesor al eliminar equilibrios improbables en juegos más ricos.
Sea la clase de todos los juegos y, para cada juego , sea el conjunto de perfiles de estrategia de . Un concepto de solución es un elemento del producto directo , es decir , una función tal que para todos
En este concepto de solución, se supone que los jugadores son racionales y, por lo tanto, las estrategias estrictamente dominadas se eliminan del conjunto de estrategias que podrían jugarse de manera factible. Una estrategia está estrictamente dominada cuando hay alguna otra estrategia disponible para el jugador que siempre tiene una recompensa mayor, independientemente de las estrategias que elijan los otros jugadores. (Las estrategias estrictamente dominadas también son importantes en la búsqueda de árboles de juego minimax ). Por ejemplo, en el dilema del prisionero (de un solo período) (que se muestra a continuación), cooperar está estrictamente dominado por fallar para ambos jugadores porque a cualquiera de los jugadores siempre le conviene jugar fallar , independientemente de lo que haga su oponente.
Un equilibrio de Nash es un perfil de estrategia (un perfil de estrategia especifica una estrategia para cada jugador, por ejemplo, en el juego del dilema del prisionero mencionado anteriormente ( cooperar , desertar ) especifica que el prisionero 1 juega a cooperar y el prisionero 2 juega a desertar ) en el que cada estrategia jugada por cada agente (agente i) es la mejor respuesta a cada otra estrategia jugada por todos los demás oponentes (agentes j para cada j≠i). Una estrategia de un jugador es la mejor respuesta a la estrategia de otro jugador si no hay otra estrategia que pueda jugarse que produzca una recompensa mayor en cualquier situación en la que se juegue la estrategia del otro jugador.
En algunos juegos, existen múltiples equilibrios de Nash, pero no todos son realistas. En los juegos dinámicos, se puede utilizar la inducción hacia atrás para eliminar los equilibrios de Nash poco realistas. La inducción hacia atrás supone que los jugadores son racionales y tomarán las mejores decisiones en función de sus expectativas futuras. Esto elimina las amenazas no creíbles, que son amenazas que un jugador no llevaría a cabo si alguna vez se le pidiera que lo hiciera.
Por ejemplo, considere un juego dinámico con una empresa establecida y un potencial nuevo competidor en el sector. La empresa establecida tiene un monopolio y quiere mantener su participación en el mercado. Si el nuevo competidor entra, la empresa establecida puede luchar contra ella o adaptarse a ella. Si la empresa establecida se adapta a ella, el nuevo competidor entrará y obtendrá ganancias. Si la empresa establecida lucha, bajará sus precios, sacará del mercado al nuevo competidor (incurriendo en costos de salida) y perjudicará sus propias ganancias.
La mejor respuesta para el incumbente si el nuevo competidor entra es adaptarse, y la mejor respuesta para el nuevo competidor si el incumbente se adapta es entrar. Esto da como resultado un equilibrio de Nash. Sin embargo, si el incumbente elige luchar, la mejor respuesta para el nuevo competidor es no entrar. Si el nuevo competidor no entra, no importa lo que el incumbente elija hacer. Por lo tanto, la lucha puede considerarse la mejor respuesta para el incumbente si el nuevo competidor no entra, lo que da como resultado otro equilibrio de Nash.
Sin embargo, este segundo equilibrio de Nash se puede eliminar mediante inducción hacia atrás, ya que se basa en una amenaza no creíble por parte del incumbente. Cuando el incumbente llega al nodo de decisión donde puede optar por luchar, sería irracional hacerlo porque el nuevo competidor ya ha entrado. Por lo tanto, la inducción hacia atrás elimina este equilibrio de Nash poco realista.
Ver también:
Una generalización de la inducción hacia atrás es la perfección del subjuego. La inducción hacia atrás supone que todo el juego futuro será racional. En los equilibrios perfectos del subjuego, el juego en cada subjuego es racional (específicamente un equilibrio de Nash). La inducción hacia atrás solo se puede utilizar en juegos finales (finitos) de duración definida y no se puede aplicar a juegos con información imperfecta . En estos casos, se puede utilizar la perfección del subjuego. El equilibrio de Nash eliminado descrito anteriormente es imperfecto del subjuego porque no es un equilibrio de Nash del subjuego que comienza en el nodo alcanzado una vez que el participante ha entrado.
A veces, la perfección del subjuego no impone una restricción lo suficientemente grande sobre los resultados irrazonables. Por ejemplo, dado que los subjuegos no pueden atravesar conjuntos de información , un juego con información imperfecta puede tener solo un subjuego (él mismo) y, por lo tanto, la perfección del subjuego no se puede utilizar para eliminar ningún equilibrio de Nash. Un equilibrio bayesiano perfecto (EBP) es una especificación de las estrategias y creencias de los jugadores sobre qué nodo del conjunto de información se ha alcanzado mediante el juego. Una creencia sobre un nodo de decisión es la probabilidad de que un jugador en particular piense que ese nodo está o estará en juego (en la ruta de equilibrio ). En particular, la intuición del EBP es que especifica estrategias de los jugadores que son racionales dadas las creencias de los jugadores que especifica y las creencias que especifica son consistentes con las estrategias que especifica.
En un juego bayesiano, una estrategia determina lo que juega un jugador en cada conjunto de información controlado por ese jugador. El requisito de que las creencias sean consistentes con las estrategias es algo que no está especificado por la perfección del subjuego. Por lo tanto, el PBE es una condición de consistencia en las creencias de los jugadores. Al igual que en un equilibrio de Nash, ninguna estrategia de los jugadores está estrictamente dominada, en un PBE, para cualquier conjunto de información, ninguna estrategia de los jugadores está estrictamente dominada a partir de ese conjunto de información. Es decir, para cada creencia que el jugador podría mantener en ese conjunto de información, no hay ninguna estrategia que produzca un mayor pago esperado para ese jugador. A diferencia de los conceptos de solución anteriores, ninguna estrategia de los jugadores está estrictamente dominada a partir de cualquier conjunto de información, incluso si está fuera de la trayectoria de equilibrio. Por lo tanto, en el PBE, los jugadores no pueden amenazar con jugar estrategias que estén estrictamente dominadas a partir de cualquier conjunto de información fuera de la trayectoria de equilibrio.
El término bayesiano en el nombre de este concepto de solución alude al hecho de que los jugadores actualizan sus creencias según el teorema de Bayes . Calculan probabilidades teniendo en cuenta lo que ya ha sucedido en el juego.
La inducción hacia adelante se llama así porque, así como la inducción hacia atrás supone que el juego futuro será racional, la inducción hacia adelante supone que el juego pasado fue racional. Cuando un jugador no sabe qué tipo es otro jugador (es decir, hay información imperfecta y asimétrica), ese jugador puede formarse una creencia de qué tipo es ese jugador observando las acciones pasadas de ese jugador. Por lo tanto, la creencia formada por ese jugador sobre cuál es la probabilidad de que el oponente sea de un cierto tipo se basa en el juego pasado de ese oponente siendo racional. Un jugador puede elegir señalar su tipo a través de sus acciones.
Kohlberg y Mertens (1986) introdujeron el concepto de solución de equilibrio estable, un refinamiento que satisface la inducción hacia adelante. Se encontró un contraejemplo en el que dicho equilibrio estable no satisfacía la inducción hacia atrás. Para resolver el problema, Jean-François Mertens introdujo lo que los teóricos de juegos ahora llaman el concepto de equilibrio estable de Mertens , probablemente el primer concepto de solución que satisface tanto la inducción hacia adelante como la inducción hacia atrás.
La inducción hacia adelante ofrece una solución única para el juego de quemar dinero .