En otras palabras, un equilibrio de Nash es una situación en la cual todos los jugadores han puesto en práctica, y saben que lo han hecho, una estrategia que maximiza sus ganancias dadas las estrategias de los otros.
Es importante tener presente que un equilibrio de Nash no implica que se logre el mejor resultado conjunto para los participantes, sino solo el mejor resultado para cada uno de ellos considerados individualmente.
Es perfectamente posible que el resultado fuera mejor para todos si, de alguna manera, los jugadores coordinaran su acción.
El resultado sería mejor para todos si todos cooperaran entre ellos y no declararan, pero, dado que cada cual persigue su propio interés, y ninguno puede confiar en que nadie declarará, todos deben adoptar la estrategia de declarar, lo que termina en una situación (equilibrio) en la cual cada uno minimiza su posible pérdida.
Modificaciones adicionales permiten repetir el juego de forma indefinida (por ejemplo, con los jugadores repartiendo un «botín», etc.).
En todas esas situaciones resulta que la estrategia de no cooperar es la que minimiza el riesgo de pérdidas y otorga una ganancia media pero segura para cada jugador individual, aunque la cooperación maximizaría la ganancia tanto a nivel individual como de grupo.
Fue John Forbes Nash quien, en su tesis doctoral, Juegos no cooperativos (Non-Cooperative games), presentada en 1950 y publicada en 1951,[4] define los equilibrios que hoy llevan su nombre, tratando de manera general las estrategias mixtas y demostrando que cualquier juego con un número finito de estrategias tiene al menos un equilibrio de Nash en estrategias mixtas.
denota el número de estrategias puras del jugador j. Intuitivamente, una estrategia mixta es un vector que asocia cierta probabilidad a cada estrategia pura del jugador j, de ahí que cada entrada tenga que ser no negativa y la suma de todas ellas sea 1.
se interpreta como el peso o probabilidad que el jugador j le asocia a su estrategia pura
es un equilibrio de Nash en estrategias puras (ep) si para cada jugador en N se cumple:
representa el pago para el jugador j cuando este decide cambiar su estrategia por cualquier otra
es el pago esperado (o pago promedio) que obtendrá el jugador j al jugarse siempre el perfil de estrategias mixtas X. Intuitivamente, un perfil de estrategias mixtas es equilibrio de Nash si, en promedio, ningún jugador puede mejorar su pago cambiando sus estrategias mixtas cuando el resto de los jugadores se mantenga con la estrategia actual.
En estos casos pueden buscarse los equilibrios de Nash a través de la forma normal del juego o usando diversos algoritmos en el juego extensivo, como la inducción hacia atrás.
En estrategias mixtas sin embargo se puede asegurar que siempre existen equilibrios.
Los dos jugadores ganan el valor menor en dólares, pero además, si los números son distintos, el que ha escogido el mayor le debe pagar $2 al otro».
Este juego tiene un único equilibrio de Nash: ambos jugadores deben escoger cero (0).
Cualquier otra estrategia puede desfavorecer a un jugador si otro escoge un número menor.
El primer número en cada celda indica la ganancia del primer jugador (cuyas opciones se muestran a la izquierda) y el segundo la ganancia del segundo jugador (cuyas opciones se muestran encima).
Esto ayuda a explicar por qué en casi toda Europa se conduce por el mismo lado (a la derecha) y como en Inglaterra, al ser una isla y no empeorar su pago por no coordinarse con los demás países, se mantuvo la estrategia de conducir por la izquierda.
El dilema del prisionero tiene un equilibrio de Nash en estrategias puras: se produce cuando ambos jugadores confiesan.
Así, «ambos cooperan» no es un equilibrio de Nash pero sí un óptimo paretiano.
También podría llegarse a una solución fuera del equilibrio de Nash si el juego se repitiese infinitas veces, cuando se logra la estrategia «ojo por ojo».
La tragedia de los comunes es una generalización del dilema del prisionero ideada por James Garrett Hardin y publicada por primera vez en su artículo The tragedy of the commons (1968).
En este juego existen n jugadores que hacen uso de un bien común (por ejemplo, un terreno comunal).
Aunque cada jugador puede participar en el cuidado de este bien (lo que conlleva un costo para el que lo hace), todos los jugadores tienen derecho a usarlo, lo cuiden o no.
De este modo, el juego solo tiene un equilibrio de Nash en estrategias puras y es (egoísta, egoísta, …, egoísta) a pesar de que, como en el dilema del prisionero, el beneficio para cada jugador termina siendo mucho menor que si todos hubieran elegido ser solidarios.
Consideremos, por ejemplo, una ciudad con caminos libres de tránsito y contaminación baja como un bien común que todos debemos cuidar.
Siempre existe la tentación de ser egoísta (usar automóvil particular para mejorar nuestro propio transporte por la ciudad, ignorar semáforos en rojo, etc.) a pesar de que si todos siguen la misma estrategia los viales sufren congestionamientos extremos y surge el serio problema de la contaminación ambiental.
Entonces el jugador 2 podría sacar ventaja de ello jugando siempre papel.
Una mejor respuesta del jugador 1 sería entonces jugar con estrategias mixtas, es decir, asignarle cierta probabilidad a cada estrategia y en cada jugada elegir aleatoriamente de acuerdo a la distribución elegida.