En teoría de juegos , el equilibrio de Nash , llamado así en honor al matemático John Nash , es la forma más común de definir la solución de un juego no cooperativo en el que participan dos o más jugadores. En un equilibrio de Nash, se supone que cada jugador conoce las estrategias de equilibrio de los demás jugadores y nadie tiene nada que ganar cambiando sólo su propia estrategia. [1] El principio de equilibrio de Nash se remonta a la época de Cournot , quien en 1838 lo aplicó a empresas competidoras que elegían productos. [2]
Si cada jugador ha elegido una estrategia (un plan de acción basado en lo que ha sucedido hasta el momento en el juego) y nadie puede aumentar el beneficio esperado cambiando su estrategia mientras los otros jugadores mantienen la suya sin cambios, entonces el conjunto actual de opciones de estrategia constituye un equilibrio de Nash.
Si dos jugadores , Alice y Bob, eligen las estrategias A y B, (A, B) es un equilibrio de Nash si Alice no tiene otra estrategia disponible que funcione mejor que A para maximizar su pago en respuesta a que Bob elija B, y Bob no tiene otra estrategia. disponible que obtiene mejores resultados que B para maximizar su pago en respuesta a que Alice elija A. En un juego en el que Carol y Dan también son jugadores, (A, B, C, D) es un equilibrio de Nash si A es la mejor respuesta de Alice a ( B, C, D), B es la mejor respuesta de Bob a (A, C, D), y así sucesivamente.
Nash demostró que existe un equilibrio de Nash, posiblemente en estrategias mixtas , para todo juego finito. [3]
Los teóricos de juegos utilizan el equilibrio de Nash para analizar el resultado de la interacción estratégica de varios tomadores de decisiones . En una interacción estratégica, el resultado para cada tomador de decisiones depende tanto de las decisiones de los demás como de las suyas propias. La simple idea que subyace a la idea de Nash es que no se pueden predecir las elecciones de múltiples tomadores de decisiones si se analizan esas decisiones de forma aislada. En lugar de ello, debemos preguntarnos qué haría cada jugador teniendo en cuenta lo que espera que hagan los demás. El equilibrio de Nash requiere que las elecciones sean consistentes: ningún jugador desea deshacer su decisión dado lo que los demás están decidiendo.
El concepto se ha utilizado para analizar situaciones hostiles como guerras y carreras armamentistas [4] (ver dilema del prisionero ), y también cómo el conflicto puede mitigarse mediante la interacción repetida (ver ojo por ojo ). También se ha utilizado para estudiar hasta qué punto las personas con diferentes preferencias pueden cooperar (ver batalla de sexos ) y si correrán riesgos para lograr un resultado cooperativo (ver caza del ciervo ). Se ha utilizado para estudiar la adopción de estándares técnicos , [ cita necesaria ] y también la aparición de corridas bancarias y crisis monetarias (ver juego de coordinación ). Otras aplicaciones incluyen el flujo de tráfico (ver el principio de Wardrop ), cómo organizar las subastas (ver teoría de la subasta ), el resultado de los esfuerzos ejercidos por múltiples partes en el proceso educativo, [5] legislación regulatoria como las regulaciones ambientales (ver la tragedia de los comunes ). , [6] gestión de recursos naturales, [7] análisis de estrategias en marketing, [8] incluso tiros penales en el fútbol (ver monedas de un centavo coincidentes ), [9] sistemas energéticos, sistemas de transporte, problemas de evacuación [10] y comunicaciones inalámbricas. [11]
El equilibrio de Nash lleva el nombre del matemático estadounidense John Forbes Nash Jr. La misma idea fue utilizada en una aplicación particular en 1838 por Antoine Augustin Cournot en su teoría del oligopolio . [12] En la teoría de Cournot, cada una de varias empresas elige cuánta producción producir para maximizar sus ganancias. La mejor producción de una empresa depende de la producción de las demás. Un equilibrio de Cournot ocurre cuando la producción de cada empresa maximiza sus ganancias dada la producción de las otras empresas, lo cual es un equilibrio de Nash de estrategia pura . Cournot también introdujo el concepto de dinámica de mejor respuesta en su análisis de la estabilidad del equilibrio. Sin embargo, Cournot no utilizó la idea en ninguna otra aplicación ni la definió de manera general.
En cambio, el concepto moderno de equilibrio de Nash se define en términos de estrategias mixtas , donde los jugadores eligen una distribución de probabilidad sobre posibles estrategias puras (lo que podría poner el 100% de la probabilidad en una estrategia pura; dichas estrategias puras son un subconjunto de estrategias mixtas). El concepto de equilibrio de estrategias mixtas fue introducido por John von Neumann y Oskar Morgenstern en su libro de 1944 La teoría de los juegos y el comportamiento económico , pero su análisis se limitó al caso especial de los juegos de suma cero . Demostraron que existirá un equilibrio de Nash de estrategias mixtas para cualquier juego de suma cero con un conjunto finito de acciones. [13] La contribución de Nash en su artículo de 1951 "Juegos no cooperativos" fue definir un equilibrio de Nash de estrategia mixta para cualquier juego con un conjunto finito de acciones y demostrar que debe existir al menos un equilibrio de Nash (de estrategia mixta). en tal juego. La clave de la capacidad de Nash para demostrar la existencia de manera mucho más general que la de von Neumann residía en su definición de equilibrio. Según Nash, "un punto de equilibrio es una n-tupla tal que la estrategia mixta de cada jugador maximiza su beneficio si las estrategias de los demás se mantienen fijas. Por lo tanto, la estrategia de cada jugador es óptima frente a las de los demás". Plantear el problema en este marco permitió a Nash emplear el teorema del punto fijo de Kakutani en su artículo de 1950 para demostrar la existencia de equilibrios. Su artículo de 1951 utilizó el teorema del punto fijo de Brouwer, más simple , para el mismo propósito. [14]
Los teóricos de juegos han descubierto que, en algunas circunstancias, el equilibrio de Nash hace predicciones inválidas o no logra hacer una predicción única. Han propuesto muchos conceptos de solución ('refinamientos' de los equilibrios de Nash) diseñados para descartar equilibrios de Nash inverosímiles. Una cuestión particularmente importante es que algunos equilibrios de Nash pueden basarse en amenazas que no son " creíbles ". En 1965, Reinhard Selten propuso el equilibrio perfecto en subjuegos como un refinamiento que elimina los equilibrios que dependen de amenazas no creíbles . Otras extensiones del concepto de equilibrio de Nash han abordado lo que sucede si se repite un juego , o lo que sucede si se juega en ausencia de información completa . Sin embargo, los refinamientos y ampliaciones posteriores del equilibrio de Nash comparten la idea principal en la que se basa el concepto de Nash: el equilibrio es un conjunto de estrategias tales que la estrategia de cada jugador es óptima dadas las elecciones de los demás.
Un perfil de estrategia es un conjunto de estrategias, una para cada jugador. Informalmente, un perfil estratégico es un equilibrio de Nash si ningún jugador puede hacerlo mejor cambiando unilateralmente su estrategia. Para ver lo que esto significa, imagine que a cada jugador se le dicen las estrategias de los demás. Supongamos entonces que cada jugador se pregunta: "Conociendo las estrategias de los otros jugadores y tratando las estrategias de los otros jugadores como escritas en piedra, ¿puedo beneficiarme cambiando mi estrategia?"
Por ejemplo, si un jugador prefiere "Sí", entonces ese conjunto de estrategias no es un equilibrio de Nash. Pero si todos los jugadores prefieren no cambiar (o son indiferentes entre cambiar o no), entonces el perfil de estrategia es un equilibrio de Nash. Por tanto, cada estrategia en un equilibrio de Nash es la mejor respuesta a las estrategias de los demás jugadores en ese equilibrio. [15]
Formalmente, sea el conjunto de todas las estrategias posibles para el jugador , donde . Sea un perfil de estrategia, un conjunto que consta de una estrategia para cada jugador, donde denota las estrategias de todos los jugadores excepto . Sea el pago del jugador i en función de las estrategias. El perfil de la estrategia es un equilibrio de Nash si
Un juego puede tener más de un equilibrio de Nash. Incluso si el equilibrio es único, podría ser débil : un jugador podría ser indiferente entre varias estrategias dadas las elecciones de los demás jugadores. Es único y se llama equilibrio estricto de Nash si la desigualdad es estricta, por lo que una estrategia es la mejor respuesta única:
El conjunto de estrategias puede ser diferente para diferentes jugadores y sus elementos pueden ser una variedad de objetos matemáticos. Más simplemente, un jugador podría elegir entre dos estrategias, por ejemplo, O, el conjunto de estrategias podría ser un conjunto finito de estrategias condicionales que responden a otros jugadores, por ejemplo, O, podría ser un conjunto infinito, un continuo o ilimitado, por ejemplo, tal que sea un número real no negativo. Las pruebas existentes de Nash suponen un conjunto de estrategias finito, pero el concepto de equilibrio de Nash no lo requiere.
Un juego puede tener un equilibrio de Nash de estrategia pura o de estrategia mixta . En este último caso, se elige estocásticamente una estrategia pura con una probabilidad fija .
Supongamos que en el equilibrio de Nash, cada jugador se pregunta: "Conociendo las estrategias de los otros jugadores y tratando las estrategias de los otros jugadores como escritas en piedra, ¿sufriría una pérdida si cambiara mi estrategia?"
Si la respuesta de todos los jugadores es "Sí", entonces el equilibrio se clasifica como equilibrio estricto de Nash . [dieciséis]
Si, en cambio, para algún jugador existe una igualdad exacta entre la estrategia del equilibrio de Nash y alguna otra estrategia que proporcione exactamente el mismo pago (es decir, al jugador le es indiferente cambiar o no), entonces el equilibrio se clasifica como débil [ nota 1]. ] o equilibrio de Nash no estricto [ cita necesaria ] [ aclaración necesaria ] .
El equilibrio de Nash define la estabilidad sólo en términos de las desviaciones de los jugadores individuales. En los juegos cooperativos este concepto no resulta suficientemente convincente. Un equilibrio de Nash fuerte permite desviaciones en cualquier coalición concebible. [17] Formalmente, un equilibrio de Nash fuerte es un equilibrio de Nash en el que ninguna coalición, tomando como dadas las acciones de sus complementos, puede desviarse cooperativamente de una manera que beneficie a todos sus miembros. [18] Sin embargo, el concepto fuerte de Nash a veces se percibe como demasiado "fuerte" en el sentido de que el entorno permite una comunicación privada ilimitada. De hecho, un equilibrio de Nash fuerte tiene que ser eficiente en Pareto . Como resultado de estos requisitos, un Nash fuerte es demasiado raro para ser útil en muchas ramas de la teoría de juegos. Sin embargo, en juegos como las elecciones en los que hay muchos más jugadores que resultados posibles, puede ser más común que un equilibrio estable.
Un equilibrio de Nash refinado conocido como equilibrio de Nash a prueba de coaliciones (CPNE) [17] ocurre cuando los jugadores no pueden hacerlo mejor incluso si se les permite comunicarse y llegar a acuerdos "autoaplicables" para desviarse. Toda estrategia correlacionada respaldada por una dominancia estricta iterada y en la frontera de Pareto es una CPNE. [19] Además, es posible que un juego tenga un equilibrio de Nash que sea resistente contra coaliciones menores que un tamaño específico, k. CPNE está relacionado con la teoría del núcleo .
Nash demostró que si se permiten estrategias mixtas (donde un jugador elige probabilidades de usar varias estrategias puras), entonces todo juego con un número finito de jugadores en el que cada jugador puede elegir entre un número finito de estrategias puras tiene al menos un equilibrio de Nash, que podría ser una estrategia pura para cada jugador o podría ser una distribución de probabilidad sobre estrategias para cada jugador.
Los equilibrios de Nash no tienen por qué existir si el conjunto de opciones es infinito y no compacto. Por ejemplo:
Sin embargo, existe un equilibrio de Nash si el conjunto de opciones es compacto y el pago de cada jugador es continuo en las estrategias de todos los jugadores. [20]
Rosen [21] amplió el teorema de existencia de Nash de varias maneras. Considera un juego de n jugadores, en el que la estrategia de cada jugador i es un vector si en el espacio euclidiano Rmi . Denota m := m 1 +...+ m n ; entonces una tupla de estrategia es un vector en R m . Parte de la definición de un juego es un subconjunto S de R m tal que la tupla de estrategia debe estar en S. Esto significa que las acciones de los jugadores pueden verse potencialmente limitadas en función de las acciones de otros jugadores. Un caso especial común del modelo es cuando S es un producto cartesiano de conjuntos convexos S 1 ,..., S n , tal que la estrategia del jugador i debe estar en Si . Esto representa el caso en el que las acciones de cada jugador i están restringidas independientemente de las acciones de los demás jugadores. Si se cumplen las siguientes condiciones:
Entonces existe un equilibrio de Nash. La prueba utiliza el teorema del punto fijo de Kakutani . Rosen también demuestra que, bajo ciertas condiciones técnicas que incluyen una concavidad estricta, el equilibrio es único.
El resultado de Nash se refiere al caso especial en el que cada Si es un simplex (que representa todas las combinaciones posibles de estrategias puras) y las funciones de pago de todos los jugadores son funciones bilineales de las estrategias.
El equilibrio de Nash a veces puede parecer no racional desde una perspectiva en tercera persona. Esto se debe a que un equilibrio de Nash no es necesariamente óptimo de Pareto .
El equilibrio de Nash también puede tener consecuencias no racionales en los juegos secuenciales porque los jugadores pueden "amenazarse" entre sí con amenazas que en realidad no llevarían a cabo. Para tales juegos, el equilibrio de Nash perfecto en subjuegos puede ser más significativo como herramienta de análisis.
El juego de coordinación es un juego clásico de dos jugadores y dos estrategias , como se muestra en el ejemplo de matriz de pagos a la derecha. Hay dos equilibrios de estrategia pura, (A,A) con pago de 4 para cada jugador y (B,B) con pago de 2 para cada uno. La combinación (B,B) es un equilibrio de Nash porque si cualquiera de los jugadores cambia unilateralmente su estrategia de B a A, su pago caerá de 2 a 1.
Un ejemplo famoso de juego de coordinación es la caza del ciervo . Dos jugadores pueden elegir cazar un ciervo o un conejo, proporcionando el ciervo más carne (4 unidades de utilidad, 2 para cada jugador) que el conejo (1 unidad de utilidad). La advertencia es que el ciervo debe cazarse de forma cooperativa, por lo que si un jugador intenta cazar el ciervo, mientras el otro caza el conejo, el cazador de ciervos fracasará totalmente, con un pago de 0, mientras que el cazador de conejos tendrá éxito, por un pago de 1. El juego tiene dos equilibrios, (ciervo, ciervo) y (conejo, conejo), porque la estrategia óptima de un jugador depende de sus expectativas sobre lo que hará el otro jugador. Si un cazador confía en que el otro cazará al ciervo, deberá cazar al ciervo; sin embargo, si cree que el otro cazará el conejo, él también cazará el conejo. Este juego se utiliza como analogía de la cooperación social, ya que gran parte del beneficio que las personas obtienen en la sociedad depende de que las personas cooperen y confíen implícitamente unas en otras para actuar de una manera correspondiente a la cooperación.
Conducir por una carretera en dirección contraria a un coche y tener que elegir entre desviarse por la izquierda o por la derecha de la carretera también es un juego de coordinación. Por ejemplo, con pagos 10 que significan que no hay accidente y 0 que significa un accidente, el juego de coordinación se puede definir con la siguiente matriz de pagos:
En este caso hay dos equilibrios de Nash de estrategia pura, cuando ambos eligen conducir por la izquierda o por la derecha. Si admitimos estrategias mixtas (donde se elige una estrategia pura al azar, sujeta a una probabilidad fija), entonces hay tres equilibrios de Nash para el mismo caso: dos que hemos visto en la forma de estrategia pura, donde las probabilidades son (0 %, 100%) para el jugador uno, (0%, 100%) para el jugador dos; y (100%, 0%) para el jugador uno, (100%, 0%) para el jugador dos respectivamente. Agregamos otro donde están las probabilidades de cada jugador (50%, 50%).
Una aplicación de los equilibrios de Nash es la determinación del flujo de tráfico esperado en una red. Considere el gráfico de la derecha. Si suponemos que hay "automóviles" que viajan de A a D , ¿cuál es la distribución esperada del tráfico en la red?
Esta situación se puede modelar como un " juego ", donde cada viajero puede elegir entre 3 estrategias y donde cada estrategia es una ruta de A a D (una de ABD , ABCD o ACD ). La "recompensa" de cada estrategia es el tiempo de viaje de cada ruta. En el gráfico de la derecha, un automóvil que viaja por ABD experimenta un tiempo de viaje de , donde es el número de automóviles que viajan por el borde AB . Por tanto, los beneficios de cualquier estrategia determinada dependen de las elecciones de los demás jugadores, como es habitual. Sin embargo, el objetivo, en este caso, es minimizar el tiempo de viaje, no maximizarlo. El equilibrio se producirá cuando el tiempo en todos los caminos sea exactamente el mismo. Cuando eso sucede, ningún conductor tiene ningún incentivo para cambiar de ruta, ya que esto sólo puede aumentar su tiempo de viaje. Para el gráfico de la derecha, si, por ejemplo, 100 automóviles viajan de A a D , entonces se producirá el equilibrio cuando 25 conductores viajen por ABD , 50 por ABCD y 25 por ACD . Cada conductor tiene ahora un tiempo total de viaje de 3,75 (para ver esto, un total de 75 automóviles toman el borde AB y, de la misma manera, 75 autos toman el borde CD ).
Obsérvese que esta distribución no es, en realidad, socialmente óptima. Si los 100 automóviles acordaron que 50 viajan por ABD y los otros 50 por ACD , entonces el tiempo de viaje para cualquier automóvil sería en realidad 3,5, que es menos de 3,75. Este es también el equilibrio de Nash si se elimina el camino entre B y C , lo que significa que agregar otra ruta posible puede disminuir la eficiencia del sistema, fenómeno conocido como paradoja de Braess .
Esto se puede ilustrar con un juego de dos jugadores en el que ambos eligen simultáneamente un número entero del 0 al 3 y ambos ganan el menor de los dos números en puntos. Además, si un jugador elige un número mayor que el otro, tendrá que ceder dos puntos al otro.
Este juego tiene un equilibrio de Nash de estrategia pura único: ambos jugadores eligen 0 (resaltado en rojo claro). Cualquier otra estrategia puede mejorarse si un jugador cambia su número a uno menos que el del otro jugador. En la mesa adyacente, si el juego comienza en el cuadrado verde, al jugador 1 le interesa moverse al cuadrado morado y al jugador 2 le interesa moverse al cuadrado azul. Aunque no encajaría en la definición de juego de competición, si el juego se modifica de modo que los dos jugadores ganen la cantidad indicada si ambos eligen el mismo número y, de lo contrario, no ganan nada, entonces existen 4 equilibrios de Nash: (0,0 ), (1,1), (2,2) y (3,3).
Existe una forma numérica sencilla de identificar los equilibrios de Nash en una matriz de pagos. Es especialmente útil en juegos de dos personas donde los jugadores tienen más de dos estrategias. En este caso, el análisis formal puede resultar demasiado largo. Esta regla no se aplica al caso en el que sean de interés estrategias mixtas (estocásticas). La regla es la siguiente: si el primer número de pago, en el par de pagos de la celda, es el máximo de la columna de la celda y si el segundo número es el máximo de la fila de la celda, entonces la celda representa un Nash. equilibrio.
Podemos aplicar esta regla a una matriz de 3×3:
Usando la regla, podemos ver muy rápidamente (mucho más rápido que con el análisis formal) que las celdas de equilibrio de Nash son (B,A), (A,B) y (C,C). De hecho, para la celda (B,A), 40 es el máximo de la primera columna y 25 es el máximo de la segunda fila. Para (A,B), 25 es el máximo de la segunda columna y 40 es el máximo de la primera fila; lo mismo se aplica a la celda (C,C). Para otras celdas, uno o ambos miembros del doblete no son el máximo de las filas y columnas correspondientes.
Dicho esto, la mecánica real para encontrar celdas de equilibrio es obvia: encontrar el máximo de una columna y verificar si el segundo miembro del par es el máximo de la fila. Si se cumplen estas condiciones, la celda representa un equilibrio de Nash. Verifique todas las columnas de esta manera para encontrar todas las celdas NE. Una matriz N×N puede tener entre 0 y N×N equilibrios de Nash de estrategia pura .
El concepto de estabilidad , útil en el análisis de muchos tipos de equilibrios, también puede aplicarse a los equilibrios de Nash.
Un equilibrio de Nash para un juego de estrategia mixta es estable si un pequeño cambio (específicamente, un cambio infinitesimal) en las probabilidades de un jugador conduce a una situación en la que se cumplen dos condiciones:
Si ambos casos se cumplen, entonces un jugador con un pequeño cambio en su estrategia mixta regresará inmediatamente al equilibrio de Nash. Se dice que el equilibrio es estable. Si la condición uno no se cumple entonces el equilibrio es inestable. Si solo se cumple la condición uno, es probable que haya un número infinito de estrategias óptimas para el jugador que cambió.
En el ejemplo anterior del "juego de conducción" hay equilibrios estables e inestables. Los equilibrios que involucran estrategias mixtas con 100% de probabilidades son estables. Si cualquiera de los jugadores cambia ligeramente sus probabilidades, ambos estarán en desventaja y su oponente no tendrá motivos para cambiar su estrategia. El equilibrio (50%,50%) es inestable. Si cualquiera de los jugadores cambia sus probabilidades (lo que no beneficiaría ni dañaría las expectativas del jugador que hizo el cambio, si la estrategia mixta del otro jugador sigue siendo (50%, 50%)), entonces el otro jugador inmediatamente tiene una mejor estrategia en ya sea (0%, 100%) o (100%, 0%).
La estabilidad es crucial en las aplicaciones prácticas de los equilibrios de Nash, ya que la estrategia mixta de cada jugador no se conoce perfectamente, sino que debe inferirse de la distribución estadística de sus acciones en el juego. En este caso, es muy poco probable que surjan equilibrios inestables en la práctica, ya que cualquier cambio mínimo en las proporciones de cada estrategia observada conducirá a un cambio de estrategia y a la ruptura del equilibrio.
Finalmente, en los años ochenta, basándose con gran profundidad en tales ideas, se introdujeron los equilibrios estables de Mertens como concepto de solución . Los equilibrios estables de Mertens satisfacen tanto la inducción hacia adelante como la inducción hacia atrás . En el contexto de la teoría de juegos , los equilibrios estables ahora generalmente se refieren a equilibrios estables de Mertens. [ cita necesaria ]
Si un juego tiene un equilibrio de Nash único y se juega entre jugadores bajo ciertas condiciones, entonces se adoptará el conjunto de estrategias NE. Las condiciones suficientes para garantizar que se juegue el equilibrio de Nash son:
Ejemplos de problemas de teoría de juegos en los que no se cumplen estas condiciones:
En su doctorado. En su disertación, John Nash propuso dos interpretaciones de su concepto de equilibrio, con el objetivo de mostrar cómo los puntos de equilibrio pueden conectarse con fenómenos observables.
(...) Una interpretación es racionalista: si asumimos que los jugadores son racionales, conocen la estructura completa del juego, el juego se juega solo una vez y hay un solo equilibrio de Nash, entonces los jugadores jugarán de acuerdo con ese equilibrio .
Esta idea fue formalizada por R. Aumann y A. Brandenburger, 1995, Epistemic Conditions for Nash Equilibrium , Econometrica, 63, 1161-1180 quienes interpretaron la estrategia mixta de cada jugador como una conjetura sobre el comportamiento de otros jugadores y han demostrado que si el juego y la racionalidad de los jugadores se conoce mutuamente y estas conjeturas se conocen comúnmente, entonces las conjeturas deben ser un equilibrio de Nash (se necesita un supuesto previo común para este resultado en general, pero no en el caso de dos jugadores. En este caso, la las conjeturas sólo necesitan ser mutuamente conocidas).
Una segunda interpretación, a la que Nash se refirió mediante la interpretación de la acción masiva, es menos exigente para los jugadores:
[e]s innecesario suponer que los participantes tienen pleno conocimiento de la estructura total del juego, o la capacidad y la inclinación para pasar por procesos de razonamiento complejos. Lo que se supone es que existe una población de participantes para cada posición del juego, que serán jugadas a lo largo del tiempo por participantes elegidos al azar de las diferentes poblaciones. Si existe una frecuencia promedio estable con la que cada estrategia pura es empleada por el miembro promedio de la población apropiada, entonces esta frecuencia promedio estable constituye un equilibrio de Nash de estrategias mixtas.
Para un resultado formal en este sentido, véase Kuhn, H. y et al., 1996, "The Work of John Nash in Game Theory", Journal of Economic Theory , 69, 153-185.
Debido a las condiciones limitadas en las que las NE realmente pueden observarse, rara vez se las trata como una guía para el comportamiento cotidiano, ni se las observa en la práctica en las negociaciones humanas. Sin embargo, como concepto teórico en economía y biología evolutiva , la EN tiene poder explicativo. La recompensa en economía es la utilidad (o, a veces, el dinero), y en biología evolutiva es la transmisión genética; ambos son el resultado fundamental de la supervivencia. Los investigadores que aplican la teoría de juegos en estos campos afirman que las estrategias que no logren maximizarlos por cualquier motivo serán expulsadas del mercado o del entorno, a los que se les atribuye la capacidad de probar todas las estrategias. Esta conclusión se extrae de la teoría de la "estabilidad" anterior. En estas situaciones, la investigación ha confirmado a menudo la suposición de que la estrategia observada es en realidad una EN. [23]
El equilibrio de Nash es un superconjunto del equilibrio de Nash perfecto en subjuegos. El equilibrio perfecto en subjuegos, además del equilibrio de Nash, requiere que la estrategia también sea un equilibrio de Nash en cada subjuego de ese juego. Esto elimina todas las amenazas no creíbles , es decir, estrategias que contienen movimientos no racionales para hacer que el contrajugador cambie su estrategia.
La imagen de la derecha muestra un juego secuencial simple que ilustra el problema de los equilibrios imperfectos de Nash en subjuegos. En este juego, el jugador elige izquierda (L) o derecha (R), seguido de que el jugador dos sea llamado a ser amable (K) o cruel (U) con el jugador uno. Sin embargo, el jugador dos solo gana si es cruel si el jugador uno va hacia la izquierda. Si el jugador uno va bien, el jugador racional dos sería de facto amable con él en ese subjuego. Sin embargo, la amenaza no creíble de ser cruel en 2(2) sigue siendo parte del equilibrio azul de Nash (L, (U,U)). Por lo tanto, si ambas partes pueden esperar un comportamiento racional, el equilibrio perfecto de Nash en subjuegos puede ser un concepto de solución más significativo cuando surgen tales inconsistencias dinámicas .
La demostración original de Nash (en su tesis) utilizó el teorema del punto fijo de Brouwer (por ejemplo, véase más adelante una variante). Esta sección presenta una prueba más simple a través del teorema del punto fijo de Kakutani , siguiendo el artículo de Nash de 1950 (le da crédito a David Gale por la observación de que tal simplificación es posible).
Para demostrar la existencia de un equilibrio de Nash, sea la mejor respuesta del jugador i a las estrategias de todos los demás jugadores.
Aquí, donde , es un perfil de estrategia mixta en el conjunto de todas las estrategias mixtas y es la función de pago para el jugador i. Defina una función con valores establecidos tal que . La existencia de un equilibrio de Nash equivale a tener un punto fijo.
El teorema del punto fijo de Kakutani garantiza la existencia de un punto fijo si se cumplen las cuatro condiciones siguientes.
La condición 1. se cumple por el hecho de que es simplex y, por tanto, compacto. La convexidad surge de la capacidad de los jugadores para combinar estrategias. no está vacío siempre que los jugadores tengan estrategias.
Las condiciones 2. y 3. se satisfacen mediante el teorema del máximo de Berge . Porque es continuo y compacto, no vacío y hemicontinuo superior .
La condición 4. se cumple como resultado de estrategias mixtas. Supongamos entonces . es decir, si dos estrategias maximizan los beneficios, entonces una combinación de las dos estrategias producirá el mismo beneficio.
Por tanto, existe un punto fijo y un equilibrio de Nash. [24]
Cuando Nash planteó este punto a John von Neumann en 1949, von Neumann lo descartó con las famosas palabras: "Eso es trivial, ¿sabes? Es sólo un teorema del punto fijo ". (Ver Nasar, 1998, pág. 94.)
Tenemos un juego donde es el número de jugadores y la acción establecida para los jugadores. Todos los conjuntos de acciones son finitos. Denotemos el conjunto de estrategias mixtas para los jugadores. La finitud de la s asegura la compacidad de .
Ahora podemos definir las funciones de ganancia. Para una estrategia mixta , dejamos que la ganancia para el jugador en acción sea
La función de ganancia representa el beneficio que obtiene un jugador al cambiar unilateralmente su estrategia. Ahora definimos dónde
para . Vemos eso
A continuación definimos:
Es fácil ver que cada una es una estrategia mixta válida en . También es fácil comprobar que cada uno es una función continua de y, por tanto, es una función continua. Como producto cruzado de un número finito de conjuntos compactos convexos, también es compacto y convexo. Aplicando el teorema del punto fijo de Brouwer a y concluimos que tiene un punto fijo en , llamémoslo . Afirmamos que se trata de un equilibrio de Nash en . Para ello basta demostrar que
Esto simplemente establece que cada jugador no obtiene ningún beneficio al cambiar unilateralmente su estrategia, que es exactamente la condición necesaria para un equilibrio de Nash.
Ahora supongamos que las ganancias no son todas cero. Por tanto, y tal que . Entonces
Entonces deja
También lo denotaremos como el vector de ganancia indexado por acciones en . Como es el punto fijo tenemos:
Ya que tenemos una escala positiva del vector . Ahora afirmamos que
Para ver esto, primero si esto es cierto por definición de la función de ganancia. Ahora supongamos eso . Por nuestras declaraciones anteriores tenemos que
y entonces el término de la izquierda es cero, lo que nos da que la expresión completa es la necesaria.
Entonces finalmente tenemos eso
donde sigue la última desigualdad ya que es un vector distinto de cero. Pero esto es una clara contradicción, por lo que todas las ganancias deben ser cero. Por lo tanto, existe un equilibrio de Nash para lo necesario.
Si un jugador A tiene una estrategia dominante entonces existe un equilibrio de Nash en el que A juega . En el caso de dos jugadores A y B, existe un equilibrio de Nash en el que A juega y B juega la mejor respuesta a . Si es una estrategia estrictamente dominante, A juega en todos los equilibrios de Nash. Si tanto A como B tienen estrategias estrictamente dominantes, existe un equilibrio de Nash único en el que cada uno juega su estrategia estrictamente dominante.
En juegos con equilibrios de Nash de estrategias mixtas, la probabilidad de que un jugador elija cualquier estrategia particular (tan pura) se puede calcular asignando una variable a cada estrategia que represente una probabilidad fija de elegir esa estrategia. Para que un jugador esté dispuesto a aleatorizar, el beneficio esperado para cada estrategia (pura) debe ser el mismo. Además, la suma de las probabilidades de cada estrategia de un jugador en particular debe ser 1. Esto crea un sistema de ecuaciones del cual se pueden derivar las probabilidades de elegir cada estrategia. [15]
En el juego de emparejar monedas de un centavo, el jugador A pierde un punto frente a B si A y B juegan la misma estrategia y le gana un punto a B si juegan estrategias diferentes. Para calcular el equilibrio de Nash de estrategia mixta, asigne a A la probabilidad de jugar H y de jugar T, y asigne a B la probabilidad de jugar H y de jugar T.
Por lo tanto, un equilibrio de Nash de estrategia mixta en este juego es que cada jugador elija aleatoriamente H o T con y .
En 1971, Robert Wilson ideó el teorema de la rareza, [25] que dice que "casi todos" los juegos finitos tienen un número finito e impar de equilibrios de Nash. En 1993, Harsanyi publicó una prueba alternativa del resultado. [26] "Casi todos" aquí significa que cualquier juego con un número infinito o par de equilibrios es muy especial en el sentido de que si sus pagos estuvieran incluso ligeramente perturbados aleatoriamente, con probabilidad uno tendría en su lugar un número impar de equilibrios.
El dilema del prisionero , por ejemplo, tiene un equilibrio, mientras que la batalla de los sexos tiene tres: dos puros y uno mixto, y esto sigue siendo cierto incluso si los resultados cambian ligeramente. El juego de dinero gratis es un ejemplo de juego "especial" con un número par de equilibrios. En él, dos jugadores tienen que votar "sí" en lugar de "no" para obtener una recompensa y los votos son simultáneos. Hay dos equilibrios de Nash de estrategia pura, (sí, sí) y (no, no), y no hay equilibrios de estrategia mixta, porque la estrategia "sí" domina débilmente al "no". "Sí" es tan bueno como "no" independientemente de la acción del otro jugador, pero si existe alguna posibilidad de que el otro jugador elija "sí", entonces "sí" es la mejor respuesta. Sin embargo, bajo una pequeña perturbación aleatoria de los pagos, la probabilidad de que dos pagos cualesquiera sigan empatados, ya sea en 0 o en algún otro número, es extremadamente pequeña, y el juego tendría uno o tres equilibrios.