stringtranslate.com

Equilibrio de Nash

En teoría de juegos , el equilibrio de Nash es el concepto de solución más utilizado para los juegos no cooperativos . Un equilibrio de Nash es una situación en la que ningún jugador podría ganar si cambia su propia estrategia (manteniendo fijas las estrategias de todos los demás jugadores). [1] La idea del equilibrio de Nash se remonta a la época de Cournot , quien en 1838 lo aplicó a su modelo de competencia en un oligopolio . [2]

Si cada jugador ha elegido una estrategia  (un plan de acción basado en lo que ha sucedido hasta ahora en el juego) y nadie puede aumentar su propia ganancia esperada cambiando su estrategia mientras los otros jugadores mantienen la suya sin cambios, entonces el conjunto actual de opciones de estrategia constituye un equilibrio de Nash.

Si dos jugadores, Alice y Bob, eligen las estrategias A y B, (A, B) es un equilibrio de Nash si Alice no tiene otra estrategia disponible que maximice mejor que A su recompensa en respuesta a que Bob elija B, y Bob no tiene otra estrategia disponible que maximice mejor que B su recompensa en respuesta a que Alice elija A. En un juego en el que Carol y Dan también son jugadores, (A, B, C, D) es un equilibrio de Nash si A es la mejor respuesta de Alice a (B, C, D), B es la mejor respuesta de Bob a (A, C, D), y así sucesivamente.

Nash demostró que existe un equilibrio de Nash, posiblemente en estrategias mixtas , para cada juego finito. [3]

Aplicaciones

Los teóricos de juegos utilizan el equilibrio de Nash para analizar el resultado de la interacción estratégica de varios tomadores de decisiones . En una interacción estratégica, el resultado para cada tomador de decisiones depende de las decisiones de los demás, así como de las suyas propias. La idea de Nash se basa en la idea de que no se pueden predecir las decisiones de múltiples tomadores de decisiones si se analizan esas decisiones de forma aislada. En cambio, hay que preguntarse qué haría cada jugador teniendo en cuenta lo que espera que hagan los demás. El equilibrio de Nash exige que las decisiones de uno sean coherentes: ningún jugador desea deshacer su decisión teniendo en cuenta lo que están decidiendo los demás.

El concepto se ha utilizado para analizar situaciones hostiles como guerras y carreras armamentísticas [4] (véase el dilema del prisionero ), y también cómo se puede mitigar el conflicto mediante la interacción repetida (véase el ojo por ojo ). También se ha utilizado para estudiar hasta qué punto las personas con diferentes preferencias pueden cooperar (véase la batalla de los sexos ), y si asumirán riesgos para lograr un resultado cooperativo (véase la caza del ciervo ). Se ha utilizado para estudiar la adopción de normas técnicas , [ cita requerida ] y también la aparición de corridas bancarias y crisis monetarias (véase el juego de la coordinación ). Otras aplicaciones incluyen el flujo de tráfico (ver el principio de Wardrop ), cómo organizar subastas (ver teoría de subastas ), el resultado de los esfuerzos ejercidos por múltiples partes en el proceso educativo, [5] legislación regulatoria como regulaciones ambientales (ver tragedia de los comunes ), [6] gestión de recursos naturales, [7] análisis de estrategias en marketing, [8] tiros penales en fútbol (ver emparejar centavos ), [9] navegación de robots en multitudes, [10] sistemas de energía, sistemas de transporte, problemas de evacuación [11] y comunicaciones inalámbricas. [12]

Historia

El equilibrio de Nash debe su nombre al matemático estadounidense John Forbes Nash Jr. La misma idea fue utilizada en una aplicación particular en 1838 por Antoine Augustin Cournot en su teoría del oligopolio . [13] En la teoría de Cournot, cada una de varias empresas elige cuánta producción producir para maximizar sus ganancias. La mejor producción para una empresa depende de las producciones de las demás. Un equilibrio de Cournot ocurre cuando la producción de cada empresa maximiza sus ganancias dada la producción de las otras empresas, lo que es un equilibrio de Nash de estrategia pura . Cournot también introdujo el concepto de dinámica de mejor respuesta en su análisis de la estabilidad del equilibrio. Sin embargo, Cournot no utilizó la idea en ninguna otra aplicación ni la definió de manera general.

El concepto moderno de equilibrio de Nash se define en cambio en términos de estrategias mixtas , donde los jugadores eligen una distribución de probabilidad sobre posibles estrategias puras (que podrían poner el 100% de la probabilidad en una estrategia pura; tales estrategias puras son un subconjunto de las estrategias mixtas). El concepto de equilibrio de estrategia mixta fue introducido por John von Neumann y Oskar Morgenstern en su libro de 1944 La teoría de juegos y el comportamiento económico , pero su análisis se limitó al caso especial de los juegos de suma cero . Demostraron que existirá un equilibrio de Nash de estrategia mixta para cualquier juego de suma cero con un conjunto finito de acciones. [14] La contribución de Nash en su artículo de 1951 "Juegos no cooperativos" fue definir un equilibrio de Nash de estrategia mixta para cualquier juego con un conjunto finito de acciones y demostrar que al menos un equilibrio de Nash (de estrategia mixta) debe existir en tal juego. La clave de la capacidad de Nash para demostrar la existencia de manera mucho más general que von Neumann residía en su definición de equilibrio. Según Nash, "un punto de equilibrio es una n-tupla tal que la estrategia mixta de cada jugador maximiza [su] beneficio si las estrategias de los demás se mantienen fijas. Por lo tanto, la estrategia de cada jugador es óptima frente a las de los demás". Planteando el problema en este marco, Nash pudo emplear el teorema del punto fijo de Kakutani en su artículo de 1950 para demostrar la existencia de equilibrios. Su artículo de 1951 utilizó el teorema del punto fijo de Brouwer, más simple , para el mismo propósito. [15]

Los teóricos de juegos han descubierto que en algunas circunstancias el equilibrio de Nash hace predicciones inválidas o no hace una predicción única. Han propuesto muchos conceptos de solución ('refinamientos' de los equilibrios de Nash) diseñados para descartar equilibrios de Nash implausibles. Una cuestión particularmente importante es que algunos equilibrios de Nash pueden basarse en amenazas que no son ' creíbles '. En 1965, Reinhard Selten propuso el equilibrio perfecto en subjuegos como un refinamiento que elimina los equilibrios que dependen de amenazas no creíbles . Otras extensiones del concepto de equilibrio de Nash han abordado lo que sucede si se repite un juego o lo que sucede si se juega un juego en ausencia de información completa . Sin embargo, los refinamientos y extensiones posteriores del equilibrio de Nash comparten la idea principal en la que se basa el concepto de Nash: el equilibrio es un conjunto de estrategias tales que la estrategia de cada jugador es óptima dadas las elecciones de los demás.

Definiciones

Equilibrio de Nash

Un perfil de estrategia es un conjunto de estrategias, una para cada jugador. De manera informal, un perfil de estrategia es un equilibrio de Nash si ningún jugador puede mejorar su estrategia si cambia unilateralmente. Para ver lo que esto significa, imaginemos que a cada jugador se le comunican las estrategias de los demás. Supongamos entonces que cada jugador se pregunta: "Conociendo las estrategias de los demás jugadores y tratando las estrategias de los demás jugadores como si estuvieran escritas en piedra, ¿puedo beneficiarme si cambio mi estrategia?".

Por ejemplo, si un jugador prefiere "Sí", entonces ese conjunto de estrategias no es un equilibrio de Nash. Pero si cada jugador prefiere no cambiar (o es indiferente entre cambiar o no), entonces el perfil de estrategias es un equilibrio de Nash. Por lo tanto, cada estrategia en un equilibrio de Nash es una mejor respuesta a las estrategias de los otros jugadores en ese equilibrio. [16]

Formalmente, sea el conjunto de todas las estrategias posibles para el jugador , donde . Sea un perfil de estrategias, un conjunto que consta de una estrategia para cada jugador, donde denota las estrategias de todos los jugadores excepto . Sea la ganancia del jugador i en función de las estrategias. El perfil de estrategias es un equilibrio de Nash si

Un juego puede tener más de un equilibrio de Nash. Incluso si el equilibrio es único, puede ser débil : un jugador puede ser indiferente entre varias estrategias dadas las elecciones de los otros jugadores. Es único y se denomina equilibrio de Nash estricto si la desigualdad es estricta, de modo que una estrategia es la única mejor respuesta:

El conjunto de estrategias puede ser diferente para distintos jugadores y sus elementos pueden ser una variedad de objetos matemáticos. De forma más sencilla, un jugador puede elegir entre dos estrategias, por ejemplo O bien, el conjunto de estrategias puede ser un conjunto finito de estrategias condicionales que respondan a otros jugadores, por ejemplo O bien, puede ser un conjunto infinito, un continuo o ilimitado, por ejemplo tal que sea un número real no negativo. Las pruebas existentes de Nash suponen un conjunto de estrategias finito, pero el concepto de equilibrio de Nash no lo requiere.

Variantes

Equilibrio puro/mixto

Un juego puede tener un equilibrio de Nash de estrategia pura o de estrategia mixta . En este último caso, no todos los jugadores utilizan siempre la misma estrategia, sino que existe una distribución de probabilidad entre distintas estrategias.

Equilibrio estricto/no estricto

Supongamos que en el equilibrio de Nash cada jugador se pregunta: "Conociendo las estrategias de los otros jugadores y tratándolas como inmutables, ¿sufriría una pérdida si cambiara mi estrategia?".

Si la respuesta de cada jugador es "Sí", entonces el equilibrio se clasifica como un equilibrio de Nash estricto . [17]

Si, en cambio, para algún jugador hay una igualdad exacta entre la estrategia en equilibrio de Nash y alguna otra estrategia que da exactamente el mismo pago (es decir, al jugador le es indiferente cambiar o no), entonces el equilibrio se clasifica como un equilibrio de Nash débil [nota 1] o no estricto [ cita necesaria ] [ aclaración necesaria ] .

Equilibrios para coaliciones

El equilibrio de Nash define la estabilidad sólo en términos de desviaciones de jugadores individuales. En los juegos cooperativos, este concepto no es lo suficientemente convincente. El equilibrio de Nash fuerte permite desviaciones por parte de cada coalición concebible. [18] Formalmente, un equilibrio de Nash fuerte es un equilibrio de Nash en el que ninguna coalición, tomando las acciones de sus complementos como dadas, puede desviarse cooperativamente de una manera que beneficie a todos sus miembros. [19] Sin embargo, el concepto de Nash fuerte a veces se percibe como demasiado "fuerte" en el sentido de que el entorno permite una comunicación privada ilimitada. De hecho, el equilibrio de Nash fuerte tiene que ser eficiente en el sentido de Pareto . Como resultado de estos requisitos, el equilibrio de Nash fuerte es demasiado raro para ser útil en muchas ramas de la teoría de juegos. Sin embargo, en juegos como las elecciones con muchos más jugadores que resultados posibles, puede ser más común que un equilibrio estable.

Un equilibrio de Nash refinado, conocido como equilibrio de Nash a prueba de coaliciones (CPNE, por sus siglas en inglés) [18] , ocurre cuando los jugadores no pueden hacerlo mejor incluso si se les permite comunicarse y llegar a un acuerdo "autoejecutable" para desviarse. Toda estrategia correlacionada respaldada por un dominio estricto iterado y en la frontera de Pareto es un CPNE. [20] Además, es posible que un juego tenga un equilibrio de Nash que sea resistente a coaliciones menores a un tamaño especificado, k. El CPNE está relacionado con la teoría del núcleo .

Existencia

Teorema de existencia de Nash

Nash demostró que si se permiten estrategias mixtas (donde un jugador elige probabilidades de usar varias estrategias puras), entonces cada juego con un número finito de jugadores en el que cada jugador puede elegir entre un número finito de estrategias puras tiene al menos un equilibrio de Nash, que podría ser una estrategia pura para cada jugador o podría ser una distribución de probabilidad sobre estrategias para cada jugador.

Los equilibrios de Nash no necesariamente existen si el conjunto de opciones es infinito y no compacto. Por ejemplo:

Sin embargo, existe un equilibrio de Nash si el conjunto de opciones es compacto y el pago de cada jugador es continuo en las estrategias de todos los jugadores. [21]

Teorema de existencia de Rosen

Rosen [22] extendió el teorema de existencia de Nash de varias maneras. Considera un juego de n jugadores, en el que la estrategia de cada jugador i es un vector s i en el espacio euclidiano R mi . Denote m := m 1 +...+ m n ; por lo que una tupla de estrategias es un vector en R m . Parte de la definición de un juego es un subconjunto S de R m tal que la tupla de estrategias debe estar en S . Esto significa que las acciones de los jugadores pueden potencialmente estar restringidas en función de las acciones de otros jugadores. Un caso especial común del modelo es cuando S es un producto cartesiano de conjuntos convexos S 1 ,..., S n , tal que la estrategia del jugador i debe estar en S i . Esto representa el caso en el que las acciones de cada jugador i están restringidas independientemente de las acciones de otros jugadores. Si se cumplen las siguientes condiciones:

Entonces existe un equilibrio de Nash. La prueba utiliza el teorema del punto fijo de Kakutani . Rosen también demuestra que, bajo ciertas condiciones técnicas que incluyen una concavidad estricta, el equilibrio es único.

El resultado de Nash se refiere al caso especial en el que cada S i es un símplex (que representa todas las mezclas posibles de estrategias puras) y las funciones de pago de todos los jugadores son funciones bilineales de las estrategias.

Racionalidad

El equilibrio de Nash puede parecer a veces no racional desde una perspectiva en tercera persona. Esto se debe a que un equilibrio de Nash no es necesariamente óptimo en el sentido de Pareto .

El equilibrio de Nash también puede tener consecuencias no racionales en los juegos secuenciales, ya que los jugadores pueden "amenazarse" entre sí con amenazas que en realidad no llevarían a cabo. Para estos juegos, el equilibrio de Nash perfecto en subjuegos puede ser más útil como herramienta de análisis.

Ejemplos

Juego de coordinación

El juego de coordinación es un juego clásico de dos jugadores y dos estrategias , como se muestra en la matriz de pagos de ejemplo que aparece a la derecha. Hay dos equilibrios de estrategia pura, (A, A) con un pago de 4 para cada jugador y (B, B) con un pago de 2 para cada uno. La combinación (B, B) es un equilibrio de Nash porque si cualquiera de los jugadores cambia unilateralmente su estrategia de B a A, su pago caerá de 2 a 1.

Un ejemplo famoso de un juego de coordinación es la caza del ciervo . Dos jugadores pueden elegir cazar un ciervo o un conejo, y el ciervo proporciona más carne (4 unidades de utilidad, 2 para cada jugador) que el conejo (1 unidad de utilidad). La salvedad es que el ciervo debe cazarse de forma cooperativa, por lo que si un jugador intenta cazar el ciervo, mientras que el otro caza el conejo, el cazador del ciervo fracasará totalmente, con un pago de 0, mientras que el cazador del conejo tendrá éxito, con un pago de 1. El juego tiene dos equilibrios, (ciervo, ciervo) y (conejo, conejo), porque la estrategia óptima de un jugador depende de su expectativa sobre lo que hará el otro jugador. Si un cazador confía en que el otro cazará el ciervo, debería cazar el ciervo; sin embargo, si cree que el otro cazará el conejo, él también cazará el conejo. Este juego se utiliza como analogía de la cooperación social, ya que gran parte del beneficio que las personas obtienen en la sociedad depende de que las personas cooperen y confíen implícitamente entre sí para actuar de una manera correspondiente a la cooperación.

Conducir por una carretera en contra de un coche que viene en sentido contrario y tener que elegir entre desviarse hacia la izquierda o hacia la derecha de la carretera también es un juego de coordinación. Por ejemplo, con pagos 10 que significan que no hay colisión y 0 que significa que hay colisión, el juego de coordinación se puede definir con la siguiente matriz de pagos:

En este caso hay dos equilibrios de Nash de estrategia pura, cuando ambos eligen conducir por la izquierda o por la derecha. Si admitimos estrategias mixtas (donde una estrategia pura se elige al azar, sujeta a cierta probabilidad fija), entonces hay tres equilibrios de Nash para el mismo caso: dos que hemos visto de la forma de estrategia pura, donde las probabilidades son (0%, 100%) para el jugador uno, (0%, 100%) para el jugador dos; y (100%, 0%) para el jugador uno, (100%, 0%) para el jugador dos respectivamente. Añadimos otro donde las probabilidades para cada jugador son (50%, 50%).

Tráfico de red

Ejemplo de gráfico de red. Los valores en los bordes son el tiempo de viaje que experimenta un "automóvil" al pasar por ese borde. es la cantidad de automóviles que pasan por ese borde.

Una aplicación de los equilibrios de Nash es determinar el flujo esperado de tráfico en una red. Considere el gráfico de la derecha. Si suponemos que hay "automóviles" que viajan de A a D , ¿cuál es la distribución esperada del tráfico en la red?

Esta situación se puede modelar como un " juego ", donde cada viajero tiene la opción de 3 estrategias y donde cada estrategia es una ruta de A a D (una de ABD , ABCD o ACD ). La "ganancia" de cada estrategia es el tiempo de viaje de cada ruta. En el gráfico de la derecha, un automóvil que viaja por ABD experimenta un tiempo de viaje de , donde es el número de automóviles que viajan por el borde AB . Por lo tanto, las ganancias para cualquier estrategia dada dependen de las elecciones de los otros jugadores, como es habitual. Sin embargo, el objetivo, en este caso, es minimizar el tiempo de viaje, no maximizarlo. El equilibrio se producirá cuando el tiempo en todos los caminos sea exactamente el mismo. Cuando eso sucede, ningún conductor tiene incentivo alguno para cambiar de ruta, ya que solo puede aumentar su tiempo de viaje. Para el gráfico de la derecha, si, por ejemplo, 100 automóviles viajan de A a D , entonces el equilibrio se producirá cuando 25 conductores viajen por ABD , 50 por ABCD y 25 por ACD . Cada conductor ahora tiene un tiempo total de viaje de 3,75 (para ver esto, un total de 75 automóviles toman el borde AB y, de la misma manera, 75 automóviles toman el borde CD ).

Obsérvese que esta distribución no es, en realidad, socialmente óptima. Si los 100 automóviles acordaran que 50 viajarían por ABD y los otros 50 por ACD , entonces el tiempo de viaje para cualquier automóvil individual sería en realidad de 3,5, que es menos de 3,75. Este es también el equilibrio de Nash si se elimina el camino entre B y C , lo que significa que agregar otra ruta posible puede disminuir la eficiencia del sistema, un fenómeno conocido como la paradoja de Braess .

Juego de competición

Esto se puede ilustrar con un juego de dos jugadores en el que ambos jugadores eligen simultáneamente un número entero entre 0 y 3 y ambos ganan el menor de los dos números en puntos. Además, si un jugador elige un número mayor que el otro, entonces tiene que ceder dos puntos al otro.

Este juego tiene un equilibrio de Nash de estrategia pura único: ambos jugadores eligen 0 (resaltado en rojo claro). Cualquier otra estrategia puede mejorarse si un jugador cambia su número a uno menos que el del otro jugador. En la tabla adyacente, si el juego comienza en el cuadrado verde, al jugador 1 le conviene moverse al cuadrado violeta y al jugador 2 le conviene moverse al cuadrado azul. Aunque no encajaría en la definición de un juego de competición, si el juego se modifica de modo que los dos jugadores ganen la cantidad indicada si ambos eligen el mismo número y, de lo contrario, no ganen nada, entonces hay 4 equilibrios de Nash: (0,0), (1,1), (2,2) y (3,3).

Equilibrios de Nash en una matriz de pagos

Existe una manera numérica sencilla de identificar los equilibrios de Nash en una matriz de pagos. Es especialmente útil en juegos de dos personas en los que los jugadores tienen más de dos estrategias. En este caso, el análisis formal puede resultar demasiado largo. Esta regla no se aplica al caso en el que las estrategias mixtas (estocásticas) son de interés. La regla es la siguiente: si el primer número de pago, en el par de pagos de la celda, es el máximo de la columna de la celda y si el segundo número es el máximo de la fila de la celda, entonces la celda representa un equilibrio de Nash.

Podemos aplicar esta regla a una matriz de 3×3:

Usando la regla, podemos ver muy rápidamente (mucho más rápido que con el análisis formal) que las celdas de equilibrio de Nash son (B, A), (A, B) y (C, C). De hecho, para la celda (B, A), 40 es el máximo de la primera columna y 25 es el máximo de la segunda fila. Para (A, B), 25 es el máximo de la segunda columna y 40 es el máximo de la primera fila; lo mismo se aplica para la celda (C, C). Para otras celdas, uno o ambos de los miembros del duplete no son el máximo de las filas y columnas correspondientes.

Dicho esto, la mecánica real para encontrar celdas de equilibrio es obvia: hay que encontrar el máximo de una columna y comprobar si el segundo miembro del par es el máximo de la fila. Si se cumplen estas condiciones, la celda representa un equilibrio de Nash. Se comprueban todas las columnas de esta manera para encontrar todas las celdas NE. Una matriz N×N puede tener entre 0 y N×N equilibrios de Nash de estrategia pura .

Estabilidad

El concepto de estabilidad , útil en el análisis de muchos tipos de equilibrios, también puede aplicarse a los equilibrios de Nash.

Un equilibrio de Nash para un juego de estrategia mixta es estable si un cambio pequeño (específicamente, un cambio infinitesimal) en las probabilidades de un jugador conduce a una situación en la que se cumplen dos condiciones:

  1. El jugador que no cambió no tiene mejor estrategia en la nueva circunstancia
  2. El jugador que cambió ahora está jugando con una estrategia estrictamente peor.

Si se cumplen ambos casos, entonces un jugador con un pequeño cambio en su estrategia mixta regresará inmediatamente al equilibrio de Nash. Se dice que el equilibrio es estable. Si la condición uno no se cumple, entonces el equilibrio es inestable. Si solo se cumple la condición uno, entonces es probable que haya un número infinito de estrategias óptimas para el jugador que cambió.

En el ejemplo del "juego de conducir" anterior hay equilibrios estables e inestables. Los equilibrios que implican estrategias mixtas con probabilidades del 100% son estables. Si cualquiera de los jugadores cambia ligeramente sus probabilidades, ambos estarán en desventaja y su oponente no tendrá motivos para cambiar su estrategia a su vez. El equilibrio (50%,50%) es inestable. Si cualquiera de los jugadores cambia sus probabilidades (lo que no beneficiaría ni dañaría las expectativas del jugador que hizo el cambio, si la estrategia mixta del otro jugador sigue siendo (50%,50%)), entonces el otro jugador tiene inmediatamente una mejor estrategia ya sea (0%,100%) o (100%,0%).

La estabilidad es crucial en las aplicaciones prácticas de los equilibrios de Nash, ya que la estrategia mixta de cada jugador no se conoce con exactitud, sino que debe inferirse a partir de la distribución estadística de sus acciones en el juego. En este caso, es muy poco probable que surjan equilibrios inestables en la práctica, ya que cualquier cambio mínimo en las proporciones de cada estrategia observada conducirá a un cambio de estrategia y a la ruptura del equilibrio.

Finalmente, en los años ochenta, basándose en gran profundidad en estas ideas, se introdujeron los equilibrios estables de Mertens como concepto de solución . Los equilibrios estables de Mertens satisfacen tanto la inducción hacia delante como la inducción hacia atrás . En un contexto de teoría de juegos, los equilibrios estables ahora suelen referirse a los equilibrios estables de Mertens. [ cita requerida ]

Aparición

Si un juego tiene un único equilibrio de Nash y se juega entre jugadores en determinadas condiciones, se adoptará el conjunto de estrategias NE. Las condiciones suficientes para garantizar que se juegue el equilibrio de Nash son:

  1. Todos los jugadores harán todo lo posible para maximizar su recompensa esperada según lo describe el juego.
  2. Los jugadores son impecables en la ejecución.
  3. Los jugadores tienen suficiente inteligencia para deducir la solución.
  4. Los jugadores conocen la estrategia de equilibrio planificada de todos los demás jugadores.
  5. Los jugadores creen que una desviación en su propia estrategia no provocará desviaciones por parte de los demás jugadores.
  6. Es de conocimiento público que todos los jugadores cumplen estas condiciones, incluida esta. Por lo tanto, no sólo cada jugador debe saber que los demás jugadores cumplen las condiciones, sino que también deben saber que todos saben que las cumplen, y que todos saben que saben que las cumplen, y así sucesivamente.

Cuando no se cumplen las condiciones

Ejemplos de problemas de teoría de juegos en los que no se cumplen estas condiciones:

  1. La primera condición no se cumple si el juego no describe correctamente las cantidades que un jugador desea maximizar. En este caso, no hay ninguna razón particular para que ese jugador adopte una estrategia de equilibrio. Por ejemplo, el dilema del prisionero no es un dilema si alguno de los jugadores está dispuesto a ser encarcelado indefinidamente.
  2. Imperfección intencional o accidental en la ejecución. Por ejemplo, si una computadora capaz de realizar un juego lógico impecable se enfrenta a una segunda computadora que no tiene defectos, el resultado será el equilibrio. La introducción de una imperfección provocará su alteración, ya sea por pérdida para el jugador que comete el error o por negación del criterio de conocimiento común que conduce a una posible victoria para el jugador. (Un ejemplo sería un jugador que pone repentinamente el coche en marcha atrás en el juego de la gallina , lo que garantiza un escenario de no perder y no ganar).
  3. En muchos casos, la tercera condición no se cumple porque, aunque el equilibrio debe existir, se desconoce debido a la complejidad del juego, por ejemplo en el ajedrez chino . [23] O, si se conoce, puede que no lo sepan todos los jugadores, como cuando se juega al tres en raya con un niño pequeño que quiere desesperadamente ganar (cumpliendo los otros criterios).
  4. El criterio del conocimiento común puede no cumplirse incluso si todos los jugadores cumplen, de hecho, todos los demás criterios. Los jugadores que desconfían equivocadamente de la racionalidad de los demás pueden adoptar contraestrategias para contrarrestar el juego irracional esperado por parte de sus oponentes. Esta es una consideración importante en el juego de la " gallina " o en una carrera armamentista , por ejemplo.

Cuando se cumplen las condiciones

En su tesis doctoral, John Nash propuso dos interpretaciones de su concepto de equilibrio, con el objetivo de mostrar cómo los puntos de equilibrio pueden conectarse con fenómenos observables.

(...) Una interpretación es racionalista: si asumimos que los jugadores son racionales, conocen la estructura completa del juego, el juego se juega sólo una vez y hay un solo equilibrio de Nash, entonces los jugadores jugarán de acuerdo a ese equilibrio .

Esta idea fue formalizada por R. Aumann y A. Brandenburger, 1995, Epistemic Conditions for Nash Equilibrium , Econometrica, 63, 1161-1180 quienes interpretaron la estrategia mixta de cada jugador como una conjetura sobre el comportamiento de los otros jugadores y demostraron que si el juego y la racionalidad de los jugadores son mutuamente conocidos y estas conjeturas son comúnmente conocidas, entonces las conjeturas deben ser un equilibrio de Nash (se necesita una suposición previa común para este resultado en general, pero no en el caso de dos jugadores. En este caso, las conjeturas solo necesitan ser mutuamente conocidas).

Una segunda interpretación, a la que Nash se refiere como la interpretación de la acción de masas, es menos exigente para los jugadores:

No es necesario suponer que los participantes tienen pleno conocimiento de la estructura total del juego, o la capacidad e inclinación para pasar por procesos de razonamiento complejos. Lo que se supone es que existe una población de participantes para cada posición en el juego, que será desempeñada a lo largo del tiempo por participantes elegidos al azar de las diferentes poblaciones. Si existe una frecuencia media estable con la que cada estrategia pura es empleada por el miembro medio de la población apropiada, entonces esta frecuencia media estable constituye un equilibrio de Nash de estrategia mixta.

Para un resultado formal en esta línea, véase Kuhn, H. y et al., 1996, "El trabajo de John Nash en teoría de juegos", Journal of Economic Theory , 69, 153–185.

Debido a las limitadas condiciones en las que se puede observar realmente la EN, rara vez se la trata como una guía para el comportamiento cotidiano o se la observa en la práctica en las negociaciones humanas. Sin embargo, como concepto teórico en economía y biología evolutiva , la EN tiene poder explicativo. La recompensa en economía es la utilidad (o a veces el dinero), y en biología evolutiva es la transmisión genética; ambas son el resultado final fundamental de la supervivencia. Los investigadores que aplican la teoría de juegos en estos campos afirman que las estrategias que no logren maximizarlas por cualquier razón serán expulsadas del mercado o del entorno, a los que se les atribuye la capacidad de probar todas las estrategias. Esta conclusión se extrae de la teoría de la "estabilidad" antes mencionada. En estas situaciones, la suposición de que la estrategia observada es en realidad una EN a menudo ha sido confirmada por la investigación. [24]

NE y amenazas no creíbles

Ilustraciones extensas y en forma normal que muestran la diferencia entre SPNE y otros NE. El equilibrio azul no es perfecto en subjuegos porque el jugador dos hace una amenaza no creíble en 2(2) de ser cruel (U).

El equilibrio de Nash es un superconjunto del equilibrio de Nash perfecto en subjuegos. El equilibrio perfecto en subjuegos, además del equilibrio de Nash, requiere que la estrategia también sea un equilibrio de Nash en cada subjuego de ese juego. Esto elimina todas las amenazas no creíbles , es decir, estrategias que contienen movimientos no racionales para hacer que el contrajugador cambie su estrategia.

La imagen de la derecha muestra un juego secuencial simple que ilustra el problema de los equilibrios de Nash imperfectos en subjuegos. En este juego, el jugador uno elige izquierda (L) o derecha (R), a lo que sigue el llamado al jugador dos para que sea amable (K) o cruel (U) con el jugador uno. Sin embargo, el jugador dos solo se beneficia de ser cruel si el jugador uno va a la izquierda. Si el jugador uno va a la derecha, el jugador racional dos sería de facto amable con él/ella en ese subjuego. Sin embargo, la amenaza no creíble de ser cruel en 2(2) sigue siendo parte del equilibrio de Nash azul (L, (U,U)). Por lo tanto, si se puede esperar un comportamiento racional de ambas partes, el equilibrio de Nash perfecto en subjuegos puede ser un concepto de solución más significativo cuando surgen tales inconsistencias dinámicas .

Prueba de existencia

Demostración mediante el teorema del punto fijo de Kakutani

La prueba original de Nash (en su tesis) utilizó el teorema del punto fijo de Brouwer (véase más abajo una variante). Esta sección presenta una prueba más simple a través del teorema del punto fijo de Kakutani , siguiendo el artículo de Nash de 1950 (le atribuye a David Gale la observación de que tal simplificación es posible).

Para demostrar la existencia de un equilibrio de Nash, sea la mejor respuesta del jugador i a las estrategias de todos los demás jugadores.

Aquí, , donde , es un perfil de estrategia mixta en el conjunto de todas las estrategias mixtas y es la función de pago para el jugador i. Defina una función con valores establecidos tal que . La existencia de un equilibrio de Nash es equivalente a tener un punto fijo.

El teorema del punto fijo de Kakutani garantiza la existencia de un punto fijo si se cumplen las cuatro condiciones siguientes.

  1. es compacto, convexo y no vacío.
  2. no está vacío.
  3. es hemicontinuo superior
  4. es convexo

La condición 1 se cumple por el hecho de que es un simplex y, por lo tanto, compacto. La convexidad se desprende de la capacidad de los jugadores para combinar estrategias. no es vacío siempre que los jugadores tengan estrategias.

Las condiciones 2. y 3. se cumplen por el teorema del máximo de Berge . Porque es continuo y compacto, es no vacío y hemicontinuo superior .

La condición 4 se cumple como resultado de estrategias mixtas. Supongamos que , entonces . es decir, si dos estrategias maximizan los beneficios, entonces una combinación entre las dos estrategias producirá el mismo beneficio.

Por lo tanto, existe un punto fijo y un equilibrio de Nash. [25]

Cuando Nash le planteó este punto a John von Neumann en 1949, von Neumann lo desestimó con estas famosas palabras: "Eso es trivial, ¿sabe? Es sólo un teorema de punto fijo " (véase Nasar, 1998, pág. 94).

Prueba alternativa utilizando el teorema del punto fijo de Brouwer

Tenemos un juego donde es el número de jugadores y es el conjunto de acciones para los jugadores. Todos los conjuntos de acciones son finitos. Sea s el conjunto de estrategias mixtas para los jugadores. La finitud de s garantiza la compacidad de .

Ahora podemos definir las funciones de ganancia. Para una estrategia mixta , dejamos que la ganancia del jugador en acción sea

La función de ganancia representa el beneficio que obtiene un jugador al cambiar unilateralmente su estrategia. Ahora definimos dónde

para . Vemos que

A continuación definimos:

Es fácil ver que cada una es una estrategia mixta válida en . También es fácil comprobar que cada una es una función continua de , y por tanto es una función continua. Como producto vectorial de un número finito de conjuntos compactos convexos, también es compacto y convexo. Aplicando el teorema del punto fijo de Brouwer a y concluimos que tiene un punto fijo en , llamémoslo . Afirmamos que es un equilibrio de Nash en . Para ello, basta con demostrar que

Esto simplemente establece que cada jugador no obtiene ningún beneficio al cambiar unilateralmente su estrategia, que es exactamente la condición necesaria para un equilibrio de Nash.

Ahora supongamos que las ganancias no son todas cero. Por lo tanto, y tal que . Entonces

Así que dejemoslo

También lo denotaremos como el vector de ganancia indexado por acciones en . Como es el punto fijo tenemos:

Dado que tenemos que hay una escala positiva del vector . Ahora afirmamos que

Para comprobarlo, primero si entonces esto es cierto por definición de la función de ganancia. Ahora supongamos que . Por nuestras afirmaciones anteriores tenemos que

y entonces el término izquierdo es cero, lo que nos da que toda la expresión es como se necesita.

Así que finalmente tenemos eso

donde la última desigualdad sigue ya que es un vector distinto de cero. Pero esto es una clara contradicción, por lo que todas las ganancias deben ser de hecho cero. Por lo tanto, es un equilibrio de Nash para según sea necesario.

Cálculo de los equilibrios de Nash

Si un jugador A tiene una estrategia dominante, entonces existe un equilibrio de Nash en el que A juega . En el caso de dos jugadores A y B, existe un equilibrio de Nash en el que A juega y B juega una mejor respuesta a . Si es una estrategia estrictamente dominante, A juega en todos los equilibrios de Nash. Si tanto A como B tienen estrategias estrictamente dominantes, existe un único equilibrio de Nash en el que cada uno juega su estrategia estrictamente dominante.

En los juegos con equilibrios de Nash de estrategia mixta, la probabilidad de que un jugador elija una estrategia particular (es decir, pura) se puede calcular asignando una variable a cada estrategia que represente una probabilidad fija de elegir esa estrategia. Para que un jugador esté dispuesto a aleatorizar, su pago esperado para cada estrategia (pura) debe ser el mismo. Además, la suma de las probabilidades para cada estrategia de un jugador en particular debe ser 1. Esto crea un sistema de ecuaciones a partir del cual se pueden derivar las probabilidades de elegir cada estrategia. [16]

Ejemplos

En el juego de emparejar monedas, el jugador A pierde un punto ante B si A y B juegan la misma estrategia y gana un punto ante B si juegan estrategias diferentes. Para calcular el equilibrio de Nash de estrategia mixta, asigne a A la probabilidad de jugar H y de jugar T, y asigne a B la probabilidad de jugar H y de jugar T.

Por lo tanto, un equilibrio de Nash de estrategia mixta en este juego es que cada jugador elija aleatoriamente H o T con y .

Rareza de los puntos de equilibrio

En 1971, Robert Wilson propuso el teorema de la rareza [26] , que dice que "casi todos" los juegos finitos tienen un número finito e impar de equilibrios de Nash. En 1993, Harsanyi publicó una prueba alternativa del resultado. [27] "Casi todos" significa aquí que cualquier juego con un número infinito o par de equilibrios es muy especial en el sentido de que si sus pagos se perturbaran incluso ligeramente de forma aleatoria, con probabilidad uno tendría en cambio un número impar de equilibrios.

El dilema del prisionero , por ejemplo, tiene un equilibrio, mientras que la batalla de los sexos tiene tres: dos puros y uno mixto, y esto sigue siendo así incluso si los pagos cambian ligeramente. El juego del dinero gratis es un ejemplo de un juego "especial" con un número par de equilibrios. En él, dos jugadores tienen que votar "sí" en lugar de "no" para obtener una recompensa y los votos son simultáneos. Hay dos equilibrios de Nash de estrategia pura (sí, sí) y (no, no), y ningún equilibrio de estrategia mixta, porque la estrategia "sí" domina débilmente a "no". "Sí" es tan bueno como "no" independientemente de la acción del otro jugador, pero si hay alguna posibilidad de que el otro jugador elija "sí", entonces "sí" es la mejor respuesta. Sin embargo, bajo una pequeña perturbación aleatoria de los pagos, la probabilidad de que dos pagos permanezcan empatados, ya sea en 0 o en algún otro número, es extremadamente pequeña, y el juego tendría uno o tres equilibrios.

Véase también

Notas

  1. ^ Este término no se prefiere, ya que también puede significar lo opuesto a un equilibrio de Nash "fuerte" (es decir, un equilibrio de Nash que es vulnerable a la manipulación por parte de grupos).

Referencias

  1. ^ Osborne, Martin J.; Rubinstein, Ariel (12 de julio de 1994). Un curso de teoría de juegos . Cambridge, MA: MIT. p. 14. ISBN 9780262150415.
  2. ^ Kreps DM (1987) "Equilibrio de Nash". En: Palgrave Macmillan (eds) The New Palgrave Dictionary of Economics . Palgrave Macmillan, Londres.
  3. ^ Nash, John F. (1950). "Puntos de equilibrio en juegos de n personas". PNAS . 36 (1): 48–49. Bibcode :1950PNAS...36...48N. doi : 10.1073/pnas.36.1.48 . PMC 1063129 . PMID  16588946. 
  4. ^ Schelling, Thomas, La estrategia del conflicto , copyright 1960, 1980, Harvard University Press, ISBN 0-674-84031-3
  5. ^ De Fraja, G.; Oliveira, T.; Zanchi, L. (2010). "Hay que esforzarse más: evaluación del papel del esfuerzo en el logro educativo". Revista de Economía y Estadística . 92 (3): 577. doi :10.1162/REST_a_00013. hdl : 2108/55644 . S2CID  57072280.
  6. ^ Ward, H. (1996). "Teoría de juegos y la política del calentamiento global: el estado de la cuestión y más allá". Estudios políticos . 44 (5): 850–871. doi :10.1111/j.1467-9248.1996.tb00338.x. S2CID  143728467.,
  7. ^ Thorpe, Robert B.; Jennings, Simon; Dolder, Paul J. (2017). "Riesgos y beneficios de obtener buenos rendimientos en pesquerías mixtas de múltiples especies". ICES Journal of Marine Science . 74 (8): 2097–2106. doi : 10.1093/icesjms/fsx062 .,
  8. ^ "Lecciones de marketing del Dr. Nash - Andrew Frank". 25 de mayo de 2015. Consultado el 30 de agosto de 2015 .
  9. ^ Chiappori, P. -A.; Levitt, S.; Groseclose, T. (2002). "Prueba de equilibrios de estrategias mixtas cuando los jugadores son heterogéneos: el caso de los tiros penales en el fútbol" (PDF) . American Economic Review . 92 (4): 1138. CiteSeerX 10.1.1.178.1646 . doi :10.1257/00028280260344678. 
  10. ^ Muchen Sun; Francesca Baldini; Katie Hughes; Peter Trautman; Todd Murphey (2024). "Equilibrio de Nash de estrategia mixta para la navegación de multitudes". arXiv : 2403.01537 [cs.RO].
  11. ^ Djehiche, B.; Tcheukam, A.; Tembine, H. (2017). "Un juego de campo medio de evacuación en un edificio de varios niveles". IEEE Transactions on Automatic Control . 62 (10): 5154–5169. doi :10.1109/TAC.2017.2679487. ISSN  0018-9286. S2CID  21850096.
  12. ^ Djehiche, Boualem; Tcheukam, Alain; Tembine, Hamidou (27 de septiembre de 2017). "Juegos de tipo campo medio en ingeniería". AIMS Electronics and Electrical Engineering . 1 : 18–73. arXiv : 1605.03281 . doi :10.3934/ElectrEng.2017.1.18. S2CID  16055840.
  13. ^ Cournot A. (1838) Investigaciones sobre los principios matemáticos de la teoría de la riqueza
  14. ^ J. Von Neumann, O. Morgenstern, Teoría de juegos y comportamiento económico , copyright 1944, 1953, Princeton University Press
  15. ^ Carmona, Guilherme; Podczeck, Konrad (2009). "Sobre la existencia de equilibrios de Nash de estrategia pura en grandes juegos" (PDF) . Journal of Economic Theory . 144 (3): 1300–1319. doi :10.1016/j.jet.2008.11.009. hdl : 10362/11577 . SSRN  882466.[ enlace muerto permanente ]
  16. ^ ab von Ahn, Luis. "Preliminaries of Game Theory" (PDF) . Science of the Web . Archivado desde el original (PDF) el 2011-10-18 . Consultado el 2008-11-07 .
  17. ^ "Equilibrios de Nash". hoylab.cornell.edu . Archivado desde el original el 16 de junio de 2019. Consultado el 8 de diciembre de 2019 .
  18. ^ ab BD Bernheim; B. Peleg; MD Whinston (1987), "Equilibrios a prueba de coalición I. Conceptos", Journal of Economic Theory , 42 (1): 1–12, doi :10.1016/0022-0531(87)90099-8.
  19. ^ Aumann, R. (1959). "Puntos aceptables en juegos cooperativos generales de n personas". Contribuciones a la teoría de juegos . Vol. IV. Princeton, NJ: Princeton University Press. ISBN 978-1-4008-8216-8.
  20. ^ D. Moreno; J. Wooders (1996), "Equilibrio a prueba de coaliciones" (PDF) , Juegos y comportamiento económico , 17 (1): 80–112, doi :10.1006/game.1996.0095, hdl : 10016/4408 .
  21. ^ MIT OpenCourseWare. 6.254: Teoría de juegos con aplicaciones de ingeniería, primavera de 2010. Clase 6: Juegos continuos y discontinuos.
  22. ^ Rosen, JB (1965). "Existencia y unicidad de puntos de equilibrio para juegos cóncavos de N personas". Econometrica . 33 (3): 520–534. doi :10.2307/1911749. hdl : 2060/19650010164 . ISSN  0012-9682. JSTOR  1911749.
  23. ^ TL Turocy, B. Von Stengel, Game Theory , copyright 2001, Texas A&M University, London School of Economics, páginas 141-144. Nash demostró que existe un EN perfecto para este tipo de juego de forma extensiva finita [ cita requerida ] – puede ser representado como una estrategia que cumple con sus condiciones originales para un juego con un EN. Tales juegos pueden no tener un EN único, pero al menos una de las muchas estrategias de equilibrio sería jugada por jugadores hipotéticos que tuvieran conocimiento perfecto de los 10 150 árboles de juego [ cita requerida ] .
  24. ^ JC Cox, M. Walker, Aprendiendo a jugar con estrategias de duoploy de Cournot Archivado el 11 de diciembre de 2013 en Wayback Machine , copyright 1997, Texas A&M University, University of Arizona, páginas 141-144
  25. ^ Fudenburg, Drew; Tirole, Jean (1991). Teoría de juegos . Prensa del MIT. ISBN 978-0-262-06141-4.
  26. ^ Wilson, Robert (1 de julio de 1971). "Cálculo de equilibrios de juegos de N-personas". Revista SIAM de Matemáticas Aplicadas . 21 (1): 80–87. doi :10.1137/0121011. ISSN  0036-1399.
  27. ^ Harsanyi, JC (1973-12-01). "La rareza del número de puntos de equilibrio: una nueva prueba". Revista internacional de teoría de juegos . 2 (1): 235–250. doi :10.1007/BF01737572. ISSN  1432-1270. S2CID  122603890.

Bibliografía

Libros de texto de teoría de juegos

Documentos originales de Nash

Otras referencias

Enlaces externos