stringtranslate.com

equilibrio de Nash

En teoría de juegos , el equilibrio de Nash , llamado así en honor al matemático John Nash , es la forma más común de definir la solución de un juego no cooperativo en el que participan dos o más jugadores. En un equilibrio de Nash, se supone que cada jugador conoce las estrategias de equilibrio de los demás jugadores y nadie tiene nada que ganar cambiando sólo su propia estrategia. [1] El principio de equilibrio de Nash se remonta a la época de Cournot , quien en 1838 lo aplicó a empresas competidoras que elegían productos. [2]

Si cada jugador ha elegido una estrategia  (un plan de acción basado en lo que ha sucedido hasta el momento en el juego) y nadie puede aumentar el beneficio esperado cambiando su estrategia mientras los otros jugadores mantienen la suya sin cambios, entonces el conjunto actual de opciones de estrategia constituye un equilibrio de Nash.

Si dos jugadores, Alice y Bob, eligen las estrategias A y B, (A, B) es un equilibrio de Nash si Alice no tiene otra estrategia disponible que funcione mejor que A para maximizar su pago en respuesta a que Bob elija B, y Bob no tiene otra estrategia. disponible que obtiene mejores resultados que B para maximizar su pago en respuesta a que Alice elija A. En un juego en el que Carol y Dan también son jugadores, (A, B, C, D) es un equilibrio de Nash si A es la mejor respuesta de Alice a ( B, C, D), B es la mejor respuesta de Bob a (A, C, D), y así sucesivamente.

Nash demostró que existe un equilibrio de Nash, posiblemente en estrategias mixtas , para todo juego finito. [3]

Aplicaciones

Los teóricos de juegos utilizan el equilibrio de Nash para analizar el resultado de la interacción estratégica de varios tomadores de decisiones . En una interacción estratégica, el resultado para cada tomador de decisiones depende tanto de las decisiones de los demás como de las suyas propias. La simple idea que subyace a la idea de Nash es que no se pueden predecir las elecciones de múltiples tomadores de decisiones si se analizan esas decisiones de forma aislada. En lugar de ello, debemos preguntarnos qué haría cada jugador teniendo en cuenta lo que espera que hagan los demás. El equilibrio de Nash requiere que las elecciones sean consistentes: ningún jugador desea deshacer su decisión dado lo que los demás están decidiendo.

El concepto se ha utilizado para analizar situaciones hostiles como guerras y carreras armamentistas [4] (ver dilema del prisionero ), y también cómo el conflicto puede mitigarse mediante la interacción repetida (ver ojo por ojo ). También se ha utilizado para estudiar hasta qué punto las personas con diferentes preferencias pueden cooperar (ver batalla de sexos ) y si correrán riesgos para lograr un resultado cooperativo (ver caza del ciervo ). Se ha utilizado para estudiar la adopción de estándares técnicos , [ cita necesaria ] y también la aparición de corridas bancarias y crisis monetarias (ver juego de coordinación ). Otras aplicaciones incluyen el flujo de tráfico (ver el principio de Wardrop ), cómo organizar las subastas (ver teoría de la subasta ), el resultado de los esfuerzos ejercidos por múltiples partes en el proceso educativo, [5] legislación regulatoria como las regulaciones ambientales (ver la tragedia de los comunes ). , [6] gestión de recursos naturales, [7] análisis de estrategias en marketing, [8] incluso tiros penales en el fútbol (ver monedas de un centavo coincidentes ), [9] sistemas energéticos, sistemas de transporte, problemas de evacuación [10] y comunicaciones inalámbricas. [11]

Historia

El equilibrio de Nash lleva el nombre del matemático estadounidense John Forbes Nash Jr. La misma idea fue utilizada en una aplicación particular en 1838 por Antoine Augustin Cournot en su teoría del oligopolio . [12] En la teoría de Cournot, cada una de varias empresas elige cuánta producción producir para maximizar sus ganancias. La mejor producción de una empresa depende de la producción de las demás. Un equilibrio de Cournot ocurre cuando la producción de cada empresa maximiza sus ganancias dada la producción de las otras empresas, lo cual es un equilibrio de Nash de estrategia pura . Cournot también introdujo el concepto de dinámica de mejor respuesta en su análisis de la estabilidad del equilibrio. Sin embargo, Cournot no utilizó la idea en ninguna otra aplicación ni la definió de manera general.

En cambio, el concepto moderno de equilibrio de Nash se define en términos de estrategias mixtas , donde los jugadores eligen una distribución de probabilidad sobre posibles estrategias puras (lo que podría poner el 100% de la probabilidad en una estrategia pura; dichas estrategias puras son un subconjunto de estrategias mixtas). El concepto de equilibrio de estrategias mixtas fue introducido por John von Neumann y Oskar Morgenstern en su libro de 1944 La teoría de los juegos y el comportamiento económico , pero su análisis se limitó al caso especial de los juegos de suma cero . Demostraron que existirá un equilibrio de Nash de estrategias mixtas para cualquier juego de suma cero con un conjunto finito de acciones. [13] La contribución de Nash en su artículo de 1951 "Juegos no cooperativos" fue definir un equilibrio de Nash de estrategia mixta para cualquier juego con un conjunto finito de acciones y demostrar que debe existir al menos un equilibrio de Nash (de estrategia mixta). en tal juego. La clave de la capacidad de Nash para demostrar la existencia de manera mucho más general que von Neumann residía en su definición de equilibrio. Según Nash, "un punto de equilibrio es una n-tupla tal que la estrategia mixta de cada jugador maximiza su beneficio si las estrategias de los demás se mantienen fijas. Por lo tanto, la estrategia de cada jugador es óptima frente a las de los demás". Plantear el problema en este marco permitió a Nash emplear el teorema del punto fijo de Kakutani en su artículo de 1950 para demostrar la existencia de equilibrios. Su artículo de 1951 utilizó el teorema del punto fijo de Brouwer, más simple , para el mismo propósito. [14]

Los teóricos de juegos han descubierto que, en algunas circunstancias, el equilibrio de Nash hace predicciones inválidas o no logra hacer una predicción única. Han propuesto muchos conceptos de solución ('refinamientos' de los equilibrios de Nash) diseñados para descartar equilibrios de Nash inverosímiles. Una cuestión particularmente importante es que algunos equilibrios de Nash pueden basarse en amenazas que no son " creíbles ". En 1965, Reinhard Selten propuso el equilibrio perfecto en subjuegos como un refinamiento que elimina los equilibrios que dependen de amenazas no creíbles . Otras extensiones del concepto de equilibrio de Nash han abordado lo que sucede si se repite un juego , o lo que sucede si se juega en ausencia de información completa . Sin embargo, los refinamientos y ampliaciones posteriores del equilibrio de Nash comparten la idea principal en la que se basa el concepto de Nash: el equilibrio es un conjunto de estrategias tales que la estrategia de cada jugador es óptima dadas las elecciones de los demás.

Definiciones

equilibrio de Nash

Un perfil de estrategia es un conjunto de estrategias, una para cada jugador. Informalmente, un perfil estratégico es un equilibrio de Nash si ningún jugador puede hacerlo mejor cambiando unilateralmente su estrategia. Para ver lo que esto significa, imagine que a cada jugador se le dicen las estrategias de los demás. Supongamos entonces que cada jugador se pregunta: "Conociendo las estrategias de los otros jugadores y tratando las estrategias de los otros jugadores como escritas en piedra, ¿puedo beneficiarme cambiando mi estrategia?"

Por ejemplo, si un jugador prefiere "Sí", entonces ese conjunto de estrategias no es un equilibrio de Nash. Pero si todos los jugadores prefieren no cambiar (o son indiferentes entre cambiar o no), entonces el perfil de estrategia es un equilibrio de Nash. Por tanto, cada estrategia en un equilibrio de Nash es la mejor respuesta a las estrategias de los demás jugadores en ese equilibrio. [15]

Formalmente, sea el conjunto de todas las estrategias posibles para el jugador , donde . Sea un perfil de estrategia, un conjunto que consta de una estrategia para cada jugador, donde denota las estrategias de todos los jugadores excepto . Sea el pago del jugador i en función de las estrategias. El perfil de la estrategia es un equilibrio de Nash si

Un juego puede tener más de un equilibrio de Nash. Incluso si el equilibrio es único, podría ser débil : un jugador podría ser indiferente entre varias estrategias dadas las elecciones de los demás jugadores. Es único y se llama equilibrio estricto de Nash si la desigualdad es estricta, por lo que una estrategia es la mejor respuesta única:

El conjunto de estrategias puede ser diferente para diferentes jugadores y sus elementos pueden ser una variedad de objetos matemáticos. Más simplemente, un jugador podría elegir entre dos estrategias, por ejemplo, O, el conjunto de estrategias podría ser un conjunto finito de estrategias condicionales que responden a otros jugadores, por ejemplo, O, podría ser un conjunto infinito, un continuo o ilimitado, por ejemplo, tal que sea un número real no negativo. Las pruebas existentes de Nash suponen un conjunto de estrategias finito, pero el concepto de equilibrio de Nash no lo requiere.

Variantes

Equilibrio puro/mixto

Un juego puede tener un equilibrio de Nash de estrategia pura o de estrategia mixta . En este último caso, se elige estocásticamente una estrategia pura con una probabilidad fija .

Equilibrio estricto/no estricto

Supongamos que en el equilibrio de Nash, cada jugador se pregunta: "Conociendo las estrategias de los otros jugadores y tratando las estrategias de los otros jugadores como escritas en piedra, ¿sufriría una pérdida si cambiara mi estrategia?"

Si la respuesta de todos los jugadores es "Sí", entonces el equilibrio se clasifica como equilibrio estricto de Nash . [dieciséis]

Si, en cambio, para algún jugador existe una igualdad exacta entre la estrategia del equilibrio de Nash y alguna otra estrategia que proporcione exactamente el mismo pago (es decir, al jugador le es indiferente cambiar o no), entonces el equilibrio se clasifica como débil [ nota 1]. ] o equilibrio de Nash no estricto [ cita necesaria ] [ aclaración necesaria ] .

Equilibrios para coaliciones

El equilibrio de Nash define la estabilidad sólo en términos de las desviaciones de los jugadores individuales. En los juegos cooperativos este concepto no resulta suficientemente convincente. Un equilibrio de Nash fuerte permite desviaciones en cualquier coalición concebible. [17] Formalmente, un equilibrio de Nash fuerte es un equilibrio de Nash en el que ninguna coalición, tomando como dadas las acciones de sus complementos, puede desviarse cooperativamente de una manera que beneficie a todos sus miembros. [18] Sin embargo, el concepto fuerte de Nash a veces se percibe como demasiado "fuerte" en el sentido de que el entorno permite una comunicación privada ilimitada. De hecho, un equilibrio de Nash fuerte tiene que ser eficiente en Pareto . Como resultado de estos requisitos, un Nash fuerte es demasiado raro para ser útil en muchas ramas de la teoría de juegos. Sin embargo, en juegos como las elecciones en los que hay muchos más jugadores que resultados posibles, puede ser más común que un equilibrio estable.

Un equilibrio de Nash refinado conocido como equilibrio de Nash a prueba de coaliciones (CPNE) [17] ocurre cuando los jugadores no pueden hacerlo mejor incluso si se les permite comunicarse y llegar a acuerdos "autoaplicables" para desviarse. Toda estrategia correlacionada respaldada por una dominancia estricta iterada y en la frontera de Pareto es una CPNE. [19] Además, es posible que un juego tenga un equilibrio de Nash que sea resistente contra coaliciones menores que un tamaño específico, k. CPNE está relacionado con la teoría del núcleo .

Existencia

Teorema de existencia de Nash

Nash demostró que si se permiten estrategias mixtas (donde un jugador elige probabilidades de usar varias estrategias puras), entonces todo juego con un número finito de jugadores en el que cada jugador puede elegir entre un número finito de estrategias puras tiene al menos un equilibrio de Nash, que podría ser una estrategia pura para cada jugador o podría ser una distribución de probabilidad sobre estrategias para cada jugador.

Los equilibrios de Nash no tienen por qué existir si el conjunto de opciones es infinito y no compacto. Por ejemplo:

Sin embargo, existe un equilibrio de Nash si el conjunto de opciones es compacto y el pago de cada jugador es continuo en las estrategias de todos los jugadores. [20]

Teorema de existencia de Rosen

Rosen [21] amplió el teorema de existencia de Nash de varias maneras. Considera un juego de n jugadores, en el que la estrategia de cada jugador i es un vector si en el espacio euclidiano Rmi . Denota m := m 1 +...+ m n ; entonces una tupla de estrategia es un vector en R m . Parte de la definición de un juego es un subconjunto S de R m tal que la tupla de estrategia debe estar en S. Esto significa que las acciones de los jugadores pueden verse potencialmente limitadas en función de las acciones de otros jugadores. Un caso especial común del modelo es cuando S es un producto cartesiano de conjuntos convexos S 1 , ..., S n , tal que la estrategia del jugador i debe estar en Si . Esto representa el caso en el que las acciones de cada jugador i están restringidas independientemente de las acciones de los demás jugadores. Si se cumplen las siguientes condiciones:

Entonces existe un equilibrio de Nash. La prueba utiliza el teorema del punto fijo de Kakutani . Rosen también demuestra que, bajo ciertas condiciones técnicas que incluyen una concavidad estricta, el equilibrio es único.

El resultado de Nash se refiere al caso especial en el que cada Si es un simplex (que representa todas las combinaciones posibles de estrategias puras) y las funciones de pago de todos los jugadores son funciones bilineales de las estrategias.

Racionalidad

El equilibrio de Nash a veces puede parecer no racional desde una perspectiva en tercera persona. Esto se debe a que un equilibrio de Nash no es necesariamente óptimo de Pareto .

El equilibrio de Nash también puede tener consecuencias no racionales en los juegos secuenciales porque los jugadores pueden "amenazarse" entre sí con amenazas que en realidad no llevarían a cabo. Para tales juegos, el equilibrio de Nash perfecto en subjuegos puede ser más significativo como herramienta de análisis.

Ejemplos

juego de coordinacion

El juego de coordinación es un juego clásico de dos jugadores y dos estrategias , como se muestra en el ejemplo de matriz de pagos a la derecha. Hay dos equilibrios de estrategia pura, (A,A) con pago de 4 para cada jugador y (B,B) con pago de 2 para cada uno. La combinación (B,B) es un equilibrio de Nash porque si cualquiera de los jugadores cambia unilateralmente su estrategia de B a A, su pago caerá de 2 a 1.

Un ejemplo famoso de juego de coordinación es la caza del ciervo . Dos jugadores pueden elegir cazar un ciervo o un conejo, proporcionando el ciervo más carne (4 unidades de utilidad, 2 para cada jugador) que el conejo (1 unidad de utilidad). La advertencia es que el ciervo debe cazarse de forma cooperativa, por lo que si un jugador intenta cazar el ciervo, mientras el otro caza el conejo, el cazador de ciervos fracasará totalmente, con un pago de 0, mientras que el cazador de conejos tendrá éxito, por un pago de 1. El juego tiene dos equilibrios, (ciervo, ciervo) y (conejo, conejo), porque la estrategia óptima de un jugador depende de sus expectativas sobre lo que hará el otro jugador. Si un cazador confía en que el otro cazará al ciervo, deberá cazar al ciervo; sin embargo, si cree que el otro cazará el conejo, él también cazará el conejo. Este juego se utiliza como analogía de la cooperación social, ya que gran parte del beneficio que las personas obtienen en la sociedad depende de que las personas cooperen y confíen implícitamente unas en otras para actuar de una manera correspondiente a la cooperación.

Conducir por una carretera en dirección contraria a un coche y tener que elegir entre desviarse por la izquierda o por la derecha de la carretera también es un juego de coordinación. Por ejemplo, con pagos 10 que significan que no hay accidente y 0 que significa un accidente, el juego de coordinación se puede definir con la siguiente matriz de pagos:

En este caso hay dos equilibrios de Nash de estrategia pura, cuando ambos eligen conducir por la izquierda o por la derecha. Si admitimos estrategias mixtas (donde se elige una estrategia pura al azar, sujeta a una probabilidad fija), entonces hay tres equilibrios de Nash para el mismo caso: dos que hemos visto en la forma de estrategia pura, donde las probabilidades son (0 %, 100%) para el jugador uno, (0%, 100%) para el jugador dos; y (100%, 0%) para el jugador uno, (100%, 0%) para el jugador dos respectivamente. Agregamos otro donde están las probabilidades de cada jugador (50%, 50%).

Tráfico de red

Gráfico de red de muestra. Los valores en los bordes son el tiempo de viaje que experimenta un "automóvil" que baja por ese borde. es el número de automóviles que viajan por ese borde.

Una aplicación de los equilibrios de Nash es la determinación del flujo de tráfico esperado en una red. Considere el gráfico de la derecha. Si suponemos que hay "automóviles" que viajan de A a D , ¿cuál es la distribución esperada del tráfico en la red?

Esta situación se puede modelar como un " juego ", donde cada viajero puede elegir entre 3 estrategias y donde cada estrategia es una ruta de A a D (una de ABD , ABCD o ACD ). La "recompensa" de cada estrategia es el tiempo de viaje de cada ruta. En el gráfico de la derecha, un automóvil que viaja por ABD experimenta un tiempo de viaje de , donde es el número de automóviles que viajan por el borde AB . Por tanto, los beneficios de cualquier estrategia determinada dependen de las elecciones de los demás jugadores, como es habitual. Sin embargo, el objetivo, en este caso, es minimizar el tiempo de viaje, no maximizarlo. El equilibrio se producirá cuando el tiempo en todos los caminos sea exactamente el mismo. Cuando eso sucede, ningún conductor tiene ningún incentivo para cambiar de ruta, ya que esto sólo puede aumentar su tiempo de viaje. Para el gráfico de la derecha, si, por ejemplo, 100 automóviles viajan de A a D , entonces se producirá el equilibrio cuando 25 conductores viajen por ABD , 50 por ABCD y 25 por ACD . Cada conductor tiene ahora un tiempo total de viaje de 3,75 (para ver esto, un total de 75 automóviles toman el borde AB y, de la misma manera, 75 autos toman el borde CD ).

Obsérvese que esta distribución no es, en realidad, socialmente óptima. Si los 100 automóviles acordaron que 50 viajan por ABD y los otros 50 por ACD , entonces el tiempo de viaje para cualquier automóvil sería en realidad 3,5, que es menos de 3,75. Este es también el equilibrio de Nash si se elimina el camino entre B y C , lo que significa que agregar otra ruta posible puede disminuir la eficiencia del sistema, fenómeno conocido como paradoja de Braess .

juego de competición

Esto se puede ilustrar con un juego de dos jugadores en el que ambos eligen simultáneamente un número entero del 0 al 3 y ambos ganan el menor de los dos números en puntos. Además, si un jugador elige un número mayor que el otro, tendrá que ceder dos puntos al otro.

Este juego tiene un equilibrio de Nash de estrategia pura único: ambos jugadores eligen 0 (resaltado en rojo claro). Cualquier otra estrategia puede mejorarse si un jugador cambia su número a uno menos que el del otro jugador. En la mesa adyacente, si el juego comienza en el cuadrado verde, al jugador 1 le interesa moverse al cuadrado morado y al jugador 2 le interesa moverse al cuadrado azul. Aunque no encajaría en la definición de juego de competición, si el juego se modifica de modo que los dos jugadores ganen la cantidad indicada si ambos eligen el mismo número y, de lo contrario, no ganan nada, entonces existen 4 equilibrios de Nash: (0,0 ), (1,1), (2,2) y (3,3).

Equilibrios de Nash en una matriz de pagos

Existe una forma numérica sencilla de identificar los equilibrios de Nash en una matriz de pagos. Es especialmente útil en juegos de dos personas donde los jugadores tienen más de dos estrategias. En este caso, el análisis formal puede resultar demasiado largo. Esta regla no se aplica al caso en el que sean de interés estrategias mixtas (estocásticas). La regla es la siguiente: si el primer número de pago, en el par de pagos de la celda, es el máximo de la columna de la celda y si el segundo número es el máximo de la fila de la celda, entonces la celda representa un Nash. equilibrio.

Podemos aplicar esta regla a una matriz de 3×3:

Usando la regla, podemos ver muy rápidamente (mucho más rápido que con el análisis formal) que las celdas de equilibrio de Nash son (B,A), (A,B) y (C,C). De hecho, para la celda (B,A), 40 es el máximo de la primera columna y 25 es el máximo de la segunda fila. Para (A,B), 25 es el máximo de la segunda columna y 40 es el máximo de la primera fila; lo mismo se aplica a la celda (C,C). Para otras celdas, uno o ambos miembros del doblete no son el máximo de las filas y columnas correspondientes.

Dicho esto, la mecánica real para encontrar celdas de equilibrio es obvia: encontrar el máximo de una columna y verificar si el segundo miembro del par es el máximo de la fila. Si se cumplen estas condiciones, la celda representa un equilibrio de Nash. Verifique todas las columnas de esta manera para encontrar todas las celdas NE. Una matriz N×N puede tener entre 0 y N×N equilibrios de Nash de estrategia pura .

Estabilidad

El concepto de estabilidad , útil en el análisis de muchos tipos de equilibrios, también puede aplicarse a los equilibrios de Nash.

Un equilibrio de Nash para un juego de estrategia mixta es estable si un pequeño cambio (específicamente, un cambio infinitesimal) en las probabilidades de un jugador conduce a una situación en la que se cumplen dos condiciones:

  1. el jugador que no cambió no tiene mejor estrategia en las nuevas circunstancias
  2. el jugador que sí cambió ahora juega con una estrategia estrictamente peor.

Si ambos casos se cumplen, entonces un jugador con un pequeño cambio en su estrategia mixta regresará inmediatamente al equilibrio de Nash. Se dice que el equilibrio es estable. Si la condición uno no se cumple entonces el equilibrio es inestable. Si solo se cumple la condición uno, es probable que haya un número infinito de estrategias óptimas para el jugador que cambió.

En el ejemplo anterior del "juego de conducción" hay equilibrios estables e inestables. Los equilibrios que involucran estrategias mixtas con 100% de probabilidades son estables. Si cualquiera de los jugadores cambia ligeramente sus probabilidades, ambos estarán en desventaja y su oponente no tendrá motivos para cambiar su estrategia. El equilibrio (50%,50%) es inestable. Si cualquiera de los jugadores cambia sus probabilidades (lo que no beneficiaría ni dañaría las expectativas del jugador que hizo el cambio, si la estrategia mixta del otro jugador sigue siendo (50%, 50%)), entonces el otro jugador inmediatamente tiene una mejor estrategia en ya sea (0%, 100%) o (100%, 0%).

La estabilidad es crucial en las aplicaciones prácticas de los equilibrios de Nash, ya que la estrategia mixta de cada jugador no se conoce perfectamente, sino que debe inferirse de la distribución estadística de sus acciones en el juego. En este caso, es muy poco probable que surjan equilibrios inestables en la práctica, ya que cualquier cambio mínimo en las proporciones de cada estrategia observada conducirá a un cambio de estrategia y a la ruptura del equilibrio.

Finalmente, en los años ochenta, basándose con gran profundidad en tales ideas, se introdujeron los equilibrios estables de Mertens como concepto de solución . Los equilibrios estables de Mertens satisfacen tanto la inducción hacia adelante como la inducción hacia atrás . En el contexto de la teoría de juegos, los equilibrios estables ahora generalmente se refieren a equilibrios estables de Mertens. [ cita necesaria ]

Ocurrencia

Si un juego tiene un equilibrio de Nash único y se juega entre jugadores bajo ciertas condiciones, entonces se adoptará el conjunto de estrategias NE. Las condiciones suficientes para garantizar que se juegue el equilibrio de Nash son:

  1. Todos los jugadores harán todo lo posible para maximizar la recompensa esperada como se describe en el juego.
  2. Los jugadores tienen una ejecución impecable.
  3. Los jugadores tienen suficiente inteligencia para deducir la solución.
  4. Los jugadores conocen la estrategia de equilibrio planificada de todos los demás jugadores.
  5. Los jugadores creen que una desviación en su propia estrategia no provocará desviaciones por parte de ningún otro jugador.
  6. Es bien sabido que todos los jugadores cumplen estas condiciones, incluido éste. Por lo tanto, cada jugador no sólo debe saber que los demás jugadores cumplen las condiciones, sino que también debe saber que todos saben que las cumplen, y que saben que saben que las cumplen, y así sucesivamente.

Cuando no se cumplen las condiciones

Ejemplos de problemas de teoría de juegos en los que no se cumplen estas condiciones:

  1. La primera condición no se cumple si el juego no describe correctamente las cantidades que un jugador desea maximizar. En este caso no hay ninguna razón particular para que ese jugador adopte una estrategia de equilibrio. Por ejemplo, el dilema del prisionero no es un dilema si alguno de los jugadores está feliz de ser encarcelado indefinidamente.
  2. Imperfección intencionada o accidental en la ejecución. Por ejemplo, una computadora capaz de realizar un juego lógico impecable frente a una segunda computadora impecable dará como resultado el equilibrio. La introducción de la imperfección conducirá a su alteración, ya sea mediante la pérdida del jugador que comete el error, o mediante la negación del criterio de conocimiento común que conduce a una posible victoria para el jugador. (Un ejemplo sería un jugador que repentinamente pone el auto en reversa en el juego de la gallina , asegurando un escenario sin pérdidas y sin ganancias).
  3. En muchos casos la tercera condición no se cumple porque, aunque el equilibrio debe existir, éste se desconoce debido a la complejidad del juego, por ejemplo en el ajedrez chino . [22] O, si se sabe, puede que no lo sepan todos los jugadores, como cuando se juega al tres en raya con un niño pequeño que quiere desesperadamente ganar (cumpliendo los demás criterios).
  4. El criterio de conocimiento común puede no cumplirse incluso si todos los jugadores cumplen, de hecho, todos los demás criterios. Los jugadores que desconfían erróneamente de la racionalidad de los demás pueden adoptar estrategias contrarias al juego irracional esperado en nombre de sus oponentes. Esta es una consideración importante en el caso de " la gallina " o una carrera armamentista , por ejemplo.

donde se cumplen las condiciones

En su doctorado. En su disertación, John Nash propuso dos interpretaciones de su concepto de equilibrio, con el objetivo de mostrar cómo los puntos de equilibrio pueden conectarse con fenómenos observables.

(...) Una interpretación es racionalista: si asumimos que los jugadores son racionales, conocen la estructura completa del juego, el juego se juega solo una vez y hay un solo equilibrio de Nash, entonces los jugadores jugarán de acuerdo con ese equilibrio .

Esta idea fue formalizada por R. Aumann y A. Brandenburger, 1995, Epistemic Conditions for Nash Equilibrium , Econometrica, 63, 1161-1180 quienes interpretaron la estrategia mixta de cada jugador como una conjetura sobre el comportamiento de otros jugadores y han demostrado que si el juego y la racionalidad de los jugadores se conoce mutuamente y estas conjeturas se conocen comúnmente, entonces las conjeturas deben ser un equilibrio de Nash (se necesita un supuesto previo común para este resultado en general, pero no en el caso de dos jugadores. En este caso, la las conjeturas sólo necesitan ser mutuamente conocidas).

Una segunda interpretación, a la que Nash se refirió mediante la interpretación de la acción masiva, es menos exigente para los jugadores:

[e]s innecesario suponer que los participantes tienen pleno conocimiento de la estructura total del juego, o la capacidad y la inclinación para pasar por procesos de razonamiento complejos. Lo que se supone es que existe una población de participantes para cada posición del juego, que serán jugadas a lo largo del tiempo por participantes elegidos al azar de las diferentes poblaciones. Si existe una frecuencia promedio estable con la que cada estrategia pura es empleada por el miembro promedio de la población apropiada, entonces esta frecuencia promedio estable constituye un equilibrio de Nash de estrategias mixtas.

Para un resultado formal en este sentido, véase Kuhn, H. y et al., 1996, "The Work of John Nash in Game Theory", Journal of Economic Theory , 69, 153-185.

Debido a las condiciones limitadas en las que las NE realmente pueden observarse, rara vez se las trata como una guía para el comportamiento cotidiano, ni se las observa en la práctica en las negociaciones humanas. Sin embargo, como concepto teórico en economía y biología evolutiva , la EN tiene poder explicativo. La recompensa en economía es la utilidad (o, a veces, el dinero), y en biología evolutiva es la transmisión genética; ambos son el resultado fundamental de la supervivencia. Los investigadores que aplican la teoría de juegos en estos campos afirman que las estrategias que no logren maximizarlos por cualquier motivo serán expulsadas del mercado o del entorno, a los que se les atribuye la capacidad de probar todas las estrategias. Esta conclusión se extrae de la teoría de la "estabilidad" anterior. En estas situaciones, la investigación ha confirmado a menudo la suposición de que la estrategia observada es en realidad una EN. [23]

NE y amenazas no creíbles

Ilustraciones en forma extensa y normal que muestran la diferencia entre ENPS y otros NE. El equilibrio azul no es perfecto en subjuegos porque el jugador dos hace una amenaza no creíble en 2(2) de ser cruel (U).

El equilibrio de Nash es un superconjunto del equilibrio de Nash perfecto en subjuegos. El equilibrio perfecto en subjuegos, además del equilibrio de Nash, requiere que la estrategia también sea un equilibrio de Nash en cada subjuego de ese juego. Esto elimina todas las amenazas no creíbles , es decir, estrategias que contienen movimientos no racionales para hacer que el contrajugador cambie su estrategia.

La imagen de la derecha muestra un juego secuencial simple que ilustra el problema de los equilibrios imperfectos de Nash en subjuegos. En este juego, el jugador elige izquierda (L) o derecha (R), seguido de que el jugador dos sea llamado a ser amable (K) o cruel (U) con el jugador uno. Sin embargo, el jugador dos solo gana si es cruel si el jugador uno va hacia la izquierda. Si el jugador uno va bien, el jugador racional dos sería de facto amable con él en ese subjuego. Sin embargo, la amenaza no creíble de ser cruel en 2(2) sigue siendo parte del equilibrio azul de Nash (L, (U,U)). Por lo tanto, si ambas partes pueden esperar un comportamiento racional, el equilibrio perfecto de Nash en subjuegos puede ser un concepto de solución más significativo cuando surgen tales inconsistencias dinámicas .

Prueba de existencia

Prueba utilizando el teorema del punto fijo de Kakutani

La prueba original de Nash (en su tesis) utilizó el teorema del punto fijo de Brouwer (por ejemplo, véase más adelante una variante). Esta sección presenta una prueba más simple a través del teorema del punto fijo de Kakutani , siguiendo el artículo de Nash de 1950 (le da crédito a David Gale por la observación de que tal simplificación es posible).

Para demostrar la existencia de un equilibrio de Nash, sea la mejor respuesta del jugador i a las estrategias de todos los demás jugadores.

Aquí, donde , es un perfil de estrategia mixta en el conjunto de todas las estrategias mixtas y es la función de pago para el jugador i. Defina una función con valores establecidos tal que . La existencia de un equilibrio de Nash equivale a tener un punto fijo.

El teorema del punto fijo de Kakutani garantiza la existencia de un punto fijo si se cumplen las cuatro condiciones siguientes.

  1. es compacto, convexo y no vacío.
  2. no está vacío.
  3. es hemicontinuo superior
  4. es convexo.

La condición 1. se cumple por el hecho de que es simplex y, por tanto, compacto. La convexidad surge de la capacidad de los jugadores para combinar estrategias. no está vacío siempre que los jugadores tengan estrategias.

Las condiciones 2. y 3. se satisfacen mediante el teorema del máximo de Berge . Porque es continuo y compacto, no vacío y hemicontinuo superior .

La condición 4. se cumple como resultado de estrategias mixtas. Supongamos entonces . es decir, si dos estrategias maximizan los beneficios, entonces una combinación de las dos estrategias producirá el mismo beneficio.

Por tanto, existe un punto fijo y un equilibrio de Nash. [24]

Cuando Nash planteó este punto a John von Neumann en 1949, von Neumann lo descartó con las famosas palabras: "Eso es trivial, ¿sabes? Es sólo un teorema del punto fijo ". (Ver Nasar, 1998, pág. 94.)

Prueba alternativa utilizando el teorema del punto fijo de Brouwer

Tenemos un juego donde es el número de jugadores y la acción establecida para los jugadores. Todos los conjuntos de acciones son finitos. Denotemos el conjunto de estrategias mixtas para los jugadores. La finitud de la s asegura la compacidad de .

Ahora podemos definir las funciones de ganancia. Para una estrategia mixta , dejamos que la ganancia para el jugador en acción sea

La función de ganancia representa el beneficio que obtiene un jugador al cambiar unilateralmente su estrategia. Ahora definimos dónde

para . Vemos eso

A continuación definimos:

Es fácil ver que cada una es una estrategia mixta válida en . También es fácil comprobar que cada uno es una función continua de y, por tanto, es una función continua. Como producto cruzado de un número finito de conjuntos compactos convexos, también es compacto y convexo. Aplicando el teorema del punto fijo de Brouwer a y concluimos que tiene un punto fijo en , llamémoslo . Afirmamos que se trata de un equilibrio de Nash en . Para ello basta demostrar que

Esto simplemente establece que cada jugador no obtiene ningún beneficio al cambiar unilateralmente su estrategia, que es exactamente la condición necesaria para un equilibrio de Nash.

Ahora supongamos que las ganancias no son todas cero. Por tanto, y tal que . Entonces

Entonces deja

También lo denotaremos como el vector de ganancia indexado por acciones en . Como es el punto fijo tenemos:

Ya que tenemos una escala positiva del vector . Ahora afirmamos que

Para ver esto, primero si esto es cierto por definición de la función de ganancia. Ahora supongamos eso . Por nuestras declaraciones anteriores tenemos que

y entonces el término de la izquierda es cero, lo que nos da que la expresión completa es la necesaria.

Entonces finalmente tenemos eso

donde sigue la última desigualdad ya que es un vector distinto de cero. Pero esto es una clara contradicción, por lo que todas las ganancias deben ser cero. Por lo tanto, existe un equilibrio de Nash para lo necesario.

Calcular los equilibrios de Nash

Si un jugador A tiene una estrategia dominante entonces existe un equilibrio de Nash en el que A juega . En el caso de dos jugadores A y B, existe un equilibrio de Nash en el que A juega y B juega la mejor respuesta a . Si es una estrategia estrictamente dominante, A juega en todos los equilibrios de Nash. Si tanto A como B tienen estrategias estrictamente dominantes, existe un equilibrio de Nash único en el que cada uno juega su estrategia estrictamente dominante.

En juegos con equilibrios de Nash de estrategias mixtas, la probabilidad de que un jugador elija cualquier estrategia particular (tan pura) se puede calcular asignando una variable a cada estrategia que represente una probabilidad fija de elegir esa estrategia. Para que un jugador esté dispuesto a aleatorizar, el beneficio esperado para cada estrategia (pura) debe ser el mismo. Además, la suma de las probabilidades de cada estrategia de un jugador en particular debe ser 1. Esto crea un sistema de ecuaciones del cual se pueden derivar las probabilidades de elegir cada estrategia. [15]

Ejemplos

En el juego de emparejar monedas de un centavo, el jugador A pierde un punto frente a B si A y B juegan la misma estrategia y le gana un punto a B si juegan estrategias diferentes. Para calcular el equilibrio de Nash de estrategia mixta, asigne a A la probabilidad de jugar H y de jugar T, y asigne a B la probabilidad de jugar H y de jugar T.

Por lo tanto, un equilibrio de Nash de estrategia mixta en este juego es que cada jugador elija aleatoriamente H o T con y .

Rareza de los puntos de equilibrio.

En 1971, Robert Wilson ideó el teorema de la rareza, [25] que dice que "casi todos" los juegos finitos tienen un número finito e impar de equilibrios de Nash. En 1993, Harsanyi publicó una prueba alternativa del resultado. [26] "Casi todos" aquí significa que cualquier juego con un número infinito o par de equilibrios es muy especial en el sentido de que si sus pagos estuvieran ligeramente perturbados aleatoriamente, con probabilidad uno tendría en su lugar un número impar de equilibrios.

El dilema del prisionero , por ejemplo, tiene un equilibrio, mientras que la batalla de los sexos tiene tres: dos puros y uno mixto, y esto sigue siendo cierto incluso si los resultados cambian ligeramente. El juego de dinero gratis es un ejemplo de juego "especial" con un número par de equilibrios. En él, dos jugadores tienen que votar "sí" en lugar de "no" para obtener una recompensa y los votos son simultáneos. Hay dos equilibrios de Nash de estrategia pura, (sí, sí) y (no, no), y no hay equilibrios de estrategia mixta, porque la estrategia "sí" domina débilmente al "no". "Sí" es tan bueno como "no" independientemente de la acción del otro jugador, pero si existe alguna posibilidad de que el otro jugador elija "sí", entonces "sí" es la mejor respuesta. Sin embargo, bajo una pequeña perturbación aleatoria de los pagos, la probabilidad de que dos pagos cualesquiera sigan empatados, ya sea en 0 o en algún otro número, es extremadamente pequeña, y el juego tendría uno o tres equilibrios.

Ver también

Notas

  1. ^ No se prefiere este término, ya que también puede significar lo opuesto a un equilibrio de Nash "fuerte" (es decir, un equilibrio de Nash que es vulnerable a la manipulación por parte de grupos).

Referencias

  1. ^ Osborne, Martín J.; Rubinstein, Ariel (12 de julio de 1994). Un curso de teoría de juegos . Cambridge, MA: MIT. pag. 14.ISBN​ 9780262150415.
  2. ^ Kreps DM (1987) "Equilibrio de Nash". En: Palgrave Macmillan (eds) El Diccionario de Economía New Palgrave . Palgrave Macmillan, Londres.
  3. ^ Nash, John F. (1950). "Puntos de equilibrio en juegos de n personas". PNAS . 36 (1): 48–49. Código bibliográfico : 1950PNAS...36...48N. doi : 10.1073/pnas.36.1.48 . PMC 1063129 . PMID  16588946. 
  4. ^ Schelling, Thomas, La estrategia del conflicto , copyright 1960, 1980, Harvard University Press, ISBN 0-674-84031-3
  5. ^ De Fraja, G.; Oliveira, T.; Zanchi, L. (2010). "Debe esforzarse más: evaluar el papel del esfuerzo en el logro educativo". Revista de Economía y Estadística . 92 (3): 577. doi : 10.1162/REST_a_00013. hdl : 2108/55644 . S2CID  57072280.
  6. ^ Sala, H. (1996). "Teoría de juegos y la política del calentamiento global: la situación actual y más allá". Estudios Políticos . 44 (5): 850–871. doi :10.1111/j.1467-9248.1996.tb00338.x. S2CID  143728467.,
  7. ^ Thorpe, Robert B.; Jennings, Simón; Dolder, Paul J. (2017). "Riesgos y beneficios de obtener un rendimiento bastante bueno en pesquerías mixtas de múltiples especies". Revista ICES de Ciencias Marinas . 74 (8): 2097–2106. doi : 10.1093/icesjms/fsx062 .,
  8. ^ "Lecciones de marketing del Dr. Nash: Andrew Frank". 25/05/2015 . Consultado el 30 de agosto de 2015 .
  9. ^ Chiappori, P.-A.; Levitt, S.; Groseclose, T. (2002). "Prueba de equilibrios de estrategias mixtas cuando los jugadores son heterogéneos: el caso de los penales en el fútbol" (PDF) . Revista económica estadounidense . 92 (4): 1138. CiteSeerX 10.1.1.178.1646 . doi :10.1257/00028280260344678. 
  10. ^ Djehiche, B.; Cheukam, A.; Tembine, H. (2017). "Un juego de evacuación de campo medio en un edificio de varios niveles". Transacciones IEEE sobre control automático . 62 (10): 5154–5169. doi :10.1109/TAC.2017.2679487. ISSN  0018-9286. S2CID  21850096.
  11. ^ Djehiche, Boualem; Cheukam, Alain; Tembine, Hamidou (27 de septiembre de 2017). "Juegos de campo medio en ingeniería". OBJETIVOS Electrónica e Ingeniería Eléctrica . 1 : 18–73. arXiv : 1605.03281 . doi :10.3934/ElectrEng.2017.1.18. S2CID  16055840.
  12. ^ Cournot A. (1838) Investigaciones sobre los principios matemáticos de la teoría de la riqueza
  13. ^ J. Von Neumann, O. Morgenstern, Teoría de los juegos y comportamiento económico , copyright 1944, 1953, Princeton University Press
  14. ^ Carmona, Guilherme; Podczeck, Konrad (2009). "Sobre la existencia de equilibrios de Nash de estrategia pura en juegos grandes" (PDF) . Revista de teoría económica . 144 (3): 1300-1319. doi :10.1016/j.jet.2008.11.009. hdl : 10362/11577 . SSRN  882466.[ enlace muerto permanente ]
  15. ^ ab von Ahn, Luis. "Preliminares de la teoría de juegos" (PDF) . Archivado desde el original (PDF) el 18 de octubre de 2011 . Consultado el 7 de noviembre de 2008 .
  16. ^ "Equilibrios de Nash". hoylab.cornell.edu . Consultado el 8 de diciembre de 2019 .
  17. ^ ab BD Bernheim; B. Péleg; MD Whinston (1987), "Coalition-Proof Equilibria I. Concepts", Journal of Economic Theory , 42 (1): 1–12, doi :10.1016/0022-0531(87)90099-8.
  18. ^ Aumann, R. (1959). "Puntos aceptables en juegos cooperativos generales para n personas". Aportaciones a la Teoría de Juegos . vol. IV. Princeton, Nueva Jersey: Princeton University Press. ISBN 978-1-4008-8216-8.
  19. ^ D. Moreno; J. Wooders (1996), "Equilibrio a prueba de coaliciones" (PDF) , Juegos y comportamiento económico , 17 (1): 80–112, doi :10.1006/game.1996.0095, hdl : 10016/4408 .
  20. ^ MIT OpenCourseWare. 6.254: Teoría de juegos con aplicaciones de ingeniería, primavera de 2010. Conferencia 6: Juegos continuos y discontinuos.
  21. ^ Rosen, JB (1965). "Existencia y singularidad de los puntos de equilibrio para juegos cóncavos de N personas". Econométrica . 33 (3): 520–534. doi :10.2307/1911749. hdl : 2060/19650010164 . ISSN  0012-9682. JSTOR  1911749.
  22. ^ TL Turocy, B. Von Stengel, Teoría de juegos , copyright 2001, Universidad Texas A&M, Escuela de Economía de Londres, páginas 141-144. Nash demostró que existe un EN perfecto para este tipo de juego de forma extensiva finita [ cita necesaria ] ; puede representarse como una estrategia que cumple con sus condiciones originales para un juego con un EN. Es posible que estos juegos no tengan una NE única, pero al menos una de las muchas estrategias de equilibrio sería jugada por jugadores hipotéticos que tuvieran un conocimiento perfecto de los 10 150 árboles de juegos [ cita requerida ] .
  23. ^ JC Cox, M. Walker, Learning to Play Cournot Duoploy Strategies Archivado el 11 de diciembre de 2013 en Wayback Machine , copyright 1997, Texas A&M University, University of Arizona, páginas 141-144
  24. ^ Fudenburg, Drew; Tirole, Jean (1991). Teoría de juego . Prensa del MIT. ISBN 978-0-262-06141-4.
  25. ^ Wilson, Robert (1 de julio de 1971). "Cálculo de equilibrios de juegos de N personas". Revista SIAM de Matemática Aplicada . 21 (1): 80–87. doi :10.1137/0121011. ISSN  0036-1399.
  26. ^ Harsanyi, JC (1 de diciembre de 1973). "Impareja del número de puntos de equilibrio: una nueva prueba". Revista Internacional de Teoría de Juegos . 2 (1): 235–250. doi :10.1007/BF01737572. ISSN  1432-1270. S2CID  122603890.

Bibliografía

Libros de texto de teoría de juegos.

Papeles originales de Nash

otras referencias

enlaces externos