stringtranslate.com

Dominio del riesgo

El dominio del riesgo y el dominio de los pagos son dos refinamientos relacionados del concepto de solución de equilibrio de Nash (EN) en la teoría de juegos , definido por John Harsanyi y Reinhard Selten . Un equilibrio de Nash se considera dominante en los pagos si es Pareto superior a todos los demás equilibrios de Nash en el juego. 1 Cuando se enfrentan a una elección entre equilibrios, todos los jugadores estarían de acuerdo en el equilibrio dominante en los pagos, ya que ofrece a cada jugador al menos tanto pago como los otros equilibrios de Nash. Por el contrario, un equilibrio de Nash se considera dominante en el riesgo si tiene la cuenca de atracción más grande (es decir, es menos riesgoso). Esto implica que cuanto más incertidumbre tengan los jugadores sobre las acciones de los otros jugadores, más probable es que elijan la estrategia correspondiente.

La matriz de pagos de la Figura 1 proporciona un ejemplo simple de dos jugadores y dos estrategias de un juego con dos equilibrios de Nash puros. El par de estrategias (Cazar, Cazar) es dominante en cuanto a pagos, ya que los pagos son mayores para ambos jugadores en comparación con el otro EN puro, (Recoger, Recoger). Por otro lado, (Recoger, Recoger) el riesgo domina (Cazar, Cazar) ya que si existe incertidumbre sobre la acción del otro jugador, la recolección proporcionará un pago esperado mayor. El juego de la Figura 1 es un dilema de teoría de juegos bien conocido llamado caza del ciervo . La lógica detrás de esto es que la acción comunitaria (cazar) produce un mayor rendimiento si todos los jugadores combinan sus habilidades, pero si se desconoce si el otro jugador ayuda en la caza, la recolección podría resultar ser la mejor estrategia individual para la provisión de alimentos, ya que no depende de la coordinación con el otro jugador. Además, la recolección en solitario es preferible a la recolección en competencia con otros. Al igual que el dilema del prisionero , proporciona una razón por la cual la acción colectiva podría fracasar en ausencia de compromisos creíbles .

Definición formal

El juego que se muestra en la Figura 2 es un juego de coordinación si se cumplen las siguientes desigualdades de pagos para el jugador 1 (filas): A > B, D > C, y para el jugador 2 (columnas): a > b, d > c. Los pares de estrategias (H, H) y (G, G) son entonces los únicos equilibrios de Nash puros . Además, existe un equilibrio de Nash mixto en el que el jugador 1 juega H con probabilidad p = (dc)/(ab-c+d) y G con probabilidad 1–p; el jugador 2 juega H con probabilidad q = (DC)/(AB-C+D) y G con probabilidad 1–q.

El pago del par de estrategias (H, H) domina (G, G) si A ≥ D, a ≥ d, y al menos una de las dos es una desigualdad estricta: A > D o a > d.

El riesgo del par de estrategias (G, G) domina sobre (H, H) si el producto de las pérdidas por desviación es mayor para (G, G) (Harsanyi y Selten, 1988, Lema 5.4.4). En otras palabras, si se cumple la siguiente desigualdad: (C – D)(c – d)≥(B – A)(b – a) . Si la desigualdad es estricta, entonces el riesgo de (G, G) domina estrictamente sobre (H, H). 2 (Es decir, los jugadores tienen más incentivos para desviarse).

Si el juego es simétrico, es decir, si A = a, B = b, etc., la desigualdad permite una interpretación sencilla: suponemos que los jugadores no están seguros de qué estrategia elegirá el oponente y asignamos probabilidades para cada estrategia. Si cada jugador asigna probabilidades ½ a H y G cada uno, entonces el riesgo (G, G) domina a (H, H) si el beneficio esperado de jugar G supera el beneficio esperado de jugar H: ½ B + ½ D ≥ ½ A + ½ C , o simplemente B + D ≥ A + C .

Otra forma de calcular el equilibrio dominante del riesgo es calcular el factor de riesgo para todos los equilibrios y encontrar el equilibrio con el factor de riesgo más pequeño. Para calcular el factor de riesgo en nuestro juego 2x2, considere la ganancia esperada para un jugador si juega H: (donde p es la probabilidad de que el otro jugador juegue H), y compárela con la ganancia esperada si juega G: . El valor de p que hace que estos dos valores esperados sean iguales es el factor de riesgo para el equilibrio (H, H), con el factor de riesgo para jugar (G, G). También puede calcular el factor de riesgo para jugar (G, G) haciendo el mismo cálculo, pero estableciendo p como la probabilidad de que el otro jugador juegue G. Una interpretación para p es que es la probabilidad más pequeña de que el oponente deba jugar esa estrategia de modo que la ganancia de la persona por copiar la estrategia del oponente sea mayor que si se jugó la otra estrategia.

Selección de equilibrio

Varios enfoques evolutivos han establecido que cuando se juega en una población grande, los jugadores pueden no jugar la estrategia de equilibrio dominante de pago y, en cambio, terminar en el equilibrio dominante de pago, riesgo. Dos modelos evolutivos separados respaldan la idea de que es más probable que ocurra el equilibrio dominante de riesgo. El primer modelo, basado en la dinámica de replicadores , predice que es más probable que una población adopte el equilibrio dominante de riesgo que el equilibrio dominante de pago. El segundo modelo, basado en la revisión y mutación de la estrategia de mejor respuesta , predice que el estado dominante de riesgo es el único equilibrio estocásticamente estable . Ambos modelos asumen que se juegan múltiples juegos de dos jugadores en una población de N jugadores. Los jugadores se emparejan aleatoriamente con oponentes, y cada jugador tiene las mismas probabilidades de sacar cualquiera de los otros N−1 jugadores. Los jugadores comienzan con una estrategia pura, G o H, y juegan esta estrategia contra su oponente. En la dinámica de replicadores, el juego de la población se repite en generaciones secuenciales donde las subpoblaciones cambian según el éxito de sus estrategias elegidas. En la mejor respuesta, los jugadores actualizan sus estrategias para mejorar los pagos esperados en las generaciones posteriores. El reconocimiento de Kandori, Mailath y Rob (1993) y Young (1993) fue que si la regla para actualizar la estrategia permite la mutación 4 , y la probabilidad de mutación se desvanece, es decir, llega asintóticamente a cero con el tiempo, la probabilidad de que se alcance el equilibrio dominante del riesgo se convierte en uno, incluso si está dominado por los pagos. 3

Notas

Referencias