stringtranslate.com

Estrategia (teoría de juegos)

En teoría de juegos , la estrategia de un jugador es cualquiera de las opciones que elige en un entorno donde el resultado óptimo depende no sólo de sus propias acciones sino de las acciones de los demás. [1] La disciplina se refiere principalmente a la acción de un jugador en un juego que afecta el comportamiento o las acciones de otros jugadores. Algunos ejemplos de "juegos" incluyen ajedrez, bridge, póquer, monopolio, diplomacia o acorazado. [2] La estrategia de un jugador determinará la acción que realizará en cualquier etapa del juego. Al estudiar la teoría de juegos, los economistas utilizan una lente más racional para analizar decisiones en lugar de las perspectivas psicológicas o sociológicas adoptadas al analizar las relaciones entre decisiones de dos o más partes en diferentes disciplinas.

El concepto de estrategia se confunde a veces (erróneamente) con el de jugada . Un movimiento es una acción realizada por un jugador en algún momento durante el desarrollo de una partida (por ejemplo, en ajedrez, mover el alfil blanco de a2 a b3). Por otro lado, una estrategia es un algoritmo completo para jugar, que le dice al jugador qué hacer en cada situación posible a lo largo del juego. Es útil pensar en una "estrategia" como una lista de direcciones y en un "movimiento" como un único giro en la propia lista de direcciones. Esta estrategia se basa en la recompensa o resultado de cada acción. El objetivo de cada agente es considerar su recompensa en función de la acción de la competencia. Por ejemplo, el competidor A puede suponer que el competidor B ingresa al mercado. A partir de ahí, el competidor A compara los pagos que recibe al entrar y al no entrar. El siguiente paso es asumir que el competidor B no ingresa y luego considerar qué pago es mejor en función de si el competidor A elige ingresar o no. Esta técnica puede identificar estrategias dominantes en las que un jugador puede identificar una acción que puede realizar sin importar lo que haga el competidor para intentar maximizar la recompensa. Esto también ayuda a los jugadores a identificar el equilibrio de Nash, que se analiza con más detalle a continuación.

Un perfil de estrategia (a veces llamado combinación de estrategias ) es un conjunto de estrategias para todos los jugadores que especifica completamente todas las acciones de un juego. Un perfil de estrategia debe incluir una y sólo una estrategia para cada jugador.

Conjunto de estrategias

El conjunto de estrategias de un jugador define qué estrategias están disponibles para jugar. Un perfil de estrategia es una lista de conjuntos de estrategias, ordenadas de más a menos deseables.

Un jugador tiene un conjunto de estrategias finito si tiene varias estrategias discretas disponibles. Por ejemplo, un juego de piedra, papel o tijera comprende un solo movimiento de cada jugador (y el movimiento de cada jugador se realiza sin conocimiento del otro, no como respuesta), por lo que cada jugador tiene un conjunto de estrategias finito {piedra, papel o tijera}.

De lo contrario, un conjunto de estrategias es infinito. Por ejemplo, el juego de cortar pasteles tiene una serie continua de estrategias acotadas en el conjunto de estrategias {Cortar entre cero por ciento y 100 por ciento del pastel}.

En un juego dinámico , juegos que se juegan durante una serie de tiempo, el conjunto de estrategias consta de las posibles reglas que un jugador podría darle a un robot o agente sobre cómo jugar el juego. Por ejemplo, en el juego del ultimátum , la estrategia establecida para el segundo jugador consistiría en todas las reglas posibles sobre qué ofertas aceptar y cuáles rechazar.

En un juego bayesiano , o en juegos en los que los jugadores tienen información incompleta entre sí, la estrategia establecida es similar a la de un juego dinámico. Consiste en reglas sobre qué acciones tomar ante cualquier posible información privada.

Elegir un conjunto de estrategias

En la teoría de juegos aplicada, la definición de los conjuntos de estrategias es una parte importante del arte de hacer que un juego tenga solución y significado al mismo tiempo. El teórico de juegos puede utilizar el conocimiento del problema general, es decir, la fricción entre dos o más jugadores, para limitar los espacios estratégicos y facilitar la solución.

Por ejemplo, estrictamente hablando en el juego Ultimatum un jugador puede tener estrategias tales como: Rechazar ofertas de ($1, $3, $5,..., $19), aceptar ofertas de ($0, $2, $4,..., $20) . Incluir todas estas estrategias crea un espacio estratégico muy grande y un problema algo difícil. En cambio, un teórico de juegos podría creer que puede limitar la estrategia establecida a: {Rechazar cualquier oferta ≤ x , aceptar cualquier oferta > x ; para x en ($0, $1, $2, ..., $20)}.

Estrategias puras y mixtas

Una estrategia pura proporciona una definición completa de cómo un jugador jugará un juego. La estrategia pura puede considerarse como un plan concreto singular sujeto a las observaciones que se hacen durante el transcurso del juego. En particular, determina el movimiento que hará un jugador ante cualquier situación que pueda enfrentar. El conjunto de estrategias de un jugador es el conjunto de estrategias puras disponibles para ese jugador.

Una estrategia mixta es una asignación de una probabilidad a cada estrategia pura. Cuando se incluye una estrategia mixta, a menudo se debe a que el juego no permite una descripción racional al especificar una estrategia pura para el juego. Esto permite que un jugador seleccione aleatoriamente una estrategia pura. (Consulte la siguiente sección para ver una ilustración). Dado que las probabilidades son continuas, hay infinitas estrategias mixtas disponibles para un jugador. Dado que las probabilidades se asignan a estrategias para un jugador específico cuando se discuten los pagos de ciertos escenarios, el pago debe denominarse "pago esperado".

Por supuesto, se puede considerar una estrategia pura como un caso degenerado de una estrategia mixta, en la que esa estrategia pura en particular se selecciona con probabilidad 1 y todas las demás estrategias con probabilidad 0 .

Una estrategia totalmente mixta es una estrategia mixta en la que el jugador asigna una probabilidad estrictamente positiva a cada estrategia pura. (Las estrategias totalmente mixtas son importantes para refinar el equilibrio, como el equilibrio perfecto con la mano temblorosa ).

Estrategia mixta

Ilustración

En un tiro penal de fútbol, ​​el lanzador debe elegir si patear hacia el lado derecho o izquierdo de la portería y, simultáneamente, el portero debe decidir en qué dirección bloquearlo. Además, el pateador tiene una dirección en la que es mejor para disparar, que es hacia la izquierda si es diestro. La matriz del juego de fútbol ilustra esta situación, una forma simplificada del juego estudiada por Chiappori, Levitt y Groseclose (2002). [3] Se supone que si el portero adivina correctamente, el tiro se bloquea, lo que se establece en el pago base de 0 para ambos jugadores. Si el portero adivina mal, es más probable que el tiro entre hacia la izquierda (pagos de +2 para el pateador y -2 para el portero) que si es hacia la derecha (el pago más bajo de +1 a pateador y -1 al portero).

Este juego no tiene un equilibrio de estrategia pura, porque uno u otro jugador se desviaría de cualquier perfil de estrategias; por ejemplo, (Izquierda, Izquierda) no es un equilibrio porque el pateador se desviaría hacia la derecha y aumentaría su pago de 0 a 1. .

El equilibrio de estrategia mixta del pateador se encuentra a partir del hecho de que se desviarán de la aleatorización a menos que sus pagos de Patada izquierda y Patada derecha sean exactamente iguales. Si el portero se inclina hacia la izquierda con probabilidad g, el pago esperado del pateador con Kick Left es g(0) + (1-g)(2), y con Kick Right es g(1) + (1-g)(0). Al equiparar estos se obtiene g= 2/3. De manera similar, el portero está dispuesto a aleatorizar solo si el pateador elige una estrategia mixta con probabilidad k tal que el pago de Lean Left de k(0) + (1-k)(-1) sea igual al pago de Lean Right de k(-2) + (1 -k)(0), entonces k = 1/3. Por tanto, el equilibrio de la estrategia mixta es (Prob(Kick Left) = 1/3, Prob(Lean Left) = 2/3).

En equilibrio, el pateador patea hacia su mejor lado sólo 1/3 del tiempo. Eso se debe a que el portero protege más ese lado. Además, en equilibrio, al pateador le es indiferente en qué dirección patea, pero para que sea un equilibrio debe elegir exactamente 1/3 de probabilidad.

Chiappori, Levitt y Groseclose intentan medir qué tan importante es para el pateador patear hacia su lado favorito, agregar patadas centrales, etc., y observar cómo se comportan realmente los jugadores profesionales. Encuentran que hacen aleatorización y que los pateadores patean hacia su lado favorito el 45% de las veces y los porteros se inclinan hacia ese lado el 57% de las veces. Su artículo es bien conocido como un ejemplo de cómo la gente en la vida real utiliza estrategias mixtas.

Significado

En su famoso artículo, John Forbes Nash demostró que existe un equilibrio para todo juego finito. Se pueden dividir los equilibrios de Nash en dos tipos. Los equilibrios de Nash de estrategia pura son equilibrios de Nash en los que todos los jugadores juegan estrategias puras. Los equilibrios de Nash en estrategias mixtas son equilibrios en los que al menos un jugador juega una estrategia mixta. Si bien Nash demostró que todo juego finito tiene un equilibrio de Nash, no todos tienen equilibrios de Nash estratégicos puros. Para ver un ejemplo de un juego que no tiene un equilibrio de Nash en estrategias puras, consulte Emparejar monedas de un centavo . Sin embargo, muchos juegos tienen equilibrios de Nash de estrategia pura (por ejemplo, el juego de coordinación , el dilema del prisionero , la caza del ciervo ). Además, los juegos pueden tener equilibrios tanto de estrategia pura como de estrategia mixta. Un ejemplo sencillo es el juego de coordinación puro, donde además de las estrategias puras (A,A) y (B,B) existe un equilibrio mixto en el que ambos jugadores juegan cualquiera de las estrategias con probabilidad 1/2.

Interpretaciones de estrategias mixtas.

Durante la década de 1980, el concepto de estrategias mixtas fue objeto de fuertes críticas por ser "intuitivamente problemático", ya que son equilibrios de Nash débiles y un jugador es indiferente a seguir su estrategia de equilibrio de probabilidad o desviarse hacia alguna otra probabilidad. [4] [5] El teórico de juegos Ariel Rubinstein describe formas alternativas de entender el concepto. La primera, debida a Harsanyi (1973), [6] se llama purificación , y supone que la interpretación de las estrategias mixtas simplemente refleja nuestro desconocimiento de la información y del proceso de toma de decisiones de los jugadores. Las elecciones aparentemente aleatorias se ven entonces como consecuencias de factores exógenos no especificados e irrelevantes para los resultados. [5] Una segunda interpretación imagina que los jugadores representan una gran población de agentes. Cada uno de los agentes elige una estrategia pura y la recompensa depende de la fracción de agentes que eligen cada estrategia. Por tanto, la estrategia mixta representa la distribución de estrategias puras elegidas por cada población. Sin embargo, esto no proporciona ninguna justificación para el caso en que los jugadores sean agentes individuales.

Posteriormente, Aumann y Brandenburger (1995) [7] reinterpretaron el equilibrio de Nash como un equilibrio de creencias , más que de acciones. Por ejemplo, en piedra, papel o tijera, un equilibrio en las creencias haría que cada jugador creyera que el otro tiene la misma probabilidad de utilizar cada estrategia. Sin embargo, esta interpretación debilita el poder descriptivo del equilibrio de Nash, ya que en tal equilibrio es posible que cada jugador juegue realmente una estrategia pura de Roca en cada jugada del juego, aunque con el tiempo las probabilidades sean las de la estrategia mixta. .

Estrategia de comportamiento

Mientras que una estrategia mixta asigna una distribución de probabilidad sobre las estrategias puras, una estrategia de comportamiento asigna a cada conjunto de información una distribución de probabilidad sobre el conjunto de acciones posibles. Si bien los dos conceptos están muy relacionados en el contexto de los juegos en forma normal, tienen implicaciones muy diferentes para los juegos en forma extensiva. En términos generales, una estrategia mixta elige aleatoriamente un camino determinista a través del árbol del juego , mientras que una estrategia de comportamiento puede verse como un camino estocástico. La relación entre estrategias mixtas y conductuales es el tema del teorema de Kuhn , una perspectiva conductual de las hipótesis tradicionales de la teoría de juegos. El resultado establece que en cualquier juego finito de forma extensiva con recuperación perfecta, para cualquier jugador y cualquier estrategia mixta, existe una estrategia de comportamiento que, contra todos los perfiles de estrategias (de otros jugadores), induce la misma distribución sobre los nodos terminales que el la estrategia mixta sí lo hace. Lo contrario también es cierto.

Un ejemplo famoso de por qué se requiere una memoria perfecta para la equivalencia lo dan Piccione y Rubinstein (1997) [ cita completa necesaria ] con su juego de conductor distraído .

Equivalencia de resultados

La equivalencia de resultados combina la estrategia mixta y conductual del jugador i en relación con la estrategia pura del oponente del jugador i. La equivalencia de resultados se define como la situación en la que, para cualquier estrategia mixta y de comportamiento que adopte el jugador i, en respuesta a cualquier estrategia pura que juegue el oponente del jugador I, la distribución de resultados de la estrategia mixta y de comportamiento debe ser igual. Esta equivalencia se puede describir mediante la siguiente fórmula: (Q^(U(i), S(-i)))(z) = (Q^(β(i), S(-i)))(z), donde U(i) describe la estrategia mixta del jugador i, β(i) describe la estrategia de comportamiento del jugador i y S(-i) es la estrategia del oponente. [8]

Estrategia con recuerdo perfecto.

La recuperación perfecta se define como la capacidad de cada jugador del juego para recordar y recordar todas las acciones pasadas dentro del juego. Se requiere un recuerdo perfecto para la equivalencia ya que, en juegos finitos con un recuerdo imperfecto, existirán estrategias mixtas del Jugador I en las que no existe una estrategia de comportamiento equivalente. Esto se describe completamente en el juego del conductor distraído formulado por Piccione y Rubinstein. En definitiva, este juego se basa en la toma de decisiones de un conductor con memoria imperfecta, que necesita tomar la segunda salida de la autopista para llegar a casa pero no recuerda en qué intersección se encuentra cuando llega a ella. La figura [2] describe este juego.

Sin información perfecta (es decir, información imperfecta), los jugadores toman una decisión en cada nodo de decisión sin conocer las decisiones que la han precedido. Por lo tanto, la estrategia mixta de un jugador puede producir resultados que su estrategia conductual no puede producir, y viceversa. Esto se demuestra en el juego Conductor distraído . Con memoria e información perfectas, el conductor tiene una única estrategia pura, que es [continuar, salir], ya que el conductor sabe en qué intersección (o nodo de decisión) se encuentra cuando llega a ella. Por otro lado, si se analiza únicamente la etapa de planificación óptima, el máximo beneficio se logra al continuar en ambas intersecciones, maximizado en p=2/3 (referencia). Este sencillo juego para un jugador demuestra la importancia de la memoria perfecta para la equivalencia de resultados y su impacto en los juegos de forma normal y extendida. [9]

Ver también

Referencias

  1. ^ Teoría de juegos de Ben Polak : Transcripción de la conferencia 1 ECON 159, 5 de septiembre de 2007, Cursos abiertos de Yale .
  2. ^ Aumann, R. (22 de marzo de 2017). Teoría de juego. En: Palgrave Macmillan . Londres: Palgrave Macmillan. ISBN 978-1-349-95121-5.
  3. ^ Chiappori, P.-A.; Levitt, S.; Groseclose, T. (2002). "Prueba de equilibrios de estrategias mixtas cuando los jugadores son heterogéneos: el caso de los penales en el fútbol" (PDF) . Revista económica estadounidense . 92 (4): 1138. CiteSeerX 10.1.1.178.1646 . doi :10.1257/00028280260344678. 
  4. ^ Aumann, R. (1985). "¿Qué intenta lograr la teoría de juegos?" (PDF) . En Arrow, K.; Honkapohja, S. (eds.). Fronteras de la economía . Oxford: Albahaca Blackwell. págs. 909–924.
  5. ^ ab Rubinstein, A. (1991). "Comentarios sobre la interpretación de la Teoría de Juegos". Econométrica . 59 (4): 909–924. doi :10.2307/2938166. JSTOR  2938166.
  6. ^ Harsanyi, John (1973). "Juegos con pagos perturbados aleatoriamente: una nueva justificación para los puntos de equilibrio de estrategias mixtas". En t. J. Teoría de juegos . 2 : 1–23. doi :10.1007/BF01737554. S2CID  154484458.
  7. ^ Aumann, Robert ; Brandeburgo, Adam (1995). "Condiciones epistémicas para el equilibrio de Nash". Econométrica . 63 (5): 1161-1180. CiteSeerX 10.1.1.122.5816 . doi :10.2307/2171725. JSTOR  2171725. 
  8. ^ Shimoji, Makoto (1 de mayo de 2012). "Equivalencia de resultados del equilibrio de autoconfirmación y el equilibrio de Nash". Juegos y comportamiento económico . 75 (1): 441–447. doi :10.1016/j.geb.2011.09.010. ISSN  0899-8256.
  9. ^ Kak, Subhash (2017). "El problema del conductor distraído Redux". arXiv : 1702.05778 [cs.AI].