stringtranslate.com

Teoría de juegos

La teoría de juegos es el estudio de modelos matemáticos de interacciones estratégicas. [1] Tiene aplicaciones en muchos campos de las ciencias sociales y se utiliza ampliamente en economía , lógica , ciencia de sistemas y ciencias de la computación . [2] Inicialmente, la teoría de juegos abordó los juegos de suma cero entre dos personas , en los que las ganancias o pérdidas de un participante se equilibran exactamente con las pérdidas y ganancias del otro participante. En la década de 1950, se extendió al estudio de los juegos de suma no cero y, finalmente, se aplicó a una amplia gama de relaciones de comportamiento . Ahora es un término general para la ciencia de la toma de decisiones racional en humanos, animales y computadoras.

La teoría de juegos moderna comenzó con la idea de equilibrios de estrategia mixta en juegos de suma cero de dos personas y su demostración por parte de John von Neumann . La prueba original de von Neumann utilizó el teorema de punto fijo de Brouwer sobre aplicaciones continuas en conjuntos convexos compactos , que se convirtió en un método estándar en la teoría de juegos y la economía matemática . Su artículo fue seguido por Theory of Games and Economic Behavior (1944), coescrito con Oskar Morgenstern , que consideró juegos cooperativos de varios jugadores. [3] La segunda edición proporcionó una teoría axiomática de la utilidad esperada , que permitió a los estadísticos matemáticos y economistas tratar la toma de decisiones en condiciones de incertidumbre. [4]

La teoría de juegos se desarrolló ampliamente en la década de 1950 y se aplicó explícitamente a la evolución en la década de 1970, aunque desarrollos similares se remontan al menos a la década de 1930. La teoría de juegos ha sido ampliamente reconocida como una herramienta importante en muchos campos. John Maynard Smith fue galardonado con el Premio Crafoord por su aplicación de la teoría de juegos evolutiva en 1999, y quince teóricos de juegos han ganado el Premio Nobel de Economía hasta 2020, incluidos los más recientes Paul Milgrom y Robert B. Wilson .

Historia

Pensamiento teórico de juegos

La estrategia basada en la teoría de juegos dentro de la historia registrada se remonta al menos a la guía de estrategia militar de Sun Tzu . [5] [6] En El arte de la guerra , escribió:

Conociendo al otro y conociéndose a sí mismo, En cien batallas no hay peligro,

No conocer al otro y conocerse a sí mismo, Una victoria por una derrota,

No conocer al otro y no conocerse a sí mismo, En cada batalla una derrota segura

—Sun  Tzu

Orígenes matemáticos

Las discusiones sobre las matemáticas de los juegos comenzaron mucho antes del surgimiento de la teoría matemática de juegos moderna. La obra de Cardano Liber de ludo aleae ( Libro sobre los juegos de azar ), que se escribió alrededor de 1564 pero se publicó póstumamente en 1663, esboza algunas ideas básicas sobre los juegos de azar. En la década de 1650, Pascal y Huygens desarrollaron el concepto de expectativa sobre el razonamiento acerca de la estructura de los juegos de azar. Pascal argumentó a favor de una división igual cuando las probabilidades son iguales, mientras que Huygens amplió el argumento al considerar estrategias para un jugador que puede hacer cualquier apuesta con cualquier oponente siempre que sus términos sean iguales. [7] Huygens publicó más tarde su cálculo de juegos de azar como De ratiociniis in ludo aleæ ( Sobre el razonamiento en los juegos de azar ) en 1657.

En 1713, una carta atribuida a Charles Waldegrave, un jacobita activo y tío del diplomático británico James Waldegrave , analizó un juego llamado " le her ". [8] [9] Waldegrave proporcionó una solución de estrategia mixta minimax a una versión para dos personas del juego de cartas, y el problema ahora se conoce como problema de Waldegrave . En 1838, Antoine Augustin Cournot consideró un duopolio y presentó una solución que es el equilibrio de Nash del juego en sus Recherches sur les principes mathématiques de la théorie des richesses ( Investigaciones sobre los principios matemáticos de la teoría de la riqueza ).

En 1913, Ernst Zermelo publicó Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels ( Sobre una aplicación de la teoría de conjuntos a la teoría del juego de ajedrez ), que demostró que la estrategia óptima del ajedrez está estrictamente determinada . Esto allanó el camino para teoremas más generales. [10]

En 1938, el economista matemático danés Frederik Zeuthen demostró que el modelo matemático tenía una estrategia ganadora utilizando el teorema del punto fijo de Brouwer . [11] En su libro de 1938 Aplicaciones a los juegos de apuestas y notas anteriores, Émile Borel demostró un teorema minimax para juegos de matriz de suma cero de dos personas solo cuando la matriz de pagos es simétrica y proporcionó una solución a un juego infinito no trivial (conocido en inglés como juego Blotto ). Borel conjeturó la inexistencia de equilibrios de estrategia mixta en juegos finitos de suma cero de dos personas , una conjetura que von Neumann demostró que era falsa.

Nacimiento y primeros desarrollos

Juan von Neumann

La teoría de juegos surgió como un campo único cuando John von Neumann publicó el artículo On the Theory of Games of Strategy en 1928. [12] [13] La prueba original de von Neumann utilizó el teorema de punto fijo de Brouwer sobre aplicaciones continuas en conjuntos convexos compactos , que se convirtió en un método estándar en la teoría de juegos y la economía matemática . El trabajo de von Neumann en teoría de juegos culminó en su libro de 1944 Theory of Games and Economic Behavior , en coautoría con Oskar Morgenstern . [14] La segunda edición de este libro proporcionó una teoría axiomática de la utilidad , que reencarnó la antigua teoría de la utilidad (del dinero) de Daniel Bernoulli como una disciplina independiente. Este trabajo fundamental contiene el método para encontrar soluciones mutuamente consistentes para juegos de suma cero de dos personas. El trabajo posterior se centró principalmente en la teoría de juegos cooperativos , que analiza las estrategias óptimas para grupos de individuos, suponiendo que pueden hacer cumplir acuerdos entre ellos sobre las estrategias adecuadas. [15]

Juan Nash

En 1950, apareció la primera discusión matemática del dilema del prisionero , y los notables matemáticos Merrill M. Flood y Melvin Dresher llevaron a cabo un experimento como parte de las investigaciones de la Corporación RAND sobre la teoría de juegos. RAND llevó a cabo los estudios debido a las posibles aplicaciones a la estrategia nuclear global . [16] Casi al mismo tiempo, John Nash desarrolló un criterio para la consistencia mutua de las estrategias de los jugadores conocido como el equilibrio de Nash , aplicable a una variedad más amplia de juegos que el criterio propuesto por von Neumann y Morgenstern. Nash demostró que todo juego finito de n jugadores, de suma no cero (no solo de suma cero para dos jugadores) no cooperativo tiene lo que ahora se conoce como un equilibrio de Nash en estrategias mixtas.

La teoría de juegos experimentó un gran auge en la década de 1950, durante la cual se desarrollaron los conceptos de núcleo , juego de forma extensiva , juego ficticio , juegos repetidos y valor de Shapley . La década de 1950 también vio las primeras aplicaciones de la teoría de juegos a la filosofía y la ciencia política .

Logros premiados

En 1965, Reinhard Selten introdujo su concepto de solución de equilibrios perfectos en subjuegos , que perfeccionó aún más el equilibrio de Nash. Más tarde, también introduciría la perfección de la mano temblorosa . En 1994, Nash, Selten y Harsanyi recibieron el Premio Nobel de Economía por sus contribuciones a la teoría de juegos económicos.

En la década de 1970, la teoría de juegos se aplicó ampliamente en biología , en gran medida como resultado del trabajo de John Maynard Smith y su estrategia evolutivamente estable . Además, se introdujeron y analizaron los conceptos de equilibrio correlacionado , perfección de mano temblorosa y conocimiento común [a] .

En 1994, John Nash recibió el Premio Nobel de Economía por su contribución a la teoría de juegos. La contribución más famosa de Nash a la teoría de juegos es el concepto de equilibrio de Nash, que es un concepto de solución para juegos no cooperativos . Un equilibrio de Nash es un conjunto de estrategias, una para cada jugador, de modo que ningún jugador pueda mejorar su pago modificando unilateralmente su estrategia.

En 2005, los teóricos de juegos Thomas Schelling y Robert Aumann sucedieron a Nash, Selten y Harsanyi como Premios Nobel. Schelling trabajó en modelos dinámicos, ejemplos tempranos de la teoría de juegos evolutiva . Aumann contribuyó más a la escuela del equilibrio, introduciendo el engrosamiento del equilibrio y los equilibrios correlacionados, y desarrollando un extenso análisis formal del supuesto del conocimiento común y de sus consecuencias.

En 2007, Leonid Hurwicz , Eric Maskin y Roger Myerson recibieron el Premio Nobel de Economía "por haber sentado las bases de la teoría del diseño de mecanismos ". Las contribuciones de Myerson incluyen la noción de equilibrio adecuado y un importante texto de posgrado: Teoría de juegos, análisis del conflicto . [1] Hurwicz introdujo y formalizó el concepto de compatibilidad de incentivos .

En 2012, Alvin E. Roth y Lloyd S. Shapley recibieron el Premio Nobel de Economía "por la teoría de las asignaciones estables y la práctica del diseño de mercados". En 2014, el Nobel fue para el teórico de juegos Jean Tirole .

Diferentes tipos de juegos

Cooperativo / no cooperativo

Un juego es cooperativo si los jugadores pueden formar compromisos vinculantes que se hacen cumplir externamente (por ejemplo, mediante la ley de contratos ). Un juego no es cooperativo si los jugadores no pueden formar alianzas o si todos los acuerdos deben hacerse cumplir por sí mismos (por ejemplo, mediante amenazas creíbles ). [17]

Los juegos cooperativos suelen analizarse a través del marco de la teoría de juegos cooperativos , que se centra en predecir qué coaliciones se formarán, las acciones conjuntas que toman los grupos y los resultados colectivos resultantes. Es diferente de la teoría de juegos no cooperativos , que se centra en predecir las acciones y los resultados de los jugadores individuales mediante el análisis de los equilibrios de Nash . [18] [19]

La teoría de juegos cooperativos ofrece un enfoque de alto nivel, ya que describe únicamente la estructura y los beneficios de las coaliciones, mientras que la teoría de juegos no cooperativos también analiza cómo la interacción estratégica afectará la distribución de los beneficios. Como la teoría de juegos no cooperativos es más general, los juegos cooperativos pueden analizarse a través del enfoque de la teoría de juegos no cooperativos (no se cumple lo contrario), siempre que se hagan suficientes suposiciones para abarcar todas las posibles estrategias disponibles para los jugadores debido a la posibilidad de imposición externa de la cooperación.

Simétrico / asimétrico

Un juego simétrico es un juego en el que cada jugador gana el mismo premio al hacer la misma elección. En otras palabras, la identidad del jugador no cambia el juego resultante que enfrenta el otro jugador. [20] Muchos de los juegos 2×2 que se estudian comúnmente son simétricos. Las representaciones estándar de la gallina , el dilema del prisionero y la caza del ciervo son todos juegos simétricos.

Los juegos asimétricos que se estudian con más frecuencia son aquellos en los que no hay conjuntos de estrategias idénticos para ambos jugadores. Por ejemplo, el juego del ultimátum y, de forma similar, el juego del dictador tienen estrategias diferentes para cada jugador. Sin embargo, es posible que un juego tenga estrategias idénticas para ambos jugadores y, sin embargo, sea asimétrico. Por ejemplo, el juego que se muestra en el gráfico de esta sección es asimétrico a pesar de tener conjuntos de estrategias idénticos para ambos jugadores.

Suma cero / suma no cero

Los juegos de suma cero (más generalmente, juegos de suma constante) son juegos en los que las decisiones de los jugadores no pueden aumentar ni disminuir los recursos disponibles. En los juegos de suma cero, el beneficio total va a todos los jugadores en un juego, para cada combinación de estrategias, y siempre se suma a cero (más informalmente, un jugador se beneficia solo a expensas iguales de los demás). [21] El póquer ejemplifica un juego de suma cero (ignorando la posibilidad de la comisión de la casa), porque uno gana exactamente la cantidad que pierden sus oponentes. Otros juegos de suma cero incluyen los centavos de igual a igual y la mayoría de los juegos de mesa clásicos, incluidos Go y ajedrez .

Muchos juegos estudiados por los teóricos de juegos (incluido el famoso dilema del prisionero) son juegos de suma no cero, porque el resultado tiene resultados netos mayores o menores que cero. De manera informal, en los juegos de suma no cero, una ganancia de un jugador no necesariamente se corresponde con una pérdida de otro.

Además, los juegos de suma constante corresponden a actividades como el robo y el juego, pero no a la situación económica fundamental en la que existen ganancias potenciales derivadas del comercio . Es posible transformar cualquier juego de suma constante en un juego de suma cero (posiblemente asimétrico) añadiendo un jugador ficticio (a menudo llamado "el tablero") cuyas pérdidas compensan las ganancias netas de los jugadores.

Simultáneo / secuencial

Los juegos simultáneos son juegos en los que ambos jugadores se mueven simultáneamente o, en cambio, los jugadores posteriores no son conscientes de las acciones de los jugadores anteriores (lo que las hace efectivamente simultáneas). Los juegos secuenciales (o juegos dinámicos) son juegos en los que los jugadores no toman decisiones simultáneamente y las acciones anteriores de los jugadores afectan el resultado y las decisiones de los otros jugadores. [22] Esto no tiene por qué ser información perfecta sobre cada acción de los jugadores anteriores; puede ser muy poco conocimiento. Por ejemplo, un jugador puede saber que un jugador anterior no realizó una acción en particular, mientras que no sabe cuál de las otras acciones disponibles realizó realmente el primer jugador.

La diferencia entre juegos simultáneos y secuenciales se refleja en las diferentes representaciones que se han analizado anteriormente. A menudo, se utiliza la forma normal para representar juegos simultáneos, mientras que la forma extensiva se utiliza para representar juegos secuenciales. La transformación de la forma extensiva a la forma normal es unidireccional, lo que significa que varios juegos en forma extensiva corresponden a la misma forma normal. En consecuencia, las nociones de equilibrio para juegos simultáneos son insuficientes para razonar sobre juegos secuenciales; véase perfección de subjuegos .

En resumen, las diferencias entre juegos secuenciales y simultáneos son las siguientes:

Información perfecta e información imperfecta

Un juego de información imperfecta. La línea de puntos representa la ignorancia por parte del jugador 2, formalmente llamada conjunto de información .

Un subconjunto importante de los juegos secuenciales consiste en juegos de información perfecta. Un juego con información perfecta significa que todos los jugadores, en cada movimiento del juego, conocen el historial previo del juego y los movimientos realizados previamente por todos los demás jugadores. Un juego de información imperfecta se juega cuando los jugadores no conocen todos los movimientos ya realizados por el oponente, como un juego de movimientos simultáneos. [23] Ejemplos de juegos de información perfecta incluyen tres en raya , damas , ajedrez y Go . [24] [25] [26]

Muchos juegos de cartas son juegos de información imperfecta, como el póquer y el bridge . [27] La ​​información perfecta a menudo se confunde con la información completa , que es un concepto similar relacionado con el conocimiento común de la secuencia, las estrategias y los pagos de cada jugador a lo largo del juego. [28] La información completa requiere que cada jugador conozca las estrategias y los pagos disponibles para los otros jugadores, pero no necesariamente las acciones realizadas, mientras que la información perfecta es el conocimiento de todos los aspectos del juego y de los jugadores. [29] Sin embargo, los juegos de información incompleta se pueden reducir a juegos de información imperfecta introduciendo " movimientos por naturaleza ". [30]

Juego bayesiano

Uno de los supuestos del equilibrio de Nash es que cada jugador tiene creencias correctas sobre las acciones de los otros jugadores. Sin embargo, hay muchas situaciones en la teoría de juegos en las que los participantes no comprenden completamente las características de sus oponentes. Los negociadores pueden no ser conscientes de la valoración que hace su oponente del objeto de la negociación, las empresas pueden no ser conscientes de las funciones de costos de su oponente, los combatientes pueden no ser conscientes de las fortalezas de su oponente y los jurados pueden no ser conscientes de la interpretación que hace su colega de las pruebas en el juicio. En algunos casos, los participantes pueden conocer bien el carácter de su oponente, pero pueden no saber hasta qué punto su oponente conoce su propio carácter. [31]

Un juego bayesiano es un juego estratégico con información incompleta. En un juego estratégico, los que toman las decisiones son los jugadores, y cada jugador tiene un grupo de acciones. Una parte fundamental de la especificación de información imperfecta es el conjunto de estados. Cada estado describe completamente una colección de características relevantes para el jugador, como sus preferencias y detalles sobre ellas. Debe haber un estado para cada conjunto de características que algún jugador cree que pueden existir. [32]

Ejemplo de un juego bayesiano

Por ejemplo, cuando el Jugador 1 no está seguro de si el Jugador 2 preferiría salir con ella o alejarse de ella, mientras que el Jugador 2 entiende las preferencias del Jugador 1 como antes. Para ser más específico, supongamos que el Jugador 1 cree que el Jugador 2 quiere salir con ella bajo una probabilidad de 1/2 y alejarse de ella bajo una probabilidad de 1/2 (esta evaluación proviene probablemente de la experiencia del Jugador 1: se enfrenta a jugadores que quieren salir con ella la mitad del tiempo en tal caso y a jugadores que quieren evitarla la mitad del tiempo). Debido a la probabilidad involucrada, el análisis de esta situación requiere comprender la preferencia del jugador por el empate, aunque a las personas solo les interesa el equilibrio estratégico puro.

Juegos combinatorios

Los juegos en los que la dificultad de encontrar una estrategia óptima surge de la multiplicidad de movimientos posibles se denominan juegos combinatorios. Algunos ejemplos son el ajedrez y el Go . Los juegos que implican información imperfecta también pueden tener un fuerte carácter combinatorio, por ejemplo el backgammon . No existe una teoría unificada que aborde los elementos combinatorios en los juegos. Sin embargo, existen herramientas matemáticas que pueden resolver algunos problemas particulares y responder a algunas preguntas generales. [33]

Los juegos de información perfecta se han estudiado en la teoría de juegos combinatorios , que ha desarrollado representaciones novedosas, por ejemplo, números surrealistas , así como métodos de prueba combinatorios y algebraicos (y a veces no constructivos ) para resolver juegos de ciertos tipos, incluidos los juegos "bucles" que pueden dar lugar a secuencias de movimientos infinitamente largas. Estos métodos abordan juegos con una complejidad combinatoria mayor que los que se consideran habitualmente en la teoría de juegos tradicional (o "económica"). [34] [35] Un juego típico que se ha resuelto de esta manera es Hex . Un campo de estudio relacionado, que se basa en la teoría de la complejidad computacional , es la complejidad del juego , que se ocupa de estimar la dificultad computacional de encontrar estrategias óptimas. [36]

La investigación en inteligencia artificial ha abordado juegos de información tanto perfectos como imperfectos que tienen estructuras combinatorias muy complejas (como ajedrez, go o backgammon) para los que no se han encontrado estrategias óptimas demostrables. Las soluciones prácticas implican heurísticas computacionales, como la poda alfa-beta o el uso de redes neuronales artificiales entrenadas por aprendizaje de refuerzo , que hacen que los juegos sean más manejables en la práctica informática. [33] [37]

Juegos discretos y continuos

Gran parte de la teoría de juegos se ocupa de juegos finitos y discretos que tienen un número finito de jugadores, movimientos, eventos, resultados, etc. Sin embargo, muchos conceptos se pueden ampliar. Los juegos continuos permiten a los jugadores elegir una estrategia de un conjunto de estrategias continuas. Por ejemplo, la competición de Cournot se modela típicamente con las estrategias de los jugadores siendo cualquier cantidad no negativa, incluidas las cantidades fraccionarias.

Juegos diferenciales

Los juegos diferenciales como el juego de persecución continua y el juego de evasión son juegos continuos donde la evolución de las variables de estado de los jugadores está gobernada por ecuaciones diferenciales . El problema de encontrar una estrategia óptima en un juego diferencial está estrechamente relacionado con la teoría del control óptimo . En particular, existen dos tipos de estrategias: las estrategias de bucle abierto se encuentran utilizando el principio del máximo de Pontryagin mientras que las estrategias de bucle cerrado se encuentran utilizando el método de Programación Dinámica de Bellman .

Un caso particular de juegos diferenciales son los juegos con un horizonte temporal aleatorio . [38] En tales juegos, el tiempo terminal es una variable aleatoria con una función de distribución de probabilidad dada . Por lo tanto, los jugadores maximizan la expectativa matemática de la función de costo. Se demostró que el problema de optimización modificado puede reformularse como un juego diferencial descontado sobre un intervalo de tiempo infinito.

Teoría de juegos evolutiva

La teoría de juegos evolutiva estudia a los jugadores que ajustan sus estrategias a lo largo del tiempo según reglas que no son necesariamente racionales ni previsoras. [39] En general, la evolución de las estrategias a lo largo del tiempo según dichas reglas se modela como una cadena de Markov con una variable de estado como el perfil de estrategia actual o cómo se ha jugado el juego en el pasado reciente. Dichas reglas pueden incluir la imitación, la optimización o la supervivencia del más apto.

En biología, estos modelos pueden representar la evolución , en la que los descendientes adoptan las estrategias de sus padres y los padres que juegan estrategias más exitosas (es decir, que corresponden a mayores ganancias) tienen un mayor número de descendientes. En las ciencias sociales, estos modelos suelen representar el ajuste estratégico de los jugadores que juegan un juego muchas veces durante su vida y, consciente o inconscientemente, ocasionalmente ajustan sus estrategias. [40]

Resultados estocásticos (y relación con otros campos)

Los problemas de decisión individuales con resultados estocásticos a veces se consideran "juegos de un solo jugador". Pueden modelarse utilizando herramientas similares dentro de las disciplinas relacionadas de la teoría de la decisión , la investigación de operaciones y las áreas de inteligencia artificial , en particular la planificación de IA (con incertidumbre) y los sistemas multiagente . Aunque estos campos pueden tener diferentes motivadores, las matemáticas involucradas son sustancialmente las mismas, por ejemplo, utilizando procesos de decisión de Markov (MDP). [41]

Los resultados estocásticos también pueden modelarse en términos de teoría de juegos añadiendo un jugador que actúa aleatoriamente y hace "movimientos aleatorios" (" movimientos por naturaleza "). [42] Este jugador no suele considerarse un tercer jugador en lo que de otro modo sería un juego de dos jugadores, sino que simplemente sirve para proporcionar una tirada de dados cuando lo requiere el juego.

En el caso de algunos problemas, los distintos enfoques para modelar los resultados estocásticos pueden llevar a soluciones diferentes. Por ejemplo, la diferencia de enfoque entre los modelos de incertidumbre múltiple y la solución minimax es que esta última considera el peor de los casos para un conjunto de movimientos adversarios, en lugar de razonar en función de las expectativas sobre estos movimientos dada una distribución de probabilidad fija. El enfoque minimax puede ser ventajoso cuando no se dispone de modelos estocásticos de incertidumbre, pero también puede estar sobrestimando eventos extremadamente improbables (pero costosos), lo que hace que la estrategia se incline drásticamente en tales escenarios si se supone que un adversario puede forzar la ocurrencia de tal evento. [43] (Véase la teoría del cisne negro para más información sobre este tipo de problema de modelado, en particular en lo que se refiere a la predicción y limitación de pérdidas en la banca de inversión).

También se han estudiado modelos generales que incluyen todos los elementos de resultados estocásticos, adversarios y observabilidad parcial o ruidosa (de movimientos de otros jugadores). Se considera que el " estándar de oro " es el juego estocástico parcialmente observable (POSG), pero pocos problemas realistas son factibles computacionalmente en la representación POSG. [43]

Metajuegos

Se trata de juegos cuyo juego consiste en desarrollar las reglas de otro juego, el juego objetivo o sujeto. Los metajuegos buscan maximizar el valor de utilidad del conjunto de reglas desarrollado. La teoría de los metajuegos está relacionada con la teoría del diseño de mecanismos .

El término análisis del metajuego también se utiliza para referirse a un enfoque práctico desarrollado por Nigel Howard [44], según el cual una situación se enmarca como un juego estratégico en el que las partes interesadas intentan alcanzar sus objetivos mediante las opciones que tienen a su disposición. Desarrollos posteriores han llevado a la formulación del análisis de la confrontación .

Teoría de juegos de campo medio

La teoría de juegos de campo medio es el estudio de la toma de decisiones estratégicas en poblaciones muy grandes de pequeños agentes que interactúan entre sí. Esta clase de problemas fue considerada en la literatura económica por Boyan Jovanovic y Robert W. Rosenthal , en la literatura de ingeniería por Peter E. Caines y por los matemáticos Pierre-Louis Lions y Jean-Michel Lasry.

Representación de juegos

Los juegos que se estudian en la teoría de juegos son objetos matemáticos bien definidos. Para estar completamente definidos, un juego debe especificar los siguientes elementos: los jugadores del juego, la información y las acciones disponibles para cada jugador en cada punto de decisión y los pagos por cada resultado. (Eric Rasmusen se refiere a estos cuatro "elementos esenciales" con el acrónimo "PAPI"). [45] [46] [47] [48] Un teórico de juegos normalmente utiliza estos elementos, junto con un concepto de solución de su elección, para deducir un conjunto de estrategias de equilibrio para cada jugador de modo que, cuando se emplean estas estrategias, ningún jugador pueda beneficiarse desviándose unilateralmente de su estrategia. Estas estrategias de equilibrio determinan un equilibrio para el juego: un estado estable en el que se produce un resultado o un conjunto de resultados con una probabilidad conocida.

La mayoría de los juegos cooperativos se presentan en la forma de función característica, mientras que las formas extensiva y normal se utilizan para definir juegos no cooperativos.

Forma extensa

Un juego de formato extenso

La forma extensiva se puede utilizar para formalizar juegos con una secuencia temporal de movimientos. Los juegos en forma extensiva se pueden visualizar utilizando árboles de juego (como se muestra aquí). Aquí cada vértice (o nodo) representa un punto de elección para un jugador. El jugador se especifica mediante un número indicado por el vértice. Las líneas que salen del vértice representan una posible acción para ese jugador. Los pagos se especifican en la parte inferior del árbol. La forma extensiva se puede ver como una generalización para varios jugadores de un árbol de decisiones . [49] Para resolver cualquier juego en forma extensiva, se debe utilizar la inducción hacia atrás . Implica trabajar hacia atrás en el árbol de juego para determinar qué haría un jugador racional en el último vértice del árbol, qué haría el jugador con el movimiento anterior dado que el jugador con el último movimiento es racional, y así sucesivamente hasta que se alcanza el primer vértice del árbol. [50]

El juego ilustrado consta de dos jugadores. La forma en que está estructurado este juego en particular (es decir, con toma de decisiones secuencial e información perfecta), el Jugador 1 "mueve" primero al elegir F o U (justo o injusto). A continuación en la secuencia, el Jugador 2 , que ahora ha observado el movimiento del Jugador 1 , puede elegir jugar A o R (aceptar o rechazar). Una vez que el Jugador 2 ha hecho su elección, el juego se considera terminado y cada jugador obtiene su respectivo pago, representado en la imagen como dos números, donde el primer número representa el pago del Jugador 1 y el segundo número representa el pago del Jugador 2. Supongamos que el Jugador 1 elige U y luego el Jugador 2 elige A : el Jugador 1 obtiene un pago de "ocho" (que en términos del mundo real se puede interpretar de muchas maneras, la más simple de las cuales es en términos de dinero, pero podría significar cosas como ocho días de vacaciones u ocho países conquistados o incluso ocho oportunidades más para jugar el mismo juego contra otros jugadores) y el Jugador 2 obtiene un pago de "dos".

La forma extensiva también puede capturar partidas de movimientos simultáneos y partidas con información imperfecta. Para representarla, se puede trazar una línea de puntos que conecta los diferentes vértices para representarlos como parte del mismo conjunto de información (es decir, los jugadores no saben en qué punto se encuentran) o bien se dibuja una línea cerrada alrededor de ellos (véase el ejemplo en la sección de información imperfecta).

Forma normal

El juego normal (o en su forma estratégica) suele representarse mediante una matriz que muestra los jugadores, las estrategias y los pagos (véase el ejemplo de la derecha). De forma más general, puede representarse mediante cualquier función que asocie un pago para cada jugador con cada combinación posible de acciones. En el ejemplo adjunto hay dos jugadores; uno elige la fila y el otro elige la columna. Cada jugador tiene dos estrategias, que se especifican mediante el número de filas y el número de columnas. Los pagos se proporcionan en el interior. El primer número es el pago recibido por el jugador de la fila (Jugador 1 en nuestro ejemplo); el segundo es el pago para el jugador de la columna (Jugador 2 en nuestro ejemplo). Supongamos que el Jugador 1 juega Arriba y que el Jugador 2 juega Izquierda . Entonces el Jugador 1 obtiene un pago de 4 y el Jugador 2 obtiene 3.

Cuando un juego se presenta en forma normal, se supone que cada jugador actúa simultáneamente o, al menos, sin conocer las acciones del otro. Si los jugadores tienen alguna información sobre las elecciones de los otros jugadores, el juego suele presentarse en forma extensa.

Todo juego en forma extensiva tiene un juego en forma normal equivalente, sin embargo, la transformación a la forma normal puede resultar en un aumento exponencial del tamaño de la representación, volviéndola computacionalmente impráctica. [51]

Forma de función característica

En la teoría de juegos cooperativos, la función característica enumera los beneficios de cada coalición. El origen de esta formulación se encuentra en el libro de John von Neumann y Oskar Morgenstern. [ cita requerida ]

Formalmente, una función característica es una función [52] del conjunto de todas las posibles coaliciones de jugadores a un conjunto de pagos, y también satisface . La función describe cuánto pago colectivo puede obtener un conjunto de jugadores al formar una coalición.

Representaciones alternativas de juegos

Se utilizan formas de representación de juegos alternativas para algunas subclases de juegos o se ajustan a las necesidades de la investigación interdisciplinaria. [53] Además de las representaciones de juegos clásicas, algunas de las representaciones alternativas también codifican aspectos relacionados con el tiempo.

Usos generales y aplicados

Como método de matemáticas aplicadas , la teoría de juegos se ha utilizado para estudiar una amplia variedad de comportamientos humanos y animales. Inicialmente se desarrolló en economía para comprender una gran colección de comportamientos económicos, incluidos los comportamientos de las empresas, los mercados y los consumidores. El primer uso del análisis de teoría de juegos fue por parte de Antoine Augustin Cournot en 1838 con su solución del duopolio de Cournot . El uso de la teoría de juegos en las ciencias sociales se ha expandido y la teoría de juegos también se ha aplicado a los comportamientos políticos, sociológicos y psicológicos. [68]

Aunque los naturalistas anteriores al siglo XX, como Charles Darwin, hicieron afirmaciones de tipo teórico de juegos, el uso del análisis teórico de juegos en biología comenzó con los estudios de Ronald Fisher sobre el comportamiento animal durante la década de 1930. Este trabajo es anterior al nombre de "teoría de juegos", pero comparte muchas características importantes con este campo. Los avances en economía fueron aplicados posteriormente a la biología en gran medida por John Maynard Smith en su libro de 1982 Evolution and the Theory of Games . [69]

Además de usarse para describir, predecir y explicar el comportamiento, la teoría de juegos también se ha utilizado para desarrollar teorías de comportamiento ético o normativo y para prescribir dicho comportamiento. [70] En economía y filosofía , los académicos han aplicado la teoría de juegos para ayudar a comprender el comportamiento bueno o apropiado. También se han sugerido enfoques de teoría de juegos en la filosofía del lenguaje y la filosofía de la ciencia . [71] Los argumentos de teoría de juegos de este tipo se pueden encontrar desde Platón . [72] Una versión alternativa de la teoría de juegos, llamada teoría de juegos químicos , representa las elecciones del jugador como moléculas reactivas químicas metafóricas llamadas "conocimientos". [73]  La teoría de juegos químicos luego calcula los resultados como soluciones de equilibrio para un sistema de reacciones químicas.

Descripción y modelado

Un juego de ciempiés de cuatro etapas

El uso principal de la teoría de juegos es describir y modelar cómo se comportan las poblaciones humanas. [ cita requerida ] Algunos [ ¿ quiénes? ] académicos creen que al encontrar los equilibrios de los juegos pueden predecir cómo se comportarán las poblaciones humanas reales cuando se enfrentan a situaciones análogas al juego en estudio. Esta visión particular de la teoría de juegos ha sido criticada. Se argumenta que las suposiciones hechas por los teóricos de juegos a menudo se violan cuando se aplican a situaciones del mundo real. Los teóricos de juegos generalmente asumen que los jugadores actúan racionalmente, pero en la práctica, la racionalidad y/o el comportamiento humano a menudo se desvían del modelo de racionalidad tal como se usa en la teoría de juegos. Los teóricos de juegos responden comparando sus suposiciones con las utilizadas en física . Por lo tanto, si bien sus suposiciones no siempre se cumplen, pueden tratar la teoría de juegos como un ideal científico razonable similar a los modelos utilizados por los físicos . Sin embargo, el trabajo empírico ha demostrado que en algunos juegos clásicos, como el juego del ciempiés , adivina 2/3 del juego promedio, y el juego del dictador , las personas regularmente no juegan equilibrios de Nash. Existe un debate en curso sobre la importancia de estos experimentos y si el análisis de los mismos captura plenamente todos los aspectos de la situación relevante. [b]

Algunos teóricos de juegos, siguiendo el trabajo de John Maynard Smith y George R. Price , han recurrido a la teoría de juegos evolutiva para resolver estos problemas. Estos modelos presuponen la inexistencia de racionalidad o una racionalidad limitada por parte de los jugadores. A pesar del nombre, la teoría de juegos evolutiva no presupone necesariamente la selección natural en el sentido biológico. La teoría de juegos evolutiva incluye tanto la evolución biológica como la cultural y también modelos de aprendizaje individual (por ejemplo, dinámicas de juego ficticias ).

Análisis prescriptivo o normativo

Algunos investigadores consideran la teoría de juegos no como una herramienta predictiva del comportamiento de los seres humanos, sino como una sugerencia de cómo debería comportarse la gente. Dado que una estrategia, correspondiente a un equilibrio de Nash de un juego, constituye la mejor respuesta a las acciones de los otros jugadores –siempre que se encuentren en (el mismo) equilibrio de Nash–, parece apropiado utilizar una estrategia que forme parte de un equilibrio de Nash. Este uso normativo de la teoría de juegos también ha sido objeto de críticas. [75]

Ciencias económicas

La teoría de juegos es un método importante utilizado en economía matemática y negocios para modelar comportamientos competitivos de agentes que interactúan . [c] [76] [77] [78] Las aplicaciones incluyen una amplia gama de fenómenos y enfoques económicos, como subastas , negociaciones , fusiones y adquisiciones , fijación de precios, [79] división justa , duopolios , oligopolios , formación de redes sociales , economía computacional basada en agentes , [80] [81] equilibrio general , diseño de mecanismos, [82] [83 ] [84] [85] [86] y sistemas de votación ; [87] y en áreas tan amplias como la economía experimental, [88] [89] [90] [91] [92] la economía del comportamiento , [93] [94] [95] [96] [97] [98] la economía de la información , [45] [46] [47] [48] la organización industrial , [99] [100] [101] [102] y la economía política . [103] [104] [105] [47]

Esta investigación se centra generalmente en conjuntos particulares de estrategias conocidas como "conceptos de solución" o "equilibrios" . Un supuesto común es que los jugadores actúan racionalmente. En los juegos no cooperativos, el más famoso de ellos es el equilibrio de Nash. Un conjunto de estrategias es un equilibrio de Nash si cada una representa una mejor respuesta a las otras estrategias. Si todos los jugadores están jugando las estrategias en un equilibrio de Nash, no tienen ningún incentivo unilateral para desviarse, ya que su estrategia es lo mejor que pueden hacer dado lo que están haciendo los demás. [106] [107]

Los pagos del juego generalmente se consideran representativos de la utilidad de los jugadores individuales.

Un artículo prototípico sobre la teoría de juegos en economía comienza presentando un juego que es una abstracción de una situación económica particular. Se eligen uno o más conceptos de solución y el autor demuestra qué conjuntos de estrategias en el juego presentado son equilibrios del tipo apropiado. Los economistas y profesores de negocios sugieren dos usos principales (mencionados anteriormente): descriptivo y prescriptivo . [70]

Economía gerencial

La teoría de juegos también tiene un uso extensivo en una rama o corriente específica de la economía: la economía gerencial . Un uso importante de la misma en el campo de la economía gerencial es el análisis de interacciones estratégicas entre empresas. [108] Por ejemplo, las empresas pueden estar compitiendo en un mercado con recursos limitados, y la teoría de juegos puede ayudar a los gerentes a comprender cómo sus decisiones afectan a sus competidores y los resultados generales del mercado. La teoría de juegos también se puede utilizar para analizar la cooperación entre empresas, como en la formación de alianzas estratégicas o empresas conjuntas. Otro uso de la teoría de juegos en la economía gerencial es el análisis de las estrategias de precios. Por ejemplo, las empresas pueden utilizar la teoría de juegos para determinar la estrategia de precios óptima en función de cómo esperan que sus competidores respondan a sus decisiones de precios. En general, la teoría de juegos sirve como una herramienta útil para analizar las interacciones estratégicas y la toma de decisiones en el contexto de la economía gerencial.

Negocio

El Chartered Institute of Procurement & Supply (CIPS) promueve el conocimiento y el uso de la teoría de juegos en el contexto de las compras empresariales . [109] El CIPS y los socios de TWS han llevado a cabo una serie de encuestas diseñadas para explorar la comprensión, el conocimiento y la aplicación de la teoría de juegos entre los profesionales de las compras . Algunos de los principales hallazgos de su tercera encuesta anual (2019) incluyen:

Gestión de proyectos

La toma de decisiones sensata es fundamental para el éxito de los proyectos. En la gestión de proyectos, la teoría de juegos se utiliza para modelar el proceso de toma de decisiones de los participantes, como inversores, directores de proyectos, contratistas, subcontratistas, gobiernos y clientes. Muy a menudo, estos participantes tienen intereses en pugna y, a veces, sus intereses son directamente perjudiciales para otros participantes, lo que hace que los escenarios de gestión de proyectos sean adecuados para ser modelados mediante la teoría de juegos.

Piraveenan (2019) [111] en su revisión proporciona varios ejemplos en los que se utiliza la teoría de juegos para modelar escenarios de gestión de proyectos. Por ejemplo, un inversor normalmente tiene varias opciones de inversión, y cada opción probablemente dará como resultado un proyecto diferente, y por lo tanto una de las opciones de inversión tiene que ser elegida antes de que se pueda producir el acta de constitución del proyecto. De manera similar, cualquier proyecto grande que involucre subcontratistas, por ejemplo, un proyecto de construcción, tiene una interacción compleja entre el contratista principal (el gerente del proyecto) y los subcontratistas, o entre los propios subcontratistas, que normalmente tiene varios puntos de decisión. Por ejemplo, si hay una ambigüedad en el contrato entre el contratista y el subcontratista, cada uno debe decidir con qué fuerza impulsar su caso sin poner en peligro todo el proyecto y, por lo tanto, su propia participación en él. De manera similar, cuando se lanzan proyectos de organizaciones competidoras, el personal de marketing tiene que decidir cuál es el mejor momento y la mejor estrategia para comercializar el proyecto, o su producto o servicio resultante, de modo que pueda ganar la máxima tracción frente a la competencia. En cada uno de estos escenarios, las decisiones requeridas dependen de las decisiones de otros jugadores que, de alguna manera, tienen intereses en competencia con los intereses del que toma las decisiones y, por lo tanto, pueden modelarse idealmente utilizando la teoría de juegos.

Piraveenan [111] resume que los juegos de dos jugadores se utilizan predominantemente para modelar escenarios de gestión de proyectos y, en función de la identidad de estos jugadores, se utilizan cinco tipos distintos de juegos en la gestión de proyectos.

En términos de tipos de juegos, tanto los cooperativos como los no cooperativos, los de forma normal como los de forma extensiva, y los de suma cero como los de suma distinta de cero se utilizan para modelar varios escenarios de gestión de proyectos.

Ciencia política

La aplicación de la teoría de juegos a la ciencia política se centra en las áreas superpuestas de la división justa , la economía política , la elección pública , la negociación de guerra , la teoría política positiva y la teoría de la elección social . En cada una de estas áreas, los investigadores han desarrollado modelos de teoría de juegos en los que los jugadores suelen ser votantes, estados, grupos de intereses especiales y políticos. [112]

Anthony Downs ofrece ejemplos tempranos de la teoría de juegos aplicada a la ciencia política . En su libro de 1957 An Economic Theory of Democracy [113] , aplica el modelo de ubicación de empresas de Hotelling al proceso político. En el modelo downsiano, los candidatos políticos se comprometen con ideologías en un espacio político unidimensional. Downs primero muestra cómo los candidatos políticos convergerán hacia la ideología preferida por el votante medio si los votantes están completamente informados, pero luego argumenta que los votantes eligen permanecer racionalmente ignorantes, lo que permite la divergencia de candidatos. La teoría de juegos se aplicó en 1962 a la Crisis de los Misiles de Cuba durante la presidencia de John F. Kennedy. [114]

También se ha propuesto que la teoría de juegos explica la estabilidad de cualquier forma de gobierno político. Tomando el caso más simple de una monarquía, por ejemplo, el rey, al ser una sola persona, no mantiene ni puede mantener su autoridad ejerciendo personalmente el control físico sobre todos sus súbditos o incluso sobre un número significativo de ellos. El control soberano se explica, en cambio, por el reconocimiento por parte de cada ciudadano de que todos los demás ciudadanos esperan que los demás vean al rey (u otro gobierno establecido) como la persona cuyas órdenes serán acatadas. La coordinación de la comunicación entre ciudadanos para reemplazar al soberano está efectivamente prohibida, ya que la conspiración para reemplazar al soberano es generalmente punible como un delito. [115] Así, en un proceso que puede modelarse mediante variantes del dilema del prisionero, durante períodos de estabilidad ningún ciudadano encontrará racional actuar para reemplazar al soberano, incluso si todos los ciudadanos saben que estarían mejor si actuaran todos colectivamente. [ cita requerida ]

Una explicación teórica de la paz democrática es que el debate público y abierto en las democracias envía información clara y fiable sobre sus intenciones a otros Estados. En cambio, es difícil saber cuáles son las intenciones de los líderes no democráticos, qué efecto tendrán las concesiones y si se cumplirán las promesas. Por lo tanto, habrá desconfianza y renuencia a hacer concesiones si al menos una de las partes en disputa no es una democracia. [116]

Sin embargo, la teoría de juegos predice que dos países pueden ir a la guerra aun cuando sus líderes sean conscientes de los costos de la lucha. La guerra puede ser resultado de información asimétrica; dos países pueden tener incentivos para distorsionar la cantidad de recursos militares que tienen a mano, lo que los vuelve incapaces de resolver las disputas de manera agradable sin recurrir a la lucha. Además, la guerra puede surgir debido a problemas de compromiso: si dos países desean resolver una disputa por medios pacíficos, pero cada uno desea incumplir los términos de ese acuerdo, es posible que no tengan otra opción que recurrir a la guerra. Finalmente, la guerra puede ser resultado de indivisibilidades de cuestiones. [117]

La teoría de juegos también podría ayudar a predecir las respuestas de una nación cuando hay una nueva regla o ley que se debe aplicar a esa nación. Un ejemplo es la investigación de Peter John Wood (2013) que investigó lo que las naciones podrían hacer para ayudar a reducir el cambio climático. Wood pensó que esto podría lograrse mediante la celebración de tratados con otras naciones para reducir las emisiones de gases de efecto invernadero . Sin embargo, concluyó que esta idea no podría funcionar porque crearía un dilema del prisionero para las naciones. [118]

Ciencia y tecnología de defensa

La teoría de juegos se ha utilizado ampliamente para modelar escenarios de toma de decisiones relevantes para aplicaciones de defensa. [119] La mayoría de los estudios que han aplicado la teoría de juegos en entornos de defensa se ocupan de la guerra de mando y control, y pueden clasificarse además en estudios que tratan de (i) guerra de asignación de recursos (ii) guerra de información (iii) guerra de control de armas, y (iv) guerra de monitoreo del adversario. [119] Muchos de los problemas estudiados están relacionados con la detección y el seguimiento, por ejemplo, un buque de superficie que intenta rastrear a un submarino hostil y el submarino que intenta evadir ser rastreado, y la toma de decisiones interdependiente que tiene lugar con respecto al rumbo, la velocidad y la tecnología de sensores activada por ambos buques. Ho et al. [119] proporciona un resumen conciso del estado del arte con respecto al uso de la teoría de juegos en aplicaciones de defensa y destaca los beneficios y limitaciones de la teoría de juegos en los escenarios considerados.

Biología

A diferencia de lo que ocurre en la economía, en biología los beneficios de los juegos suelen interpretarse como correspondientes a la aptitud . Además, se ha prestado menos atención a los equilibrios que corresponden a una noción de racionalidad y más a los que se mantendrían mediante fuerzas evolutivas. El equilibrio más conocido en biología se conoce como estrategia evolutivamente estable (ESS), introducida por primera vez en (Maynard Smith y Price 1973). Aunque su motivación inicial no implicaba ninguno de los requisitos mentales del equilibrio de Nash, cada ESS es un equilibrio de Nash.

En biología, la teoría de juegos se ha utilizado como modelo para comprender muchos fenómenos diferentes. Se utilizó por primera vez para explicar la evolución (y estabilidad) de la proporción aproximada de sexos de 1:1 . (Fisher 1930) sugirió que la proporción de sexos de 1:1 es el resultado de fuerzas evolutivas que actúan sobre individuos que podrían ser vistos como tratando de maximizar su número de nietos.

Además, los biólogos han utilizado la teoría de juegos evolutivos y la ESS para explicar el surgimiento de la comunicación animal . [120] El análisis de los juegos de señalización y otros juegos de comunicación ha proporcionado información sobre la evolución de la comunicación entre animales. Por ejemplo, el comportamiento de acoso de muchas especies, en el que una gran cantidad de animales presa atacan a un depredador más grande, parece ser un ejemplo de organización emergente espontánea. También se ha demostrado que las hormigas exhiben un comportamiento de retroalimentación similar a la moda (ver Butterfly Economics de Paul Ormerod ).

Los biólogos han utilizado el juego de la gallina para analizar el comportamiento de lucha y la territorialidad. [121]

Según Maynard Smith, en el prefacio de Evolution and the Theory of Games , «paradójicamente, ha resultado que la teoría de juegos se aplica más fácilmente a la biología que al campo del comportamiento económico para el que fue diseñada originalmente». La teoría de juegos evolutiva se ha utilizado para explicar muchos fenómenos aparentemente incongruentes de la naturaleza. [122]

Uno de estos fenómenos se conoce como altruismo biológico . Se trata de una situación en la que un organismo parece actuar de una manera que beneficia a otros organismos y es perjudicial para sí mismo. Esto se distingue de las nociones tradicionales de altruismo porque tales acciones no son conscientes, sino que parecen ser adaptaciones evolutivas para aumentar la aptitud general. Se pueden encontrar ejemplos en especies que van desde los murciélagos vampiros que regurgitan la sangre que han obtenido de una noche de caza y se la dan a los miembros del grupo que no han podido alimentarse, hasta las abejas obreras que cuidan a la abeja reina durante toda su vida y nunca se aparean, hasta los monos verdes que advierten a los miembros del grupo de la aproximación de un depredador, incluso cuando pone en peligro la posibilidad de supervivencia de ese individuo. [123] Todas estas acciones aumentan la aptitud general de un grupo, pero se producen a un costo para el individuo.

La teoría de juegos evolutiva explica este altruismo con la idea de la selección de parentesco . Los altruistas discriminan entre los individuos a los que ayudan y favorecen a los parientes. La regla de Hamilton explica la lógica evolutiva detrás de esta selección con la ecuación c < b × r , donde el costo c para el altruista debe ser menor que el beneficio b para el receptor multiplicado por el coeficiente de parentesco r . Cuanto más estrechamente relacionados estén dos organismos, más aumentan las incidencias del altruismo porque comparten muchos de los mismos alelos. Esto significa que el individuo altruista, al asegurarse de que los alelos de su pariente cercano se transmitan a través de la supervivencia de su descendencia, puede renunciar a la opción de tener descendencia porque se transmite el mismo número de alelos. Por ejemplo, ayudar a un hermano (en animales diploides) tiene un coeficiente de 12 , porque (en promedio) un individuo comparte la mitad de los alelos en la descendencia de su hermano. Asegurarse de que una cantidad suficiente de la descendencia de un hermano sobreviva hasta la edad adulta excluye la necesidad de que el individuo altruista produzca descendencia. [123] Los valores de los coeficientes dependen en gran medida del alcance del campo de juego; por ejemplo, si la elección de a quién favorecer incluye a todos los seres vivos genéticos, no solo a todos los parientes, suponemos que la discrepancia entre todos los humanos solo representa aproximadamente el 1% de la diversidad en el campo de juego, un coeficiente que era 12 en el campo más pequeño se convierte en 0,995. De manera similar, si se considera que la información distinta a la de naturaleza genética (por ejemplo, epigenética, religión, ciencia, etc.) persistió a través del tiempo, el campo de juego se vuelve aún más grande y las discrepancias más pequeñas.

Informática y lógica

La teoría de juegos ha llegado a desempeñar un papel cada vez más importante en la lógica y en la ciencia informática . Varias teorías lógicas tienen una base en la semántica de los juegos . Además, los científicos informáticos han utilizado juegos para modelar cálculos interactivos . Asimismo, la teoría de juegos proporciona una base teórica al campo de los sistemas multiagente . [124]

Por otra parte, la teoría de juegos ha desempeñado un papel en los algoritmos en línea ; en particular, el problema del servidor k , que en el pasado se ha denominado juegos con costos móviles y juegos de solicitud-respuesta . [125] El principio de Yao es una técnica de teoría de juegos para demostrar límites inferiores en la complejidad computacional de algoritmos aleatorios , especialmente algoritmos en línea.

La aparición de Internet ha motivado el desarrollo de algoritmos para encontrar equilibrios en juegos, mercados, subastas computacionales, sistemas peer-to-peer y mercados de seguridad e información. La teoría de juegos algorítmicos [86] y, dentro de ella, el diseño de mecanismos algorítmicos [85] combinan el diseño de algoritmos computacionales y el análisis de sistemas complejos con la teoría económica. [126] [127] [128]

La teoría de juegos tiene múltiples aplicaciones en el campo de la inteligencia artificial y el aprendizaje automático. A menudo se utiliza para desarrollar sistemas autónomos que pueden tomar decisiones complejas en entornos inciertos. [129] Algunas otras áreas de aplicación de la teoría de juegos en el contexto de la IA/ML son las siguientes: formación de sistemas multiagente, aprendizaje de refuerzo, [130] diseño de mecanismos, etc. [131] Al utilizar la teoría de juegos para modelar el comportamiento de otros agentes y anticipar sus acciones, los sistemas de IA/ML pueden tomar mejores decisiones y funcionar de manera más eficaz. [132]

Filosofía

La teoría de juegos ha sido utilizada de diversas formas en filosofía . En respuesta a dos artículos de WVO Quine  (1960, 1967), Lewis (1969) utilizó la teoría de juegos para desarrollar una explicación filosófica de las convenciones . Al hacerlo, proporcionó el primer análisis del conocimiento común y lo empleó para analizar el juego en juegos de coordinación . Además, fue el primero en sugerir que uno puede entender el significado en términos de juegos de señalización . Esta última sugerencia ha sido perseguida por varios filósofos desde Lewis. [133] [134] Siguiendo la explicación de las convenciones desde la teoría de juegos de Lewis (1969), Edna Ullmann-Margalit (1977) y Bicchieri (2006) han desarrollado teorías de las normas sociales que las definen como equilibrios de Nash que resultan de transformar un juego de motivos mixtos en un juego de coordinación. [135] [136]

La teoría de juegos también ha desafiado a los filósofos a pensar en términos de epistemología interactiva : qué significa para un colectivo tener creencias o conocimientos comunes, y cuáles son las consecuencias de este conocimiento para los resultados sociales resultantes de las interacciones de los agentes. Entre los filósofos que han trabajado en esta área se incluyen Bicchieri (1989, 1993), [137] [138] Skyrms (1990), [139] y Stalnaker (1999). [140]

La síntesis de la teoría de juegos con la ética fue defendida por RB Braithwaite . [141] La esperanza era que un análisis matemático riguroso de la teoría de juegos pudiera ayudar a formalizar las discusiones filosóficas más imprecisas. Sin embargo, esta expectativa solo se materializó en una medida limitada. [142]

En ética , algunos autores (entre los que destacan David Gauthier, Gregory Kavka y Jean Hampton) [¿ quiénes? ] han intentado seguir el proyecto de Thomas Hobbes de derivar la moralidad del interés propio. Dado que juegos como el dilema del prisionero presentan un aparente conflicto entre la moralidad y el interés propio, explicar por qué el interés propio requiere cooperación es un componente importante de este proyecto. Esta estrategia general es un componente de la visión general del contrato social en la filosofía política (para ejemplos, véase Gauthier (1986) y Kavka (1986)). [d]

Otros autores han intentado utilizar la teoría de juegos evolutiva para explicar el surgimiento de actitudes humanas sobre la moralidad y las conductas animales correspondientes. Estos autores analizan varios juegos, entre ellos el dilema del prisionero, la caza del ciervo y el juego de negociación de Nash , como una explicación del surgimiento de actitudes sobre la moralidad (véase, por ejemplo, Skyrms (1996, 2004) y Sober y Wilson (1998)).

Epidemiología

Dado que la decisión de vacunarse contra una enfermedad en particular suele ser tomada por individuos que pueden considerar una variedad de factores y parámetros al tomar esta decisión (como la incidencia y prevalencia de la enfermedad, los riesgos percibidos y reales asociados con contraer la enfermedad, la tasa de mortalidad, los riesgos percibidos y reales asociados con la vacunación y el costo financiero de la vacunación), la teoría de juegos se ha utilizado para modelar y predecir la aceptación de la vacunación en una sociedad. [143] [144]

Ejemplos conocidos de juegos

El dilema del prisionero

William Poundstone describió el juego en su libro de 1993 El dilema del prisionero: [145]

Dos miembros de una banda criminal, A y B, son arrestados y encarcelados. Cada prisionero se encuentra en régimen de aislamiento sin ningún medio de comunicación con su compañero. El cargo principal conllevaría una sentencia de diez años de prisión; sin embargo, la policía no tiene pruebas para una condena. Planean condenar a ambos a dos años de prisión por un cargo menor, pero ofrecen a cada prisionero un trato fáustico: si uno de ellos confiesa el crimen del cargo principal, traicionar al otro, será indultado y podrá irse, mientras que el otro deberá cumplir la totalidad de la sentencia en lugar de solo dos años por el cargo menor.

La estrategia dominante (y por lo tanto la mejor respuesta a cualquier posible estrategia del oponente), es traicionar al otro, lo que se alinea con el principio de lo seguro . [146] Sin embargo, que ambos prisioneros permanezcan en silencio produciría una recompensa mayor para ambos que la traición mutua.

Batalla de los sexos

La "batalla de los sexos" es un término que se utiliza para describir el conflicto percibido entre hombres y mujeres en diversas áreas de la vida, como las relaciones, las carreras y los roles sociales. Este conflicto se suele representar en la cultura popular, como en películas y programas de televisión, como una competencia humorística o dramática entre los géneros. Este conflicto se puede representar en un marco de teoría de juegos. Este es un ejemplo de juegos no cooperativos.

Un ejemplo de la “batalla de los sexos” se puede ver en la representación de las relaciones en los medios de comunicación populares, donde los hombres y las mujeres suelen ser representados como seres fundamentalmente diferentes y en conflicto entre sí. Por ejemplo, en algunas comedias románticas, los protagonistas masculinos y femeninos se muestran con puntos de vista opuestos sobre el amor y las relaciones, y tienen que superar estas diferencias para estar juntos. [147]

En este juego, hay dos equilibrios de Nash de estrategia pura: uno en el que ambos jugadores eligen la misma estrategia y el otro en el que los jugadores eligen diferentes opciones. Si el juego se juega con estrategias mixtas, donde cada jugador elige su estrategia al azar, entonces hay un número infinito de equilibrios de Nash. Sin embargo, en el contexto del juego de la "batalla de los sexos", se suele suponer que el juego se juega con estrategias puras. [148]

Juego del ultimátum

El juego del ultimátum es un juego que se ha convertido en un instrumento popular de experimentación económica . Una de sus primeras descripciones es la del premio Nobel John Harsanyi en 1961. [149]

Un jugador, el proponente, recibe una suma de dinero. El proponente tiene la tarea de dividirla con otro jugador, el respondedor (que sabe cuál es la suma total). Una vez que el proponente comunica su decisión, el respondedor puede aceptarla o rechazarla. Si el respondedor acepta, el dinero se divide según la propuesta; si el respondedor rechaza, ambos jugadores no reciben nada. Ambos jugadores saben de antemano las consecuencias de que el respondedor acepte o rechace la oferta. El juego demuestra cómo la aceptación social, la justicia y la generosidad influyen en las decisiones de los jugadores. [150]

El juego del ultimátum tiene una variante, el juego del dictador. En su mayor parte son idénticos, excepto que en el juego del dictador el que responde no tiene poder para rechazar la oferta del proponente.

Juego de confianza

El juego de la confianza es un experimento diseñado para medir la confianza en las decisiones económicas. También se lo denomina "el juego de la inversión" y está diseñado para investigar la confianza y demostrar su importancia en lugar de la "racionalidad" del interés propio. El juego fue diseñado por Berg Joyce, John Dickhaut y Kevin McCabe en 1995. [151]

En el juego, un jugador (el inversor) recibe una suma de dinero y debe decidir cuánto le dará a otro jugador (el fiduciario). El experimentador triplica la cantidad entregada y el fiduciario decide entonces cuánto de la cantidad triplicada le devolverá al inversor. Si el receptor está completamente interesado en sí mismo, no debería devolver nada. Sin embargo, esto no es así en el experimento. Los resultados sugieren que las personas están dispuestas a depositar una confianza, arriesgando cierta cantidad de dinero, con la creencia de que habrá reciprocidad. [152]

Concurso Cournot

El modelo de competencia de Cournot implica que los jugadores eligen la cantidad de un producto homogéneo para producir de forma independiente y simultánea, donde el costo marginal puede ser diferente para cada empresa y la recompensa de la empresa es la ganancia. Los costos de producción son información pública y la empresa apunta a encontrar la cantidad que maximiza la ganancia con base en lo que cree que la otra empresa producirá y se comportará como monopolios. En este juego, las empresas quieren producir en la cantidad de monopolio, pero hay un alto incentivo para desviarse y producir más, lo que disminuye el precio de equilibrio del mercado. [23] Por ejemplo, las empresas pueden verse tentadas a desviarse de la cantidad de monopolio si hay una cantidad de monopolio baja y un precio alto, con el objetivo de aumentar la producción para maximizar la ganancia. [23] Sin embargo, esta opción no proporciona la recompensa más alta, ya que la capacidad de una empresa para maximizar las ganancias depende de su participación de mercado y la elasticidad de la demanda del mercado. [153] El equilibrio de Cournot se alcanza cuando cada empresa opera en su función de reacción sin incentivo para desviarse, ya que tienen la mejor respuesta en función de la producción de las otras empresas. [23] Dentro del juego, las empresas alcanzan el equilibrio de Nash cuando se alcanza el equilibrio de Cournot.

Equilibrio para la competencia cuantitativa de Cournot

Concurso Bertrand

La competencia de Bertrand supone productos homogéneos y un coste marginal constante, y los participantes eligen los precios. [23] El equilibrio de la competencia de precios se da cuando el precio es igual a los costes marginales, suponiendo que se dispone de información completa sobre los costes de los competidores. Por tanto, las empresas tienen un incentivo para desviarse del equilibrio porque un producto homogéneo con un precio más bajo obtendrá toda la cuota de mercado, lo que se conoce como ventaja de costes. [154]

En la cultura popular

Véase también

Liza

Notas

  1. ^ Aunque el conocimiento común fue discutido por primera vez por el filósofo David Lewis en su tesis (y posterior libro) Convención a fines de la década de 1960, no fue ampliamente considerado por los economistas hasta el trabajo de Robert Aumann en la década de 1970.
  2. ^ El trabajo experimental en teoría de juegos tiene muchos nombres: economía experimental , economía conductual y teoría de juegos conductual son algunos de ellos. [74]
  3. ^ En JEL:C7 del Journal of Economic Literature, códigos de clasificación.
  4. ^ Para una discusión más detallada del uso de la teoría de juegos en la ética, véase la entrada sobre teoría de juegos y ética de la Enciclopedia de Filosofía de Stanford.

Referencias

  1. ^ ab Myerson, Roger B. (1991). Teoría de juegos: análisis del conflicto . Harvard University Press . ISBN 9780674341166.
  2. ^ Shapley, Lloyd S.; Shubik, Martin (1 de enero de 1971). «Capítulo 1, Introducción, El uso de modelos». Teoría de juegos en economía. Archivado desde el original el 23 de abril de 2023. Consultado el 23 de abril de 2023 .
  3. ^ Neumann, John von; Morgenstern, Oskar (8 de abril de 2007). Teoría de juegos y comportamiento económico. Princeton University Press. ISBN 978-0-691-13061-3Archivado desde el original el 28 de marzo de 2023 . Consultado el 23 de abril de 2023 .
  4. ^ Nisan (2020). "Reseña del libro: Teoría de juegos y comportamiento económico (von Neumann & Morgenstern)". lesswrong.com .
  5. ^ Khan, Faisal Shah; Solmeyer, Neal; Balu, Radhakrishnan; Humble, Travis S. (noviembre de 2018). "Juegos cuánticos: una revisión de la historia, el estado actual y la interpretación". Procesamiento de información cuántica . 17 (11): 309. Bibcode :2018QuIP...17..309K. doi :10.1007/s11128-018-2082-8.
  6. ^ Martin, Brian (1978). "La utilidad selectiva de la teoría de juegos". Estudios sociales de la ciencia . 8 (1): 85–110. doi :10.1177/030631277800800103. JSTOR  284857. Sin embargo, las técnicas matemáticas utilizadas en la teoría de juegos están orientadas a la consecución de un único objetivo: la maximización del "nivel de seguridad", donde el nivel de seguridad es la cantidad mínima que un jugador puede recibir de una elección de estrategia.
  7. ^ Shafer, G. (diciembre de 2018). Fundamentos teóricos de juegos de Pascal y Huygens para la probabilidad . Conferencia Sarton, Facultad de Arquitectura e Ingeniería, Universidad de Gante. [1]
  8. ^ Bellhouse, David R. (2007), "El problema de Waldegrave" (PDF) , Journal Électronique d'Histoire des Probabilités et de la Statistique [ Revista electrónica de historia y estadística de la probabilidad ], 3 (2), archivado (PDF) del original el 20 de agosto de 2008
  9. ^ Bellhouse, David R. (2015). "Le Her y otros problemas de probabilidad analizados por Bernoulli, Montmort y Waldegrave". Ciencia estadística . 30 (1). Instituto de Estadística Matemática : 26–39. arXiv : 1504.01950 . Código Bibliográfico :2015arXiv150401950B. doi :10.1214/14-STS469. S2CID  59066805.
  10. ^ Zermelo, Ernst (1913). Hobson, EW; Love, AEH (eds.). Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels [ Sobre una aplicación de la teoría de conjuntos a la teoría del juego de ajedrez ] (PDF) . Actas del Quinto Congreso Internacional de Matemáticos (1912) (en alemán). Cambridge: Cambridge University Press. págs. 501–504. Archivado desde el original (PDF) el 31 de julio de 2020 . Consultado el 29 de agosto de 2019 .
  11. ^ Kim, Sungwook, ed. (2014). Aplicaciones de la teoría de juegos en el diseño de redes. IGI Global. p. 3. ISBN 978-1-4666-6051-9.
  12. ^ von Neumann, Juan (1928). "Zur Theorie der Gesellschaftsspiele" [Sobre la teoría de los juegos de estrategia]. Mathematische Annalen [ Anales de Matemáticas ] (en alemán). 100 (1): 295–320. doi :10.1007/BF01448847. S2CID  122961988.
  13. ^ von Neumann, John (1959). "Sobre la teoría de los juegos de estrategia". En Tucker, AW; Luce, RD (eds.). Contribuciones a la teoría de los juegos . Vol. 4. Traducido por Bargmann, Sonya. Princeton, Nueva Jersey : Princeton University Press . pp. 13–42. ISBN 0-691-07937-4.
  14. ^ Mirowski, Philip (1992). "¿Qué intentaban lograr von Neumann y Morgenstern?". En Weintraub, E. Roy (ed.). Hacia una historia de la teoría de juegos . Durham: Duke University Press. págs. 113-147. ISBN 978-0-8223-1253-6.
  15. ^ Leonard, Robert (2010), Von Neumann, Morgenstern y la creación de la teoría de juegos , Nueva York: Cambridge University Press, doi :10.1017/CBO9780511778278, ISBN 978-0-521-56266-9
  16. ^ Kuhn, Steven (4 de septiembre de 1997). Zalta, Edward N. (ed.). "El dilema del prisionero". Stanford Encyclopedia of Philosophy . Universidad de Stanford. Archivado desde el original el 18 de enero de 2012. Consultado el 3 de enero de 2013 .
  17. ^ Shor, Mike. «Juego no cooperativo». GameTheory.net . Archivado desde el original el 1 de abril de 2014. Consultado el 15 de septiembre de 2016 .
  18. ^ Chandrasekaran, Ramaswamy. "Teoría de juegos cooperativos" (PDF) . Universidad de Texas en Dallas. Archivado (PDF) del original el 18 de abril de 2016.
  19. ^ Brandenburger, Adam. «Teoría de juegos cooperativos: funciones características, asignaciones, contribución marginal» (PDF) . Archivado desde el original (PDF) el 29 de agosto de 2017. Consultado el 14 de abril de 2020 .
  20. ^ Shor, Mike (2006). "Juego simétrico". Game Theory.net .
  21. ^ Owen, Guillermo (1995). Teoría de juegos: Tercera edición . Bingley: Emerald Group Publishing. pág. 11. ISBN. 978-0-12-531151-9.
  22. ^ Chang, Kuang-Hua (2015). "Decisiones en el diseño de ingeniería". Teoría y métodos de diseño con CAD/CAE . págs. 39-101. doi :10.1016/b978-0-12-398512-5.00002-5. ISBN 978-0-12-398512-5.
  23. ^ abcde Gibbons, Robert (1992). Teoría de juegos para economistas aplicados . Princeton, Nueva Jersey: Princeton University Press. pp. 14-17. ISBN 0-691-04308-6.
  24. ^ Ferguson, Thomas S. "Teoría de juegos" (PDF) . Departamento de Matemáticas de la UCLA. pp. 56–57. Archivado (PDF) desde el original el 30 de julio de 2004.
  25. ^ Mycielski, Jan (1992). "Juegos con información perfecta". Manual de teoría de juegos con aplicaciones económicas . Vol. 1. págs. 41–70. doi :10.1016/S1574-0005(05)80006-2. ISBN 978-0-4448-8098-7.
  26. ^ "Ajedrez infinito". Serie Infinite de PBS . 2 de marzo de 2017. Archivado desde el original el 28 de octubre de 2021.Información perfecta definida a las 0:25, con fuentes académicas arXiv :1302.4377 y arXiv :1510.08155.
  27. ^ Owen, Guillermo (1995). Teoría de juegos: Tercera edición . Bingley: Emerald Group Publishing. pág. 4. ISBN. 978-0-12-531151-9.
  28. ^ Mirman, Leonard J. (1989). "Información perfecta". Teoría de juegos . pp. 194–198. doi :10.1007/978-1-349-20181-5_22. ISBN . 978-0-333-49537-7.
  29. ^ Mirman, Leonard (1989). Perfect Information . Londres: Palgrave Macmillan. Págs. 194-195. ISBN. 978-1-349-20181-5.
  30. ^ Shoham y Leyton-Brown (2008), pág. 60.
  31. ^ Osborne, Martin J. (2000). Introducción a la teoría de juegos . Oxford University Press. págs. 271–272.
  32. ^ Osborne, Martin J (2020). Introducción a la teoría de juegos . Oxford University Press. págs. 271–277.
  33. ^ de Jörg Bewersdorff (2005). "31". Suerte, lógica y mentiras piadosas: las matemáticas de los juegos . AK Peters, Ltd., págs. ix-xii. ISBN 978-1-56881-210-6.
  34. ^ Albert, Michael H .; Nowakowski, Richard J.; Wolfe, David (2007), Lecciones de juego: Introducción a la teoría de juegos combinatorios , AK Peters Ltd, págs. 3-4, ISBN 978-1-56881-277-9
  35. ^ Beck, József (2008). Juegos combinatorios: teoría del tres en raya . Cambridge University Press. págs. 1–3. ISBN 978-0-521-46100-9.
  36. ^ Hearn, Robert A. ; Demaine, Erik D. (2009), Juegos, rompecabezas y computación , AK Peters, Ltd., ISBN 978-1-56881-322-6
  37. ^ Jones, M. Tim (2008). Inteligencia artificial: un enfoque de sistemas . Jones & Bartlett Learning. pp. 106–118. ISBN 978-0-7637-7337-3.
  38. ^ Petrosjan, LA; Murzov, NV (1966). "Problemas de mecánica basados ​​en la teoría de juegos". Litovsk. Mat. Sb. (en ruso). 6 : 423–433.
  39. ^ Newton, Jonathan (2018). "Teoría de juegos evolutiva: un renacimiento". Juegos . 9 (2): 31. doi : 10.3390/g9020031 . hdl : 10419/179191 .
  40. ^ Webb (2007).
  41. ^ Lozovanu, D; Pickl, S (2015). Un enfoque teórico de juegos para los procesos de decisión de Markov, los juegos posicionales estocásticos y los modelos de control multicriterio . Springer, Cham. ISBN 978-3-319-11832-1.
  42. ^ Osborne y Rubinstein (1994).
  43. ^ ab McMahan, Hugh Brendan (2006). Planificación robusta en dominios con resultados estocásticos, adversarios y observabilidad parcial (PDF) (tesis doctoral). Universidad Carnegie Mellon. págs. 3-4. Archivado (PDF) desde el original el 1 de abril de 2011.
  44. ^ Howard (1971).
  45. ^ de Rasmusen, Eric (2007). Juegos e información (4.ª ed.). Wiley. ISBN 978-1-4051-3666-2.
  46. ^ ab Kreps, David M. (1990). Teoría de juegos y modelado económico . Oxford University Press. doi :10.1093/0198283814.001.0001. ISBN 978-0-19-828381-2.[ página necesaria ]
  47. ^ abc Aumann, RJ; Hart, S., eds. (1992). Manual de teoría de juegos con aplicaciones económicas . Elsevier. ISBN 978-0-444-89427-4.[ página necesaria ]
  48. ^ ab Aumann, Robert J.; Heifetz, Aviad (2002). "Capítulo 43 Información incompleta". Manual de teoría de juegos con aplicaciones económicas, volumen 3. Vol. 3. págs. 1665–1686. doi :10.1016/S1574-0005(02)03006-0. ISBN 978-0-444-89428-1.
  49. ^ Fudenberg, dibujó; Tirole, Jean (1991). Teoría de juegos . Prensa del MIT. pag. 67.ISBN 978-0-262-06141-4.
  50. ^ Williams, Paul D. (2013). Estudios de seguridad: una introducción (segunda edición). Abingdon : Routledge. págs. 55–56.
  51. ^ Shoham y Leyton-Brown (2008), pág. 35.
  52. ^ denota el conjunto potencia de .
  53. ^ Tagiew, Rustam (3 de mayo de 2011). "Si se necesita algo más que un modelo analítico para predecir la interacción estratégica de los agentes reales". arXiv : 1105.0558 [cs.GT].
  54. ^ Rosenthal, Robert W. (diciembre de 1973). "Una clase de juegos que poseen equilibrios de Nash de estrategia pura". Revista Internacional de Teoría de Juegos . 2 (1): 65–67. doi :10.1007/BF01737559. S2CID  121904640.
  55. ^ Koller, Daphne ; Megiddo, Nimrod ; von Stengel, Bernhard (1994). "Algoritmos rápidos para encontrar estrategias aleatorias en árboles de juego". Actas del vigésimo sexto simposio anual de la ACM sobre teoría de la computación – STOC '94 . págs. 750–759. doi :10.1145/195058.195451. ISBN 0-89791-663-8. Número de identificación del sujeto  1893272.
  56. ^ Alur, Rajeev; Dill, David L. (abril de 1994). "Una teoría de autómatas temporizados". Ciencias Informáticas Teóricas . 126 (2): 183–235. doi : 10.1016/0304-3975(94)90010-8 .
  57. ^ Tomlin, CJ; Lygeros, J.; Shankar Sastry, S. (julio de 2000). "Un enfoque teórico de juegos para el diseño de controladores para sistemas híbridos". Actas del IEEE . 88 (7): 949–970. doi :10.1109/5.871303. S2CID  1844682.
  58. ^ Koller, Daphne; Pfeffer, Avi (julio de 1997). "Representaciones y soluciones para problemas de teoría de juegos". Inteligencia artificial . 94 (1–2): 167–215. doi :10.1016/S0004-3702(97)00023-4.
  59. ^ Michael, Michael Kearns; Littman, Michael L. (2001). "Modelos gráficos para la teoría de juegos". En UAI : 253–260. CiteSeerX 10.1.1.22.5705 . 
  60. ^ Kearns, Michael; Littman, Michael L.; Singh, Satinder (7 de marzo de 2011). "Modelos gráficos para la teoría de juegos". arXiv : 1301.2281 [cs.GT].
  61. ^ Leyton-Brown, Kevin; Tennenholtz, Moshe (2005). Juegos de efectos locales (PDF) . Actas del seminario Dagstuhl. Schloss Dagstuhl-Leibniz-Zentrum für Informatik . Consultado el 3 de febrero de 2023 .
  62. ^ Genesereth, Michael; Love, Nathaniel; Pell, Barney (15 de junio de 2005). "Juegos generales: descripción general de la competencia AAAI". AI Magazine . 26 (2): 62. doi :10.1609/aimag.v26i2.1813.
  63. ^ Clempner, Julio (2006). "Modelado de juegos de caminos más cortos con redes de Petri: una teoría basada en Lyapunov". Revista Internacional de Matemática Aplicada y Ciencias de la Computación . 16 (3): 387–397.
  64. ^ Sannikov, Yuliy (septiembre de 2007). "Juegos con acciones imperfectamente observables en tiempo continuo" (PDF) . Econometrica . 75 (5): 1285–1329. doi :10.1111/j.1468-0262.2007.00795.x.
  65. ^ Tagiew, Rustam (diciembre de 2008). "Juegos de Petri multiagente". Conferencia internacional de 2008 sobre inteligencia computacional para modelado, control y automatización . pp. 130–135. doi :10.1109/CIMCA.2008.15. ISBN 978-0-7695-3514-2. Número de identificación del sujeto  16679934.
  66. ^ Tagiew, Rustam (2009). "Sobre modelos de redes de Petri multiagente para el cálculo de juegos finitos extensivos". Nuevos desafíos en inteligencia colectiva computacional . Estudios en inteligencia computacional. Vol. 244. Springer. págs. 243–254. doi :10.1007/978-3-642-03958-4_21. ISBN . 978-3-642-03957-7.
  67. ^ Bhat, Navin; Leyton-Brown, Kevin (11 de julio de 2012). "Cálculo de equilibrios de Nash de juegos de gráficos de acción". arXiv : 1207.4128 [cs.GT].
  68. ^ Larson, Jennifer M. (11 de mayo de 2021). «Redes de conflicto y cooperación». Revista anual de ciencia política . 24 (1): 89–107. doi : 10.1146/annurev-polisci-041719-102523 .
  69. ^ Friedman, Daniel (1998). "Sobre las aplicaciones económicas de la teoría de juegos evolutiva" (PDF) . Journal of Evolutionary Economics . 8 : 14–53. Archivado (PDF) desde el original el 11 de febrero de 2014.
  70. ^ ab Camerer, Colin F. (2003). "1.1 ¿Para qué sirve la teoría de juegos?". Teoría de juegos conductual: experimentos en interacción estratégica. pp. 5–7. Archivado desde el original el 14 de mayo de 2011.
  71. ^ Bruin, Boudewijn de (septiembre de 2005). "Teoría de juegos en filosofía". Topoi . 24 (2): 197–208. doi :10.1007/s11245-005-5055-3.
  72. ^ Ross, Don (10 de marzo de 2006). "Teoría de juegos". En Zalta, Edward N. (ed.). Stanford Encyclopedia of Philosophy . Universidad de Stanford . Consultado el 21 de agosto de 2008 .
  73. ^ Velegol, Darrell; Suhey, Paul; Connolly, John; Morrissey, Natalie; Cook, Laura (17 de octubre de 2018). "Teoría de juegos químicos". Investigación en química industrial e ingeniería . 57 (41): 13593–13607. doi :10.1021/acs.iecr.8b03835. S2CID  105204747.
  74. ^ Camerer, Colin F. (2003). "Introducción". Teoría de juegos conductuales: experimentos en interacción estratégica. pp. 1–25. Archivado desde el original el 14 de mayo de 2011.
  75. ^ Kadane, Joseph B.; Larkey, Patrick D. (diciembre de 1983). "La confusión entre lo que es y lo que debería ser en contextos teóricos de juegos". Management Science . 29 (12): 1365–1379. doi :10.1287/mnsc.29.12.1365.
  76. ^ Aumann, Robert J. (2008). «teoría de juegos». The New Palgrave Dictionary of Economics (2.ª ed.). Archivado desde el original el 15 de mayo de 2011. Consultado el 22 de agosto de 2011 .
  77. ^ Shubik, Martin (1981). "Modelos y métodos de teoría de juegos en economía política". En Arrow, Kenneth ; Intriligator, Michael (eds.). Handbook of Mathematical Economics, v. 1. 1. Vol. 1. págs. 285–330. doi :10.1016/S1573-4382(81)01011-4. ISBN 978-0-444-86126-9.
  78. ^ Shapiro, Carl (primavera de 1989). "La teoría de la estrategia empresarial". Revista RAND de Economía . 20 (1). Wiley : 125–137. JSTOR  2555656. PMID  10296625..
  79. ^ Agarwal, N.; Zeephongsekul, P. (11–12 de diciembre de 2011). Fijación psicológica de precios en fusiones y adquisiciones mediante la teoría de juegos (PDF) . 19.° Congreso Internacional sobre Modelado y Simulación. Perth . Consultado el 3 de febrero de 2023 .
  80. ^ Tesfatsion, Leigh (2006). Economía computacional basada en agentes: un enfoque constructivo de la teoría económica . Manual de economía computacional. Vol. 2. págs. 831–880. doi :10.1016/S1574-0021(05)02016-2. ISBN 978-0-444-51253-6.
  81. ^ Joseph Y. Halpern (2008). "Ciencia informática y teoría de juegos". Diccionario de economía New Palgrave .
  82. ^ Myerson, Roger B. (2008). «Mechanism Design». The New Palgrave Dictionary of Economics . Archivado desde el original el 23 de noviembre de 2011. Consultado el 4 de agosto de 2011 .
  83. ^ Myerson, Roger B. (2008). «principio de revelación». The New Palgrave Dictionary of Economics . Archivado desde el original el 16 de mayo de 2013. Consultado el 4 de agosto de 2011 .
  84. ^ Sandholm, Tuomas (2008). «Computación en el diseño de mecanismos». Diccionario de economía New Palgrave . Archivado desde el original el 23 de noviembre de 2011. Consultado el 5 de diciembre de 2011 .
  85. ^ ab Nisan, Noam; Ronen, Amir (abril de 2001). "Diseño de mecanismos algorítmicos". Juegos y comportamiento económico . 35 (1–2): 166–196. doi :10.1006/game.1999.0790.
  86. ^ ab Nisán, Noam ; Jardín áspero, Tim; Tardós, Eva; Vazirani, Vijay V., eds. (2007). Teoría algorítmica de juegos . Prensa de la Universidad de Cambridge . ISBN 9780521872829. Número de serie LCCN  2007014231.
  87. ^ Brams, Steven J. (1994). Capítulo 30 Procedimientos de votación . Manual de teoría de juegos con aplicaciones económicas. Vol. 2. págs. 1055–1089. doi :10.1016/S1574-0005(05)80062-1. ISBN 978-0-444-89427-4.y Moulin, Hervé (1994). Capítulo 31 Elección social . Manual de teoría de juegos con aplicaciones económicas. Vol. 2. págs. 1091–1125. doi :10.1016/S1574-0005(05)80063-3. ISBN 978-0-444-89427-4.
  88. ^ Smith, Vernon L. (diciembre de 1992). "Teoría de juegos y economía experimental: comienzos y primeras influencias". Historia de la economía política . 24 (suplemento): 241–282. doi :10.1215/00182702-24-Suplemento-241.
  89. ^ Smith, Vernon L. (2001). "Experimental Economics". Enciclopedia Internacional de las Ciencias Sociales y del Comportamiento . pp. 5100–5108. doi :10.1016/B0-08-043076-7/02232-4. ISBN 978-0-08-043076-8.
  90. ^ Plott, Charles R.; Smith, Vernon L., eds. (2008). Manual de resultados de economía experimental . Elsevier. ISBN 978-0-08-088796-8.[ página necesaria ]
  91. ^ Vincent P. Crawford (1997). "Teoría y experimentación en el análisis de la interacción estratégica", en Advances in Economics and Econometrics: Theory and Applications , pp. 206–242 Archivado el 1 de abril de 2012 en Wayback Machine . Cambridge. Reimpreso en Colin F. Camerer et al ., ed. (2003). Advances in Behavioral Economics , Princeton. Artículos de 1986–2003. Descripción Archivado el 18 de enero de 2012 en Wayback Machine , vista previa, Princeton, cap. 12
  92. ^ Shubik, Martin (2002). "Capítulo 62 Teoría de juegos y juegos experimentales". Manual de teoría de juegos con aplicaciones económicas, volumen 3. Vol. 3. págs. 2327–2351. doi :10.1016/S1574-0005(02)03025-4. ISBN 978-0-444-89428-1.
  93. ^ El nuevo diccionario Palgrave de economía . 2008.Faruk Gul . "Economía conductual y teoría de juegos". Resumen. Archivado el 7 de agosto de 2017 en Wayback Machine.
  94. ^ Camerer, Colin F. (2008). «teoría de juegos conductual». The New Palgrave Dictionary of Economics . Archivado desde el original el 23 de noviembre de 2011. Consultado el 4 de agosto de 2011 .
  95. ^ Camerer, Colin F. (1997). "Progreso en la teoría de juegos conductuales". Revista de perspectivas económicas . 11 (4): 172. doi :10.1257/jep.11.4.167.
  96. ^ Camerer, Colin F. (2003). Teoría de juegos conductuales . Princeton.Descripción Archivado el 14 de mayo de 2011 en Wayback Machine , vista previa Archivado el 26 de marzo de 2023 en Wayback Machine ([ctrl]+) y enlace al cap. 1 Archivado el 4 de julio de 2013 en Wayback Machine .
  97. ^ Camerer, Colin F.; Loewenstein, George; Rabin, Matthew, eds. (2011). Avances en economía del comportamiento . Princeton University Press. ISBN 978-1-4008-2911-8.[ página necesaria ]
  98. ^ Fudenberg, Drew (2006). "Avanzando más allá de los avances en economía del comportamiento". Revista de literatura económica . 44 (3): 694–711. doi :10.1257/jel.44.3.694. JSTOR  30032349. S2CID  3490729.
  99. ^ Tirole, Jean (1988). La teoría de la organización industrial . MIT Press.Descripción y enlaces a vistas previas de capítulos, págs. vii–ix, "Organización general", págs. 5–6, y "Teoría de juegos no cooperativos: Manual del usuario", cap. 11, págs. 423–59.
  100. ^ Bagwell, Kyle; Wolinsky, Asher (2002). "Teoría de juegos y organización industrial". Manual de teoría de juegos con aplicaciones económicas, volumen 3. Vol. 3. págs. 1851–1895. doi :10.1016/S1574-0005(02)03012-6. ISBN 978-0-444-89428-1.
  101. ^ Fels, EM (1961). "Revisión de la estrategia y la estructura del mercado: competencia, oligopolio y la teoría de los juegos". Weltwirtschaftliches Archiv . 87 : 12–14. JSTOR  40434883.
  102. ^ Reid, Gavin C. (1982). "Revisión de la estructura y el comportamiento del mercado". The Economic Journal . 92 (365): 200–202. doi :10.2307/2232276. JSTOR  2232276.
  103. ^ Martin Shubik (1981). "Modelos y métodos de teoría de juegos en economía política", en Handbook of Mathematical Economics , v. 1, págs. 285-330 doi :10.1016/S1573-4382(81)01011-4.
  104. ^ Martin Shubik (1987). Un enfoque teórico de juegos para la economía política . MIT Press. Descripción. Archivado el 29 de junio de 2011 en Wayback Machine.
  105. ^ Martin Shubik (1978). "Teoría de juegos: aplicaciones económicas", en W. Kruskal y JM Tanur, ed., International Encyclopedia of Statistics , v. 2, págs. 372-78.
  106. ^ Christen, Markus (1 de julio de 1998). «Modelo de teoría de juegos para examinar las dos disyuntivas en la adquisición de información para lograr un equilibrio cuidadoso». INSEAD . Archivado desde el original el 24 de mayo de 2013. Consultado el 1 de julio de 2012 .
  107. ^ Chevalier-Roignant, Benoît; Trigeorgis, Lenos (15 de febrero de 2012). «Options Games: Balancing the trade-off between flexibilidad and compromiso». The European Financial Review . Archivado desde el original el 20 de junio de 2013. Consultado el 3 de enero de 2013 .
  108. ^ Wilkinson, Nick (2005). "Teoría de juegos". Economía gerencial . pp. 331–381. doi :10.1017/CBO9780511810534.015. ISBN . 978-0-521-81993-0.
  109. ^ "Los socios de CIPS y TWS promueven la teoría de juegos en el escenario global". 27 de noviembre de 2020. Archivado desde el original el 27 de noviembre de 2020. Consultado el 20 de abril de 2023 .
  110. ^ CIPS (2021), Game Theory Archivado el 11 de abril de 2021 en Wayback Machine , CIPS en conjunto con TWS Partners, consultado el 11 de abril de 2021
  111. ^ ab Piraveenan, Mahendra (2019). "Aplicaciones de la teoría de juegos en la gestión de proyectos: una revisión y análisis estructurados". Matemáticas . 7 (9): 858. doi : 10.3390/math7090858 .
  112. ^ "Lo que la teoría de juegos nos dice sobre la política y la sociedad". MIT News | Massachusetts Institute of Technology . 4 de diciembre de 2018. Archivado desde el original el 23 de abril de 2023 . Consultado el 23 de abril de 2023 .
  113. ^ Bajos (1957).
  114. ^ Brams, Steven J. (1 de enero de 2001). «Teoría de juegos y la crisis de los misiles cubanos». Revista Plus . Archivado desde el original el 24 de abril de 2015. Consultado el 31 de enero de 2016 .
  115. ^ "Cómo la teoría de juegos explica el comportamiento 'irracional'". MIT Sloan . Archivado desde el original el 23 de abril de 2023 . Consultado el 23 de abril de 2023 .
  116. ^ Levy, Gilat; Razin, Ronny (marzo de 2004). "Se necesitan dos: una explicación de la paz democrática". Revista de la Asociación Económica Europea . 2 (1): 1–29. doi :10.1162/154247604323015463.
  117. ^ Fearon, James D. (1 de enero de 1995). "Explicaciones racionalistas de la guerra". Organización Internacional . 49 (3): 379–414. doi :10.1017/s0020818300033324. JSTOR  2706903. S2CID  38573183.
  118. ^ Wood, Peter John (febrero de 2011). "Cambio climático y teoría de juegos". Anales de la Academia de Ciencias de Nueva York . 1219 (1): 153–170. Bibcode :2011NYASA1219..153W. doi :10.1111/j.1749-6632.2010.05891.x. PMID  21332497.
  119. ^ abc Ho, Edwin; Rajagopalan, Arvind; Skvortsov, Alex; Arulampalam, Sanjeev; Piraveenan, Mahendra (28 de enero de 2022). "Teoría de juegos en aplicaciones de defensa: una revisión". Sensores . 22 (3): 1032. arXiv : 2111.01876 . Bibcode :2022Senso..22.1032H. doi : 10.3390/s22031032 . PMC 8838118 . PMID  35161778. 
  120. ^ Harper y Maynard Smith (2003).
  121. ^ Maynard Smith, John (1974). "La teoría de los juegos y la evolución de los conflictos animales" (PDF) . Revista de biología teórica . 47 (1): 209–221. Bibcode :1974JThBi..47..209M. doi :10.1016/0022-5193(74)90110-6. PMID  4459582.
  122. ^ Alexander, J. McKenzie (19 de julio de 2009). «Teoría de juegos evolutiva». En Zalta, Edward N. (ed.). Stanford Encyclopedia of Philosophy . Universidad de Stanford . Consultado el 3 de enero de 2013 .
  123. ^ ab Okasha, Samir (3 de junio de 2003). "Altruismo biológico". En Zalta, Edward N. (ed.). Stanford Encyclopedia of Philosophy . Universidad de Stanford . Consultado el 3 de enero de 2013 .
  124. ^ Shoham, Yoav; Leyton-Brown, Kevin (2008). Sistemas multiagente: fundamentos algorítmicos, lógicos y de teoría de juegos . Cambridge University Press. ISBN 978-1-139-47524-2.[ página necesaria ]
  125. ^ Ben-David y otros (1994).
  126. ^ Halpern, Joseph Y. (2008). "Ciencia informática y teoría de juegos". Diccionario de economía New Palgrave (2.ª ed.).
  127. ^ Shoham, Yoav (agosto de 2008). "Ciencia informática y teoría de juegos". Comunicaciones de la ACM . 51 (8): 74–79. doi :10.1145/1378704.1378721.
  128. ^ Littman, Amy; Littman, Michael L. (2007). "Introducción al número especial sobre aprendizaje y teoría de juegos computacional". Aprendizaje automático . 67 (1–2): 3–6. doi : 10.1007/s10994-007-0770-1 . S2CID  22635389.
  129. ^ Hanley, John T. (14 de diciembre de 2021). «GAMES, teoría de juegos e inteligencia artificial». Revista de análisis y logística de defensa . 5 (2): 114–130. doi : 10.1108/JDAL-10-2021-0011 .
  130. ^ Alberto, Stefano V.; Cristianos, Filippos; Schäfer, Lukas (2024). Aprendizaje por refuerzo de múltiples agentes: fundamentos y enfoques modernos . Prensa del MIT. ISBN 978-0-262-04937-5.[ página necesaria ]
  131. ^ Parashar, Nilesh (15 de agosto de 2022). "¿Qué es la teoría de juegos en IA?". Medium .
  132. ^ Hazra, Tanmoy; Anjaria, Kushal (marzo de 2022). "Aplicaciones de la teoría de juegos en el aprendizaje profundo: una encuesta". Herramientas y aplicaciones multimedia . 81 (6): 8963–8994. doi :10.1007/s11042-022-12153-2. PMC 9039031 . PMID  35496996. 
  133. ^ Skyrms (1996)
  134. ^ Grim y otros (2004).
  135. ^ Ullmann-Margalit, E. (1977), El surgimiento de las normas, Oxford University Press, ISBN 978-0-19-824411-0[ página necesaria ]
  136. ^ Bicchieri, Cristina (2006), La gramática de la sociedad: la naturaleza y la dinámica de las normas sociales , Cambridge University Press, ISBN 978-0-521-57372-6[ página necesaria ]
  137. ^ Bicchieri, Cristina (1989). "Teorías autorrefutables de la interacción estratégica: una paradoja del conocimiento común". Erkenntnis . 30 (1–2): 69–85. doi :10.1007/BF00184816. S2CID  120848181.
  138. ^ Bicchieri, Cristina (1993), Racionalidad y coordinación , Cambridge University Press , ISBN 978-0-521-57444-0
  139. ^ Skyrms, Brian (1990), La dinámica de la deliberación racional , Harvard University Press, ISBN 978-0-674-21885-7
  140. ^ Stalnaker, Robert (octubre de 1996). "Conocimiento, creencia y razonamiento contrafáctico en los juegos". Economía y filosofía . 12 (2): 133–163. doi :10.1017/S0266267100004132.
  141. ^ Braithwaite, Richard Bevan (1955). La teoría de los juegos como herramienta del filósofo moral. Conferencia inaugural pronunciada en Cambridge el 2 de diciembre de 1954. University Press. ISBN 978-0-521-11351-9.[ página necesaria ]
  142. ^ Kuhn, Steven T. (julio de 2004). "Reflexiones sobre ética y teoría de juegos". Synthese . 141 (1): 1–44. doi :10.1023/B:SYNT.0000035846.91195.cb.
  143. ^ Chang, Sheryl L.; Piraveenan, Mahendra; Pattison, Philippa; Prokopenko, Mikhail (2020). "Modelado teórico de juegos de la dinámica de enfermedades infecciosas y métodos de intervención: una revisión". Revista de dinámica biológica . 14 (1): 57–89. arXiv : 1901.04143 . Código Bibliográfico :2020JBioD..14...57C. doi :10.1080/17513758.2020.1720322. PMID  31996099.
  144. ^ Roberts, Siobhan (20 de diciembre de 2020). «'La pandemia es un juego de dilema del prisionero'». The New York Times .
  145. ^ Poundstone 1993, págs. 8, 117.
  146. ^ Rapoport, Anatol (1987). "El dilema del prisionero". Diccionario de economía New Palgrave . pp. 1–5. doi :10.1057/978-1-349-95121-5_1850-1. ISBN . 978-1-349-95121-5.
  147. ^ "Batalla de los sexos | Historia, participantes y hechos | Britannica". www.britannica.com . Archivado desde el original el 23 de abril de 2023 . Consultado el 23 de abril de 2023 .
  148. ^ Athenarium (12 de agosto de 2020). «Batalla de sexos: equilibrio de Nash en estrategias mixtas de coordinación». Athenarium . Archivado desde el original el 23 de abril de 2023 . Consultado el 23 de abril de 2023 .
  149. ^ Harsanyi, John C. (junio de 1961). "Sobre los postulados de racionalidad que subyacen a la teoría de los juegos cooperativos". Journal of Conflict Resolution . 5 (2): 179–196. doi :10.1177/002200276100500205.
  150. ^ Aoki, Ryuta; Yomogida, Yukihito; Matsumoto, Kenji (enero de 2015). "Las bases neuronales para valorar la igualdad social". Investigación en neurociencia . 90 : 33–40. doi :10.1016/j.neures.2014.10.020. PMID  25452125.
  151. ^ Berg, Joyce; Dickhaut, John; McCabe, Kevin (julio de 1995). "Confianza, reciprocidad e historia social". Juegos y comportamiento económico . 10 (1): 122–142. doi :10.1006/game.1995.1027.
  152. ^ Johnson, Noel D.; Mislin, Alexandra A. (octubre de 2011). "Juegos de confianza: un metaanálisis". Revista de psicología económica . 32 (5): 865–889. doi :10.1016/j.joep.2011.05.007.
  153. ^ "Equilibrio de Cournot (Nash)". OCDE . 18 de abril de 2013. Archivado desde el original el 23 de mayo de 2021 . Consultado el 20 de abril de 2021 .
  154. ^ Spulber, Daniel F. (1995). "Competencia Bertrand cuando los costos de los rivales son desconocidos". The Journal of Industrial Economics . 43 (1): 1–11. doi :10.2307/2950422. JSTOR  2950422.
  155. ^ Nasar, Sylvia (1998) Una mente maravillosa , Simon & Schuster. ISBN 0-684-81906-6
  156. ^ Singh, Simon (14 de junio de 1998). "Entre el genio y la locura". The New York Times .
  157. ^ Heinlein, Robert A. (1959), Soldados de la nave espacial
  158. ^ Dr. Strangelove o cómo aprendí a dejar de preocuparme y amar la bomba. 29 de enero de 1964. 51 minutos. ... ¡es que se pierde todo el sentido de la máquina del fin del mundo si la mantienes en secreto!
  159. ^ Guzmán, Rafer (6 de marzo de 1996). «Star on hold: Faithful following, meager sales» (Estrella en espera: seguidores fieles, escasas ventas). Pacific Sun. Archivado desde el original el 6 de noviembre de 2013. Consultado el 25 de julio de 2018 ..
  160. ^ "Liar Game (manga) – Anime News Network" . www.animenewsnetwork.com . Archivado desde el original el 25 de noviembre de 2022 . Consultado el 25 de noviembre de 2022 .
  161. ^ Chaffin, Sean (20 de agosto de 2018). "El póquer y la teoría de juegos aparecen en la película de éxito 'Crazy Rich Asians'". PokerNews.com. Archivado desde el original el 5 de noviembre de 2022. Consultado el 5 de noviembre de 2022 .
  162. ^ Bean, Travis (8 de febrero de 2019). «Teoría de juegos en Crazy Rich Asians: explicación del enfrentamiento de Mahjong entre Rachel y Eleanor». Colossus. Archivado desde el original el 5 de noviembre de 2022. Consultado el 5 de noviembre de 2022 .
  163. ^ "Análisis de las aplicaciones de redes en "Molly's Game": blog del curso de redes para INFO 2040/CS 2850/Econ 2040/SOC 2090". Archivado desde el original el 8 de abril de 2023 . Consultado el 8 de abril de 2023 .

Fuentes

Lectura adicional

Libros de texto y literatura general

Textos de importancia histórica

Otros materiales

Enlaces externos