La teoría de juegos es el estudio de modelos matemáticos de interacciones estratégicas. [1] Tiene aplicaciones en muchos campos de las ciencias sociales y se utiliza ampliamente en economía , lógica , ciencia de sistemas y ciencias de la computación . [2] Inicialmente, la teoría de juegos abordó los juegos de suma cero entre dos personas , en los que las ganancias o pérdidas de un participante se equilibran exactamente con las pérdidas y ganancias del otro participante. En la década de 1950, se extendió al estudio de los juegos de suma no cero y, finalmente, se aplicó a una amplia gama de relaciones de comportamiento . Ahora es un término general para la ciencia de la toma de decisiones racional en humanos, animales y computadoras.
La teoría de juegos moderna comenzó con la idea de equilibrios de estrategia mixta en juegos de suma cero de dos personas y su demostración por parte de John von Neumann . La prueba original de von Neumann utilizó el teorema de punto fijo de Brouwer sobre aplicaciones continuas en conjuntos convexos compactos , que se convirtió en un método estándar en la teoría de juegos y la economía matemática . Su artículo fue seguido por Theory of Games and Economic Behavior (1944), coescrito con Oskar Morgenstern , que consideró juegos cooperativos de varios jugadores. [3] La segunda edición proporcionó una teoría axiomática de la utilidad esperada , que permitió a los estadísticos matemáticos y economistas tratar la toma de decisiones en condiciones de incertidumbre. [4]
La teoría de juegos se desarrolló ampliamente en la década de 1950 y se aplicó explícitamente a la evolución en la década de 1970, aunque desarrollos similares se remontan al menos a la década de 1930. La teoría de juegos ha sido ampliamente reconocida como una herramienta importante en muchos campos. John Maynard Smith fue galardonado con el Premio Crafoord por su aplicación de la teoría de juegos evolutiva en 1999, y quince teóricos de juegos han ganado el Premio Nobel de Economía hasta 2020, incluidos los más recientes Paul Milgrom y Robert B. Wilson .
La estrategia basada en la teoría de juegos dentro de la historia registrada se remonta al menos a la guía de estrategia militar de Sun Tzu . [5] [6] En El arte de la guerra , escribió:
Conociendo al otro y conociéndose a sí mismo, En cien batallas no hay peligro,
No conocer al otro y conocerse a sí mismo, Una victoria por una derrota,
No conocer al otro y no conocerse a sí mismo, En cada batalla una derrota segura
—Sun Tzu
Las discusiones sobre las matemáticas de los juegos comenzaron mucho antes del surgimiento de la teoría matemática de juegos moderna. La obra de Cardano Liber de ludo aleae ( Libro sobre los juegos de azar ), que se escribió alrededor de 1564 pero se publicó póstumamente en 1663, esboza algunas ideas básicas sobre los juegos de azar. En la década de 1650, Pascal y Huygens desarrollaron el concepto de expectativa sobre el razonamiento acerca de la estructura de los juegos de azar. Pascal argumentó a favor de una división igual cuando las probabilidades son iguales, mientras que Huygens amplió el argumento al considerar estrategias para un jugador que puede hacer cualquier apuesta con cualquier oponente siempre que sus términos sean iguales. [7] Huygens publicó más tarde su cálculo de juegos de azar como De ratiociniis in ludo aleæ ( Sobre el razonamiento en los juegos de azar ) en 1657.
En 1713, una carta atribuida a Charles Waldegrave, un jacobita activo y tío del diplomático británico James Waldegrave , analizó un juego llamado " le her ". [8] [9] Waldegrave proporcionó una solución de estrategia mixta minimax a una versión para dos personas del juego de cartas, y el problema ahora se conoce como problema de Waldegrave . En 1838, Antoine Augustin Cournot consideró un duopolio y presentó una solución que es el equilibrio de Nash del juego en sus Recherches sur les principes mathématiques de la théorie des richesses ( Investigaciones sobre los principios matemáticos de la teoría de la riqueza ).
En 1913, Ernst Zermelo publicó Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels ( Sobre una aplicación de la teoría de conjuntos a la teoría del juego de ajedrez ), que demostró que la estrategia óptima del ajedrez está estrictamente determinada . Esto allanó el camino para teoremas más generales. [10]
En 1938, el economista matemático danés Frederik Zeuthen demostró que el modelo matemático tenía una estrategia ganadora utilizando el teorema del punto fijo de Brouwer . [11] En su libro de 1938 Aplicaciones a los juegos de apuestas y notas anteriores, Émile Borel demostró un teorema minimax para juegos de matriz de suma cero de dos personas solo cuando la matriz de pagos es simétrica y proporcionó una solución a un juego infinito no trivial (conocido en inglés como juego Blotto ). Borel conjeturó la inexistencia de equilibrios de estrategia mixta en juegos finitos de suma cero de dos personas , una conjetura que von Neumann demostró que era falsa.
La teoría de juegos surgió como un campo único cuando John von Neumann publicó el artículo On the Theory of Games of Strategy en 1928. [12] [13] La prueba original de von Neumann utilizó el teorema de punto fijo de Brouwer sobre aplicaciones continuas en conjuntos convexos compactos , que se convirtió en un método estándar en la teoría de juegos y la economía matemática . El trabajo de von Neumann en teoría de juegos culminó en su libro de 1944 Theory of Games and Economic Behavior , en coautoría con Oskar Morgenstern . [14] La segunda edición de este libro proporcionó una teoría axiomática de la utilidad , que reencarnó la antigua teoría de la utilidad (del dinero) de Daniel Bernoulli como una disciplina independiente. Este trabajo fundamental contiene el método para encontrar soluciones mutuamente consistentes para juegos de suma cero de dos personas. El trabajo posterior se centró principalmente en la teoría de juegos cooperativos , que analiza las estrategias óptimas para grupos de individuos, suponiendo que pueden hacer cumplir acuerdos entre ellos sobre las estrategias adecuadas. [15]
En 1950, apareció la primera discusión matemática del dilema del prisionero , y los notables matemáticos Merrill M. Flood y Melvin Dresher llevaron a cabo un experimento como parte de las investigaciones de la Corporación RAND sobre la teoría de juegos. RAND llevó a cabo los estudios debido a las posibles aplicaciones a la estrategia nuclear global . [16] Casi al mismo tiempo, John Nash desarrolló un criterio para la consistencia mutua de las estrategias de los jugadores conocido como el equilibrio de Nash , aplicable a una variedad más amplia de juegos que el criterio propuesto por von Neumann y Morgenstern. Nash demostró que todo juego finito de n jugadores, de suma no cero (no solo de suma cero para dos jugadores) no cooperativo tiene lo que ahora se conoce como un equilibrio de Nash en estrategias mixtas.
La teoría de juegos experimentó un gran auge en la década de 1950, durante la cual se desarrollaron los conceptos de núcleo , juego de forma extensiva , juego ficticio , juegos repetidos y valor de Shapley . La década de 1950 también vio las primeras aplicaciones de la teoría de juegos a la filosofía y la ciencia política .
En 1965, Reinhard Selten introdujo su concepto de solución de equilibrios perfectos en subjuegos , que perfeccionó aún más el equilibrio de Nash. Más tarde, también introduciría la perfección de la mano temblorosa . En 1994, Nash, Selten y Harsanyi recibieron el Premio Nobel de Economía por sus contribuciones a la teoría de juegos económicos.
En la década de 1970, la teoría de juegos se aplicó ampliamente en biología , en gran medida como resultado del trabajo de John Maynard Smith y su estrategia evolutivamente estable . Además, se introdujeron y analizaron los conceptos de equilibrio correlacionado , perfección de mano temblorosa y conocimiento común [a] .
En 1994, John Nash recibió el Premio Nobel de Economía por su contribución a la teoría de juegos. La contribución más famosa de Nash a la teoría de juegos es el concepto de equilibrio de Nash, que es un concepto de solución para juegos no cooperativos . Un equilibrio de Nash es un conjunto de estrategias, una para cada jugador, de modo que ningún jugador pueda mejorar su pago modificando unilateralmente su estrategia.
En 2005, los teóricos de juegos Thomas Schelling y Robert Aumann sucedieron a Nash, Selten y Harsanyi como Premios Nobel. Schelling trabajó en modelos dinámicos, ejemplos tempranos de la teoría de juegos evolutiva . Aumann contribuyó más a la escuela del equilibrio, introduciendo el engrosamiento del equilibrio y los equilibrios correlacionados, y desarrollando un extenso análisis formal del supuesto del conocimiento común y de sus consecuencias.
En 2007, Leonid Hurwicz , Eric Maskin y Roger Myerson recibieron el Premio Nobel de Economía "por haber sentado las bases de la teoría del diseño de mecanismos ". Las contribuciones de Myerson incluyen la noción de equilibrio adecuado y un importante texto de posgrado: Teoría de juegos, análisis del conflicto . [1] Hurwicz introdujo y formalizó el concepto de compatibilidad de incentivos .
En 2012, Alvin E. Roth y Lloyd S. Shapley recibieron el Premio Nobel de Economía "por la teoría de las asignaciones estables y la práctica del diseño de mercados". En 2014, el Nobel fue para el teórico de juegos Jean Tirole .
Un juego es cooperativo si los jugadores pueden formar compromisos vinculantes que se hacen cumplir externamente (por ejemplo, mediante la ley de contratos ). Un juego no es cooperativo si los jugadores no pueden formar alianzas o si todos los acuerdos deben hacerse cumplir por sí mismos (por ejemplo, mediante amenazas creíbles ). [17]
Los juegos cooperativos suelen analizarse a través del marco de la teoría de juegos cooperativos , que se centra en predecir qué coaliciones se formarán, las acciones conjuntas que toman los grupos y los resultados colectivos resultantes. Es diferente de la teoría de juegos no cooperativos , que se centra en predecir las acciones y los resultados de los jugadores individuales mediante el análisis de los equilibrios de Nash . [18] [19]
La teoría de juegos cooperativos ofrece un enfoque de alto nivel, ya que describe únicamente la estructura y los beneficios de las coaliciones, mientras que la teoría de juegos no cooperativos también analiza cómo la interacción estratégica afectará la distribución de los beneficios. Como la teoría de juegos no cooperativos es más general, los juegos cooperativos pueden analizarse a través del enfoque de la teoría de juegos no cooperativos (no se cumple lo contrario), siempre que se hagan suficientes suposiciones para abarcar todas las posibles estrategias disponibles para los jugadores debido a la posibilidad de imposición externa de la cooperación.
Un juego simétrico es un juego en el que cada jugador gana el mismo premio al hacer la misma elección. En otras palabras, la identidad del jugador no cambia el juego resultante que enfrenta el otro jugador. [20] Muchos de los juegos 2×2 que se estudian comúnmente son simétricos. Las representaciones estándar de la gallina , el dilema del prisionero y la caza del ciervo son todos juegos simétricos.
Los juegos asimétricos que se estudian con más frecuencia son aquellos en los que no hay conjuntos de estrategias idénticos para ambos jugadores. Por ejemplo, el juego del ultimátum y, de forma similar, el juego del dictador tienen estrategias diferentes para cada jugador. Sin embargo, es posible que un juego tenga estrategias idénticas para ambos jugadores y, sin embargo, sea asimétrico. Por ejemplo, el juego que se muestra en el gráfico de esta sección es asimétrico a pesar de tener conjuntos de estrategias idénticos para ambos jugadores.
Los juegos de suma cero (más generalmente, juegos de suma constante) son juegos en los que las decisiones de los jugadores no pueden aumentar ni disminuir los recursos disponibles. En los juegos de suma cero, el beneficio total va a todos los jugadores en un juego, para cada combinación de estrategias, y siempre se suma a cero (más informalmente, un jugador se beneficia solo a expensas iguales de los demás). [21] El póquer ejemplifica un juego de suma cero (ignorando la posibilidad de la comisión de la casa), porque uno gana exactamente la cantidad que pierden sus oponentes. Otros juegos de suma cero incluyen los centavos de igual a igual y la mayoría de los juegos de mesa clásicos, incluidos Go y ajedrez .
Muchos juegos estudiados por los teóricos de juegos (incluido el famoso dilema del prisionero) son juegos de suma no cero, porque el resultado tiene resultados netos mayores o menores que cero. De manera informal, en los juegos de suma no cero, una ganancia de un jugador no necesariamente se corresponde con una pérdida de otro.
Además, los juegos de suma constante corresponden a actividades como el robo y el juego, pero no a la situación económica fundamental en la que existen ganancias potenciales derivadas del comercio . Es posible transformar cualquier juego de suma constante en un juego de suma cero (posiblemente asimétrico) añadiendo un jugador ficticio (a menudo llamado "el tablero") cuyas pérdidas compensan las ganancias netas de los jugadores.
Los juegos simultáneos son juegos en los que ambos jugadores se mueven simultáneamente o, en cambio, los jugadores posteriores no son conscientes de las acciones de los jugadores anteriores (lo que las hace efectivamente simultáneas). Los juegos secuenciales (o juegos dinámicos) son juegos en los que los jugadores no toman decisiones simultáneamente y las acciones anteriores de los jugadores afectan el resultado y las decisiones de los otros jugadores. [22] Esto no tiene por qué ser información perfecta sobre cada acción de los jugadores anteriores; puede ser muy poco conocimiento. Por ejemplo, un jugador puede saber que un jugador anterior no realizó una acción en particular, mientras que no sabe cuál de las otras acciones disponibles realizó realmente el primer jugador.
La diferencia entre juegos simultáneos y secuenciales se refleja en las diferentes representaciones que se han analizado anteriormente. A menudo, se utiliza la forma normal para representar juegos simultáneos, mientras que la forma extensiva se utiliza para representar juegos secuenciales. La transformación de la forma extensiva a la forma normal es unidireccional, lo que significa que varios juegos en forma extensiva corresponden a la misma forma normal. En consecuencia, las nociones de equilibrio para juegos simultáneos son insuficientes para razonar sobre juegos secuenciales; véase perfección de subjuegos .
En resumen, las diferencias entre juegos secuenciales y simultáneos son las siguientes:
Un subconjunto importante de los juegos secuenciales consiste en juegos de información perfecta. Un juego con información perfecta significa que todos los jugadores, en cada movimiento del juego, conocen el historial previo del juego y los movimientos realizados previamente por todos los demás jugadores. Un juego de información imperfecta se juega cuando los jugadores no conocen todos los movimientos ya realizados por el oponente, como un juego de movimientos simultáneos. [23] Ejemplos de juegos de información perfecta incluyen tres en raya , damas , ajedrez y Go . [24] [25] [26]
Muchos juegos de cartas son juegos de información imperfecta, como el póquer y el bridge . [27] La información perfecta a menudo se confunde con la información completa , que es un concepto similar relacionado con el conocimiento común de la secuencia, las estrategias y los pagos de cada jugador a lo largo del juego. [28] La información completa requiere que cada jugador conozca las estrategias y los pagos disponibles para los otros jugadores, pero no necesariamente las acciones realizadas, mientras que la información perfecta es el conocimiento de todos los aspectos del juego y de los jugadores. [29] Sin embargo, los juegos de información incompleta se pueden reducir a juegos de información imperfecta introduciendo " movimientos por naturaleza ". [30]
Uno de los supuestos del equilibrio de Nash es que cada jugador tiene creencias correctas sobre las acciones de los otros jugadores. Sin embargo, hay muchas situaciones en la teoría de juegos en las que los participantes no comprenden completamente las características de sus oponentes. Los negociadores pueden no ser conscientes de la valoración que hace su oponente del objeto de la negociación, las empresas pueden no ser conscientes de las funciones de costos de su oponente, los combatientes pueden no ser conscientes de las fortalezas de su oponente y los jurados pueden no ser conscientes de la interpretación que hace su colega de las pruebas en el juicio. En algunos casos, los participantes pueden conocer bien el carácter de su oponente, pero pueden no saber hasta qué punto su oponente conoce su propio carácter. [31]
Un juego bayesiano es un juego estratégico con información incompleta. En un juego estratégico, los que toman las decisiones son los jugadores, y cada jugador tiene un grupo de acciones. Una parte fundamental de la especificación de información imperfecta es el conjunto de estados. Cada estado describe completamente una colección de características relevantes para el jugador, como sus preferencias y detalles sobre ellas. Debe haber un estado para cada conjunto de características que algún jugador cree que pueden existir. [32]
Por ejemplo, cuando el Jugador 1 no está seguro de si el Jugador 2 preferiría salir con ella o alejarse de ella, mientras que el Jugador 2 entiende las preferencias del Jugador 1 como antes. Para ser más específico, supongamos que el Jugador 1 cree que el Jugador 2 quiere salir con ella bajo una probabilidad de 1/2 y alejarse de ella bajo una probabilidad de 1/2 (esta evaluación proviene probablemente de la experiencia del Jugador 1: se enfrenta a jugadores que quieren salir con ella la mitad del tiempo en tal caso y a jugadores que quieren evitarla la mitad del tiempo). Debido a la probabilidad involucrada, el análisis de esta situación requiere comprender la preferencia del jugador por el empate, aunque a las personas solo les interesa el equilibrio estratégico puro.
Los juegos en los que la dificultad de encontrar una estrategia óptima surge de la multiplicidad de movimientos posibles se denominan juegos combinatorios. Algunos ejemplos son el ajedrez y el Go . Los juegos que implican información imperfecta también pueden tener un fuerte carácter combinatorio, por ejemplo el backgammon . No existe una teoría unificada que aborde los elementos combinatorios en los juegos. Sin embargo, existen herramientas matemáticas que pueden resolver algunos problemas particulares y responder a algunas preguntas generales. [33]
Los juegos de información perfecta se han estudiado en la teoría de juegos combinatorios , que ha desarrollado representaciones novedosas, por ejemplo, números surrealistas , así como métodos de prueba combinatorios y algebraicos (y a veces no constructivos ) para resolver juegos de ciertos tipos, incluidos los juegos "bucles" que pueden dar lugar a secuencias de movimientos infinitamente largas. Estos métodos abordan juegos con una complejidad combinatoria mayor que los que se consideran habitualmente en la teoría de juegos tradicional (o "económica"). [34] [35] Un juego típico que se ha resuelto de esta manera es Hex . Un campo de estudio relacionado, que se basa en la teoría de la complejidad computacional , es la complejidad del juego , que se ocupa de estimar la dificultad computacional de encontrar estrategias óptimas. [36]
La investigación en inteligencia artificial ha abordado juegos de información tanto perfectos como imperfectos que tienen estructuras combinatorias muy complejas (como ajedrez, go o backgammon) para los que no se han encontrado estrategias óptimas demostrables. Las soluciones prácticas implican heurísticas computacionales, como la poda alfa-beta o el uso de redes neuronales artificiales entrenadas por aprendizaje de refuerzo , que hacen que los juegos sean más manejables en la práctica informática. [33] [37]
Gran parte de la teoría de juegos se ocupa de juegos finitos y discretos que tienen un número finito de jugadores, movimientos, eventos, resultados, etc. Sin embargo, muchos conceptos se pueden ampliar. Los juegos continuos permiten a los jugadores elegir una estrategia de un conjunto de estrategias continuas. Por ejemplo, la competición de Cournot se modela típicamente con las estrategias de los jugadores siendo cualquier cantidad no negativa, incluidas las cantidades fraccionarias.
Los juegos diferenciales como el juego de persecución continua y el juego de evasión son juegos continuos donde la evolución de las variables de estado de los jugadores está gobernada por ecuaciones diferenciales . El problema de encontrar una estrategia óptima en un juego diferencial está estrechamente relacionado con la teoría del control óptimo . En particular, existen dos tipos de estrategias: las estrategias de bucle abierto se encuentran utilizando el principio del máximo de Pontryagin mientras que las estrategias de bucle cerrado se encuentran utilizando el método de Programación Dinámica de Bellman .
Un caso particular de juegos diferenciales son los juegos con un horizonte temporal aleatorio . [38] En tales juegos, el tiempo terminal es una variable aleatoria con una función de distribución de probabilidad dada . Por lo tanto, los jugadores maximizan la expectativa matemática de la función de costo. Se demostró que el problema de optimización modificado puede reformularse como un juego diferencial descontado sobre un intervalo de tiempo infinito.
La teoría de juegos evolutiva estudia a los jugadores que ajustan sus estrategias a lo largo del tiempo según reglas que no son necesariamente racionales ni previsoras. [39] En general, la evolución de las estrategias a lo largo del tiempo según dichas reglas se modela como una cadena de Markov con una variable de estado como el perfil de estrategia actual o cómo se ha jugado el juego en el pasado reciente. Dichas reglas pueden incluir la imitación, la optimización o la supervivencia del más apto.
En biología, estos modelos pueden representar la evolución , en la que los descendientes adoptan las estrategias de sus padres y los padres que juegan estrategias más exitosas (es decir, que corresponden a mayores ganancias) tienen un mayor número de descendientes. En las ciencias sociales, estos modelos suelen representar el ajuste estratégico de los jugadores que juegan un juego muchas veces durante su vida y, consciente o inconscientemente, ocasionalmente ajustan sus estrategias. [40]
Los problemas de decisión individuales con resultados estocásticos a veces se consideran "juegos de un solo jugador". Pueden modelarse utilizando herramientas similares dentro de las disciplinas relacionadas de la teoría de la decisión , la investigación de operaciones y las áreas de inteligencia artificial , en particular la planificación de IA (con incertidumbre) y los sistemas multiagente . Aunque estos campos pueden tener diferentes motivadores, las matemáticas involucradas son sustancialmente las mismas, por ejemplo, utilizando procesos de decisión de Markov (MDP). [41]
Los resultados estocásticos también pueden modelarse en términos de teoría de juegos añadiendo un jugador que actúa aleatoriamente y hace "movimientos aleatorios" (" movimientos por naturaleza "). [42] Este jugador no suele considerarse un tercer jugador en lo que de otro modo sería un juego de dos jugadores, sino que simplemente sirve para proporcionar una tirada de dados cuando lo requiere el juego.
En el caso de algunos problemas, los distintos enfoques para modelar los resultados estocásticos pueden llevar a soluciones diferentes. Por ejemplo, la diferencia de enfoque entre los modelos de incertidumbre múltiple y la solución minimax es que esta última considera el peor de los casos para un conjunto de movimientos adversarios, en lugar de razonar en función de las expectativas sobre estos movimientos dada una distribución de probabilidad fija. El enfoque minimax puede ser ventajoso cuando no se dispone de modelos estocásticos de incertidumbre, pero también puede estar sobrestimando eventos extremadamente improbables (pero costosos), lo que hace que la estrategia se incline drásticamente en tales escenarios si se supone que un adversario puede forzar la ocurrencia de tal evento. [43] (Véase la teoría del cisne negro para más información sobre este tipo de problema de modelado, en particular en lo que se refiere a la predicción y limitación de pérdidas en la banca de inversión).
También se han estudiado modelos generales que incluyen todos los elementos de resultados estocásticos, adversarios y observabilidad parcial o ruidosa (de movimientos de otros jugadores). Se considera que el " estándar de oro " es el juego estocástico parcialmente observable (POSG), pero pocos problemas realistas son factibles computacionalmente en la representación POSG. [43]
Se trata de juegos cuyo juego consiste en desarrollar las reglas de otro juego, el juego objetivo o sujeto. Los metajuegos buscan maximizar el valor de utilidad del conjunto de reglas desarrollado. La teoría de los metajuegos está relacionada con la teoría del diseño de mecanismos .
El término análisis del metajuego también se utiliza para referirse a un enfoque práctico desarrollado por Nigel Howard [44], según el cual una situación se enmarca como un juego estratégico en el que las partes interesadas intentan alcanzar sus objetivos mediante las opciones que tienen a su disposición. Desarrollos posteriores han llevado a la formulación del análisis de la confrontación .
La teoría de juegos de campo medio es el estudio de la toma de decisiones estratégicas en poblaciones muy grandes de pequeños agentes que interactúan entre sí. Esta clase de problemas fue considerada en la literatura económica por Boyan Jovanovic y Robert W. Rosenthal , en la literatura de ingeniería por Peter E. Caines y por los matemáticos Pierre-Louis Lions y Jean-Michel Lasry.
Los juegos que se estudian en la teoría de juegos son objetos matemáticos bien definidos. Para estar completamente definidos, un juego debe especificar los siguientes elementos: los jugadores del juego, la información y las acciones disponibles para cada jugador en cada punto de decisión y los pagos por cada resultado. (Eric Rasmusen se refiere a estos cuatro "elementos esenciales" con el acrónimo "PAPI"). [45] [46] [47] [48] Un teórico de juegos normalmente utiliza estos elementos, junto con un concepto de solución de su elección, para deducir un conjunto de estrategias de equilibrio para cada jugador de modo que, cuando se emplean estas estrategias, ningún jugador pueda beneficiarse desviándose unilateralmente de su estrategia. Estas estrategias de equilibrio determinan un equilibrio para el juego: un estado estable en el que se produce un resultado o un conjunto de resultados con una probabilidad conocida.
La mayoría de los juegos cooperativos se presentan en la forma de función característica, mientras que las formas extensiva y normal se utilizan para definir juegos no cooperativos.
La forma extensiva se puede utilizar para formalizar juegos con una secuencia temporal de movimientos. Los juegos en forma extensiva se pueden visualizar utilizando árboles de juego (como se muestra aquí). Aquí cada vértice (o nodo) representa un punto de elección para un jugador. El jugador se especifica mediante un número indicado por el vértice. Las líneas que salen del vértice representan una posible acción para ese jugador. Los pagos se especifican en la parte inferior del árbol. La forma extensiva se puede ver como una generalización para varios jugadores de un árbol de decisiones . [49] Para resolver cualquier juego en forma extensiva, se debe utilizar la inducción hacia atrás . Implica trabajar hacia atrás en el árbol de juego para determinar qué haría un jugador racional en el último vértice del árbol, qué haría el jugador con el movimiento anterior dado que el jugador con el último movimiento es racional, y así sucesivamente hasta que se alcanza el primer vértice del árbol. [50]
El juego ilustrado consta de dos jugadores. La forma en que está estructurado este juego en particular (es decir, con toma de decisiones secuencial e información perfecta), el Jugador 1 "mueve" primero al elegir F o U (justo o injusto). A continuación en la secuencia, el Jugador 2 , que ahora ha observado el movimiento del Jugador 1 , puede elegir jugar A o R (aceptar o rechazar). Una vez que el Jugador 2 ha hecho su elección, el juego se considera terminado y cada jugador obtiene su respectivo pago, representado en la imagen como dos números, donde el primer número representa el pago del Jugador 1 y el segundo número representa el pago del Jugador 2. Supongamos que el Jugador 1 elige U y luego el Jugador 2 elige A : el Jugador 1 obtiene un pago de "ocho" (que en términos del mundo real se puede interpretar de muchas maneras, la más simple de las cuales es en términos de dinero, pero podría significar cosas como ocho días de vacaciones u ocho países conquistados o incluso ocho oportunidades más para jugar el mismo juego contra otros jugadores) y el Jugador 2 obtiene un pago de "dos".
La forma extensiva también puede capturar partidas de movimientos simultáneos y partidas con información imperfecta. Para representarla, se puede trazar una línea de puntos que conecta los diferentes vértices para representarlos como parte del mismo conjunto de información (es decir, los jugadores no saben en qué punto se encuentran) o bien se dibuja una línea cerrada alrededor de ellos (véase el ejemplo en la sección de información imperfecta).
El juego normal (o en su forma estratégica) suele representarse mediante una matriz que muestra los jugadores, las estrategias y los pagos (véase el ejemplo de la derecha). De forma más general, puede representarse mediante cualquier función que asocie un pago para cada jugador con cada combinación posible de acciones. En el ejemplo adjunto hay dos jugadores; uno elige la fila y el otro elige la columna. Cada jugador tiene dos estrategias, que se especifican mediante el número de filas y el número de columnas. Los pagos se proporcionan en el interior. El primer número es el pago recibido por el jugador de la fila (Jugador 1 en nuestro ejemplo); el segundo es el pago para el jugador de la columna (Jugador 2 en nuestro ejemplo). Supongamos que el Jugador 1 juega Arriba y que el Jugador 2 juega Izquierda . Entonces el Jugador 1 obtiene un pago de 4 y el Jugador 2 obtiene 3.
Cuando un juego se presenta en forma normal, se supone que cada jugador actúa simultáneamente o, al menos, sin conocer las acciones del otro. Si los jugadores tienen alguna información sobre las elecciones de los otros jugadores, el juego suele presentarse en forma extensa.
Todo juego en forma extensiva tiene un juego en forma normal equivalente, sin embargo, la transformación a la forma normal puede resultar en un aumento exponencial del tamaño de la representación, volviéndola computacionalmente impráctica. [51]
En la teoría de juegos cooperativos, la función característica enumera los beneficios de cada coalición. El origen de esta formulación se encuentra en el libro de John von Neumann y Oskar Morgenstern. [ cita requerida ]
Formalmente, una función característica es una función [52] del conjunto de todas las posibles coaliciones de jugadores a un conjunto de pagos, y también satisface . La función describe cuánto pago colectivo puede obtener un conjunto de jugadores al formar una coalición.
Se utilizan formas de representación de juegos alternativas para algunas subclases de juegos o se ajustan a las necesidades de la investigación interdisciplinaria. [53] Además de las representaciones de juegos clásicas, algunas de las representaciones alternativas también codifican aspectos relacionados con el tiempo.
Como método de matemáticas aplicadas , la teoría de juegos se ha utilizado para estudiar una amplia variedad de comportamientos humanos y animales. Inicialmente se desarrolló en economía para comprender una gran colección de comportamientos económicos, incluidos los comportamientos de las empresas, los mercados y los consumidores. El primer uso del análisis de teoría de juegos fue por parte de Antoine Augustin Cournot en 1838 con su solución del duopolio de Cournot . El uso de la teoría de juegos en las ciencias sociales se ha expandido y la teoría de juegos también se ha aplicado a los comportamientos políticos, sociológicos y psicológicos. [68]
Aunque los naturalistas anteriores al siglo XX, como Charles Darwin, hicieron afirmaciones de tipo teórico de juegos, el uso del análisis teórico de juegos en biología comenzó con los estudios de Ronald Fisher sobre el comportamiento animal durante la década de 1930. Este trabajo es anterior al nombre de "teoría de juegos", pero comparte muchas características importantes con este campo. Los avances en economía fueron aplicados posteriormente a la biología en gran medida por John Maynard Smith en su libro de 1982 Evolution and the Theory of Games . [69]
Además de usarse para describir, predecir y explicar el comportamiento, la teoría de juegos también se ha utilizado para desarrollar teorías de comportamiento ético o normativo y para prescribir dicho comportamiento. [70] En economía y filosofía , los académicos han aplicado la teoría de juegos para ayudar a comprender el comportamiento bueno o apropiado. También se han sugerido enfoques de teoría de juegos en la filosofía del lenguaje y la filosofía de la ciencia . [71] Los argumentos de teoría de juegos de este tipo se pueden encontrar desde Platón . [72] Una versión alternativa de la teoría de juegos, llamada teoría de juegos químicos , representa las elecciones del jugador como moléculas reactivas químicas metafóricas llamadas "conocimientos". [73] La teoría de juegos químicos luego calcula los resultados como soluciones de equilibrio para un sistema de reacciones químicas.
El uso principal de la teoría de juegos es describir y modelar cómo se comportan las poblaciones humanas. [ cita requerida ] Algunos [ ¿ quiénes? ] académicos creen que al encontrar los equilibrios de los juegos pueden predecir cómo se comportarán las poblaciones humanas reales cuando se enfrentan a situaciones análogas al juego en estudio. Esta visión particular de la teoría de juegos ha sido criticada. Se argumenta que las suposiciones hechas por los teóricos de juegos a menudo se violan cuando se aplican a situaciones del mundo real. Los teóricos de juegos generalmente asumen que los jugadores actúan racionalmente, pero en la práctica, la racionalidad y/o el comportamiento humano a menudo se desvían del modelo de racionalidad tal como se usa en la teoría de juegos. Los teóricos de juegos responden comparando sus suposiciones con las utilizadas en física . Por lo tanto, si bien sus suposiciones no siempre se cumplen, pueden tratar la teoría de juegos como un ideal científico razonable similar a los modelos utilizados por los físicos . Sin embargo, el trabajo empírico ha demostrado que en algunos juegos clásicos, como el juego del ciempiés , adivina 2/3 del juego promedio, y el juego del dictador , las personas regularmente no juegan equilibrios de Nash. Existe un debate en curso sobre la importancia de estos experimentos y si el análisis de los mismos captura plenamente todos los aspectos de la situación relevante. [b]
Algunos teóricos de juegos, siguiendo el trabajo de John Maynard Smith y George R. Price , han recurrido a la teoría de juegos evolutiva para resolver estos problemas. Estos modelos presuponen la inexistencia de racionalidad o una racionalidad limitada por parte de los jugadores. A pesar del nombre, la teoría de juegos evolutiva no presupone necesariamente la selección natural en el sentido biológico. La teoría de juegos evolutiva incluye tanto la evolución biológica como la cultural y también modelos de aprendizaje individual (por ejemplo, dinámicas de juego ficticias ).
Algunos investigadores consideran la teoría de juegos no como una herramienta predictiva del comportamiento de los seres humanos, sino como una sugerencia de cómo debería comportarse la gente. Dado que una estrategia, correspondiente a un equilibrio de Nash de un juego, constituye la mejor respuesta a las acciones de los otros jugadores –siempre que se encuentren en (el mismo) equilibrio de Nash–, parece apropiado utilizar una estrategia que forme parte de un equilibrio de Nash. Este uso normativo de la teoría de juegos también ha sido objeto de críticas. [75]
La teoría de juegos es un método importante utilizado en economía matemática y negocios para modelar comportamientos competitivos de agentes que interactúan . [c] [76] [77] [78] Las aplicaciones incluyen una amplia gama de fenómenos y enfoques económicos, como subastas , negociaciones , fusiones y adquisiciones , fijación de precios, [79] división justa , duopolios , oligopolios , formación de redes sociales , economía computacional basada en agentes , [80] [81] equilibrio general , diseño de mecanismos, [82] [83 ] [84] [85] [86] y sistemas de votación ; [87] y en áreas tan amplias como la economía experimental, [88] [89] [90] [91] [92] la economía del comportamiento , [93] [94] [95] [96] [97] [98] la economía de la información , [45] [46] [47] [48] la organización industrial , [99] [100] [101] [102] y la economía política . [103] [104] [105] [47]
Esta investigación se centra generalmente en conjuntos particulares de estrategias conocidas como "conceptos de solución" o "equilibrios" . Un supuesto común es que los jugadores actúan racionalmente. En los juegos no cooperativos, el más famoso de ellos es el equilibrio de Nash. Un conjunto de estrategias es un equilibrio de Nash si cada una representa una mejor respuesta a las otras estrategias. Si todos los jugadores están jugando las estrategias en un equilibrio de Nash, no tienen ningún incentivo unilateral para desviarse, ya que su estrategia es lo mejor que pueden hacer dado lo que están haciendo los demás. [106] [107]
Los pagos del juego generalmente se consideran representativos de la utilidad de los jugadores individuales.
Un artículo prototípico sobre la teoría de juegos en economía comienza presentando un juego que es una abstracción de una situación económica particular. Se eligen uno o más conceptos de solución y el autor demuestra qué conjuntos de estrategias en el juego presentado son equilibrios del tipo apropiado. Los economistas y profesores de negocios sugieren dos usos principales (mencionados anteriormente): descriptivo y prescriptivo . [70]
La teoría de juegos también tiene un uso extensivo en una rama o corriente específica de la economía: la economía gerencial . Un uso importante de la misma en el campo de la economía gerencial es el análisis de interacciones estratégicas entre empresas. [108] Por ejemplo, las empresas pueden estar compitiendo en un mercado con recursos limitados, y la teoría de juegos puede ayudar a los gerentes a comprender cómo sus decisiones afectan a sus competidores y los resultados generales del mercado. La teoría de juegos también se puede utilizar para analizar la cooperación entre empresas, como en la formación de alianzas estratégicas o empresas conjuntas. Otro uso de la teoría de juegos en la economía gerencial es el análisis de las estrategias de precios. Por ejemplo, las empresas pueden utilizar la teoría de juegos para determinar la estrategia de precios óptima en función de cómo esperan que sus competidores respondan a sus decisiones de precios. En general, la teoría de juegos sirve como una herramienta útil para analizar las interacciones estratégicas y la toma de decisiones en el contexto de la economía gerencial.
El Chartered Institute of Procurement & Supply (CIPS) promueve el conocimiento y el uso de la teoría de juegos en el contexto de las compras empresariales . [109] El CIPS y los socios de TWS han llevado a cabo una serie de encuestas diseñadas para explorar la comprensión, el conocimiento y la aplicación de la teoría de juegos entre los profesionales de las compras . Algunos de los principales hallazgos de su tercera encuesta anual (2019) incluyen:
La toma de decisiones sensata es fundamental para el éxito de los proyectos. En la gestión de proyectos, la teoría de juegos se utiliza para modelar el proceso de toma de decisiones de los participantes, como inversores, directores de proyectos, contratistas, subcontratistas, gobiernos y clientes. Muy a menudo, estos participantes tienen intereses en pugna y, a veces, sus intereses son directamente perjudiciales para otros participantes, lo que hace que los escenarios de gestión de proyectos sean adecuados para ser modelados mediante la teoría de juegos.
Piraveenan (2019) [111] en su revisión proporciona varios ejemplos en los que se utiliza la teoría de juegos para modelar escenarios de gestión de proyectos. Por ejemplo, un inversor normalmente tiene varias opciones de inversión, y cada opción probablemente dará como resultado un proyecto diferente, y por lo tanto una de las opciones de inversión tiene que ser elegida antes de que se pueda producir el acta de constitución del proyecto. De manera similar, cualquier proyecto grande que involucre subcontratistas, por ejemplo, un proyecto de construcción, tiene una interacción compleja entre el contratista principal (el gerente del proyecto) y los subcontratistas, o entre los propios subcontratistas, que normalmente tiene varios puntos de decisión. Por ejemplo, si hay una ambigüedad en el contrato entre el contratista y el subcontratista, cada uno debe decidir con qué fuerza impulsar su caso sin poner en peligro todo el proyecto y, por lo tanto, su propia participación en él. De manera similar, cuando se lanzan proyectos de organizaciones competidoras, el personal de marketing tiene que decidir cuál es el mejor momento y la mejor estrategia para comercializar el proyecto, o su producto o servicio resultante, de modo que pueda ganar la máxima tracción frente a la competencia. En cada uno de estos escenarios, las decisiones requeridas dependen de las decisiones de otros jugadores que, de alguna manera, tienen intereses en competencia con los intereses del que toma las decisiones y, por lo tanto, pueden modelarse idealmente utilizando la teoría de juegos.
Piraveenan [111] resume que los juegos de dos jugadores se utilizan predominantemente para modelar escenarios de gestión de proyectos y, en función de la identidad de estos jugadores, se utilizan cinco tipos distintos de juegos en la gestión de proyectos.
En términos de tipos de juegos, tanto los cooperativos como los no cooperativos, los de forma normal como los de forma extensiva, y los de suma cero como los de suma distinta de cero se utilizan para modelar varios escenarios de gestión de proyectos.
La aplicación de la teoría de juegos a la ciencia política se centra en las áreas superpuestas de la división justa , la economía política , la elección pública , la negociación de guerra , la teoría política positiva y la teoría de la elección social . En cada una de estas áreas, los investigadores han desarrollado modelos de teoría de juegos en los que los jugadores suelen ser votantes, estados, grupos de intereses especiales y políticos. [112]
Anthony Downs ofrece ejemplos tempranos de la teoría de juegos aplicada a la ciencia política . En su libro de 1957 An Economic Theory of Democracy [113] , aplica el modelo de ubicación de empresas de Hotelling al proceso político. En el modelo downsiano, los candidatos políticos se comprometen con ideologías en un espacio político unidimensional. Downs primero muestra cómo los candidatos políticos convergerán hacia la ideología preferida por el votante medio si los votantes están completamente informados, pero luego argumenta que los votantes eligen permanecer racionalmente ignorantes, lo que permite la divergencia de candidatos. La teoría de juegos se aplicó en 1962 a la Crisis de los Misiles de Cuba durante la presidencia de John F. Kennedy. [114]
También se ha propuesto que la teoría de juegos explica la estabilidad de cualquier forma de gobierno político. Tomando el caso más simple de una monarquía, por ejemplo, el rey, al ser una sola persona, no mantiene ni puede mantener su autoridad ejerciendo personalmente el control físico sobre todos sus súbditos o incluso sobre un número significativo de ellos. El control soberano se explica, en cambio, por el reconocimiento por parte de cada ciudadano de que todos los demás ciudadanos esperan que los demás vean al rey (u otro gobierno establecido) como la persona cuyas órdenes serán acatadas. La coordinación de la comunicación entre ciudadanos para reemplazar al soberano está efectivamente prohibida, ya que la conspiración para reemplazar al soberano es generalmente punible como un delito. [115] Así, en un proceso que puede modelarse mediante variantes del dilema del prisionero, durante períodos de estabilidad ningún ciudadano encontrará racional actuar para reemplazar al soberano, incluso si todos los ciudadanos saben que estarían mejor si actuaran todos colectivamente. [ cita requerida ]
Una explicación teórica de la paz democrática es que el debate público y abierto en las democracias envía información clara y fiable sobre sus intenciones a otros Estados. En cambio, es difícil saber cuáles son las intenciones de los líderes no democráticos, qué efecto tendrán las concesiones y si se cumplirán las promesas. Por lo tanto, habrá desconfianza y renuencia a hacer concesiones si al menos una de las partes en disputa no es una democracia. [116]
Sin embargo, la teoría de juegos predice que dos países pueden ir a la guerra aun cuando sus líderes sean conscientes de los costos de la lucha. La guerra puede ser resultado de información asimétrica; dos países pueden tener incentivos para distorsionar la cantidad de recursos militares que tienen a mano, lo que los vuelve incapaces de resolver las disputas de manera agradable sin recurrir a la lucha. Además, la guerra puede surgir debido a problemas de compromiso: si dos países desean resolver una disputa por medios pacíficos, pero cada uno desea incumplir los términos de ese acuerdo, es posible que no tengan otra opción que recurrir a la guerra. Finalmente, la guerra puede ser resultado de indivisibilidades de cuestiones. [117]
La teoría de juegos también podría ayudar a predecir las respuestas de una nación cuando hay una nueva regla o ley que se debe aplicar a esa nación. Un ejemplo es la investigación de Peter John Wood (2013) que investigó lo que las naciones podrían hacer para ayudar a reducir el cambio climático. Wood pensó que esto podría lograrse mediante la celebración de tratados con otras naciones para reducir las emisiones de gases de efecto invernadero . Sin embargo, concluyó que esta idea no podría funcionar porque crearía un dilema del prisionero para las naciones. [118]
La teoría de juegos se ha utilizado ampliamente para modelar escenarios de toma de decisiones relevantes para aplicaciones de defensa. [119] La mayoría de los estudios que han aplicado la teoría de juegos en entornos de defensa se ocupan de la guerra de mando y control, y pueden clasificarse además en estudios que tratan de (i) guerra de asignación de recursos (ii) guerra de información (iii) guerra de control de armas, y (iv) guerra de monitoreo del adversario. [119] Muchos de los problemas estudiados están relacionados con la detección y el seguimiento, por ejemplo, un buque de superficie que intenta rastrear a un submarino hostil y el submarino que intenta evadir ser rastreado, y la toma de decisiones interdependiente que tiene lugar con respecto al rumbo, la velocidad y la tecnología de sensores activada por ambos buques. Ho et al. [119] proporciona un resumen conciso del estado del arte con respecto al uso de la teoría de juegos en aplicaciones de defensa y destaca los beneficios y limitaciones de la teoría de juegos en los escenarios considerados.
A diferencia de lo que ocurre en la economía, en biología los beneficios de los juegos suelen interpretarse como correspondientes a la aptitud . Además, se ha prestado menos atención a los equilibrios que corresponden a una noción de racionalidad y más a los que se mantendrían mediante fuerzas evolutivas. El equilibrio más conocido en biología se conoce como estrategia evolutivamente estable (ESS), introducida por primera vez en (Maynard Smith y Price 1973). Aunque su motivación inicial no implicaba ninguno de los requisitos mentales del equilibrio de Nash, cada ESS es un equilibrio de Nash.
En biología, la teoría de juegos se ha utilizado como modelo para comprender muchos fenómenos diferentes. Se utilizó por primera vez para explicar la evolución (y estabilidad) de la proporción aproximada de sexos de 1:1 . (Fisher 1930) sugirió que la proporción de sexos de 1:1 es el resultado de fuerzas evolutivas que actúan sobre individuos que podrían ser vistos como tratando de maximizar su número de nietos.
Además, los biólogos han utilizado la teoría de juegos evolutivos y la ESS para explicar el surgimiento de la comunicación animal . [120] El análisis de los juegos de señalización y otros juegos de comunicación ha proporcionado información sobre la evolución de la comunicación entre animales. Por ejemplo, el comportamiento de acoso de muchas especies, en el que una gran cantidad de animales presa atacan a un depredador más grande, parece ser un ejemplo de organización emergente espontánea. También se ha demostrado que las hormigas exhiben un comportamiento de retroalimentación similar a la moda (ver Butterfly Economics de Paul Ormerod ).
Los biólogos han utilizado el juego de la gallina para analizar el comportamiento de lucha y la territorialidad. [121]
Según Maynard Smith, en el prefacio de Evolution and the Theory of Games , «paradójicamente, ha resultado que la teoría de juegos se aplica más fácilmente a la biología que al campo del comportamiento económico para el que fue diseñada originalmente». La teoría de juegos evolutiva se ha utilizado para explicar muchos fenómenos aparentemente incongruentes de la naturaleza. [122]
Uno de estos fenómenos se conoce como altruismo biológico . Se trata de una situación en la que un organismo parece actuar de una manera que beneficia a otros organismos y es perjudicial para sí mismo. Esto se distingue de las nociones tradicionales de altruismo porque tales acciones no son conscientes, sino que parecen ser adaptaciones evolutivas para aumentar la aptitud general. Se pueden encontrar ejemplos en especies que van desde los murciélagos vampiros que regurgitan la sangre que han obtenido de una noche de caza y se la dan a los miembros del grupo que no han podido alimentarse, hasta las abejas obreras que cuidan a la abeja reina durante toda su vida y nunca se aparean, hasta los monos verdes que advierten a los miembros del grupo de la aproximación de un depredador, incluso cuando pone en peligro la posibilidad de supervivencia de ese individuo. [123] Todas estas acciones aumentan la aptitud general de un grupo, pero se producen a un costo para el individuo.
La teoría de juegos evolutiva explica este altruismo con la idea de la selección de parentesco . Los altruistas discriminan entre los individuos a los que ayudan y favorecen a los parientes. La regla de Hamilton explica la lógica evolutiva detrás de esta selección con la ecuación c < b × r , donde el costo c para el altruista debe ser menor que el beneficio b para el receptor multiplicado por el coeficiente de parentesco r . Cuanto más estrechamente relacionados estén dos organismos, más aumentan las incidencias del altruismo porque comparten muchos de los mismos alelos. Esto significa que el individuo altruista, al asegurarse de que los alelos de su pariente cercano se transmitan a través de la supervivencia de su descendencia, puede renunciar a la opción de tener descendencia porque se transmite el mismo número de alelos. Por ejemplo, ayudar a un hermano (en animales diploides) tiene un coeficiente de 1 ⁄ 2 , porque (en promedio) un individuo comparte la mitad de los alelos en la descendencia de su hermano. Asegurarse de que una cantidad suficiente de la descendencia de un hermano sobreviva hasta la edad adulta excluye la necesidad de que el individuo altruista produzca descendencia. [123] Los valores de los coeficientes dependen en gran medida del alcance del campo de juego; por ejemplo, si la elección de a quién favorecer incluye a todos los seres vivos genéticos, no solo a todos los parientes, suponemos que la discrepancia entre todos los humanos solo representa aproximadamente el 1% de la diversidad en el campo de juego, un coeficiente que era 1 ⁄ 2 en el campo más pequeño se convierte en 0,995. De manera similar, si se considera que la información distinta a la de naturaleza genética (por ejemplo, epigenética, religión, ciencia, etc.) persistió a través del tiempo, el campo de juego se vuelve aún más grande y las discrepancias más pequeñas.
La teoría de juegos ha llegado a desempeñar un papel cada vez más importante en la lógica y en la ciencia informática . Varias teorías lógicas tienen una base en la semántica de los juegos . Además, los científicos informáticos han utilizado juegos para modelar cálculos interactivos . Asimismo, la teoría de juegos proporciona una base teórica al campo de los sistemas multiagente . [124]
Por otra parte, la teoría de juegos ha desempeñado un papel en los algoritmos en línea ; en particular, el problema del servidor k , que en el pasado se ha denominado juegos con costos móviles y juegos de solicitud-respuesta . [125] El principio de Yao es una técnica de teoría de juegos para demostrar límites inferiores en la complejidad computacional de algoritmos aleatorios , especialmente algoritmos en línea.
La aparición de Internet ha motivado el desarrollo de algoritmos para encontrar equilibrios en juegos, mercados, subastas computacionales, sistemas peer-to-peer y mercados de seguridad e información. La teoría de juegos algorítmicos [86] y, dentro de ella, el diseño de mecanismos algorítmicos [85] combinan el diseño de algoritmos computacionales y el análisis de sistemas complejos con la teoría económica. [126] [127] [128]
La teoría de juegos tiene múltiples aplicaciones en el campo de la inteligencia artificial y el aprendizaje automático. A menudo se utiliza para desarrollar sistemas autónomos que pueden tomar decisiones complejas en entornos inciertos. [129] Algunas otras áreas de aplicación de la teoría de juegos en el contexto de la IA/ML son las siguientes: formación de sistemas multiagente, aprendizaje de refuerzo, [130] diseño de mecanismos, etc. [131] Al utilizar la teoría de juegos para modelar el comportamiento de otros agentes y anticipar sus acciones, los sistemas de IA/ML pueden tomar mejores decisiones y funcionar de manera más eficaz. [132]
La teoría de juegos ha sido utilizada de diversas formas en filosofía . En respuesta a dos artículos de WVO Quine (1960, 1967), Lewis (1969) utilizó la teoría de juegos para desarrollar una explicación filosófica de las convenciones . Al hacerlo, proporcionó el primer análisis del conocimiento común y lo empleó para analizar el juego en juegos de coordinación . Además, fue el primero en sugerir que uno puede entender el significado en términos de juegos de señalización . Esta última sugerencia ha sido perseguida por varios filósofos desde Lewis. [133] [134] Siguiendo la explicación de las convenciones desde la teoría de juegos de Lewis (1969), Edna Ullmann-Margalit (1977) y Bicchieri (2006) han desarrollado teorías de las normas sociales que las definen como equilibrios de Nash que resultan de transformar un juego de motivos mixtos en un juego de coordinación. [135] [136]
La teoría de juegos también ha desafiado a los filósofos a pensar en términos de epistemología interactiva : qué significa para un colectivo tener creencias o conocimientos comunes, y cuáles son las consecuencias de este conocimiento para los resultados sociales resultantes de las interacciones de los agentes. Entre los filósofos que han trabajado en esta área se incluyen Bicchieri (1989, 1993), [137] [138] Skyrms (1990), [139] y Stalnaker (1999). [140]
La síntesis de la teoría de juegos con la ética fue defendida por RB Braithwaite . [141] La esperanza era que un análisis matemático riguroso de la teoría de juegos pudiera ayudar a formalizar las discusiones filosóficas más imprecisas. Sin embargo, esta expectativa solo se materializó en una medida limitada. [142]
En ética , algunos autores (entre los que destacan David Gauthier, Gregory Kavka y Jean Hampton) [¿ quiénes? ] han intentado seguir el proyecto de Thomas Hobbes de derivar la moralidad del interés propio. Dado que juegos como el dilema del prisionero presentan un aparente conflicto entre la moralidad y el interés propio, explicar por qué el interés propio requiere cooperación es un componente importante de este proyecto. Esta estrategia general es un componente de la visión general del contrato social en la filosofía política (para ejemplos, véase Gauthier (1986) y Kavka (1986)). [d]
Otros autores han intentado utilizar la teoría de juegos evolutiva para explicar el surgimiento de actitudes humanas sobre la moralidad y las conductas animales correspondientes. Estos autores analizan varios juegos, entre ellos el dilema del prisionero, la caza del ciervo y el juego de negociación de Nash , como una explicación del surgimiento de actitudes sobre la moralidad (véase, por ejemplo, Skyrms (1996, 2004) y Sober y Wilson (1998)).
Dado que la decisión de vacunarse contra una enfermedad en particular suele ser tomada por individuos que pueden considerar una variedad de factores y parámetros al tomar esta decisión (como la incidencia y prevalencia de la enfermedad, los riesgos percibidos y reales asociados con contraer la enfermedad, la tasa de mortalidad, los riesgos percibidos y reales asociados con la vacunación y el costo financiero de la vacunación), la teoría de juegos se ha utilizado para modelar y predecir la aceptación de la vacunación en una sociedad. [143] [144]
William Poundstone describió el juego en su libro de 1993 El dilema del prisionero: [145]
Dos miembros de una banda criminal, A y B, son arrestados y encarcelados. Cada prisionero se encuentra en régimen de aislamiento sin ningún medio de comunicación con su compañero. El cargo principal conllevaría una sentencia de diez años de prisión; sin embargo, la policía no tiene pruebas para una condena. Planean condenar a ambos a dos años de prisión por un cargo menor, pero ofrecen a cada prisionero un trato fáustico: si uno de ellos confiesa el crimen del cargo principal, traicionar al otro, será indultado y podrá irse, mientras que el otro deberá cumplir la totalidad de la sentencia en lugar de solo dos años por el cargo menor.
La estrategia dominante (y por lo tanto la mejor respuesta a cualquier posible estrategia del oponente), es traicionar al otro, lo que se alinea con el principio de lo seguro . [146] Sin embargo, que ambos prisioneros permanezcan en silencio produciría una recompensa mayor para ambos que la traición mutua.
La "batalla de los sexos" es un término que se utiliza para describir el conflicto percibido entre hombres y mujeres en diversas áreas de la vida, como las relaciones, las carreras y los roles sociales. Este conflicto se suele representar en la cultura popular, como en películas y programas de televisión, como una competencia humorística o dramática entre los géneros. Este conflicto se puede representar en un marco de teoría de juegos. Este es un ejemplo de juegos no cooperativos.
Un ejemplo de la “batalla de los sexos” se puede ver en la representación de las relaciones en los medios de comunicación populares, donde los hombres y las mujeres suelen ser representados como seres fundamentalmente diferentes y en conflicto entre sí. Por ejemplo, en algunas comedias románticas, los protagonistas masculinos y femeninos se muestran con puntos de vista opuestos sobre el amor y las relaciones, y tienen que superar estas diferencias para estar juntos. [147]
En este juego, hay dos equilibrios de Nash de estrategia pura: uno en el que ambos jugadores eligen la misma estrategia y el otro en el que los jugadores eligen diferentes opciones. Si el juego se juega con estrategias mixtas, donde cada jugador elige su estrategia al azar, entonces hay un número infinito de equilibrios de Nash. Sin embargo, en el contexto del juego de la "batalla de los sexos", se suele suponer que el juego se juega con estrategias puras. [148]
El juego del ultimátum es un juego que se ha convertido en un instrumento popular de experimentación económica . Una de sus primeras descripciones es la del premio Nobel John Harsanyi en 1961. [149]
Un jugador, el proponente, recibe una suma de dinero. El proponente tiene la tarea de dividirla con otro jugador, el respondedor (que sabe cuál es la suma total). Una vez que el proponente comunica su decisión, el respondedor puede aceptarla o rechazarla. Si el respondedor acepta, el dinero se divide según la propuesta; si el respondedor rechaza, ambos jugadores no reciben nada. Ambos jugadores saben de antemano las consecuencias de que el respondedor acepte o rechace la oferta. El juego demuestra cómo la aceptación social, la justicia y la generosidad influyen en las decisiones de los jugadores. [150]
El juego del ultimátum tiene una variante, el juego del dictador. En su mayor parte son idénticos, excepto que en el juego del dictador el que responde no tiene poder para rechazar la oferta del proponente.
El juego de la confianza es un experimento diseñado para medir la confianza en las decisiones económicas. También se lo denomina "el juego de la inversión" y está diseñado para investigar la confianza y demostrar su importancia en lugar de la "racionalidad" del interés propio. El juego fue diseñado por Berg Joyce, John Dickhaut y Kevin McCabe en 1995. [151]
En el juego, un jugador (el inversor) recibe una suma de dinero y debe decidir cuánto le dará a otro jugador (el fiduciario). El experimentador triplica la cantidad entregada y el fiduciario decide entonces cuánto de la cantidad triplicada le devolverá al inversor. Si el receptor está completamente interesado en sí mismo, no debería devolver nada. Sin embargo, esto no es así en el experimento. Los resultados sugieren que las personas están dispuestas a depositar una confianza, arriesgando cierta cantidad de dinero, con la creencia de que habrá reciprocidad. [152]
El modelo de competencia de Cournot implica que los jugadores eligen la cantidad de un producto homogéneo para producir de forma independiente y simultánea, donde el costo marginal puede ser diferente para cada empresa y la recompensa de la empresa es la ganancia. Los costos de producción son información pública y la empresa apunta a encontrar la cantidad que maximiza la ganancia con base en lo que cree que la otra empresa producirá y se comportará como monopolios. En este juego, las empresas quieren producir en la cantidad de monopolio, pero hay un alto incentivo para desviarse y producir más, lo que disminuye el precio de equilibrio del mercado. [23] Por ejemplo, las empresas pueden verse tentadas a desviarse de la cantidad de monopolio si hay una cantidad de monopolio baja y un precio alto, con el objetivo de aumentar la producción para maximizar la ganancia. [23] Sin embargo, esta opción no proporciona la recompensa más alta, ya que la capacidad de una empresa para maximizar las ganancias depende de su participación de mercado y la elasticidad de la demanda del mercado. [153] El equilibrio de Cournot se alcanza cuando cada empresa opera en su función de reacción sin incentivo para desviarse, ya que tienen la mejor respuesta en función de la producción de las otras empresas. [23] Dentro del juego, las empresas alcanzan el equilibrio de Nash cuando se alcanza el equilibrio de Cournot.
La competencia de Bertrand supone productos homogéneos y un coste marginal constante, y los participantes eligen los precios. [23] El equilibrio de la competencia de precios se da cuando el precio es igual a los costes marginales, suponiendo que se dispone de información completa sobre los costes de los competidores. Por tanto, las empresas tienen un incentivo para desviarse del equilibrio porque un producto homogéneo con un precio más bajo obtendrá toda la cuota de mercado, lo que se conoce como ventaja de costes. [154]
Liza
Sin embargo, las técnicas matemáticas utilizadas en la teoría de juegos están orientadas a la consecución de un único objetivo: la maximización del "nivel de seguridad", donde el nivel de seguridad es la cantidad mínima que un jugador puede recibir de una elección de estrategia.
... ¡es que se pierde todo el sentido de la máquina del fin del mundo si la mantienes en secreto!