El juego de suma cero es una representación matemática en la teoría de juegos y la teoría económica de una situación que involucra a dos entidades en competencia, donde el resultado es una ventaja para un lado y una pérdida equivalente para el otro. [1] En otras palabras, la ganancia del jugador uno es equivalente a la pérdida del jugador dos, con el resultado de que la mejora neta en el beneficio del juego es cero. [2]
Si se suman las ganancias totales de los participantes y se restan las pérdidas totales, la suma total será cero. Por lo tanto, cortar una torta , donde tomar un trozo más significativo reduce la cantidad de torta disponible para los demás tanto como aumenta la cantidad disponible para ese tomador, es un juego de suma cero si todos los participantes valoran cada unidad de torta por igual . Otros ejemplos de juegos de suma cero en la vida diaria incluyen juegos como el póquer , el ajedrez , el deporte y el bridge , donde una persona gana y otra pierde, lo que resulta en un beneficio neto cero para cada jugador. [3] En los mercados e instrumentos financieros, los contratos de futuros y las opciones también son juegos de suma cero. [4]
Por el contrario, la suma no nula describe una situación en la que las ganancias y pérdidas agregadas de las partes que interactúan pueden ser menores o mayores que cero. Un juego de suma cero también se denomina juego estrictamente competitivo , mientras que los juegos de suma no nula pueden ser competitivos o no competitivos. Los juegos de suma cero se resuelven con mayor frecuencia con el teorema minimax , que está estrechamente relacionado con la dualidad de programación lineal [5] , o con el equilibrio de Nash . El dilema del prisionero es un clásico juego de suma no nula [6] .
La propiedad de suma cero (si uno gana, otro pierde) significa que cualquier resultado de una situación de suma cero es óptimo en el sentido de Pareto . En general, cualquier juego en el que todas las estrategias sean óptimas en el sentido de Pareto se denomina juego de conflicto. [7] [8]
Los juegos de suma cero son un ejemplo específico de juegos de suma constante donde la suma de cada resultado es siempre cero. [9] Estos juegos son distributivos, no integrativos; el pastel no se puede agrandar mediante una buena negociación.
En situaciones en las que la ganancia (o pérdida) de un decisor no necesariamente resulta en la pérdida (o ganancia) de los otros decisores, se habla de una situación de suma no cero. [10] Por lo tanto, un país con un exceso de bananas que comercia con otro país por su exceso de manzanas, en la que ambos se benefician de la transacción, se encuentra en una situación de suma no cero. Otros juegos de suma no cero son aquellos en los que la suma de las ganancias y pérdidas de los jugadores es a veces mayor o menor que la que tenían al principio.
La idea de un resultado óptimo de Pareto en un juego de suma cero da lugar a un criterio generalizado de racionalidad egoísta relativa, el criterio de castigar al oponente, en el que ambos jugadores siempre buscan minimizar el resultado del oponente a un coste favorable para ellos en lugar de preferir más en lugar de menos. El criterio de castigar al oponente se puede utilizar tanto en juegos de suma cero (por ejemplo, juegos de guerra, ajedrez) como en juegos de suma no cero (por ejemplo, juegos de selección por pooling). [11] El jugador del juego tiene un deseo bastante simple de maximizar su beneficio, y el oponente desea minimizarlo. [12]
En los juegos finitos de suma cero para dos jugadores, los diferentes conceptos de solución de la teoría de juegos de equilibrio de Nash , minimax y maximin dan la misma solución. Si se permite a los jugadores jugar con una estrategia mixta , el juego siempre tiene un equilibrio.
La matriz de pagos de un juego es una representación conveniente. Consideremos estas situaciones como ejemplo: el juego de suma cero para dos jugadores que se muestra a la derecha o arriba.
El orden de juego se desarrolla de la siguiente manera: el primer jugador (rojo) elige en secreto una de las dos acciones 1 o 2; el segundo jugador (azul), sin saber la elección del primer jugador, elige en secreto una de las tres acciones A, B o C. Luego, se revelan las opciones y el total de puntos de cada jugador se ve afectado de acuerdo con el pago por esas opciones.
Ejemplo: Rojo elige la acción 2 y Azul elige la acción B. Cuando se asigna el pago, Rojo gana 20 puntos y Azul pierde 20 puntos.
En este juego de ejemplo, ambos jugadores conocen la matriz de pagos e intentan maximizar la cantidad de puntos que obtienen. Rojo podría razonar de la siguiente manera: "Con la acción 2, podría perder hasta 20 puntos y ganar solo 20, y con la acción 1 puedo perder solo 10 pero puedo ganar hasta 30, por lo que la acción 1 parece mucho mejor". Con un razonamiento similar, Azul elegiría la acción C. Si ambos jugadores realizan estas acciones, Rojo ganará 20 puntos. Si Azul anticipa el razonamiento de Rojo y la elección de la acción 1, Azul puede elegir la acción B, de modo de ganar 10 puntos. Si Rojo, a su vez, anticipa este truco y opta por la acción 2, Rojo ganará 20 puntos.
Émile Borel y John von Neumann tuvieron la idea fundamental de que la probabilidad proporciona una salida a este enigma. En lugar de decidir una acción concreta a realizar, los dos jugadores asignan probabilidades a sus respectivas acciones y luego utilizan un dispositivo aleatorio que, de acuerdo con estas probabilidades, elige una acción para ellos. Cada jugador calcula las probabilidades de manera de minimizar la pérdida máxima de puntos esperada independientemente de la estrategia del oponente. Esto conduce a un problema de programación lineal con las estrategias óptimas para cada jugador. Este método minimax puede calcular estrategias probablemente óptimas para todos los juegos de suma cero de dos jugadores.
Para el ejemplo dado anteriormente, resulta que Rojo debería elegir la acción 1 con probabilidad 4/7 y la acción 2 con probabilidad 3/7 , y Azul debería asignar las probabilidades 0, 4/7 , y 3/7 a las tres acciones A, B y C. Entonces el rojo ganará 20/7 puntos de media por partido.
El equilibrio de Nash para un juego de suma cero de dos jugadores se puede hallar resolviendo un problema de programación lineal . Supongamos que un juego de suma cero tiene una matriz de pagos M donde el elemento M i , j es el pago obtenido cuando el jugador que minimiza elige la estrategia pura i y el jugador que maximiza elige la estrategia pura j (es decir, el jugador que intenta minimizar el pago elige la fila y el jugador que intenta maximizar el pago elige la columna). Supongamos que cada elemento de M es positivo. El juego tendrá al menos un equilibrio de Nash. El equilibrio de Nash se puede hallar (Raghavan 1994, p. 740) resolviendo el siguiente programa lineal para hallar un vector u :
Sujeto a las restricciones:
La primera restricción dice que cada elemento del vector u debe ser no negativo, y la segunda restricción dice que cada elemento del vector M u debe ser al menos 1. Para el vector u resultante , la inversa de la suma de sus elementos es el valor del juego. Al multiplicar u por ese valor se obtiene un vector de probabilidad, que indica la probabilidad de que el jugador que maximiza elija cada estrategia pura posible.
Si la matriz del juego no tiene todos los elementos positivos, se añade una constante a cada elemento que sea lo suficientemente grande como para que todos sean positivos. Esto aumentará el valor del juego en esa constante y no afectará las estrategias mixtas de equilibrio para el equilibrio.
La estrategia mixta de equilibrio para el jugador que minimiza se puede encontrar resolviendo el dual del programa lineal dado. Alternativamente, se puede encontrar utilizando el procedimiento anterior para resolver una matriz de pagos modificada que es la transposición y negación de M (agregando una constante para que sea positiva) y luego resolviendo el juego resultante.
Si se encuentran todas las soluciones del programa lineal, constituirán todos los equilibrios de Nash del juego. A la inversa, cualquier programa lineal puede convertirse en un juego de suma cero para dos jugadores mediante un cambio de variables que lo pone en la forma de las ecuaciones anteriores y, por lo tanto, dichos juegos son equivalentes a los programas lineales, en general. [13]
Si evitar un juego de suma cero es una opción de acción con cierta probabilidad para los jugadores, evitar siempre es una estrategia de equilibrio para al menos un jugador en un juego de suma cero. Para cualquier juego de suma cero entre dos jugadores en el que un empate cero-cero es imposible o no creíble después de que se inicia el juego, como el póquer, no hay una estrategia de equilibrio de Nash que no sea evitar el juego. Incluso si hay un empate cero-cero creíble después de que se inicia un juego de suma cero, no es mejor que la estrategia de evitarlo. En este sentido, es interesante encontrar que la recompensa por partida en el cálculo de la elección óptima prevalecerá sobre todos los juegos de suma cero entre dos jugadores en lo que respecta a comenzar el juego o no. [14]
El ejemplo más común o simple del subcampo de la psicología social es el concepto de " trampas sociales ". En algunos casos, la búsqueda de intereses personales individuales puede mejorar el bienestar colectivo del grupo, pero en otras situaciones, la búsqueda de intereses personales por parte de todas las partes da como resultado un comportamiento mutuamente destructivo.
La revisión de Copeland señala que un juego de suma no cero con n jugadores se puede convertir en un juego de suma cero con (n+1) jugadores, donde el jugador n+1, denominado jugador ficticio , recibe el negativo de la suma de las ganancias de los otros n jugadores (la ganancia/pérdida global). [15]
Es evidente que en un juego de suma cero de tres personas existen múltiples relaciones entre los jugadores; en un juego de suma cero de dos personas, todo lo que gana un jugador lo pierde necesariamente el otro y viceversa; por lo tanto, siempre hay un antagonismo absoluto de intereses, y eso es similar en el juego de tres personas. [16] Se supondría que un movimiento particular de un jugador en un juego de suma cero de tres personas es claramente beneficioso para él y puede perjudicar a los otros dos jugadores, o beneficiar a uno y perjudicar al otro oponente. [16] En particular, el paralelismo de intereses entre dos jugadores hace deseable una cooperación; puede suceder que un jugador tenga la opción de elegir entre varias políticas: entrar en un interés de paralelismo con otro jugador ajustando su conducta, o lo contrario; que puede elegir con cuál de los otros dos jugadores prefiere construir tal paralelismo, y en qué medida. [16] La imagen de la izquierda muestra un ejemplo típico de un juego de suma cero de tres personas. Si el jugador 1 elige defender, pero los jugadores 2 y 3 eligen atacar, ambos ganarán un punto. Al mismo tiempo, el jugador 1 perderá dos puntos porque otros jugadores le quitan puntos y es evidente que los jugadores 2 y 3 tienen intereses paralelos.
Los estudios muestran que la entrada de aerolíneas de bajo coste al mercado de Hong Kong generó 671 millones de dólares en ingresos y resultó en una salida de 294 millones de dólares.
Por lo tanto, al introducir un nuevo modelo, se debe tener en cuenta el efecto de sustitución, que dará lugar a fugas e inyecciones económicas. Por lo tanto, la introducción de nuevos modelos requiere cautela. Por ejemplo, si el número de nuevas aerolíneas que salen y llegan al aeropuerto es el mismo, la contribución económica a la ciudad anfitriona puede ser un juego de suma cero. Porque para Hong Kong, el consumo de los turistas extranjeros en Hong Kong es un ingreso, mientras que el consumo de los residentes de Hong Kong en ciudades opuestas es un flujo de salida. Además, la introducción de nuevas aerolíneas también puede tener un impacto negativo en las aerolíneas existentes.
Por consiguiente, cuando se introduce un nuevo modelo de aviación, es necesario realizar pruebas de viabilidad en todos los aspectos, teniendo en cuenta los efectos de entrada y salida económica y de desplazamiento causados por el modelo.
El comercio de derivados puede considerarse un juego de suma cero, ya que cada dólar ganado por una parte en una transacción debe ser perdido por la otra, lo que produce una transferencia neta de riqueza de cero. [18]
Un contrato de opciones , en el que un comprador adquiere un contrato derivado que le otorga el derecho a comprar un activo subyacente a un vendedor a un precio de ejercicio especificado antes de una fecha de vencimiento especificada, es un ejemplo de un juego de suma cero. Un contrato de futuros , en el que un comprador compra un contrato derivado para comprar un activo subyacente al vendedor por un precio especificado en una fecha especificada, también es un ejemplo de un juego de suma cero. [19] Esto se debe a que el principio fundamental de estos contratos es que son acuerdos entre dos partes, y cualquier ganancia obtenida por una parte debe ser igualada por una pérdida sufrida por la otra.
Si el precio del activo subyacente aumenta antes de la fecha de vencimiento, el comprador puede ejercer o cerrar el contrato de opciones o futuros. La ganancia del comprador y la pérdida correspondiente del vendedor serán la diferencia entre el precio de ejercicio y el valor del activo subyacente en ese momento. Por lo tanto, la transferencia neta de riqueza es cero.
Los swaps , que implican el intercambio de flujos de efectivo de dos instrumentos financieros diferentes, también se consideran un juego de suma cero. [20] Consideremos un swap de tasa de interés estándar mediante el cual la Empresa A paga una tasa fija y recibe una tasa flotante; correspondientemente, la Empresa B paga una tasa flotante y recibe una tasa fija. Si las tasas aumentan, entonces la Empresa A ganará y la Empresa B perderá por el diferencial de tasas (tasa flotante – tasa fija). Si las tasas disminuyen, entonces la Empresa A perderá y la Empresa B ganará por el diferencial de tasas (tasa fija – tasa flotante).
Aunque el comercio de derivados puede considerarse un juego de suma cero, es importante recordar que esto no es una verdad absoluta. Los mercados financieros son complejos y multifacéticos, con una variedad de participantes que participan en una variedad de actividades. Si bien algunas operaciones pueden resultar en una simple transferencia de riqueza de una parte a otra, el mercado en su conjunto no es puramente competitivo y muchas transacciones cumplen importantes funciones económicas.
El mercado de valores es un excelente ejemplo de un juego de suma positiva, que a menudo se califica erróneamente de juego de suma cero. Se trata de una falacia de suma cero: la percepción de que un operador del mercado de valores sólo puede aumentar el valor de sus inversiones si otro operador las disminuye. [21]
El objetivo principal del mercado de valores es poner en contacto a compradores y vendedores, pero el precio vigente es el que equilibra la oferta y la demanda. Los precios de las acciones generalmente se mueven de acuerdo con los cambios en las expectativas futuras, como anuncios de adquisiciones, sorpresas de ganancias al alza o mejores pronósticos. [22]
Por ejemplo, si la empresa C anuncia un acuerdo para adquirir la empresa D y los inversores creen que la adquisición generará sinergias y, por lo tanto, una mayor rentabilidad para la empresa C, habrá una mayor demanda de acciones de la empresa C. En este escenario, todos los accionistas actuales de la empresa C disfrutarán de ganancias sin incurrir en pérdidas mensurables correspondientes para otros participantes.
Además, a largo plazo, el mercado de valores es un juego de suma positiva. A medida que se produce el crecimiento económico, aumenta la demanda, aumenta la producción, las empresas crecen y sus valoraciones aumentan, lo que genera creación de valor y riqueza en el mercado.
Robert Wright teorizó en su libro Nonzero: The Logic of Human Destiny que la sociedad se vuelve cada vez más de suma no cero a medida que se vuelve más compleja, especializada e interdependiente.
En 1944, John von Neumann y Oskar Morgenstern demostraron que cualquier juego de suma distinta de cero para n jugadores es equivalente a un juego de suma cero con n + 1 jugadores; el ( n + 1)ésimo jugador representa la ganancia o pérdida global. [23]
Los críticos de la teoría de juegos suelen malinterpretar los juegos de suma cero y, en particular, sus soluciones , generalmente en relación con la independencia y la racionalidad de los jugadores, así como con la interpretación de las funciones de utilidad [ se necesita más explicación ] . Además, la palabra "juego" no implica que el modelo sea válido únicamente para juegos recreativos . [5]
A veces se denomina a la política de suma cero [24] [25] [26] porque en el uso común la idea de un punto muerto se percibe como "suma cero"; sin embargo, la política y la macroeconomía no son juegos de suma cero, porque no constituyen sistemas conservados . [ cita requerida ]
En psicología, el pensamiento de suma cero se refiere a la percepción de que una situación determinada es como un juego de suma cero, donde la ganancia de una persona es igual a la pérdida de otra.