El precio de la anarquía (PoA) es un concepto de la teoría de juegos y el diseño de mecanismos que mide cómo se degrada el bienestar social de un sistema debido al comportamiento egoísta de sus agentes. Se ha estudiado ampliamente en diversos contextos, en particular en los juegos de congestión (CG).
Ejemplo
La ineficiencia de los juegos de congestión fue ilustrada por primera vez por Pigou en 1920, [1] utilizando el siguiente juego de congestión simple. Supongamos que hay dos caminos que llevan del punto A al punto B:
- La carretera 1 es ancha pero lenta. Por esta carretera se tarda 1 minuto en llegar del punto A al punto B, independientemente de cuántos conductores la utilicen.
- La carretera 2 es rápida pero angosta, por lo que se vuelve congestionada y más lenta a medida que más conductores la utilizan. Si x conductores utilizan la carretera, les toma x/1000 minutos llegar de A a B.
Supongamos que hay 1.000 conductores que necesitan ir de A a B. Cada conductor quiere minimizar su propio retraso, pero el gobierno quisiera minimizar el retraso total (la suma de los retrasos de todos los conductores).
- En primer lugar, calculemos el retraso mínimo posible. Supongamos que x conductores van a la carretera 2 y 1000 − x van a la carretera 1. Entonces, el retraso total es x 2 /1000+(1000 − x ). Este se minimiza cuando x ≈ 500, es decir, 500 conductores van a la carretera 2 y los otros 500 a la carretera 1; el retraso total es 500×1/2 + 500×1 ≈ 750 minutos.
- Para cada conductor, el retraso siempre es menor cuando se conduce por la carretera 2, ya que x /1000 < 1. Esto significa que elegir la carretera 2 es una estrategia dominante . Por lo tanto, en la "anarquía" (es decir, sin planificación central), todos los conductores eligen la carretera 2, su retraso es de 1 minuto y el retraso total es de 1000 minutos. El problema es que cada agente minimiza su propio retraso, pero ignora el costo que imponen sus propias acciones sobre el retraso de los demás; existe una externalidad negativa que conduce a un resultado ineficiente.
En este ejemplo, el enrutamiento egoísta genera un retraso total que es 4/3 veces mayor que el óptimo, por lo que el precio de la anarquía es 4/3. En general, el precio de la anarquía puede variar según el tipo de juego de congestión, la estructura de la red y las funciones de retraso. Varios autores han calculado límites superiores e inferiores en el PoA en varios juegos de congestión.
Efecto de las funciones de retardo
Para ilustrar el efecto de las funciones de retardo en PoA, considere una variante del ejemplo anterior en el que el retraso en la ruta 1 sigue siendo de 1 minuto, pero el retraso en la ruta 2 cuando x conductores la usan es , para algún d>1.
- El retraso mínimo posible se alcanza cuando el número de conductores que van a la carretera 2 es . A medida que , este número se acerca a 1000, por lo que los conductores van a la carretera 2, donde . El retraso total es , que se acerca a 0 a medida que .
- Sin embargo, por cada conductor que circula por la carretera 1, todavía merece la pena desplazarse a la carretera 2. Por lo tanto, en la anarquía, todos los conductores van a la carretera 2 y el retraso es de minutos.
Por lo tanto, el precio de la anarquía se acerca al infinito cuando .
Definiciones
Un juego de congestión (CG) se define por un conjunto de recursos . Por ejemplo, en una red de carreteras, cada carretera es un recurso individual.
recurso, existe una función de demora (también conocida como función de costo ). La función asigna la cantidad de congestión en el recurso (por ejemplo, la cantidad de conductores que eligen usar la carretera) a la demora experimentada por cada jugador que lo usa. El costo total de un jugador es la demora total en todos los recursos que elige. Cada jugador elige una estrategia para minimizar su propio costo.
Un equilibrio de Nash es una situación en la que ningún jugador puede mejorar su retraso modificando unilateralmente su elección. El precio de la anarquía (PoA) es la relación entre el mayor retraso en el equilibrio de Nash y el menor retraso posible en general. El precio de la estabilidad (PoS) es la relación entre el menor retraso en el equilibrio de Nash (es decir: el mejor equilibrio posible) y el menor retraso posible en general. El PoA y el PoS también se pueden calcular con respecto a otros conceptos de equilibrio, como el equilibrio mixto o el equilibrio correlacionado .
Hay varias clases principales de juegos de congestión:
- En los CG atómicos , hay un número finito de jugadores y cada uno elige un único camino (un único subconjunto de los recursos). Los juegos de congestión atómica tienen dos variantes:
- En los CG no ponderados , cada jugador contribuye con la misma cantidad 1 a la congestión de los recursos que utiliza. Por lo tanto, la congestión en cada recurso es simplemente la cantidad de jugadores que eligen ese recurso.
- En los CG ponderados , cada jugador i tiene un peso diferente w i . Por ejemplo, en las redes de carreteras, el peso de un conductor puede ser igual a la longitud de su coche. La congestión en cada recurso es la suma de los pesos de todos los jugadores que eligen este recurso.
- En los CG no atómicos , el número de jugadores se acerca al infinito, lo que significa que la contribución de cada jugador individual a la congestión es insignificante. Los jugadores están representados por una cantidad continua. El ejemplo de Pigou (ilustrado arriba) en realidad se planteó originalmente como un juego no atómico. Supongamos que el retraso a través de la carretera 1 es 1. Hay 1 unidad continua de jugadores. El retraso total mínimo se alcanza cuando 1/2 de los jugadores van a la carretera 1 y 1/2 de ellos van a la carretera 2; el retraso total es 1*1/2+1/2*1/2 = 3/4. Sin embargo, para cada jugador individual, el retraso es siempre menor a través de la carretera 2, por lo que en el equilibrio de Nash, el retraso total es 1*1=1.
- En los CG divisibles , hay un número finito de jugadores, cada jugador tiene un peso y cada jugador puede dividir su peso entre varios caminos (varios subconjuntos de recursos).
Otra clasificación de los CG se basa en los conjuntos de estrategias disponibles para los jugadores:
- En los CG simétricos , todos los jugadores tienen el mismo conjunto de estrategias posibles, como en el ejemplo de Pigou anterior.
- En los CG asimétricos , diferentes jugadores pueden tener diferentes conjuntos de estrategias posibles, como conductores con diferentes ubicaciones de origen y destino.
Además:
- En los CG singleton , cada estrategia de cada jugador es un conjunto singleton, es decir, cada jugador elige un único recurso.
- En los CG de red , hay un gráfico subyacente y cada estrategia de cada jugador es una ruta simple en el gráfico. Si el CG es simétrico, entonces todos los jugadores tienen el mismo origen y destino; si es asimétrico, entonces diferentes jugadores pueden tener diferentes orígenes o destinos.
Juegos de congestión atómica
Christodoulou y Koutsoupias [2] analizaron CG atómicos no ponderados. Demostraron que el PoA cuando todas las funciones de retardo son lineales es exactamente 2,5 (es decir: el PoA siempre es como máximo 2,5, y en algunos casos es exactamente 2,5). También dieron límites superior e inferior para PoA cuando las funciones de retardo son polinomios de grado acotado. En otro artículo, Christodoulou y Koutsoupias [3] analizaron el PoS de juegos de congestión atómicos no ponderados con funciones de retardo lineales. Demostraron que el PoS es como máximo 1,6 y mostraron un ejemplo en el que el PoS es 1,577 . También mostraron que el PoA de equilibrios correlacionados en este caso es exactamente 2,5 para juegos no ponderados y exactamente 2,618 para juegos ponderados.
Awerbuch, Azar y Epstein [4] analizaron CG ponderados atómicamente . Demostraron que el PoA cuando todas las funciones de retardo son lineales es exactamente 2,618 . También demostraron que, cuando las funciones de retardo son polinomios de grado d , el PoA está en .
Aland, Dumrauf, Gairing, Monien y Schoppmann [5] calcularon el PoA exacto para CG atómicos, para funciones de retardo que son polinomios de grado d como máximo :
- Para los juegos no ponderados, el PoA es , donde es la única solución real no negativa de . Nótese que es la proporción áurea y crece como . Por lo tanto, el PoA está en .
- Para los juegos ponderados, el PoA es , donde . Asintóticamente, esto todavía crece como .
Los mismos límites se aplican siempre que ningún jugador pueda mejorar su costo esperado mediante una desviación unilateral. Por lo tanto, los PoA en el peor de los casos son los mismos con respecto al equilibrio de Nash puro, el equilibrio de Nash mixto, el equilibrio correlacionado y el equilibrio burdamente correlacionado. Además, los límites se aplican para juegos de congestión de red ponderados y no ponderados .
Bhawalkar, Gairing y Roughgarden [6] analizan los CG ponderados y muestran cómo calcular el PoA para cualquier clase de funciones de costo (no necesariamente polinómicas). También muestran que, en condiciones moderadas en las funciones de retardo admisibles, el PoA con respecto a los equilibrios de Nash puros, los equilibrios de Nash mixtos, los equilibrios correlacionados y los equilibrios burdamente correlacionados son siempre iguales. También muestran que, con funciones de costo polinómicas, el PoA del peor caso se alcanza en una red simple, que consta solo de un conjunto de aristas paralelas. También muestran que el PoA de los juegos de congestión simétricos no ponderados es siempre igual al de los asimétricos.
Resultados adicionales
De-Jong y Uetz [7] estudian los CG secuenciales , en los que los jugadores eligen sus estrategias secuencialmente en lugar de simultáneamente. Analizan el PoA del equilibrio perfecto en subjuegos . Muestran que el PoA secuencial con funciones de costo afines es exactamente 1,5 para dos jugadores y ≈ 2,13 para tres jugadores, y al menos 2,46 para cuatro jugadores. Para los juegos de congestión singleton con funciones de costo afines, cuando hay n jugadores, el PoA secuencial es como máximo n -1; cuando , el PoA secuencial es al menos 2+1/e ≈ 2,37 . Para los juegos de congestión atómica singleton simétricos con funciones de costo afines, el PoA secuencial es exactamente 4/3 .
Fotakis [8] estudia el PoA de los CG con trayectorias linealmente independientes, lo que es una extensión de la configuración de enlaces paralelos.
Law, Huang y Liu [9] estudian el PoA de los CG en redes de radio cognitiva .
Gairing, Burkhard y Karsten [10] estudian el PoA de los CG con funciones de retardo lineal específicas del jugador.
Mlichtaich [11] analiza el efecto de la topología de red en la eficiencia de PNE en CG atómicos:
- Un gráfico G garantiza que cada PNE es Pareto-eficiente, siempre y cuando tres "redes prohibidas" simples no estén integradas en G.
- Un gráfico G garantiza que la paradoja de Braess no ocurre, siempre y cuando sea un gráfico serie-paralelo .
PoA de juegos de congestión no atómica
Roughgarden y Tardos [12] analizaron CG no atómicos. Demostraron que, cuando las funciones de retardo son polinomios de grado como máximo d , el PoA está en , que es sustancialmente menor que el PoA de los juegos atómicos. En particular, cuando d = 1, el PoA es 4/3; esto demuestra que el ejemplo simple de Pigou es el peor caso para funciones de retardo lineales.
Chau y Sim [13] extienden los resultados de Roughgarden y Tardos (1) considerando mapas de costos simétricos y (2) incorporando demandas elásticas.
Correa, Schulz y Stier-Moses [14] presentan una prueba geométrica breve de los resultados del PoA para CG no atómicos. También proporcionan límites más fuertes para el PoA cuando los costos de equilibrio están dentro de límites razonables de los costos fijos.
Blum, Even-Dar y Ligett [15] demostraron que todos estos límites de PoA se aplican bajo supuestos de comportamiento relativamente débiles: es suficiente que todos los usuarios logren que el arrepentimiento promedio desaparezca después de repetidas partidas del juego.
Un concepto útil en el análisis de PoA es la suavidad . Una función de retardo d se llama -suave si para todos , . Si el retraso es suave, es un equilibrio de Nash y es una asignación óptima, entonces . En otras palabras, el precio de la anarquía es . [16]
Mlichtaich [17] analizó CG no atómicos singleton , con las siguientes características adicionales:
- La utilidad de cada jugador se compone de dos partes: un valor específico del jugador , menos un retraso específico del recurso . Formalmente, si el jugador i elige el recurso e , entonces , donde es el valor intrínseco que i asigna a e.
- Las funciones de retardo son estrictamente crecientes.
- El costo social marginal de la congestión en cualquier recurso e (definido como la derivada ) es estrictamente creciente.
En estos juegos, los pagos de equilibrio son siempre únicos y eficientes en el sentido de Pareto, pero pueden no maximizar la suma de utilidades. Además:
- Si hay al menos tres recursos, el equilibrio maximiza la suma (es decir, PoS=PoA=1) si y solo si las funciones de demora son logarítmicas . Para funciones de demora no logarítmicas, siempre hay utilidades o costos fijos para los cuales ningún equilibrio maximiza la suma de utilidades (PoS>1, lo que implica PoA>1). Cuando solo hay dos recursos, la clase de funciones de demora para las cuales PoA=1 es algo mayor.
- Si las funciones de retardo no son “demasiado” convexas, entonces es posible maximizar la suma de utilidades utilizando un proceso de negociación, y existe una fórmula explícita que especifica la parte de la utilidad agregada máxima que debe asignarse a cada grupo de jugadores.
PoA de juegos de congestión divisibles
Roughgarden y Schoppmann [18] analizaron juegos de congestión divisibles. Demostraron que, cuando las funciones de retardo son polinomios de grado d como máximo , el PoA está en . En particular, cuando d = 1, el PoA es como máximo 3/2. El PoA para juegos divisibles es menor que para juegos atómicos, pero mayor que para juegos no atómicos. Por ejemplo:
- Cuando d=1, el PoA es 1,333 para juegos no atómicos, 1,5 para juegos divisibles y 2,5 para juegos atómicos;
- Cuando d=8, el PoA es 3,081 para juegos no atómicos, 512 para juegos divisibles y 1.101.126 para juegos atómicos.
PoA con jugadores altruistas
El modelo básico de CG supone que los jugadores son egoístas, es decir, que sólo les importa su propio beneficio. De hecho, los jugadores pueden ser altruistas y preocuparse también por el coste social. Esto se puede modelar suponiendo que el coste real de cada jugador es un promedio ponderado de su propio retraso y el retraso total. El altruismo puede tener efectos sorprendentes en la eficiencia del sistema:
- En general, en los CG atómicos, incluso el altruismo parcial puede perjudicar la eficiencia general. Sin embargo, en el caso especial de los juegos de equilibrio de carga simétrico , se puede lograr una eficiencia óptima equilibrando el egoísmo y el altruismo. [19]
- En los CG atómicos y los juegos de reparto de costes, el PoA robusto empeora con el aumento del altruismo, mientras que en los juegos de utilidad válida no se ve afectado por el altruismo. Pero en los CG no atómicos generales con altruismo uniforme, el PoA mejora con el aumento del altruismo. En los CG singleton atómicos y no atómicos , existen límites en el PoA puro que mejoran con el altruismo medio . [20]
Existen otros artículos que estudian el efecto del altruismo en el PoA. [21] [22] Una forma alternativa de medir el efecto del altruismo en la eficiencia es a través de la estática comparativa : en un solo juego (no necesariamente el peor de los casos), ¿cómo afecta el aumento del coeficiente de altruismo al costo social? [23] [24] Para algunas clases de CG, el efecto del altruismo en la eficiencia puede ser negativo. [25]
Véase también
- Tarifa de congestión : un impuesto que tiene como objetivo aumentar la eficiencia en redes congestionadas.
- Externalidad : una discusión general de la ineficiencia causada por el comportamiento egoísta.
Referencias
- ^ A., Pigou (1920). La economía del bienestar.
- ^ Christodoulou, George; Koutsoupias, Elias (22 de mayo de 2005). "El precio de la anarquía de los juegos de congestión finita". Actas del trigésimo séptimo simposio anual de la ACM sobre teoría de la computación . STOC '05. Nueva York, NY, EE. UU.: Association for Computing Machinery. págs. 67–73. doi :10.1145/1060590.1060600. ISBN 978-1-58113-960-0.S2CID2670556 .
- ^ Christodoulou, George; Koutsoupias, Elias (2005). "Sobre el precio de la anarquía y la estabilidad de los equilibrios correlacionados de los juegos de congestión lineal". En Brodal, Gerth Stølting; Leonardi, Stefano (eds.). Algoritmos – ESA 2005. Apuntes de clase en informática. Vol. 3669. Berlín, Heidelberg: Springer. págs. 59–70. doi :10.1007/11561071_8. ISBN 978-3-540-31951-1.
- ^ Awerbuch, Baruch; Azar, Yossi; Epstein, Amir (22 de mayo de 2005). "El precio de enrutar un flujo indivisible". Actas del trigésimo séptimo simposio anual de la ACM sobre teoría de la computación . STOC '05. Nueva York, NY, EE. UU.: Association for Computing Machinery. págs. 57–66. doi :10.1145/1060590.1060599. ISBN 978-1-58113-960-0. Número de identificación del sujeto 379922.
- ^ Aland, Sebastian; Dumrauf, Dominic; Gairing, Martin; Monien, Burkhard; Schoppmann, Florian (enero de 2011). "Precio exacto de la anarquía para juegos de congestión polinomial". Revista SIAM de informática . 40 (5): 1211–1233. doi :10.1137/090748986. ISSN 0097-5397.
- ^ Bhawalkar, Kshipra; Gairing, Martin; Roughgarden, Tim (28 de octubre de 2014). "Juegos de congestión ponderada: el precio de la anarquía, ejemplos universales de casos extremos y rigidez". ACM Transactions on Economics and Computation . 2 (4): 14:1–14:23. doi :10.1145/2629666. ISSN 2167-8375. S2CID 2292866.
- ^ de Jong, Jasper; Uetz, Marc (2014). "El precio secuencial de la anarquía para los juegos de congestión atómica". En Liu, Tie-Yan; Qi, Qi; Ye, Yinyu (eds.). Economía de la Web e Internet . Apuntes de clase en Ciencias de la Computación. Vol. 8877. Cham: Springer International Publishing. págs. 429–434. doi :10.1007/978-3-319-13129-0_35. ISBN 978-3-319-13129-0.
- ^ Fotakis, Dimitris (1 de julio de 2010). "Juegos de congestión con caminos linealmente independientes: tiempo de convergencia y precio de la anarquía". Teoría de sistemas informáticos . 47 (1): 113–136. doi :10.1007/s00224-009-9205-7. ISSN 1433-0490. S2CID 1166496.
- ^ Law, Lok Man; Huang, Jianwei; Liu, Mingyan (octubre de 2012). "Precio de la anarquía para los juegos de congestión en redes de radio cognitivas". IEEE Transactions on Wireless Communications . 11 (10): 3778–3787. doi :10.1109/TWC.2012.083112.120371. ISSN 1558-2248. S2CID 11916283.
- ^ Gairing, Martin; Monien, Burkhard; Tiemann, Karsten (2006). "Enrutamiento de flujo (no) divisible en juegos con funciones de latencia lineal específicas del jugador". En Bugliesi, Michele; Preneel, Bart; Sassone, Vladimiro; Wegener, Ingo (eds.). Autómatas, lenguajes y programación . Apuntes de clase en informática. Vol. 4051. Berlín, Heidelberg: Springer. págs. 501–512. doi :10.1007/11786986_44. ISBN . 978-3-540-35905-0.
- ^ Milchtaich, Igal (1 de noviembre de 2006). "Topología de red y eficiencia del equilibrio". Juegos y comportamiento económico . 57 (2): 321–346. doi :10.1016/j.geb.2005.09.005. hdl : 10419/259308 . ISSN 0899-8256.
- ^ Roughgarden, Tim; Tardos, Éva (1 de mayo de 2004). "Limitar la ineficiencia de los equilibrios en juegos de congestión no atómicos". Juegos y comportamiento económico . 47 (2): 389–403. doi :10.1016/j.geb.2003.06.004. ISSN 0899-8256. S2CID 10778635.
- ^ Chau, Chi Kin; Sim, Kwang Mong (1 de septiembre de 2003). "El precio de la anarquía para juegos de congestión no atómicos con mapas de costos simétricos y demandas elásticas". Operations Research Letters . 31 (5): 327–334. doi :10.1016/S0167-6377(03)00030-0. ISSN 0167-6377.
- ^ Correa, José R.; Schulz, Andreas S.; Stier-Moses, Nicolás E. (1 de noviembre de 2008). "Una aproximación geométrica al precio de la anarquía en juegos de congestión no atómica". Juegos y comportamiento económico . Número especial en honor a Michael B. Maschler. 64 (2): 457–469. doi :10.1016/j.geb.2008.01.001. ISSN 0899-8256. S2CID 1175580.
- ^ Blum, Avrim; Even-Dar, Eyal; Ligett, Katrina (23 de julio de 2006). "Enrutamiento sin arrepentimiento". Actas del vigésimo quinto simposio anual de la ACM sobre Principios de computación distribuida . PODC '06. Nueva York, NY, EE. UU.: Association for Computing Machinery. págs. 45–52. doi :10.1145/1146381.1146392. ISBN 978-1-59593-384-3. Número de identificación del sujeto 2352710.
- ^ Eva Tardos, Notas de clase: El precio de la anarquía en los juegos de congestión no atómica, primavera de 2012.
- ^ Milchtaich, Igal (1 de enero de 2004). "Optimidad social y cooperación en juegos de congestión no atómicos". Journal of Economic Theory . 114 (1): 56–87. doi :10.1016/S0022-0531(03)00106-6. ISSN 0022-0531.
- ^ Roughgarden, Tim; Schoppmann, Florian (1 de marzo de 2015). "Suavidad local y el precio de la anarquía en juegos de congestión divisibles". Journal of Economic Theory . Ciencias de la computación y teoría económica. 156 : 317–342. doi :10.1016/j.jet.2014.04.005. ISSN 0022-0531.
- ^ Caragiannis, Ioannis; Kaklamanis, Christos; Kanellopoulos, Panagiotis; Kyropoulou, Maria; Papaioannou, Evi (2010). "El impacto del altruismo en la eficiencia de los juegos de congestión atómica". En Wirsing, Martin; Hofmann, Martin; Rauschmayer, Axel (eds.). Computación global confiable . Apuntes de clase en informática. Vol. 6084. Berlín, Heidelberg: Springer. págs. 172–188. doi :10.1007/978-3-642-15640-3_12. ISBN . 978-3-642-15640-3.
- ^ Chen, Po-An; Keijzer, Bart De; Kempe, David; Schäfer, Guido (28 de octubre de 2014). "Altruismo y su impacto en el precio de la anarquía". ACM Transactions on Economics and Computation . 2 (4): 17:1–17:45. doi :10.1145/2597893. ISSN 2167-8375. S2CID 9160585.
- ^ Chen, Po-An; Kempe, David (8 de julio de 2008). "Altruismo, egoísmo y rencor en el enrutamiento del tráfico". Actas de la 9.ª conferencia de la ACM sobre comercio electrónico . EC '08. Nueva York, NY, EE. UU.: Association for Computing Machinery. págs. 140–149. doi :10.1145/1386790.1386816. ISBN 978-1-60558-169-9.S2CID6999363 .
- ^ Hoefer, Martin; Skopalik, Alexander (1 de diciembre de 2013). "Altruismo en los juegos de congestión atómica". ACM Transactions on Economics and Computation . 1 (4): 21:1–21:21. arXiv : 0807.2011 . doi :10.1145/2542174.2542177. ISSN 2167-8375. S2CID 13835397.
- ^ Milchtaich, Igal (1 de marzo de 2021). "Internalización del coste social en los juegos de congestión". Teoría económica . 71 (2): 717–760. doi :10.1007/s00199-020-01274-0. ISSN 1432-0479. S2CID 253723298.
- ^ Milchtaich, Igal (1 de marzo de 2006). "Estática comparativa de juegos entre parientes". Biología de poblaciones teórica . 69 (2): 203–210. doi :10.1016/j.tpb.2005.08.002. ISSN 0040-5809. PMID 16194555.
- ^ Milchtaich, Igal (1 de julio de 2012). "Estática comparativa del altruismo y el rencor". Juegos y comportamiento económico . 75 (2): 809–831. doi :10.1016/j.geb.2012.02.015. ISSN 0899-8256.