stringtranslate.com

competencia Stackelberg

El modelo de liderazgo de Stackelberg es un juego estratégico en economía en el que la empresa líder se mueve primero y luego las empresas seguidoras se mueven secuencialmente (de ahí que a veces se lo describa como el "juego líder-seguidor"). Lleva el nombre del economista alemán Heinrich Freiherr von Stackelberg , que publicó en 1934 Marktform und Gleichgewicht [Estructura y equilibrio del mercado] , en el que describía el modelo. En términos de teoría de juegos , los jugadores de este juego son líderes y seguidores y compiten en cantidad. Al líder de Stackelberg a veces se le conoce como el líder del mercado.

Existen algunas limitaciones adicionales para el mantenimiento de un equilibrio de Stackelberg. El líder debe saber ex ante que el seguidor observa su acción. El seguidor no debe tener medios para comprometerse con la acción de un futuro líder que no sea Stackelberg y el líder debe saberlo. De hecho, si el 'seguidor' pudiera comprometerse con una acción de líder de Stackelberg y el 'líder' lo supiera, la mejor respuesta del líder sería realizar una acción de seguidor de Stackelberg.

Las empresas pueden participar en la competencia de Stackelberg si una tiene algún tipo de ventaja que le permita moverse primero. En términos más generales, el líder debe tener poder de compromiso . Actuar primero de manera observable es el medio más obvio de compromiso: una vez que el líder ha hecho su movimiento, no puede deshacerlo: está comprometido con esa acción. Pasar primero puede ser posible si el líder fuera el monopolio actual de la industria y el seguidor fuera un nuevo participante. Mantener el exceso de capacidad es otra forma de compromiso.

Equilibrio de Nash perfecto en subjuegos

El modelo de Stackelberg se puede resolver para encontrar el equilibrio o equilibrios de Nash perfectos en subjuegos (ENPS), es decir, el perfil de estrategia que mejor sirve a cada jugador, dadas las estrategias del otro jugador y que implica que cada jugador juegue en un equilibrio de Nash en cada subjuego .

En términos muy generales, supongamos que la función de precios para la industria (duopolitica) sea ; el precio es simplemente una función de la producción total (de la industria), por lo que el subíndice representa al líder y representa al seguidor. Supongamos que la empresa tiene la estructura de costos . El modelo se resuelve por inducción hacia atrás . El líder considera cuál es la mejor respuesta del seguidor, es decir, cómo responderá una vez que haya observado la cantidad del líder. Luego, el líder elige una cantidad que maximiza su recompensa, anticipando la respuesta prevista del seguidor. El seguidor realmente observa esto y, en equilibrio, elige la cantidad esperada como respuesta.

Para calcular el SPNE, primero se deben calcular las funciones de mejor respuesta del seguidor (el cálculo se mueve "hacia atrás" debido a la inducción hacia atrás).

El beneficio de la empresa (la seguidora) es el ingreso menos el costo. Los ingresos son el producto del precio y la cantidad y el costo viene dado por la estructura de costos de la empresa, por lo que la ganancia es: . La mejor respuesta es encontrar el valor de que maximiza dado , es decir, dada la producción del líder (empresa ), se encuentra la producción que maximiza las ganancias del seguidor. Por lo tanto, se debe encontrar el máximo de con respecto a . Primero diferencia con respecto a :

Estableciendo esto en cero para maximizar:

Los valores de que satisfacen esta ecuación son las mejores respuestas. Ahora se considera la función de mejor respuesta del líder. Esta función se calcula considerando la producción del seguidor como una función de la producción del líder, tal como se acaba de calcular.

El beneficio de la empresa (el líder) es , donde es la cantidad del seguidor en función de la cantidad del líder, es decir, la función calculada anteriormente. La mejor respuesta es encontrar el valor de que maximiza dado , es decir, dada la función de mejor respuesta del seguidor (empresa ), se encuentra la producción que maximiza las ganancias del líder. Por lo tanto, se debe encontrar el máximo de con respecto a . Primero, diferenciar con respecto a :

Estableciendo esto en cero para maximizar:

Ejemplos

El siguiente ejemplo es muy general. Supone una estructura de demanda lineal generalizada.

e impone algunas restricciones a las estructuras de costos en aras de la simplicidad para que el problema pueda resolverse.

y

para facilitar el cálculo.

La ganancia del seguidor es:

El problema de maximización se resuelve (del caso general):

Considere el problema del líder:

Sustituyendo del problema del seguidor:

El problema de maximización se resuelve (del caso general):

Ahora resolviendo los rendimientos , la acción óptima del líder:

Ésta es la mejor respuesta del líder a la reacción del seguidor en equilibrio. El valor real del seguidor ahora se puede encontrar ingresando esto en su función de reacción calculada anteriormente:

Los equilibrios de Nash son todos . Está claro (si se supone que los costos marginales son cero, es decir, se ignoran esencialmente) que el líder tiene una ventaja significativa. Intuitivamente, si el líder no estuviera en mejor situación que el seguidor, simplemente adoptaría una estrategia de competencia de Cournot .

Conectar la cantidad del seguidor nuevamente a la función de mejor respuesta del líder no producirá resultados . Esto se debe a que una vez que el líder se ha comprometido con un resultado y ha observado a los seguidores, siempre quiere reducir su resultado ex post. Sin embargo, su incapacidad para hacerlo es lo que le permite recibir mayores beneficios que bajo Cournot.

Análisis Economico

A menudo se utiliza una representación de forma extensiva para analizar el modelo líder-seguidor de Stackelberg. También conocido como “ árbol de decisión ”, el modelo muestra la combinación de productos y beneficios que ambas empresas tienen en el juego de Stackelberg.

Un juego de Stackelberg representado en forma extensiva

La imagen de la izquierda muestra de forma ampliada un juego de Stackelberg. Los pagos se muestran a la derecha. Este ejemplo es bastante simple. Existe una estructura de costos básica que involucra solo costos marginales (no hay costos fijos ). La función de demanda es lineal y la elasticidad precio de la demanda es 1. Sin embargo, ilustra la ventaja del líder.

El seguidor quiere elegir maximizar su recompensa . Tomando la derivada de primer orden y equiparándola a cero (para maximizar) se obtiene el valor máximo de .

El líder quiere elegir maximizar su recompensa . Sin embargo, en equilibrio, sabe que el seguidor elegirá lo anterior. De hecho, el líder quiere maximizar su recompensa (sustituyendo la función de mejor respuesta del seguidor). Por diferenciación, el pago máximo está dado por . Introducir esto en la función de mejor respuesta del seguidor produce . Supongamos que los costos marginales fueran iguales para las empresas (por lo que el líder no tiene otra ventaja de mercado que la de dar el primer paso) y, en particular , . El líder produciría 2000 y el seguidor produciría 1000. Esto le daría al líder una ganancia (recompensa) de dos millones y al seguidor una ganancia de un millón. Simplemente por moverse primero, el líder ha acumulado el doble de ganancias que el seguidor. Sin embargo, las ganancias de Cournot aquí son de 1,78 millones cada uno (estrictamente, cada uno), por lo que el líder no ha ganado mucho, pero el seguidor ha perdido. Sin embargo, esto es específico del ejemplo. Puede haber casos en los que un líder de Stackelberg tenga enormes ganancias más allá de las ganancias de Cournot que se acerquen a las ganancias de monopolio (por ejemplo, si el líder también tenía una gran ventaja en la estructura de costos, tal vez debido a una mejor función de producción ). También puede haber casos en los que el seguidor realmente disfrute de mayores ganancias que el líder, pero sólo porque, por ejemplo, tiene costos mucho más bajos. Este comportamiento funciona consistentemente en mercados duopolio incluso si las empresas son asimétricas.

Amenazas creíbles y no creíbles por parte del seguidor

Si, después de que el líder hubiera seleccionado su cantidad de equilibrio, el seguidor se desviara del equilibrio y eligiera alguna cantidad no óptima, no sólo se perjudicaría a sí mismo, sino que también podría perjudicar al líder. Si el seguidor eligiera una cantidad mucho mayor que su mejor respuesta, el precio de mercado bajaría y las ganancias del líder se verían afectadas, tal vez por debajo de las ganancias del nivel de Cournot. En este caso, el seguidor podría anunciar al líder antes de que comience el juego que, a menos que el líder elija una cantidad de equilibrio de Cournot, el seguidor elegirá una cantidad desviada que afectará las ganancias del líder. Después de todo, la cantidad elegida por el líder en equilibrio sólo es óptima si el seguidor también juega en equilibrio. El líder, sin embargo, no corre peligro. Una vez que el líder ha elegido su cantidad de equilibrio, sería irracional que el seguidor se desviara porque él también resultaría perjudicado. Una vez que el líder ha elegido, al seguidor le irá mejor si sigue el camino del equilibrio. Por lo tanto, tal amenaza por parte del seguidor no sería creíble.

Sin embargo, en un juego de Stackelberg repetido (indefinidamente), el seguidor podría adoptar una estrategia de castigo en la que amenaza con castigar al líder en el siguiente período a menos que elija una estrategia no óptima en el período actual. Esta amenaza puede ser creíble porque podría ser racional que el seguidor castigue en el siguiente periodo de manera que el líder elija cantidades de Cournot a partir de entonces.

Stackelberg comparado con Cournot

Los modelos Stackelberg y Cournot son similares porque en ambos la competencia es en cantidad. Sin embargo, como se ve, el primer movimiento le da al líder de Stackelberg una ventaja crucial. También existe el importante supuesto de información perfecta en el juego de Stackelberg: el seguidor debe observar la cantidad elegida por el líder; de lo contrario, el juego se reduce a Cournot. Con información imperfecta, las amenazas descritas anteriormente pueden ser creíbles. Si el seguidor no puede observar el movimiento del líder, ya no es irracional que elija, digamos, un nivel de cantidad de Cournot (de hecho, esa es la acción de equilibrio). Sin embargo, debe ser que hay información imperfecta y el seguidor no puede observar el movimiento del líder porque es irracional que el seguidor no observe si puede hacerlo una vez que el líder se ha movido. Si puede observar, lo hará para poder tomar la decisión óptima. Cualquier amenaza por parte del seguidor afirmando que no observará aunque pueda hacerlo es tan increíble como las anteriores. Este es un ejemplo de cómo demasiada información perjudica a un jugador. En la competición de Cournot, es la simultaneidad del juego (la imperfección del conocimiento) lo que da como resultado que ninguno de los jugadores ( ceteris paribus ) esté en desventaja.

Consideraciones de la teoría de juegos

Como se mencionó, la información imperfecta en un juego de liderazgo se reduce a la competencia de Cournot. Sin embargo, algunos perfiles de estrategias de Cournot se mantienen como equilibrios de Nash , pero pueden eliminarse como amenazas increíbles (como se describió anteriormente) aplicando el concepto de solución de perfección en subjuegos . De hecho, es precisamente lo que hace que una estrategia de Cournot perfile un equilibrio de Nash en un juego de Stackelberg lo que le impide ser perfecto en subjuegos.

Considere un juego de Stackelberg (es decir, uno que cumple los requisitos descritos anteriormente para mantener un equilibrio de Stackelberg) en el que, por alguna razón, el líder cree que sea cual sea la acción que realice, el seguidor elegirá una cantidad de Cournot (quizás el líder cree que el seguidor es irracional). Si el líder jugó una acción de Stackelberg, (cree) que el seguidor jugará Cournot. Por lo tanto, no es óptimo que el líder interprete a Stackelberg. De hecho, su mejor respuesta (según la definición del equilibrio de Cournot) es jugar con la cantidad de Cournot. Una vez hecho esto, la mejor respuesta del seguidor es jugar a Cournot.

Considere los siguientes perfiles estratégicos: el líder interpreta a Cournot; el seguidor juega a Cournot si el líder juega a Cournot y el seguidor juega a Stackelberg si el líder juega a Stackelberg y si el líder juega a otra cosa, el seguidor juega una estrategia arbitraria (por lo tanto, esto en realidad describe varios perfiles). Este perfil es un equilibrio de Nash. Como se argumentó anteriormente, en el camino del equilibrio el juego es una mejor respuesta a una mejor respuesta. Sin embargo, jugar con Cournot no habría sido la mejor respuesta del líder si el seguidor hubiera jugado con Stackelberg si él (el líder) hubiera jugado con Stackelberg. En este caso, la mejor respuesta del líder sería jugar contra Stackelberg. Por lo tanto, lo que hace que este perfil (o más bien, estos perfiles) sea un equilibrio de Nash (o más bien, equilibrios de Nash) es el hecho de que el seguidor no jugaría con Stackelberg si el líder jugara con Stackelberg.

Sin embargo, este mismo hecho (que el seguidor jugaría sin Stackelberg si el líder jugara Stackelberg) significa que este perfil no es un equilibrio de Nash del subjuego que comienza cuando el líder ya jugó Stackelberg (un subjuego fuera del camino del equilibrio). . Si el líder ya jugó Stackelberg, la mejor respuesta del seguidor es jugar Stackelberg (y por lo tanto es la única acción que produce un equilibrio de Nash en este subjuego). Por lo tanto, el perfil de estrategia, que es Cournot, no es perfecto en subjuegos.

Comparación con otros modelos de oligopolio

En comparación con otros modelos de oligopolio,

Aplicaciones

El concepto Stackelberg se ha extendido a los juegos dinámicos de Stackelberg. [1] [2] Con la adición del tiempo como dimensión, se descubrieron fenómenos que no se encuentran en los juegos estáticos, como la violación del principio de optimización por parte del líder. [2]

En los últimos años, los juegos de Stackelberg se han aplicado en el ámbito de la seguridad. [3] En este contexto, el defensor (líder) diseña una estrategia para proteger un recurso, de modo que el recurso permanezca seguro independientemente de la estrategia adoptada por el atacante (seguidor). Los juegos diferenciales de Stackelberg también se utilizan para modelar cadenas de suministro y canales de marketing . [4] Otras aplicaciones de los juegos de Stackelberg incluyen redes heterogéneas , [5] privacidad genética , [6] [7] robótica , [8] [9] conducción autónoma , [10] [11] redes eléctricas , [12] [13] y sistemas energéticos integrados . [14]

Ver también

Referencias

  1. ^ Simaan, M.; Cruz, JB (mayo de 1973). "Sobre la estrategia de Stackelberg en juegos de suma distinta de cero". Revista de teoría y aplicaciones de optimización . 11 (5): 533–555. doi :10.1007/BF00935665. ISSN  0022-3239. S2CID  121400147.
  2. ^ ab Simaan, M.; Cruz, JB (junio de 1973). "Aspectos adicionales de la estrategia de Stackelberg en juegos de suma distinta de cero". Revista de teoría y aplicaciones de optimización . 11 (6): 613–626. doi :10.1007/BF00935561. ISSN  0022-3239.
  3. ^ Marrón, Gerald (2006). "Defensa de infraestructuras críticas". Interfaces . 36 (6): 530–544. doi : 10.1287/inte.1060.0252. hdl : 10945/36732 . S2CID  16223037.
  4. ^ Él, Xiuli; Prasad, Ashutosh; Sethi, Suresh P.; Gutiérrez, Genaro J. (diciembre de 2007). "Un estudio de los modelos de juego diferenciales de Stackelberg en los canales de suministro y comercialización". Revista de Ciencia de Sistemas e Ingeniería de Sistemas . 16 (4): 385–413. CiteSeerX 10.1.1.727.2952 . doi :10.1007/s11518-007-5058-2. ISSN  1004-3756. S2CID  11443159. 
  5. ^ Ghosh, Subha; De, Debashis (28 de abril de 2021). "E²M³: MIMO-MISO 5G HetNet masivo y energéticamente eficiente utilizando el juego Stackelberg". La revista de supercomputación . 77 (11): 13549–13583. doi :10.1007/s11227-021-03809-1. ISSN  0920-8542. S2CID  235569547.
  6. ^ Wan, Zhiyu; Vorobeychik, Yevgeniy; Xia, Weiyi; Clayton, Ellen Wright; Kantarcioglu, Murat; Malin, Bradley (2 de febrero de 2017). "Ampliar el acceso a datos genómicos a gran escala y al mismo tiempo promover la privacidad: un enfoque de teoría de juegos". La Revista Estadounidense de Genética Humana . 100 (2): 316–322. doi :10.1016/j.ajhg.2016.12.002. ISSN  0002-9297. PMC 5294764 . PMID  28065469. 
  7. ^ Wan, Zhiyu; Vorobeychik, Yevgeniy; Xia, Weiyi; Liu, Yongtai; Wooders, Myrna; Guo, Jia; Yin, Zhijun; Clayton, Ellen Wright; Kantarcioglu, Murat; Malin, Bradley A. (2021). "Uso de la teoría de juegos para frustrar las intrusiones a la privacidad en varias etapas al compartir datos". Avances científicos . 7 (50): eabe9986. Código Bib : 2021SciA....7.9986W. doi :10.1126/sciadv.abe9986. PMC 8664254 . PMID  34890225. 
  8. ^ Koh, Joewie J.; Ding, Guohui; Heckman, Christoffer; Chen, Lijun; Roncone, Alessandro (24 de octubre de 2020). "Control cooperativo de robots móviles con Stackelberg Learning". Conferencia internacional IEEE/RSJ 2020 sobre robots y sistemas inteligentes (IROS) . Las Vegas, NV, EE.UU.: IEEE. págs. 7985–7992. arXiv : 2008.00679 . doi :10.1109/IROS45743.2020.9341376. ISBN 978-1-7281-6212-6. S2CID  220935562.
  9. ^ Ranjbar-Sahraei, Bijan; Stankova, Katerina; Tuyls, Karl; Weiss, Gerhard (2 de septiembre de 2013). "Enfoque de cobertura basado en Stackelberg en entornos no convexos". Avances en Vida Artificial, ECAL 2013 . Prensa del MIT: 462–469. CiteSeerX 10.1.1.650.4481 . doi :10.7551/978-0-262-31709-2-ch066. ISBN  978-0-262-31709-2. S2CID  11668402.
  10. ^ Yoo, Jehong; Langari, Reza (2020). "Un modelo teórico de juegos de Stackelberg de fusión de carriles". arXiv : 2003.09786 . {{cite journal}}: Citar diario requiere |journal=( ayuda )
  11. ^ Cooper, Matt; Lee, Jun Ki; Beck, Jacob; Fishman, Josué D.; Gillett, Michael; Papakipos, Zoë; Zhang, Aarón; Ramos, Jerónimo; Shah, Aansh (2019), Salichs, Miguel A.; Ge, Shuzhi Sam; Barakova, Emilia Ivanova; Cabibihan, John-John (eds.), "Vehículos autónomos a prueba de acoso y castigo de Stackelberg", Robótica social , Cham: Springer International Publishing, vol. 11876, págs. 368–377, arXiv : 1908.08641 , doi : 10.1007/978-3-030-35888-4_34, ISBN 978-3-030-35887-7, S2CID  201645147 , consultado el 3 de mayo de 2021
  12. ^ Qiu, Haifeng; Gu, Wei; Wang, Lu; Pan, Guangsheng; Xu, Yinliang; Wu, Zhi (junio de 2021). "Enfoque de juego Trilayer Stackelberg para una gestión sólida de la energía en redes comunitarias". Transacciones IEEE sobre informática industrial . 17 (6): 4073–4083. doi :10.1109/TII.2020.3015733. ISSN  1551-3203. S2CID  226558914.
  13. ^ An, Lu; Chakrabortty, Aranya; Duel-Hallen, Alexandra (14 de diciembre de 2020). "Un juego de inversión en seguridad de Stackelberg para la estabilidad del voltaje de los sistemas eléctricos". 2020 59.a Conferencia IEEE sobre Decisión y Control (CDC) . Jeju, Corea (Sur): IEEE. págs. 3359–3364. arXiv : 2006.11665 . doi :10.1109/CDC42340.2020.9304301. ISBN 978-1-7281-7447-1. S2CID  219965779.
  14. ^ Zheng, Weiye; Hill, David J. (1 de marzo de 2021). "Mecanismo de coordinación basado en incentivos para el funcionamiento distribuido de sistemas integrados de electricidad y calor". Energía Aplicada . 285 : 116373. doi : 10.1016/j.apenergy.2020.116373. ISSN  0306-2619. S2CID  233833095.