Competición de Stackelberg

El modelo de liderazgo de Stackelberg es un juego estratégico en economía en el que la empresa líder se mueve primero y luego las empresas seguidoras se mueven secuencialmente (de ahí que a veces se lo describa como el "juego líder-seguidor"). Recibe su nombre del economista alemán Heinrich Freiherr von Stackelberg , quien publicó en 1934 su libro Marktform und Gleichgewicht [Estructura y equilibrio del mercado] , en el que describía el modelo. En términos de teoría de juegos , los jugadores de este juego son un líder y un seguidor y compiten en cantidad. El líder de Stackelberg a veces se denomina el líder del mercado.

Existen algunas restricciones adicionales para el mantenimiento de un equilibrio de Stackelberg. El líder debe saber ex ante que el seguidor observa su acción. El seguidor no debe tener medios para comprometerse con una acción futura de un líder que no sea de Stackelberg y el líder debe saberlo. De hecho, si el "seguidor" pudiera comprometerse con una acción de líder de Stackelberg y el "líder" lo supiera, la mejor respuesta del líder sería realizar una acción de seguidor de Stackelberg.

Las empresas pueden participar en la competencia de Stackelberg si tienen algún tipo de ventaja que les permita actuar primero. En términos más generales, el líder debe tener poder de compromiso . Actuar primero de manera observable es el medio más obvio de compromiso: una vez que el líder ha realizado su acción, no puede deshacerla: está comprometido con esa acción. Actuar primero puede ser posible si el líder era el monopolio titular de la industria y el seguidor es un nuevo participante. Mantener un exceso de capacidad es otro medio de compromiso.

Equilibrio de Nash perfecto en subjuegos

El modelo de Stackelberg se puede resolver para encontrar el equilibrio o equilibrios de Nash perfectos en subjuegos (SPNE), es decir, el perfil de estrategia que mejor se adapta a cada jugador, dadas las estrategias del otro jugador y que implica que cada jugador juegue en un equilibrio de Nash en cada subjuego .

En términos muy generales, sea la función de precios para la industria (duopolio) ; el precio es simplemente una función de la producción total (de la industria), por lo que es donde el subíndice representa al líder y representa al seguidor. Supongamos que la empresa tiene la estructura de costos . El modelo se resuelve por inducción hacia atrás . El líder considera cuál es la mejor respuesta del seguidor, es decir, cómo responderá una vez que haya observado la cantidad del líder. Luego, el líder elige una cantidad que maximice su beneficio, anticipándose a la respuesta prevista del seguidor. El seguidor realmente observa esto y en equilibrio elige la cantidad esperada como respuesta. $P$ $P(q_{1}+q_{2})$ $_{1}$ $_{2}$ $i$ $C_{i}(q_{i})$

Para calcular el SPNE, primero se deben calcular las mejores funciones de respuesta del seguidor (el cálculo se mueve "hacia atrás" debido a la inducción hacia atrás).

El beneficio de la empresa (la seguidora) es el ingreso menos el costo. El ingreso es el producto del precio y la cantidad y el costo viene dado por la estructura de costos de la empresa, por lo que el beneficio es: . La mejor respuesta es encontrar el valor de que maximiza dado , es decir, dada la producción del líder (empresa ), se encuentra la producción que maximiza el beneficio del seguidor. Por lo tanto, se debe encontrar el máximo de con respecto a . Primero, se debe diferenciar con respecto a : $2$ $\Pi _{2}=P(q_{1}+q_{2})\cdot q_{2}-C_{2}(q_{2})$ $q_{2}$ $\Pi _{2}$ $q_{1}$ $1$ $\Pi _{2}$ $q_{2}$ $\Pi _{2}$ $q_{2}$

{\frac {\partial \Pi _{2}}{\partial q_{2}}}={\frac {\partial P(q_{1}+q_{2})}{\partial q_{2}}}\cdot q_{2}+P(q_{1}+q_{2})-{\frac {\partial C_{2}(q_{2})}{\partial q_{2}}}.

Estableciendo esto en cero para maximizar:

{\frac {\partial \Pi _{2}}{\partial q_{2}}}={\frac {\partial P(q_{1}+q_{2})}{\partial q_{2}}}\cdot q_{2}+P(q_{1}+q_{2})-{\frac {\partial C_{2}(q_{2})}{\partial q_{2}}}=0.

Los valores de que satisfacen esta ecuación son las mejores respuestas. Ahora se considera la función de mejor respuesta del líder. Esta función se calcula considerando la salida del seguidor como una función de la salida del líder, como se acaba de calcular. $q_{2}$

La ganancia de la empresa (el líder) es , donde es la cantidad de seguidores en función de la cantidad del líder, es decir, la función calculada anteriormente. La mejor respuesta es encontrar el valor de que maximiza dado , es decir, dada la mejor función de respuesta del seguidor (empresa ), se encuentra la producción que maximiza la ganancia del líder. Por lo tanto, se debe encontrar el máximo de con respecto a . Primero, se diferencia con respecto a : $1$ $\Pi _{1}=P(q_{1}+q_{2}(q_{1})).q_{1}-C_{1}(q_{1})$ $q_{2}(q_{1})$ $q_{1}$ $\Pi _{1}$ $q_{2}(q_{1})$ $2$ $\Pi _{1}$ $q_{1}$ $\Pi _{1}$ $q_{1}$

{\frac {\partial \Pi _{1}}{\partial q_{1}}}={\frac {\partial P(q_{1}+q_{2})}{\partial q_{2}}}\cdot {\frac {\partial q_{2}(q_{1})}{\partial q_{1}}}\cdot q_{1}+{\frac {\partial P(q_{1}+q_{2})}{\partial q_{1}}}\cdot q_{1}+P(q_{1}+q_{2}(q_{1}))-{\frac {\partial C_{1}(q_{1})}{\partial q_{1}}}.

Estableciendo esto en cero para maximizar:

{\frac {\partial \Pi _{1}}{\partial q_{1}}}={\frac {\partial P(q_{1}+q_{2})}{\partial q_{2}}}\cdot {\frac {\partial q_{2}(q_{1})}{\partial q_{1}}}\cdot q_{1}+{\frac {\partial P(q_{1}+q_{2})}{\partial q_{1}}}\cdot q_{1}+P(q_{1}+q_{2}(q_{1}))-{\frac {\partial C_{1}(q_{1})}{\partial q_{1}}}=0.

Ejemplos

El siguiente ejemplo es muy general. Supone una estructura de demanda lineal generalizada.

p(q_{1}+q_{2})={\bigg (}a-b(q_{1}+q_{2}){\bigg )}

e impone algunas restricciones a las estructuras de costos para simplificar y así poder resolver el problema.

{\frac {\partial ^{2}C_{i}(q_{i})}{\partial q_{i}\cdot \partial q_{j}}}=0,\forall j

{\frac {\partial C_{i}(q_{i})}{\partial q_{j}}}=0,j\neq \ i

para facilitar el cálculo.

La ganancia del seguidor es:

\pi _{2}={\bigg (}a-b(q_{1}+q_{2}){\bigg )}\cdot q_{2}-C_{2}(q_{2}).

El problema de maximización se resuelve (a partir del caso general):

{\frac {\partial {\bigg (}a-b(q_{1}+q_{2}){\bigg )}}{\partial q_{2}}}\cdot q_{2}+a-b(q_{1}+q_{2})-{\frac {\partial C_{2}(q_{2})}{\partial q_{2}}}=0,

\Rightarrow \ -bq_{2}+a-b(q_{1}+q_{2})-{\frac {\partial C_{2}(q_{2})}{\partial q_{2}}}=0,

\Rightarrow \ q_{2}={\frac {a-bq_{1}-{\frac {\partial C_{2}(q_{2})}{\partial q_{2}}}}{2b}}.

Consideremos el problema del líder:

\Pi _{1}={\bigg (}a-b(q_{1}+q_{2}(q_{1})){\bigg )}\cdot q_{1}-C_{1}(q_{1}).

Sustituyendo del problema del seguidor: $q_{2}(q_{1})$

\Pi _{1}={\bigg (}a-b{\bigg (}q_{1}+{\frac {a-bq_{1}-{\frac {\partial C_{2}(q_{2})}{\partial q_{2}}}}{2b}}{\bigg )}{\bigg )}\cdot q_{1}-C_{1}(q_{1}),

\Rightarrow \Pi _{1}={\bigg (}{\frac {a-b.q_{1}+{\frac {\partial C_{2}(q_{2})}{\partial q_{2}}}}{2}}){\bigg )}\cdot q_{1}-C_{1}(q_{1}).

El problema de maximización se resuelve (a partir del caso general):

{\frac {\partial \pi _{1}}{\partial q_{1}}}={\bigg (}{\frac {a-2bq_{1}+{\frac {\partial C_{2}(q_{2})}{\partial q_{2}}}}{2}}{\bigg )}-{\frac {\partial C_{1}(q_{1})}{\partial q_{1}}}=0.

Ahora, resolviendo los rendimientos , la acción óptima del líder: $q_{1}$ $q_{1}^{*}$

q_{1}^{*}={\frac {a+{\frac {\partial C_{2}(q_{2})}{\partial q_{2}}}-2\cdot {\frac {\partial C_{1}(q_{1})}{\partial q_{1}}}}{2b}}.

Esta es la mejor respuesta del líder a la reacción del seguidor en equilibrio. La respuesta real del seguidor se puede encontrar introduciendo esto en su función de reacción calculada anteriormente:

q_{2}^{*}={\frac {a-b\cdot {\frac {a+{\frac {\partial C_{2}(q_{2})}{\partial q_{2}}}-2\cdot {\frac {\partial C_{1}(q_{1})}{\partial q_{1}}}}{2b}}-{\frac {\partial C_{2}(q_{2})}{\partial q_{2}}}}{2b}},

\Rightarrow q_{2}^{*}={\frac {a-3\cdot {\frac {\partial C_{2}(q_{2})}{\partial q_{2}}}+2\cdot {\frac {\partial C_{1}(q_{1})}{\partial q_{1}}}}{4b}}.

Los equilibrios de Nash son todos . Es evidente (si se supone que los costes marginales son cero, es decir, se ignoran los costes) que el líder tiene una ventaja significativa. Intuitivamente, si el líder no estuviera en mejor situación que el seguidor, simplemente adoptaría una estrategia de competencia de Cournot . $(q_{1}^{*},q_{2}^{*})$

Si se introduce la cantidad de seguidores en la función de mejor respuesta del líder, no se obtendrá . Esto se debe a que, una vez que el líder se ha comprometido con un resultado y ha observado a los seguidores, siempre quiere reducir su resultado ex post. Sin embargo, su incapacidad para hacerlo es lo que le permite recibir mayores ganancias que con Cournot. $q_{2}$ $q_{1}$

Análisis económico

Para analizar el modelo líder-seguidor de Stackelberg, se suele utilizar una representación en forma extensiva. También denominado “ árbol de decisiones ”, el modelo muestra la combinación de resultados y beneficios que ambas empresas obtienen en el juego de Stackelberg.

La imagen de la izquierda muestra en forma amplia un juego de Stackelberg. Los pagos se muestran a la derecha. Este ejemplo es bastante simple. Existe una estructura de costos básica que involucra solo costos marginales (no hay costos fijos ). La función de demanda es lineal y la elasticidad precio de la demanda es 1. Sin embargo, ilustra la ventaja del líder.

El seguidor quiere elegir maximizar su beneficio . Si se toma la derivada de primer orden y se la iguala a cero (para maximizar), se obtiene como valor máximo . $q_{2}$ $q_{2}\times (5000-q_{1}-q_{2}-c_{2})$ $q_{2}={\frac {5000-q_{1}-c_{2}}{2}}$ $q_{2}$

El líder quiere elegir maximizar su recompensa . Sin embargo, en equilibrio, sabe que el seguidor elegirá como se indicó anteriormente. De hecho, el líder quiere maximizar su recompensa (sustituyendo la función de mejor respuesta del seguidor). Por diferenciación, la recompensa máxima está dada por . Introduciendo esto en la función de mejor respuesta del seguidor, se obtiene . Supongamos que los costos marginales fueran iguales para las empresas (por lo que el líder no tiene ventaja de mercado aparte de actuar primero) y, en particular , . El líder produciría 2000 y el seguidor produciría 1000. Esto le daría al líder una ganancia (recompensa) de dos millones y al seguidor una ganancia de un millón. Simplemente por actuar primero, el líder ha acumulado el doble de la ganancia del seguidor. Sin embargo, las ganancias de Cournot aquí son 1,78 millones cada uno (estrictamente, cada uno), por lo que el líder no ha ganado mucho, pero el seguidor ha perdido. Sin embargo, esto es específico del ejemplo. Puede haber casos en los que un líder de Stackelberg obtenga enormes ganancias más allá de las ganancias de Cournot que se acerquen a las ganancias de monopolio (por ejemplo, si el líder también tuviera una gran ventaja en la estructura de costos, tal vez debido a una mejor función de producción ). También puede haber casos en los que el seguidor realmente disfrute de mayores ganancias que el líder, pero solo porque, digamos, tiene costos mucho más bajos. Este comportamiento funciona consistentemente en los mercados de duopolio incluso si las empresas son asimétricas. $q_{1}$ $q_{1}\times (5000-q_{1}-q_{2}-c_{1})$ $q_{2}$ $q_{1}\times (5000-q_{1}-{\frac {5000-q_{1}-c_{2}}{2}}-c_{1})$ $q_{2}$ $q_{1}={\frac {5000-2c_{1}+c_{2}}{2}}$ $q_{2}={\frac {5000+2c_{1}-3c_{2}}{4}}$ $c_{1}=c_{2}=1000$ $(16/9)10^{6}$

Amenazas creíbles y no creíbles del seguidor

Si, después de que el líder haya seleccionado su cantidad de equilibrio, el seguidor se desvía del equilibrio y elige una cantidad no óptima, no sólo se perjudicará a sí mismo, sino que también podría perjudicar al líder. Si el seguidor elige una cantidad mucho mayor que su mejor respuesta, el precio de mercado bajará y las ganancias del líder se verán afectadas, tal vez por debajo de las ganancias de nivel de Cournot. En este caso, el seguidor podría anunciar al líder antes de que comience el juego que, a menos que el líder elija una cantidad de equilibrio de Cournot, el seguidor elegirá una cantidad desviada que afectará las ganancias del líder. Después de todo, la cantidad elegida por el líder en equilibrio sólo es óptima si el seguidor también juega en equilibrio. Sin embargo, el líder no corre ningún peligro. Una vez que el líder ha elegido su cantidad de equilibrio, sería irracional que el seguidor se desviara porque también se vería perjudicado. Una vez que el líder ha elegido, al seguidor le conviene más jugar en la senda del equilibrio. Por lo tanto, una amenaza de ese tipo por parte del seguidor no sería creíble.

Sin embargo, en un juego de Stackelberg repetido (indefinidamente), el seguidor podría adoptar una estrategia de castigo en la que amenaza con castigar al líder en el siguiente período a menos que elija una estrategia no óptima en el período actual. Esta amenaza puede ser creíble porque podría ser racional que el seguidor castigue en el siguiente período para que el líder elija cantidades de Cournot a partir de entonces.

Stackelberg comparado con Cournot

Los modelos de Stackelberg y Cournot son similares porque en ambos la competencia se basa en la cantidad. Sin embargo, como se ha visto, el primer movimiento le da al líder en Stackelberg una ventaja crucial. También existe el importante supuesto de información perfecta en el juego de Stackelberg: el seguidor debe observar la cantidad elegida por el líder, de lo contrario el juego se reduce a Cournot. Con información imperfecta, las amenazas descritas anteriormente pueden ser creíbles. Si el seguidor no puede observar el movimiento del líder, ya no es irracional que el seguidor elija, por ejemplo, un nivel de cantidad de Cournot (de hecho, esa es la acción de equilibrio). Sin embargo, debe ser que hay información imperfecta y el seguidor no puede observar el movimiento del líder porque es irracional que el seguidor no observe si puede hacerlo una vez que el líder se ha movido. Si puede observar, lo hará para poder tomar la decisión óptima. Cualquier amenaza del seguidor que afirme que no observará incluso si puede es tan poco creíble como las anteriores. Este es un ejemplo de demasiada información que perjudica a un jugador. En la competición de Cournot, es la simultaneidad del juego (la imperfección del conocimiento) lo que da como resultado que ninguno de los jugadores ( ceteris paribus ) esté en desventaja.

Consideraciones de teoría de juegos

Como se mencionó, la información imperfecta en un juego de liderazgo se reduce a la competencia de Cournot. Sin embargo, algunos perfiles de estrategia de Cournot se sostienen como equilibrios de Nash , pero se pueden eliminar como amenazas increíbles (como se describió anteriormente) aplicando el concepto de solución de perfección en subjuegos . De hecho, es precisamente lo que hace que un perfil de estrategia de Cournot sea un equilibrio de Nash en un juego de Stackelberg lo que evita que sea perfecto en subjuegos.

Consideremos un juego de Stackelberg (es decir, uno que cumpla con los requisitos descritos anteriormente para mantener un equilibrio de Stackelberg) en el que, por alguna razón, el líder cree que, cualquiera sea la acción que tome, el seguidor elegirá una cantidad de Cournot (tal vez el líder crea que el seguidor es irracional). Si el líder jugó una acción de Stackelberg, (cree) que el seguidor jugará Cournot. Por lo tanto, no es óptimo para el líder jugar Stackelberg. De hecho, su mejor respuesta (según la definición de equilibrio de Cournot) es jugar una cantidad de Cournot. Una vez que ha hecho esto, la mejor respuesta del seguidor es jugar Cournot.

Consideremos los siguientes perfiles de estrategia: el líder juega Cournot; el seguidor juega Cournot si el líder juega Cournot y el seguidor juega Stackelberg si el líder juega Stackelberg y si el líder juega otra cosa, el seguidor juega una estrategia arbitraria (por lo tanto, esto en realidad describe varios perfiles). Este perfil es un equilibrio de Nash. Como se argumentó anteriormente, en la trayectoria de equilibrio, jugar es una mejor respuesta a una mejor respuesta. Sin embargo, jugar Cournot no habría sido la mejor respuesta del líder si el seguidor jugara Stackelberg si él (el líder) jugara Stackelberg. En este caso, la mejor respuesta del líder sería jugar Stackelberg. Por lo tanto, lo que hace que este perfil (o más bien, estos perfiles) sea un equilibrio de Nash (o más bien, equilibrios de Nash) es el hecho de que el seguidor jugaría no-Stackelberg si el líder jugara Stackelberg.

Sin embargo, este mismo hecho (que el seguidor jugaría no-Stackelberg si el líder jugara Stackelberg) significa que este perfil no es un equilibrio de Nash del subjuego que comienza cuando el líder ya ha jugado Stackelberg (un subjuego fuera de la trayectoria del equilibrio). Si el líder ya ha jugado Stackelberg, la mejor respuesta del seguidor es jugar Stackelberg (y por lo tanto es la única acción que produce un equilibrio de Nash en este subjuego). Por lo tanto, el perfil de estrategia -que es Cournot- no es perfecto en subjuegos.

Comparación con otros modelos de oligopolio

En comparación con otros modelos de oligopolio,

La producción agregada de Stackelberg es mayor que la producción agregada de Cournot, pero menor que la producción agregada de Bertrand .
El precio de Stackelberg es menor que el precio de Cournot, pero mayor que el precio de Bertrand.
El excedente del consumidor de Stackelberg es mayor que el excedente del consumidor de Cournot, pero menor que el excedente del consumidor de Bertrand.
La producción agregada de Stackelberg es mayor que la de un monopolio puro o un cártel , pero menor que la de una empresa perfectamente competitiva .
El precio de Stackelberg es inferior al precio de monopolio puro o de cártel, pero superior al precio perfectamente competitivo.

Aplicaciones

El concepto de Stackelberg se ha extendido a los juegos dinámicos de Stackelberg. ^[1]^[2] Con la adición del tiempo como dimensión, se descubrieron fenómenos que no se encuentran en los juegos estáticos, como la violación del principio de optimalidad por parte del líder. ^[2]

En los últimos años, los juegos de Stackelberg se han aplicado en el ámbito de la seguridad. ^[3] En este contexto, el defensor (líder) diseña una estrategia para proteger un recurso, de modo que el recurso permanezca seguro independientemente de la estrategia adoptada por el atacante (seguidor). Los juegos diferenciales de Stackelberg también se utilizan para modelar cadenas de suministro y canales de comercialización . ^[4] Otras aplicaciones de los juegos de Stackelberg incluyen redes heterogéneas , ^[5] privacidad genética , ^[6]^[7] robótica , ^[8]^[9] conducción autónoma , ^[10]^[11] redes eléctricas , ^[12]^{[13] y}sistemas de energía integrados . ^[14]

Véase también

Referencias

^ Simaan, M.; Cruz, JB (mayo de 1973). "Sobre la estrategia de Stackelberg en juegos de suma no nula". Journal of Optimization Theory and Applications . 11 (5): 533–555. doi :10.1007/BF00935665. ISSN 0022-3239. S2CID 121400147.
^ ab Simaan, M.; Cruz, JB (junio de 1973). "Aspectos adicionales de la estrategia de Stackelberg en juegos de suma no nula". Journal of Optimization Theory and Applications . 11 (6): 613–626. doi :10.1007/BF00935561. ISSN 0022-3239.
^ Brown, Gerald (2006). "Defensa de infraestructuras críticas". Interfaces . 36 (6): 530–544. doi :10.1287/inte.1060.0252. hdl : 10945/36732 . S2CID 16223037.
^ He, Xiuli; Prasad, Ashutosh; Sethi, Suresh P.; Gutierrez, Genaro J. (diciembre de 2007). "Un estudio de los modelos de juego diferencial de Stackelberg en los canales de suministro y comercialización". Revista de ciencia de sistemas e ingeniería de sistemas . 16 (4): 385–413. CiteSeerX 10.1.1.727.2952 . doi :10.1007/s11518-007-5058-2. ISSN 1004-3756. S2CID 11443159.
^ Ghosh, Subha; De, Debashis (28 de abril de 2021). "E²M³: HetNet 5G MIMO–MISO masiva y energéticamente eficiente que utiliza el juego de Stackelberg". Revista de supercomputación . 77 (11): 13549–13583. doi :10.1007/s11227-021-03809-1. ISSN 0920-8542. S2CID 235569547.
^ Wan, Zhiyu; Vorobeychik, Yevgeniy; Xia, Weiyi; Clayton, Ellen Wright; Kantarcioglu, Murat; Malin, Bradley (2 de febrero de 2017). "Ampliando el acceso a datos genómicos a gran escala y promoviendo la privacidad: un enfoque de teoría de juegos". The American Journal of Human Genetics . 100 (2): 316–322. doi :10.1016/j.ajhg.2016.12.002. ISSN 0002-9297. PMC 5294764 . PMID 28065469.
^ Wan, Zhiyu; Vorobeychik, Yevgeniy; Xia, Weiyi; Liu, Yongtai; Wooders, Myrna; Guo, Jia; Yin, Zhijun; Clayton, Ellen Wright; Kantarcioglu, Murat; Malin, Bradley A. (2021). "Uso de la teoría de juegos para frustrar intrusiones de privacidad en múltiples etapas al compartir datos". Science Advances . 7 (50): eabe9986. Bibcode :2021SciA....7.9986W. doi :10.1126/sciadv.abe9986. PMC 8664254 . PMID 34890225.
^ Koh, Joewie J.; Ding, Guohui; Heckman, Christoffer; Chen, Lijun; Roncone, Alessandro (24 de octubre de 2020). "Control cooperativo de robots móviles con aprendizaje de Stackelberg". Conferencia internacional IEEE/RSJ de 2020 sobre robots y sistemas inteligentes (IROS) . Las Vegas, NV, EE. UU.: IEEE. págs. 7985–7992. arXiv : 2008.00679 . doi :10.1109/IROS45743.2020.9341376. ISBN 978-1-7281-6212-6.S2CID220935562 .
^ Ranjbar-Sahraei, Bijan; Stankova, Katerina; Tuyls, Karl; Weiss, Gerhard (2 de septiembre de 2013). "Enfoque de cobertura basado en Stackelberg en entornos no convexos". Avances en vida artificial, ECAL 2013. MIT Press: 462–469. CiteSeerX 10.1.1.650.4481 . doi :10.7551/978-0-262-31709-2-ch066. ISBN . 978-0-262-31709-2.S2CID11668402 .
^ Yoo, Jehong; Langari, Reza (2020). "Un modelo teórico de juegos de Stackelberg de fusión de carriles". arXiv : 2003.09786 . {{cite journal}}: Requiere citar revista |journal=( ayuda )
^ Cooper, Matt; Lee, Jun Ki; Beck, Jacob; Fishman, Joshua D.; Gillett, Michael; Papakipos, Zoë; Zhang, Aaron; Ramos, Jerome; Shah, Aansh (2019), Salichs, Miguel A.; Ge, Shuzhi Sam; Barakova, Emilia Ivanova; Cabibihan, John-John (eds.), "Castigo de Stackelberg y vehículos autónomos a prueba de acoso", Social Robotics , vol. 11876, Cham: Springer International Publishing, págs. 368–377, arXiv : 1908.08641 , doi :10.1007/978-3-030-35888-4_34, ISBN 978-3-030-35887-7, S2CID 201645147 , consultado el 3 de mayo de 2021
^ Qiu, Haifeng; Gu, Wei; Wang, Lu; Pan, Guangsheng; Xu, Yinliang; Wu, Zhi (junio de 2021). "Enfoque de juego de Stackelberg de tres capas para una gestión robusta de la energía en redes comunitarias". IEEE Transactions on Industrial Informatics . 17 (6): 4073–4083. doi :10.1109/TII.2020.3015733. ISSN 1551-3203. S2CID 226558914.
^ An, Lu; Chakrabortty, Aranya; Duel-Hallen, Alexandra (14 de diciembre de 2020). "Un juego de inversión en seguridad de Stackelberg para la estabilidad de voltaje de los sistemas de energía". 2020 59.ª Conferencia IEEE sobre decisión y control (CDC) . Jeju, Corea del Sur: IEEE. págs. 3359–3364. arXiv : 2006.11665 . doi :10.1109/CDC42340.2020.9304301. ISBN. 978-1-7281-7447-1.S2CID219965779 .
^ Zheng, Weiye; Hill, David J. (1 de marzo de 2021). "Mecanismo de coordinación basado en incentivos para la operación distribuida de sistemas integrados de electricidad y calor". Applied Energy . 285 : 116373. doi :10.1016/j.apenergy.2020.116373. ISSN 0306-2619. S2CID 233833095.

H. von Stackelberg, Estructura y equilibrio del mercado: 1.ª edición, traducción al inglés, Bazin, Urch & Hill, Springer 2011, XIV, 134 págs., ISBN 978-3-642-12585-0
Fudenberg, D. y Tirole, J. (1993) Game Theory , MIT Press. (ver Capítulo 3, sección 1)
Gibbons, R. (1992) Una introducción a la teoría de juegos , Harvester-Wheatsheaf. (véase el capítulo 2, sección 1B)
Osborne, MJ y Rubenstein, A. (1994) Un curso de teoría de juegos , MIT Press (ver pág. 97-98)
La teoría de la oligopolio simplificada, capítulo 6 de Surfing Economics de Huw Dixon .