stringtranslate.com

Teorema de la envolvente

En matemáticas y economía , el teorema de la envolvente es un resultado importante sobre las propiedades de diferenciabilidad de la función de valor de un problema de optimización parametrizado. [1] A medida que cambiamos los parámetros del objetivo, el teorema de la envolvente muestra que, en cierto sentido, los cambios en el optimizador del objetivo no contribuyen al cambio en la función objetivo. El teorema de la envolvente es una herramienta importante para la estática comparativa de los modelos de optimización . [2]

El término envolvente deriva de la descripción del gráfico de la función valor como la “envolvente superior” de los gráficos de la familia parametrizada de funciones que se optimizan.

Declaración

Sean y funciones continuamente diferenciables de valores reales en , donde son variables de elección y son parámetros, y considérese el problema de elegir , para un dado , de modo que:

sujeto a y .

La expresión lagrangiana de este problema está dada por

donde son los multiplicadores de Lagrange . Ahora sean y juntos la solución que maximiza la función objetivo f sujeta a las restricciones (y por lo tanto son puntos de silla del Lagrangiano),

y definir la función de valor

Entonces tenemos el siguiente teorema. [3] [4]

Teorema: Supóngase que y son continuamente diferenciables. Entonces

dónde .

Para conjuntos de elección arbitraria

Sea el conjunto de elección y el parámetro relevante . Sea la función objetivo parametrizada, la función valor y la correspondencia de elección óptima (función valorada por el conjunto) se dan por:

Los "teoremas de envolvente" describen condiciones suficientes para que la función valor sea diferenciable en el parámetro y describen su derivada como

donde denota la derivada parcial de con respecto a . Es decir, la derivada de la función de valor con respecto al parámetro es igual a la derivada parcial de la función objetivo con respecto a manteniendo el maximizador fijo en su nivel óptimo.

Las derivaciones tradicionales del teorema de la envolvente utilizan la condición de primer orden para ( 1 ), que requiere que el conjunto de elección tenga la estructura convexa y topológica, y que la función objetivo sea diferenciable en la variable . (El argumento es que los cambios en el maximizador tienen solo un "efecto de segundo orden" en el óptimo y, por lo tanto, pueden ignorarse). Sin embargo, en muchas aplicaciones, como el análisis de restricciones de incentivos en la teoría de contratos y la teoría de juegos, problemas de producción no convexos y estática comparativa "monótona" o "robusta", los conjuntos de elección y las funciones objetivo generalmente carecen de las propiedades topológicas y de convexidad requeridas por los teoremas de la envolvente tradicionales.

Paul Milgrom y Segal (2002) observan que la fórmula de envolvente tradicional es válida para problemas de optimización con conjuntos de elección arbitrarios en cualquier punto de diferenciabilidad de la función de valor, [5] siempre que la función objetivo sea diferenciable en el parámetro:

Teorema 1: Sean y . Si existen y , se cumple la fórmula de la envolvente ( 3 ).

Prueba: La ecuación ( 1 ) implica que para ,

Bajo los supuestos, la función objetivo del problema de maximización mostrado es diferenciable en , y la condición de primer orden para esta maximización es exactamente la ecuación ( 3 ). QED

Si bien la diferenciabilidad de la función de valor en general requiere supuestos sólidos, en muchas aplicaciones son suficientes condiciones más débiles, como la continuidad absoluta , la diferenciabilidad casi en todas partes o la diferenciabilidad por izquierda y derecha. En particular, el Teorema 2 de Milgrom y Segal (2002) ofrece una condición suficiente para que sea absolutamente continua, [5] lo que significa que es diferenciable casi en todas partes y puede representarse como una integral de su derivada:

Teorema 2: Supóngase que es absolutamente continua para todos . Supóngase también que existe una función integrable tal que para todos y casi todos . Entonces es absolutamente continua. Supóngase, además, que es diferenciable para todos , y que casi en todas partes en . Entonces, para cualquier selección ,

Prueba: Utilizando ( 1 )(1), observe que para cualquier con ,

Esto implica que es absolutamente continua. Por lo tanto, es diferenciable casi en todas partes, y utilizando ( 3 ) se obtiene ( 4 ). QED

Este resultado disipa la idea errónea común de que el buen comportamiento de la función de valor requiere un comportamiento correspondientemente bueno del maximizador. El teorema 2 asegura la continuidad absoluta de la función de valor aunque el maximizador pueda ser discontinuo. En una línea similar, el teorema 3 de Milgrom y Segal (2002) implica que la función de valor debe ser diferenciable en y por lo tanto satisfacer la fórmula de la envolvente ( 3 ) cuando la familia es equidiferenciable en y es univaluada y continua en , incluso si el maximizador no es diferenciable en (por ejemplo, si se describe por un conjunto de restricciones de desigualdad y el conjunto de restricciones vinculantes cambia en ). [5]

Aplicaciones

Aplicaciones a la teoría del productor

El teorema 1 implica el lema de Hotelling en cualquier punto de diferenciabilidad de la función de beneficio, y el teorema 2 implica la fórmula del excedente del productor . Formalmente, denotemos la función de beneficio indirecto de una empresa tomadora de precios con un conjunto de producción que enfrenta precios , y denotemos la función de oferta de la empresa, es decir,

Sea (el precio del bien ) y fijemos los precios de los demás bienes en . Aplicando el Teorema 1 a obtenemos (la oferta óptima del bien ). Aplicando el Teorema 2 (cuyos supuestos se verifican cuando se restringe a un intervalo acotado) obtenemos

es decir, el excedente del productor se puede obtener integrando bajo la curva de oferta de la empresa para el bien .

Aplicaciones al diseño de mecanismos y teoría de subastas

Consideremos un agente cuya función de utilidad sobre los resultados depende de su tipo . Sea , el "menú" de resultados posibles que el agente podría obtener en el mecanismo enviando diferentes mensajes. La utilidad de equilibrio del agente en el mecanismo está dada por (1), y el conjunto de resultados de equilibrio del mecanismo está dado por (2). Cualquier selección es una regla de elección implementada por el mecanismo. Supongamos que la función de utilidad del agente es diferenciable y absolutamente continua en para todo , y que es integrable en . Entonces el Teorema 2 implica que la utilidad de equilibrio del agente en cualquier mecanismo que implemente una regla de elección dada debe satisfacer la condición integral (4).

La condición integral (4) es un paso clave en el análisis de problemas de diseño de mecanismos con espacios de tipos continuos. En particular, en el análisis de subastas de un solo artículo de Myerson (1981), el resultado desde el punto de vista de un postor puede describirse como , donde es la probabilidad del postor de recibir el objeto y es su pago esperado, y la utilidad esperada del postor toma la forma . En este caso, siendo que denota el tipo más bajo posible del postor, la condición integral (4) para la utilidad esperada de equilibrio del postor toma la forma

(Esta ecuación puede interpretarse como la fórmula del excedente del productor para la empresa cuya tecnología de producción para convertir el numerario en probabilidad de ganar el objeto está definida por la subasta y que revende el objeto a un precio fijo ). Esta condición a su vez produce el célebre teorema de equivalencia de ingresos de Myerson (1981) : el ingreso esperado generado en una subasta en la que los postores tienen valores privados independientes está completamente determinado por las probabilidades de los postores de obtener el objeto para todos los tipos , así como por los pagos esperados de los tipos más bajos de los postores. Finalmente, esta condición es un paso clave en las subastas óptimas de Myerson (1981). [6]

Para otras aplicaciones del teorema de la envolvente al diseño de mecanismos, véase Mirrlees (1971), [7] Holmstrom (1979), [8] Laffont y Maskin (1980), [9] Riley y Samuelson (1981), [10] Fudenberg y Tirole (1991), [11] y Williams (1999). [12] Si bien estos autores derivaron y explotaron el teorema de la envolvente al restringir la atención a las reglas de elección continuamente diferenciables (por partes) o incluso a clases más estrechas, a veces puede ser óptimo implementar una regla de elección que no sea continuamente diferenciable por partes. (Un ejemplo es la clase de problemas comerciales con utilidad lineal descrita en el capítulo 6.5 de Myerson (1991). [13] ) Nótese que la condición integral (3) todavía se cumple en este contexto e implica resultados tan importantes como el lema de Holmstrom (Holmstrom, 1979), [8] el lema de Myerson (Myerson, 1981), [6] el teorema de equivalencia de ingresos (para subastas), el teorema de Green-Laffont-Holmstrom (Green y Laffont, 1979; Holmstrom, 1979), [14] [8] el teorema de ineficiencia de Myerson-Satterthwaite (Myerson y Satterthwaite, 1983), [15] los teoremas de imposibilidad de Jehiel-Moldovanu (Jehiel y Moldovanu, 2001), [16] el teorema de los cárteles débiles de McAfee-McMillan (McAfee y McMillan, 1992), [17] y el teorema de martingala de Weber (Weber, 1983), [18] etc. Los detalles de estas aplicaciones se proporcionan en el Capítulo 3 de Milgrom (2004), [19] quien ofrece un marco elegante y unificador en el análisis de diseño de mecanismos y subastas principalmente basado en el teorema de la envolvente y otras técnicas y conceptos familiares en la teoría de la demanda.

Aplicaciones a espacios de parámetros multidimensionales

Para un espacio de parámetros multidimensional , el Teorema 1 se puede aplicar a las derivadas parciales y direccionales de la función valor. [ cita requerida ] Si tanto la función objetivo como la función valor son (totalmente) diferenciables en , el Teorema 1 implica la fórmula de la envolvente para sus gradientes: [ cita requerida ] para cada . Si bien la diferenciabilidad total de la función valor puede no ser fácil de asegurar, el Teorema 2 se puede aplicar a lo largo de cualquier camino suave que conecte dos valores de parámetro y . [ cita requerida ] Es decir, supongamos que las funciones son diferenciables para todos con para todos . Un camino suave de a se describe mediante una aplicación diferenciable con una derivada acotada, tal que y . [ cita requerida ] El Teorema 2 implica que para cualquier camino suave, el cambio de la función valor se puede expresar como la integral de camino del gradiente parcial de la función objetivo a lo largo del camino: [ cita requerida ]

En particular, para , esto establece que las integrales de trayectoria cíclicas a lo largo de cualquier trayectoria suave deben ser cero: [ cita requerida ]

Esta "condición de integrabilidad" juega un papel importante en el diseño de mecanismos con tipos multidimensionales, restringiendo qué tipo de reglas de elección pueden ser sostenidas por menús inducidos por mecanismos . [ cita requerida ] En aplicación a la teoría del productor, siendo el vector de producción de la empresa y siendo el vector de precios, , y la condición de integrabilidad dice que cualquier función de oferta racionalizable debe satisfacer

Cuando es continuamente diferenciable, esta condición de integrabilidad es equivalente a la simetría de la matriz de sustitución . (En la teoría del consumidor , el mismo argumento aplicado al problema de minimización del gasto produce la simetría de la matriz de Slutsky .)

Aplicaciones de restricciones parametrizadas

Supongamos ahora que el conjunto factible depende del parámetro, es decir,

donde para algunos

Supóngase que es un conjunto convexo, y son cóncavos en , y existe tal que para todo . Bajo estos supuestos, es bien sabido que el programa de optimización restringido anterior puede representarse como un problema de punto de silla para el lagrangiano , donde es el vector de multiplicadores de Lagrange elegido por el adversario para minimizar el lagrangiano. [20] [ página necesaria ] [21] [ página necesaria ] Esto permite la aplicación del teorema de la envolvente de Milgrom y Segal (2002, Teorema 4) para problemas de punto de silla, [5] bajo los supuestos adicionales de que es un conjunto compacto en un espacio lineal normado, y son continuos en , y y son continuos en . En particular, dejando denotar el punto de silla del lagrangiano para el valor del parámetro , el teorema implica que es absolutamente continuo y satisface

Para el caso especial en el que es independiente de , , y , la fórmula implica que para ae . Es decir, el multiplicador de Lagrange sobre la restricción es su " precio sombra " en el programa de optimización. [21] [ página necesaria ]

Otras aplicaciones

Milgrom y Segal (2002) demuestran que la versión generalizada de los teoremas de la envolvente también se puede aplicar a la programación convexa, problemas de optimización continua, problemas de punto de silla y problemas de parada óptima. [5]

Véase también

Referencias

  1. ^ Border, Kim C. (2019). "Notas diversas sobre la teoría de la optimización y temas relacionados". Apuntes de clase . Instituto Tecnológico de California: 154.
  2. ^ Carter, Michael (2001). Fundamentos de la economía matemática. Cambridge: MIT Press. pp. 603–609. ISBN 978-0-262-53192-4.
  3. ^ Afriat, SN (1971). "Teoría de máximos y el método de Lagrange". Revista SIAM de Matemáticas Aplicadas . 20 (3): 343–357. doi :10.1137/0120037.
  4. ^ Takayama, Akira (1985). Economía matemática (segunda edición). Nueva York: Cambridge University Press. pp. 137-138. ISBN 978-0-521-31498-5.
  5. ^ abcde Milgrom, Paul; Ilya Segal (2002). "Teoremas de envolvente para conjuntos de elección arbitraria". Econometrica . 70 (2): 583–601. CiteSeerX 10.1.1.217.4736 . doi :10.1111/1468-0262.00296. 
  6. ^ ab Myerson, Roger B. (1981). "Diseño óptimo de subastas". Matemáticas de la investigación de operaciones . 6 (1): 58–73. doi :10.1287/moor.6.1.58. S2CID  12282691.
  7. ^ Mirrlees, James (2002). "Una exploración de la teoría de la tributación óptima". Review of Economic Studies . 38 (2): 175–208. doi :10.2307/2296779. JSTOR  2296779.
  8. ^ abc Holmstrom, Bengt (1979). "Esquemas de Grove en dominios restringidos". Econometrica . 47 (5): 1137–1144. doi :10.2307/1911954. JSTOR  1911954. S2CID  55414969.
  9. ^ Laffont, Jean-Jacques; Eric Maskin (1980). "Un enfoque diferenciable de los mecanismos de estrategia dominante". Econometrica . 48 (6): 1507–1520. doi :10.2307/1912821. JSTOR  1912821.
  10. ^ Riley, John G.; Samuelson, William S. (1981). "Subastas óptimas". American Economic Review . 71 (3): 381–392. JSTOR  1802786.
  11. ^ Fudenberg, Drew; Tirole, Jean (1991). Teoría de juegos . Cambridge: MIT Press. ISBN 0-262-06141-4.
  12. ^ Williams, Steven (1999). "Una caracterización de un mecanismo compatible con incentivos bayesianos eficiente". Teoría económica . 14 : 155–180. doi :10.1007/s001990050286. S2CID  154378924.
  13. ^ Myerson, Roger (1991). Teoría de juegos . Cambridge: Harvard University Press. ISBN 0-674-34115-5.
  14. ^ Green, J.; Laffont, JJ (1979). Incentivos en la toma de decisiones públicas . Ámsterdam: Holanda Septentrional. ISBN 0-444-85144-5.
  15. ^ Myerson, R.; M. Satterthwaite (1983). "Mecanismos eficientes para el comercio bilateral" (PDF) . Revista de teoría económica . 29 (2): 265–281. doi :10.1016/0022-0531(83)90048-0. hdl : 10419/220829 .
  16. ^ Jehiel, Philippe; Moldovanu, Benny (2001). "Diseño eficiente con valoraciones interdependientes". Econometrica . 69 (5): 1237–1259. CiteSeerX 10.1.1.23.7639 . doi :10.1111/1468-0262.00240. 
  17. ^ McAfee, R. Preston; John McMillan (1992). "Anillos de licitación". American Economic Review . 82 (3): 579–599. JSTOR  2117323.
  18. ^ Weber, Robert (1983). "Subastas de objetos múltiples" (PDF) . En Engelbrecht-Wiggans, R.; Shubik, M.; Stark, RM (eds.). Subastas, ofertas y contratación: usos y teoría . Nueva York: New York University Press. págs. 165–191. ISBN. 0-8147-7827-5.
  19. ^ Milgrom, Paul (2004). Poniendo en práctica la teoría de las subastas. Cambridge University Press. ISBN 9780521536721.
  20. ^ Luenberger, DG (1969). Optimización por métodos de espacio vectorial. Nueva York: John Wiley & Sons. ISBN 9780471181170.
  21. ^ ab Rockafellar, RT (1970). Análisis convexo. Princeton: Princeton University Press. ISBN 0691015864.