stringtranslate.com

Teorema de la envolvente

En matemáticas y economía , el teorema de la envolvente es un resultado importante sobre las propiedades de diferenciabilidad de la función de valor de un problema de optimización parametrizado. [1] A medida que cambiamos los parámetros del objetivo, el teorema de la envolvente muestra que, en cierto sentido, los cambios en el optimizador del objetivo no contribuyen al cambio en la función objetivo. El teorema de la envolvente es una herramienta importante para la estática comparativa de modelos de optimización . [2]

El término envolvente deriva de describir la gráfica de la función de valor como la "envolvente superior" de las gráficas de la familia parametrizada de funciones que se optimizan.

Declaración

Sean y funciones de valor real continuamente diferenciables en , donde están las variables de elección y los parámetros, y consideremos el problema de elegir , para un determinado , de modo que:

sujeto a y .

La expresión lagrangiana de este problema viene dada por

¿Dónde están los multiplicadores de Lagrange ? Ahora sean y juntos la solución que maximiza la función objetivo f sujeta a las restricciones (y por lo tanto son puntos silla del lagrangiano),

y definir la función de valor

Entonces tenemos el siguiente teorema. [3] [4]

Teorema: Supongamos que y son continuamente diferenciables. Entonces

dónde .

Para conjuntos de elección arbitraria

Denotemos el conjunto de elección y dejemos que el parámetro relevante sea . Denotando la función objetivo parametrizada, la función de valor y la correspondencia de elección óptima (función de valor establecido) vienen dadas por:

Los "teoremas de la envolvente" describen condiciones suficientes para que la función de valor sea diferenciable en el parámetro y describen su derivada como

donde denota la derivada parcial de con respecto a . Es decir, la derivada de la función de valor con respecto al parámetro es igual a la derivada parcial de la función objetivo con respecto a mantener el maximizador fijo en su nivel óptimo.

Las derivaciones tradicionales del teorema de la envolvente utilizan la condición de primer orden para ( 1 ), que requiere que el conjunto de elección tenga la estructura convexa y topológica, y que la función objetivo sea diferenciable en la variable . (El argumento es que los cambios en el maximizador tienen sólo un "efecto de segundo orden" en el óptimo y, por lo tanto, pueden ignorarse). Sin embargo, en muchas aplicaciones, como el análisis de restricciones de incentivos en la teoría de contratos y la teoría de juegos, los problemas de producción no convexos , y la estática comparativa "monótona" o "robusta", los conjuntos de elección y las funciones objetivas generalmente carecen de las propiedades topológicas y de convexidad requeridas por los teoremas de envolvente tradicionales.

Paul Milgrom y Segal (2002) observan que la fórmula envolvente tradicional es válida para problemas de optimización con conjuntos de elección arbitrarios en cualquier punto de diferenciabilidad de la función de valor, [5] siempre que la función objetivo sea diferenciable en el parámetro:

Teorema 1: Sea y . Si ambos y existen, se cumple la fórmula de la envolvente ( 3 ).

Prueba: La ecuación ( 1 ) implica que para ,

Bajo los supuestos, la función objetivo del problema de maximización mostrado es diferenciable en y la condición de primer orden para esta maximización es exactamente la ecuación ( 3 ). QED

Si bien la diferenciabilidad de la función de valor en general requiere supuestos sólidos, en muchas aplicaciones son suficientes condiciones más débiles, como la continuidad absoluta , la diferenciabilidad en casi todas partes o la diferenciabilidad hacia la izquierda y hacia la derecha. En particular, el Teorema 2 de Milgrom y Segal (2002) ofrece una condición suficiente para ser absolutamente continuo, [5] lo que significa que es diferenciable en casi todas partes y puede representarse como una integral de su derivada:

Teorema 2: Supongamos que es absolutamente continuo para todos . Supongamos también que existe una función integrable tal que para todos y casi todos . Entonces es absolutamente continuo. Supongamos, además, que es diferenciable para todos y que casi en todas partes . Luego, para cualquier selección ,

Prueba: Usando ( 1 )(1), observe que para cualquiera con ,

Esto implica que es absolutamente continuo. Por lo tanto, es diferenciable en casi todas partes y al usar ( 3 ) se obtiene ( 4 ). QED

Este resultado disipa la idea errónea de que un buen comportamiento de la función de valor requiere correspondientemente un buen comportamiento del maximizador. El teorema 2 asegura la continuidad absoluta de la función de valor aunque el maximizador pueda ser discontinuo. En una línea similar, el Teorema 3 de Milgrom y Segal (2002) implica que la función de valor debe ser diferenciable en y por lo tanto satisfacer la fórmula envolvente ( 3 ) cuando la familia es equidiferenciable en y tiene un solo valor y es continua en , incluso si el maximizador no es diferenciable en (por ejemplo, si se describe mediante un conjunto de restricciones de desigualdad y el conjunto de restricciones vinculantes cambia en ). [5]

Aplicaciones

Aplicaciones a la teoría del productor

El teorema 1 implica el lema de Hotelling en cualquier punto de diferenciabilidad de la función de beneficio, y el teorema 2 implica la fórmula del excedente del productor . Formalmente, denotemos la función de beneficio indirecto de una empresa que toma precios con un conjunto de producción frente a los precios , y denotemos la función de oferta de la empresa, es decir,

Dejemos (el precio del bien ) y fijemos los precios de los demás bienes en . Aplicar el teorema 1 a los rendimientos (la oferta óptima de bien de la empresa ). La aplicación del teorema 2 (cuyos supuestos se verifican cuando se restringe a un intervalo acotado) produce

es decir, el excedente del productor se puede obtener integrándolo bajo la curva de oferta de la empresa para siempre .

Aplicaciones al diseño de mecanismos y teoría de subastas.

Consideremos un agente cuya función de utilidad sobre los resultados depende de su tipo . Representemos el "menú" de posibles resultados que el agente podría obtener en el mecanismo enviando diferentes mensajes. La utilidad de equilibrio del agente en el mecanismo viene entonces dada por (1), y el conjunto de resultados de equilibrio del mecanismo está dado por (2). Cualquier selección es una regla de elección implementada por el mecanismo. Supongamos que la función de utilidad del agente es diferenciable y absolutamente continua en para todos y que es integrable en . Entonces el Teorema 2 implica que la utilidad de equilibrio del agente en cualquier mecanismo que implemente una regla de elección dada debe satisfacer la condición integral (4).

La condición integral (4) es un paso clave en el análisis de problemas de diseño de mecanismos con espacios de tipo continuo. En particular, en el análisis de Myerson (1981) de las subastas de un solo artículo, el resultado desde el punto de vista de un postor puede describirse como , donde es la probabilidad del postor de recibir el objeto y es su pago esperado, y la utilidad esperada del postor toma la forma . En este caso, denotando el tipo más bajo posible del postor, la condición integral (4) para la utilidad esperada de equilibrio del postor toma la forma

(Esta ecuación puede interpretarse como la fórmula del excedente del productor para la empresa cuya tecnología de producción para convertir el numerario en probabilidad de ganar el objeto está definida por la subasta y que revende el objeto a un precio fijo ). Esta condición, a su vez, da lugar al célebre teorema de equivalencia de ingresos de Myerson (1981) : los ingresos esperados generados en una subasta en la que los postores tienen valores privados independientes están totalmente determinados por las probabilidades de los postores de obtener el objeto de todos los tipos, así como por los pagos esperados. de los tipos más bajos de los postores. Finalmente, esta condición es un paso clave en las subastas óptimas de Myerson (1981). [6]

Para otras aplicaciones del teorema de la envolvente al diseño de mecanismos, consulte Mirrlees (1971), [7] Holmstrom (1979), [8] Laffont y Maskin (1980), [9] Riley y Samuelson (1981), [10] Fudenberg y Tirole. (1991), [11] y Williams (1999). [12] Si bien estos autores derivaron y explotaron el teorema de la envolvente restringiendo la atención a reglas de elección (por partes) continuamente diferenciables o incluso clases más estrechas, a veces puede ser óptimo implementar una regla de elección que no sea continuamente diferenciable por partes. (Un ejemplo es la clase de problemas comerciales con utilidad lineal descritos en el capítulo 6.5 de Myerson (1991). [13] ) Tenga en cuenta que la condición integral (3) todavía se cumple en este contexto e implica resultados tan importantes como el lema de Holmstrom (Holmstrom, 1979), [8] el lema de Myerson (Myerson, 1981), [6] el teorema de equivalencia de ingresos (para subastas), el teorema de Green-Laffont-Holmstrom (Green y Laffont, 1979; Holmstrom, 1979), [14] [8 ] el teorema de ineficiencia de Myerson-Satterthwaite (Myerson y Satterthwaite, 1983), [15] los teoremas de imposibilidad de Jehiel-Moldovanu (Jehiel y Moldovanu, 2001), [16] el teorema de los cárteles débiles de McAfee-McMillan (McAfee y McMillan, 1992) , [17] y el teorema de la martingala de Weber (Weber, 1983), [18] , etc. Los detalles de estas aplicaciones se proporcionan en el Capítulo 3 de Milgrom (2004), [19] , quien ofrece un marco elegante y unificador en el diseño de subastas y mecanismos. Análisis basado principalmente en el teorema de la envolvente y otras técnicas y conceptos familiares en la teoría de la demanda.

Aplicaciones a espacios de parámetros multidimensionales.

Para un espacio de parámetros multidimensional , el teorema 1 se puede aplicar a las derivadas parciales y direccionales de la función de valor. [ cita necesaria ] Si tanto la función objetivo como la función de valor son (totalmente) diferenciables en , el teorema 1 implica la fórmula envolvente para sus gradientes: [ cita necesaria ] para cada una . Si bien puede no ser fácil garantizar la diferenciabilidad total de la función de valor, el Teorema 2 aún se puede aplicar a lo largo de cualquier camino suave que conecte dos valores de parámetros y . [ cita necesaria ] Es decir, supongamos que las funciones son diferenciables para todos con para todos . Un camino suave desde a se describe mediante una aplicación diferenciable con una derivada acotada, tal que y . [ cita necesaria ] El teorema 2 implica que para cualquier camino suave, el cambio de la función de valor se puede expresar como la integral de camino del gradiente parcial de la función objetivo a lo largo del camino: [ cita necesaria ]

En particular, para , esto establece que las integrales de trayectoria cíclica a lo largo de cualquier trayectoria suave deben ser cero: [ cita necesaria ]

Esta "condición de integrabilidad" juega un papel importante en el diseño de mecanismos con tipos multidimensionales, lo que limita qué tipo de reglas de elección pueden sustentarse mediante menús inducidos por mecanismos . [ cita necesaria ] En aplicación a la teoría del productor, siendo el vector de producción de la empresa y el vector de precios, y la condición de integrabilidad dice que cualquier función de oferta racionalizable debe satisfacer

Cuando es continuamente diferenciable, esta condición de integrabilidad es equivalente a la simetría de la matriz de sustitución . (En la teoría del consumidor , el mismo argumento aplicado al problema de minimización del gasto produce la simetría de la matriz de Slutsky ).

Aplicaciones a restricciones parametrizadas

Supongamos ahora que el conjunto factible depende del parámetro, es decir,

donde para algunos

Supongamos que es un conjunto convexo, y son cóncavos en , y existe tal que para todos . Bajo estos supuestos, es bien sabido que el programa de optimización restringido anterior se puede representar como un problema de punto de silla para el Lagrangiano , donde es el vector de multiplicadores de Lagrange elegido por el adversario para minimizar el Lagrangiano. [20] [ página necesaria ] [21] [ página necesaria ] Esto permite la aplicación del teorema de la envolvente de Milgrom y Segal (2002, Teorema 4) para problemas de punto de silla, [5] bajo el supuesto adicional de que es un conjunto compacto en un espacio lineal normado, y son continuos en , y y son continuos en . En particular, si denotamos el punto de silla de Lagrangiano para el valor del parámetro , el teorema implica que es absolutamente continuo y satisface

Para el caso especial en el que es independiente de , y , la fórmula implica que para ae . Es decir, el multiplicador de Lagrange de la restricción es su " precio sombra " en el programa de optimización. [21] [ página necesaria ]

Otras aplicaciones

Milgrom y Segal (2002) demuestran que la versión generalizada de los teoremas de la envolvente también se puede aplicar a la programación convexa, problemas de optimización continua, problemas de punto de silla y problemas de parada óptima. [5]

Ver también

Referencias

  1. ^ Frontera, Kim C. (2019). "Notas varias sobre la teoría de la optimización y temas relacionados". Notas de lectura . Instituto de Tecnología de California: 154.
  2. ^ Carter, Michael (2001). Fundamentos de la economía matemática. Cambridge: Prensa del MIT. págs. 603–609. ISBN 978-0-262-53192-4.
  3. ^ Afriat, SN (1971). "Teoría de los Máximos y el Método de Lagrange". Revista SIAM de Matemática Aplicada . 20 (3): 343–357. doi :10.1137/0120037.
  4. ^ Takayama, Akira (1985). Economía Matemática (Segunda ed.). Nueva York: Cambridge University Press. págs. 137-138. ISBN 978-0-521-31498-5.
  5. ^ abcde Milgrom, Paul; Iliá Segal (2002). "Teoremas de la envolvente para conjuntos de elección arbitraria". Econométrica . 70 (2): 583–601. CiteSeerX 10.1.1.217.4736 . doi :10.1111/1468-0262.00296. 
  6. ^ ab Myerson, Roger B. (1981). "Diseño óptimo de subasta". Matemáticas de la Investigación de Operaciones . 6 (1): 58–73. doi :10.1287/moor.6.1.58. S2CID  12282691.
  7. ^ Mirrlees, James (2002). "Una exploración en la teoría de la tributación óptima". Revista de Estudios Económicos . 38 (2): 175–208. doi :10.2307/2296779. JSTOR  2296779.
  8. ^ abc Holmstrom, Bengt (1979). "Esquemas de Groves en dominios restringidos". Econométrica . 47 (5): 1137-1144. doi :10.2307/1911954. JSTOR  1911954. S2CID  55414969.
  9. ^ Laffont, Jean-Jacques; Eric Maskin (1980). "Un enfoque diferenciable de los mecanismos estratégicos dominantes". Econométrica . 48 (6): 1507-1520. doi :10.2307/1912821. JSTOR  1912821.
  10. ^ Riley, John G.; Samuelson, William S. (1981). "Subastas óptimas". Revista económica estadounidense . 71 (3): 381–392. JSTOR  1802786.
  11. ^ Fudenberg, dibujó; Tirole, Jean (1991). Teoría de juego . Cambridge: Prensa del MIT. ISBN 0-262-06141-4.
  12. ^ Williams, Steven (1999). "Una caracterización de un mecanismo compatible con incentivos bayesianos eficiente". Teoría económica . 14 : 155–180. doi :10.1007/s001990050286. S2CID  154378924.
  13. ^ Myerson, Roger (1991). Teoría de juego . Cambridge: Prensa de la Universidad de Harvard. ISBN 0-674-34115-5.
  14. ^ Verde, J.; Laffont, JJ (1979). Incentivos en la Toma de Decisiones Públicas . Ámsterdam: Holanda Septentrional. ISBN 0-444-85144-5.
  15. ^ Myerson, R.; M. Satterthwaite (1983). "Mecanismos eficientes para el comercio bilateral" (PDF) . Revista de teoría económica . 29 (2): 265–281. doi :10.1016/0022-0531(83)90048-0. hdl : 10419/220829 .
  16. ^ Jehiel, Philippe; Moldovanu, Benny (2001). "Diseño eficiente con valoraciones interdependientes". Econométrica . 69 (5): 1237-1259. CiteSeerX 10.1.1.23.7639 . doi :10.1111/1468-0262.00240. 
  17. ^ McAfee, R. Preston; John McMillan (1992). "Anillos de oferta". Revista económica estadounidense . 82 (3): 579–599. JSTOR  2117323.
  18. ^ Weber, Robert (1983). "Subastas de objetos múltiples" (PDF) . En Engelbrecht-Wiggans, R.; Shubik, M.; Stark, RM (eds.). Subastas, Licitaciones y Contrataciones: Usos y Teoría . Nueva York: Prensa de la Universidad de Nueva York. págs. 165-191. ISBN 0-8147-7827-5.
  19. ^ Milgrom, Paul (2004). Poner en práctica la teoría de las subastas. Prensa de la Universidad de Cambridge. ISBN 9780521536721.
  20. ^ Luenberger, DG (1969). Optimización por métodos de espacio vectorial. Nueva York: John Wiley & Sons. ISBN 9780471181170.
  21. ^ ab Rockafellar, RT (1970). Análisis convexo. Princeton: Prensa de la Universidad de Princeton. ISBN 0691015864.