stringtranslate.com

Lema de Shapley-Folkman

El lema de Shapley-Folkman representado por un diagrama con dos paneles, uno a la izquierda y otro a la derecha. El panel de la izquierda muestra cuatro conjuntos, que se muestran en una matriz de dos por dos. Cada uno de los conjuntos contiene exactamente dos puntos, que se muestran en rojo. En cada conjunto, los dos puntos están unidos por un segmento de línea rosa, que es la envoltura convexa del conjunto original. Cada conjunto tiene exactamente un punto que se indica con un símbolo más. En la fila superior de la matriz de dos por dos, el símbolo más se encuentra en el interior del segmento de línea; en la fila inferior, el símbolo más coincide con uno de los puntos rojos. Esto completa la descripción del panel de la izquierda del diagrama. El panel de la derecha muestra la suma de Minkowski de los conjuntos, que es la unión de las sumas que tienen exactamente un punto de cada conjunto de sumandos; En el caso de los conjuntos mostrados, las dieciséis sumas son puntos distintos, que se muestran en rojo: los puntos de suma rojos de la derecha son las sumas de los puntos de sumando rojos de la izquierda. La envoltura convexa de los dieciséis puntos rojos está sombreada en rosa. En el interior rosa del conjunto de suma de la derecha se encuentra exactamente un símbolo más, que es la suma (única) de los símbolos más del lado derecho. Al comparar la matriz izquierda y el panel derecho, se confirma que el símbolo más de la derecha es de hecho la suma de los cuatro símbolos más de los conjuntos de la izquierda, precisamente dos puntos de los conjuntos de sumando no convexos originales y dos puntos de las envolturas convexas de los conjuntos de sumando restantes.
El lema de Shapley-Folkman se ilustra con la adición de Minkowski de cuatro conjuntos. El punto (+) en la envoltura convexa de la suma de Minkowski de los cuatro conjuntos no convexos ( derecha ) es la suma de cuatro puntos (+) de los conjuntos (izquierda): dos puntos en dos conjuntos no convexos más dos puntos en las envolturas convexas de dos conjuntos. Las envolturas convexas están sombreadas en rosa. Los conjuntos originales tienen exactamente dos puntos cada uno (mostrados como puntos rojos). [1]

El lema de Shapley-Folkman  es un resultado de la geometría convexa que describe la adición de conjuntos de Minkowski en un espacio vectorial . Recibe su nombre de los matemáticos Lloyd Shapley y Jon Folkman , pero fue publicado por primera vez por el economista Ross M. Starr .

El lema puede entenderse intuitivamente como que, si el número de conjuntos sumados excede la dimensión del espacio vectorial, entonces su suma de Minkowski es aproximadamente convexa. [1] [2]

Resultados relacionados proporcionan afirmaciones más precisas sobre cuán cercana es la aproximación. Por ejemplo, el teorema de Shapley-Folkman proporciona un límite superior para la distancia entre cualquier punto en la suma de Minkowski y su envoltura convexa . Este límite superior se agudiza mediante el teorema de Shapley-Folkman-Starr (alternativamente, el corolario de Starr ). [3]

El lema de Shapley-Folkman tiene aplicaciones en economía , optimización y teoría de la probabilidad . [3] En economía, se puede utilizar para extender los resultados demostrados para preferencias convexas a preferencias no convexas. En teoría de la optimización, se puede utilizar para explicar la solución exitosa de problemas de minimización que son sumas de muchas funciones . [4] [5] En probabilidad, se puede utilizar para demostrar una ley de grandes números para conjuntos aleatorios . [6]

Ejemplo introductorio

Un conjunto es convexo si cada segmento de línea que une dos de sus puntos es un subconjunto del conjunto: por ejemplo, el disco  sólido es un conjunto convexo pero el círculo no lo es, porque el segmento de línea que une dos puntos distintos  no es un subconjunto del círculo. 

La envoltura convexa de un conjunto  Q es el conjunto convexo más pequeño que contiene  a Q. Esta distancia es cero si y solo si la suma es convexa.

La suma de Minkowski es la suma de los miembros de un conjunto . Por ejemplo, sumar el conjunto formado por los números enteros cero y uno consigo mismo da como resultado el conjunto formado por cero, uno y dos:

El subconjunto de los números enteros {0, 1, 2} está contenido en el intervalo de números reales  [0, 2], que es convexo. El lema de Shapley-Folkman implica que cada punto en [0, 2] es la suma de un entero de {0, 1} y un número real de [0, 1]. [7]

La distancia entre el intervalo convexo [0, 2] y el conjunto no convexo {0, 1, 2} es igual a la mitad

1/2 = |1 − 1/2| = |0 − 1/2| = |2 − 3/2| = |1 − 3/2|.

Sin embargo, la distancia entre la suma promedio de Minkowski

1/2 ({0, 1} + {0, 1}) = {0, 1/2, 1}

y su envoltura convexa [0, 1] es solo 1/4, que es la mitad de la distancia (1/2) entre su sumando {0, 1} y [0, 1]. A medida que se suman más conjuntos, el promedio de su suma "completa" su envoltura convexa: la distancia máxima entre el promedio y su envoltura convexa se acerca a cero a medida que el promedio incluye más sumandos . [7]

Preliminares

El lema de Shapley-Folkman depende de las siguientes definiciones y resultados de la geometría convexa .

Espacios vectoriales reales

A un espacio vectorial real de dos  dimensiones se le puede asignar un sistema de coordenadas cartesianas en el que cada punto se identifica mediante un par ordenado de números reales, llamados "coordenadas", que se denotan convencionalmente por  xy . Se pueden sumar dos puntos en el plano cartesiano por coordenadas.

( x 1y 1 ) + ( x 2y 2 ) = ( x 1 + x 2 , y 1 + y 2 );

Además, un punto se puede multiplicar por cada número real  λ en coordenadas.

λ  ( xy ) = ( λx , λy ).

En términos más generales, cualquier espacio vectorial real de dimensión (finita)  puede considerarse como el conjunto de todas las -tuplas de  números reales { ( v 1 , v 2 , . . . , v D )  } en las que  se definen dos operaciones : la suma de vectores y la multiplicación por un número real . Para espacios vectoriales de dimensión finita, las operaciones de suma de vectores y multiplicación de números reales pueden definirse cada una de ellas por coordenadas, siguiendo el ejemplo del plano cartesiano. [8]

Conjuntos convexos

Los segmentos de línea prueban si un subconjunto es convexo .

En un espacio vectorial real, un conjunto  no vacío Q se define como convexo si, para cada par de sus puntos, cada punto del segmento de línea que los une todavía está en  Q . Por ejemplo, un disco  sólido es convexo pero un círculo no lo es, porque no contiene un segmento de línea que una sus puntos  ; el conjunto no convexo de tres enteros {0, 1, 2} está contenido en el intervalo [0, 2], que es convexo. Por ejemplo, un cubo sólido es convexo; sin embargo, cualquier cosa que sea hueca o abollada, por ejemplo, una forma de medialuna , es no convexa. El conjunto vacío es convexo, ya sea por definición [9] o vacuamente , dependiendo del autor. 

Más formalmente, un conjunto  Q es convexo si, para todos los puntos  v 0v 1 en  Q y para cada número real  λ en el intervalo unitario  [0,1], el punto

(1 −  λv 0 + λv 1

es miembro de  Q.

Por inducción matemática , un conjunto  Q es convexo si y solo si cada combinación convexa de miembros de  Q también pertenece a  Q. Por definición, una combinación convexa de un subconjunto indexado { v 0v 1 , . . . ,  v D } de un espacio vectorial es cualquier promedio ponderado  λ 0 v 0 + λ 1 v 1 + . . . + λ D v D , para algún conjunto indexado de números reales no negativos { λ d } ​​que satisface la ecuación  λ 0 + λ 1 + . . . + λ D  = 1. [10]

La definición de un conjunto convexo implica que la intersección de dos conjuntos convexos es un conjunto convexo. En términos más generales, la intersección de una familia de conjuntos convexos es un conjunto convexo. En particular, la intersección de dos conjuntos disjuntos es el conjunto vacío, que es convexo. [9]

Casco convexo

Imagen de un triángulo suavizado, como una tortilla de maíz triangular (mexicana) o una señal de tráfico triangular. Cada una de las tres esquinas redondeadas está dibujada con una curva roja. Los puntos interiores restantes de la forma triangular están sombreados con azul.
En la envoltura convexa del conjunto rojo, cada punto azul es una combinación convexa de algunos puntos rojos.

Para cada subconjunto  Q de un espacio vectorial real, su envoltura convexa  Conv( Q ) es el conjunto convexo  mínimo que contiene a Q . Por lo tanto, Conv( Q ) es la intersección de todos los conjuntos convexos que cubren  a Q . La envoltura convexa de un conjunto se puede definir de forma equivalente como el conjunto de todas las combinaciones convexas de puntos en  Q . [11] Por ejemplo, la envoltura convexa del conjunto de números enteros  {0,1} es el intervalo cerrado de números reales  [0,1], que contiene los puntos finales enteros. [7] La ​​envoltura convexa del círculo unitario es el disco unitario cerrado , que contiene el círculo unitario.

Adición de Minkowski

Se muestran tres cuadrados en el cuadrante no negativo del plano cartesiano.
Adición de conjuntos de Minkowski. La suma de los cuadrados de y es el cuadrado de .

En cualquier espacio vectorial (o estructura algebraica con adición), , la suma de Minkowski de dos conjuntos no vacíos se define como la operación elemento por elemento (véase también. [12] ) Por ejemplo

Esta operación es claramente conmutativa y asociativa sobre la colección de conjuntos no vacíos. Todas estas operaciones se extienden de manera bien definida a las formas recursivas. Por el principio de inducción es fácil ver que [13]

Envolventes convexos de las sumas de Minkowski

La adición de Minkowski se comporta bien con respecto a la toma de envolturas convexas. Específicamente, para todos los subconjuntos de un espacio vectorial real, , la envoltura convexa de su suma de Minkowski es la suma de Minkowski de sus envolturas convexas. Es decir,

Y por inducción se sigue que

para cualquier subconjunto no vacío , . [14] [15]

Enunciados de los tres resultados principales

Notación

son números enteros positivos.

es la dimensión del espacio ambiental .

son subconjuntos no vacíos y acotados de . También se denominan "sumandos". es el número de sumandos.

es la suma de Minkowski de los sumandos.

es un vector arbitrario en .

Lema de Shapley-Folkman

Puesto que , para cualquier , existen elementos tales que . El lema de Shapley-Folkman perfecciona esta afirmación.

Lema de Shapley-Folkman  :  Para cualquier , existen elementos tales que , y como máximo de los sumandos , mientras que los otros .

Por ejemplo, cada punto en es la suma de un elemento en y un elemento en . [7]

Si es necesario, baraje los índices, lo que significa que cada punto se puede descomponer como

donde para y para . Nótese que la reindexación depende del punto . [16]

El lema puede enunciarse sucintamente como

El recíproco del lema de Shapley-Folkman

inverso del lema de Shapley-Folkman [17]  —  Si un espacio vectorial obedece el lema de Shapley-Folkman para un número natural  , y para ningún número menor que  , entonces su dimensión es finita, y exactamente  .

En particular, el lema de Shapley-Folkman requiere que el espacio vectorial sea de dimensión finita.

Teorema de Shapley-Folkman

Shapley y Folkman utilizaron su lema para demostrar el siguiente teorema, que cuantifica la diferencia entre y utilizando la distancia euclidiana al cuadrado .

Para cualquier subconjunto no vacío y cualquier punto, defina su distancia euclidiana al cuadrado como el ínfimo. Y, de manera más general, para dos subconjuntos no vacíos cualesquiera, defina

Nótese que para ello simplemente podemos escribir donde De manera similar,

Por ejemplo,

La distancia euclidiana al cuadrado es una medida de cuán "cercanos" están dos conjuntos. En particular, si dos conjuntos son compactos, entonces su distancia euclidiana al cuadrado es cero si y solo si son iguales. Por lo tanto, podemos cuantificar cuán cerca están de la convexidad mediante la acotación superior.

Para cualquier subconjunto acotado, definamos su circunradio como el ínfimo del radio de todas las bolas que lo contienen (como se muestra en el diagrama). De manera más formal, ahora podemos afirmar

Teorema de Shapley-Folkman [18] [19]  — 

donde utilizamos la notación para significar "la suma de los términos más grandes".

Tenga en cuenta que este límite superior depende de la dimensión del espacio ambiental y de las formas de los sumandos, pero no del número de sumandos.

Teorema de Shapley-Folkman-Starr

Defina el radio interior de un subconjunto acotado como el ínfimo de tal manera que, para cualquier , existe una bola de radio tal que . [20]

Un disco azul contiene puntos rojos. Un disco verde más pequeño se encuentra en la concavidad más grande entre estos puntos rojos.
El radio circunscrito (azul) y el radio interior (verde) de un conjunto de puntos (rojo oscuro, con su envoltura convexa representada por las líneas discontinuas de color rojo más claro). El radio interior es menor que el radio circunscrito, excepto en el caso de los subconjuntos de un solo círculo, para los cuales son iguales.

Por ejemplo, sean dos bolas anidadas, entonces el radio circunscrito de es el radio de , pero su radio interior es el radio de .

Dado que para cualquier subconjunto acotado , el siguiente teorema es un refinamiento:

Teorema de Shapley-Folkman-Starr [20] [21]  —  .

En particular, si tenemos una secuencia infinita de subconjuntos no vacíos y acotados de , y si existe alguno tal que el radio interno de cada uno está acotado superiormente por , entonces Esto puede interpretarse como que, mientras tengamos un límite superior en los radios internos, realizar un "promedio de Minkowski" nos acercaría cada vez más a un conjunto convexo.

Otras pruebas de los resultados

Ha habido muchas pruebas de estos resultados, desde el original, [20] hasta los posteriores Arrow y Hahn , [22] Cassels , [23] Schneider, [24] etc. Una prueba abstracta y elegante de Ekeland [25] ha sido extendida por Artstein. [26] También han aparecido diferentes pruebas en artículos no publicados. [2] [27] Una prueba elemental del lema de Shapley-Folkman se puede encontrar en el libro de Bertsekas , [28] junto con aplicaciones en la estimación de la brecha de dualidad en problemas de optimización separable y juegos de suma cero.

Las pruebas habituales de estos resultados no son constructivas: sólo establecen la existencia de la representación, pero no proporcionan un algoritmo para calcularla. En 1981, Starr publicó un algoritmo iterativo para una versión menos precisa del teorema de Shapley-Folkman-Starr. [29]

Una prueba de los resultados

La siguiente prueba del lema de Shapley-Folkman es de. [30] La idea de la prueba es elevar la representación de de a , utilizar el teorema de Carathéodory para envolturas cónicas y luego volver a .

Demostración del lema de Shapley-Folkman

Para cada , represente como , donde es un número finito grande, , y .

Ahora "eleva" la representación de a . Define dónde está el vector en que tiene 1 en la coordenada y 0 en todas las demás coordenadas.

Con esto, tenemos una representación elevada.

Es decir, se encuentra en la envoltura cónica de .

Por el teorema de Carathéodory para envolventes cónicas, tenemos una representación alternativa

tal que , y como máximo de ellos son distintos de cero. Dado que definimos

Esta representación alternativa es también una representación de .

Argumentamos que para cualquier , debe haber al menos un valor de para el cual no es cero. Recuerde que definimos , la entrada de , como . Al mismo tiempo, a partir de la representación elevada de , eliminamos todos los términos en el lado derecho para el cual ya que son cero. Los términos restantes toman la forma , por lo que encontramos la ecuación Se deduce que hay al menos un elemento de la suma en el lado derecho que no es cero.

Combinando el hecho de que para cada valor de hay un distinto de cero , junto con el hecho de que hay como máximo que son distintos de cero, concluimos que solo puede haber como máximo elementos de para los cuales hay al menos dos de que son distintos de cero.

De esta manera obtenemos una representación

donde para la mayor parte de , el término no está en .

La siguiente prueba "probabilística" del teorema de Shapley-Folkman-Starr es de. [23]

Podemos interpretar en términos probabilísticos: , ya que para algún , podemos definir un vector aleatorio , finitamente soportado en , tal que , y .

Entonces, es natural considerar la "varianza" de un conjunto como Con eso, .

Prueba

:Ampliar sus definiciones.

: si entonces sea finitamente soportado en tal que . Ahora bien, como está acotado en una esfera de radio centrado en algún , tenemos .

:utiliza el resultado anterior.

Demostración del teorema de Shapley-Folkman-Starr

Basta con demostrarlo .

, por el lema de Shapley-Folkman, existe una representación , tal que particiona .

Ahora, para cada , construya vectores aleatorios tales que esté finitamente soportado en , con y , donde es un número pequeño arbitrario.

Sean todos ellos independientes. Entonces sea . Como cada uno es un vector determinista, tenemos

Como esto es cierto para cualquier valor arbitrario , tenemos y hemos terminado.

Historia

Imagen de Lloyd Shapley
Ganador del Premio Nobel de Economía 2012, Lloyd Shapley demostró el lema Shapley-Folkman con Jon Folkman . [1]

El lema de Lloyd Shapley y Jon Folkman fue publicado por primera vez por el economista Ross M. Starr , quien estaba investigando la existencia de equilibrios económicos mientras estudiaba con Kenneth Arrow . [1] En su artículo, Starr estudió una economía convexificada , en la que los conjuntos no convexos fueron reemplazados por sus envolturas convexas; Starr demostró que la economía convexificada tiene equilibrios que se aproximan estrechamente a los "cuasiequilibrios" de la economía original; además, demostró que cada cuasiequilibrio tiene muchas de las propiedades óptimas de los verdaderos equilibrios, que se ha demostrado que existen para las economías convexas.

Tras el trabajo de Starr de 1969, los resultados de Shapley-Folkman-Starr se han utilizado ampliamente para demostrar que los resultados centrales de la teoría económica (convexa) son buenas aproximaciones a las grandes economías sin convexidades; por ejemplo, los cuasiequilibrios se aproximan mucho a los equilibrios de una economía convexificada. "La derivación de estos resultados en forma general ha sido uno de los principales logros de la teoría económica de posguerra", escribió Roger Guesnerie . [31]

El tema de los conjuntos no convexos en economía ha sido estudiado por muchos premios Nobel : el propio Shapley (2012), Arrow (1972), Robert Aumann (2005), Gérard Debreu (1983), Tjalling Koopmans (1975), Paul Krugman (2008) y Paul Samuelson (1970); el tema complementario de los conjuntos convexos en economía ha sido enfatizado por estos premios, junto con Leonid Hurwicz , Leonid Kantorovich (1975) y Robert Solow (1987).

Aplicaciones

El lema de Shapley-Folkman permite a los investigadores extender los resultados de las sumas de conjuntos convexos de Minkowski a sumas de conjuntos generales, que no necesitan ser convexos. Estas sumas de conjuntos surgen en economía , en optimización matemática y en teoría de la probabilidad ; en cada una de estas tres ciencias matemáticas, la no convexidad es una característica importante de las aplicaciones.

Ciencias económicas

Aparece el cuadrante no negativo del plano cartesiano. Una recta azul desciende como una secante que une dos puntos, uno en cada uno de los ejes. Esta recta azul es tangente a una curva roja que la toca en un punto marcado, cuyas coordenadas están etiquetadas como Qx y Qy.
El consumidor prefiere cada canasta de bienes en la curva de indiferencia  I 3 sobre cada canasta en   I 2 . La canasta ( Q xQ y ), donde la línea presupuestaria ( mostrada en azul ) soporta  I 2 , es óptima y también factible, a diferencia de cualquier canasta que se encuentre en   I 3 que es preferida pero inviable.

En economía , las preferencias de un consumidor se definen sobre todas las "canastas" de bienes. Cada canasta se representa como un vector no negativo, cuyas coordenadas representan las cantidades de los bienes. Sobre este conjunto de canastas, se define una curva de indiferencia para cada consumidor; la curva de indiferencia de un consumidor contiene todas las canastas de bienes que el consumidor considera equivalentes: es decir, para cada par de canastas en la misma curva de indiferencia, el consumidor no prefiere una canasta sobre otra. A través de cada canasta de bienes pasa una curva de indiferencia. El conjunto de preferencias de un consumidor (en relación con una curva de indiferencia) es la unión de la curva de indiferencia y todas las canastas de bienes que el consumidor prefiere sobre la curva de indiferencia. Las preferencias de un consumidor son convexas si todos esos conjuntos de preferencias son convexos. [32]

Una canasta óptima de bienes ocurre cuando la línea presupuestaria sustenta el conjunto de preferencias de un consumidor, como se muestra en el diagrama. Esto significa que una canasta óptima está en la curva de indiferencia más alta posible dada la línea presupuestaria, que se define en términos de un vector de precios y el ingreso del consumidor (vector de dotación). Por lo tanto, el conjunto de canastas óptimas es una función de los precios, y esta función se llama demanda del consumidor . Si el conjunto de preferencias es convexo, entonces, a cualquier precio, la demanda del consumidor es un conjunto convexo, por ejemplo, una canasta óptima única o un segmento de línea de canastas. [33]

Preferencias no convexas

Imagen de un conjunto de preferencias no convexas con una concavidad no respaldada por la línea presupuestaria
Cuando las preferencias del consumidor presentan concavidades, éste puede saltar entre dos canastas óptimas separadas.

Sin embargo, si un conjunto de preferencias no es convexo , entonces algunos precios determinan una línea presupuestaria que admite dos canastas óptimas separadas . Por ejemplo, podemos imaginar que, para los zoológicos, un león cuesta tanto como un águila, y además que el presupuesto de un zoológico alcanza para un águila o un león. Podemos suponer también que un cuidador del zoológico considera que ambos animales son igualmente valiosos. En este caso, el zoológico compraría un león o un águila. Por supuesto, un cuidador de zoológico contemporáneo no quiere comprar la mitad de un águila y la mitad de un león (o un grifo ). Por lo tanto, las preferencias del cuidador del zoológico no son convexas: el cuidador del zoológico prefiere tener cualquiera de los dos animales a tener cualquier combinación estrictamente convexa de ambos. [34]

Cuando el conjunto de preferencias del consumidor no es convexo, entonces (para algunos precios) la demanda del consumidor no está conectada ; una demanda desconectada implica algún comportamiento discontinuo por parte del consumidor, como lo analiza Harold Hotelling :

Si consideramos que las curvas de indiferencia de las compras tienen un carácter ondulado, convexo respecto del origen en algunas regiones y cóncavo en otras, nos vemos obligados a concluir que sólo las partes convexas respecto del origen pueden considerarse importantes, ya que las demás son esencialmente inobservables. Sólo pueden detectarse por las discontinuidades que pueden producirse en la demanda con la variación de las relaciones de precios, que conducen a un salto abrupto de un punto de tangencia a través de un abismo cuando se gira la línea recta. Pero, aunque tales discontinuidades pueden revelar la existencia de abismos, nunca pueden medir su profundidad. Las partes cóncavas de las curvas de indiferencia y sus generalizaciones multidimensionales, si existen, deben permanecer para siempre en una oscuridad inmensurable. [35]

Las dificultades de estudiar las preferencias no convexas fueron enfatizadas por Herman Wold [36] y nuevamente por Paul Samuelson , quien escribió que las no convexidades están "envueltas en una oscuridad eterna...", [37] [a] según Diewert. [38]

Sin embargo, las preferencias no convexas fueron iluminadas desde 1959 a 1961 por una serie de artículos en The Journal of Political Economy  ( JPE ). Los principales contribuyentes fueron Farrell, [39] Bator, [40] Koopmans , [41] y Rothenberg. [42] En particular, el artículo de Rothenberg discutió la convexidad aproximada de las sumas de conjuntos no convexos. [43] Estos artículos de JPE estimularon un artículo de Lloyd Shapley y Martin Shubik , que consideró las preferencias convexificadas del consumidor e introdujo el concepto de un "equilibrio aproximado". [44] Los artículos de JPE y el artículo de Shapley-Shubik influyeron en otra noción de "cuasi-equilibrios", debido a Robert Aumann . [45] [46]

El artículo de Starr de 1969 y la economía contemporánea

Imagen de Kenneth Arrow
Kenneth Arrow ( premio Nobel de 1972 ) ayudó a Ross M. Starr a estudiar las economías no convexas . [47]

Las publicaciones anteriores sobre no convexidad y economía fueron recopiladas en una bibliografía anotada por Kenneth Arrow . Le dio la bibliografía a Starr , quien entonces era un estudiante matriculado en el curso avanzado de matemática-economía (de posgrado) de Arrow. [47] En su monografía, Starr estudió los equilibrios generales de una economía artificial en la que las preferencias no convexas fueron reemplazadas por sus envolturas convexas. En la economía convexificada, a cada precio, la demanda agregada era la suma de las envolturas convexas de las demandas de los consumidores. Las ideas de Starr interesaron a los matemáticos Lloyd Shapley y Jon Folkman , quienes demostraron su lema y teorema homónimos en "correspondencia privada", que fue reportada por el artículo publicado de Starr en 1969. [1]

En su publicación de 1969, Starr aplicó el teorema de Shapley-Folkman-Starr. Starr demostró que la economía "convexificada" tiene equilibrios generales que pueden aproximarse estrechamente mediante " cuasi-equilibrios " de la economía original, cuando el número de agentes excede la dimensión de los bienes: Concretamente, Starr demostró que existe al menos un cuasi-equilibrio de precios  p opt con las siguientes propiedades:

Starr estableció que

"En conjunto, la discrepancia entre una asignación en la economía ficticia generada por [tomar las envolturas convexas de todos los conjuntos de consumo y producción] y alguna asignación en la economía real está limitada de una manera que es independiente del número de agentes económicos. Por lo tanto, el agente promedio experimenta una desviación de las acciones previstas que se desvanece en importancia a medida que el número de agentes tiende al infinito". [49]

Tras el trabajo de Starr de 1969, los resultados de Shapley-Folkman-Starr se han utilizado ampliamente en la teoría económica. Roger Guesnerie resumió sus implicaciones económicas: "Algunos resultados clave obtenidos bajo el supuesto de convexidad siguen siendo (aproximadamente) relevantes en circunstancias en las que la convexidad falla. Por ejemplo, en economías con un gran lado del consumo, las no convexidades de las preferencias no destruyen los resultados estándar". [50] "La derivación de estos resultados en forma general ha sido uno de los principales logros de la teoría económica de posguerra", escribió Guesnerie. [31] El tema de los conjuntos no convexos en economía ha sido estudiado por muchos premios Nobel : Arrow (1972), Robert Aumann (2005), Gérard Debreu (1983), Tjalling Koopmans (1975), Paul Krugman (2008) y Paul Samuelson (1970); El tema complementario de los conjuntos convexos en economía ha sido enfatizado por estos laureados, junto con Leonid Hurwicz , Leonid Kantorovich (1975) y Robert Solow (1987). [51] Los resultados de Shapley-Folkman-Starr han aparecido en la literatura económica: en microeconomía , [52] en la teoría del equilibrio general, [53] en economía pública [54] (incluyendo fallas del mercado ), [55] así como en la teoría de juegos , [56] en economía matemática , [57] y en matemáticas aplicadas (para economistas). [58] [59] Los resultados de Shapley-Folkman-Starr también han influido en la investigación económica utilizando la teoría de la medida y la integración . [60]

Optimización matemática

Gráfica de una función convexa, que se dibuja en negro. Su epígrafe, el área sobre su gráfica, es de color verde sólido.
Una función es convexa si la región por encima de su gráfica es un conjunto convexo .

El lema de Shapley-Folkman se ha utilizado para explicar por qué los grandes problemas de minimización con no convexidades pueden resolverse casi por completo (con métodos iterativos cuyas pruebas de convergencia se establecen solo para problemas convexos ). El lema de Shapley-Folkman ha fomentado el uso de métodos de minimización convexa en otras aplicaciones con sumas de muchas funciones. [61]

Preliminares de la teoría de la optimización

La optimización no lineal se basa en las siguientes definiciones de funciones :

Grafico( f ) = { ( xf ( x ) ) }
Gráfica de la función seno, que oscila periódicamente hacia arriba y hacia abajo entre −1 y +1, con un período de 2π.
La función seno no es convexa .
Epi( f ) = {  ( xu ) :  f ( x ) ≤  u  } .

Por ejemplo, la función cuadrática  f ( x ) =  x 2 es convexa, al igual que la función  de valor absoluto g ( x ) = | x |. Sin embargo, la función seno (en la imagen) no es convexa en el intervalo  (0, π).

Problemas de optimización aditiva

En muchos problemas de optimización, la función objetivo  f es separable : es decir, f es la suma de muchas funciones sumando, cada una de las cuales tiene su propio argumento:

f ( x ) = f (  ( x 1 , ..., x )  ) = Σ f n ( x n ).  

Por ejemplo, los problemas de optimización lineal son separables. Dado un problema separable con una solución óptima, fijamos una solución óptima.

x mín  = ( x 1 , ...,  x ) mín

con el valor mínimo  f ( x min ). Para este problema separable, también consideramos una solución óptima ( x minf ( x min ) ) para el " problema convexo ", donde se toman las envolturas convexas de los gráficos de las funciones sumando. Tal solución óptima es el límite de una secuencia de puntos en el problema convexo .

( x jf ( x j ) )  ∈  Σ Conv ( Grafo ( f n ) ) . [4] [b]

Por supuesto, el punto óptimo dado es una suma de puntos en los gráficos de los sumandos originales y de un pequeño número de sumandos convexificados, por el lema de Shapley-Folkman.

Este análisis fue publicado por Ivar Ekeland en 1974 para explicar la aparente convexidad de los problemas separables con muchos sumandos, a pesar de la no convexidad de los problemas de sumandos. En 1973, el joven matemático Claude Lemaréchal se sorprendió por su éxito con los métodos de minimización convexa en problemas que se sabía que no eran convexos; para minimizar problemas no lineales, una solución del problema dual no necesita proporcionar información útil para resolver el problema primal, a menos que el problema primal sea convexo y satisfaga una calificación de restricción . El problema de Lemaréchal era aditivamente separable, y cada función sumando era no convexa; no obstante, una solución al problema dual proporcionó una aproximación cercana al valor óptimo del problema primal. [63] [4] [64] El análisis de Ekeland explicó el éxito de los métodos de minimización convexa en problemas grandes y separables , a pesar de las no convexidades de las funciones sumandos. Ekeland y otros autores posteriores argumentaron que la separabilidad aditiva producía un problema de agregado aproximadamente convexo, aunque las funciones sumando no fueran convexas. El paso crucial en estas publicaciones es el uso del lema de Shapley-Folkman. [4] [64] [65] [c] El lema de Shapley-Folkman ha fomentado el uso de métodos de minimización convexa en otras aplicaciones con sumas de muchas funciones. [4] [5] [58] [61]

Teoría de la probabilidad y de la medida

Los conjuntos convexos se estudian a menudo con la teoría de la probabilidad . Cada punto en la envoltura convexa de un subconjunto ( no vacíoQ de un espacio de dimensión finita es el valor esperado de un vector aleatorio simple que toma sus valores en  Q , como consecuencia del lema de Carathéodory . Por lo tanto, para un conjunto no vacío  Q , la colección de los valores esperados de los vectores aleatorios simples con valores  Q es igual a la envoltura convexa de Q ; esta igualdad implica que los resultados de Shapley–Folkman–Starr son útiles en la teoría de la probabilidad. [67] En la otra dirección, la teoría de la probabilidad proporciona herramientas para examinar los conjuntos convexos en general y los resultados de Shapley–Folkman–Starr en particular. [68] Los resultados de Shapley–Folkman–Starr se han utilizado ampliamente en la teoría probabilística de conjuntos aleatorios , [69] por ejemplo, para demostrar una ley de grandes números , [6] [70] un teorema de límite central , [70] [71] y un principio de grandes desviaciones . [72] Estas pruebas de teoremas de límite probabilísticos utilizaron los resultados de Shapley–Folkman–Starr para evitar la suposición de que todos los conjuntos aleatorios sean convexos. 

Una medida de probabilidad es una medida finita , y el lema de Shapley-Folkman tiene aplicaciones en la teoría de medidas no probabilísticas, como las teorías de volumen y de medidas vectoriales . El lema de Shapley-Folkman permite un refinamiento de la desigualdad de Brunn-Minkowski , que limita el volumen de las sumas en términos de los volúmenes de sus conjuntos sumandos. [73] El volumen de un conjunto se define en términos de la medida de Lebesgue , que se define en subconjuntos del espacio euclidiano . En la teoría de medidas avanzada, el lema de Shapley-Folkman se ha utilizado para demostrar el teorema de Lyapunov , que establece que el rango de una medida vectorial es convexo. [74] Aquí, el término tradicional " rango " (alternativamente, "imagen") es el conjunto de valores producidos por la función. Una medida vectorial es una generalización de una medida con valores vectoriales; por ejemplo, si  p 1p 2 son medidas de probabilidad definidas en el mismo espacio medible , entonces la función producto  p 1  p 2 es una medida vectorial, donde  p 1  p 2 se define para cada evento  ω por

( p 1  p 2 ) ( ω ) = ( p 1 ( ω ),  p 2 ( ω ) ) .

El teorema de Lyapunov se ha utilizado en economía , [45] [75] en la teoría de control ( "bang-bang" ) y en la teoría estadística . [76] El teorema de Lyapunov ha sido llamado una contraparte continua del lema de Shapley-Folkman, [3] que a su vez ha sido llamado un análogo discreto del teorema de Lyapunov. [77]

Notas

  1. ^ "Oscuridad eterna" describe el Infierno del Paraíso Perdido de John Milton , cuya concavidad se compara con la Ciénaga Serboniana en el Libro II, líneas 592-594:

    Un abismo tan profundo como el pantano serbio
    entre Damiata y el viejo monte Casio,
    donde se han hundido ejércitos enteros.

    La descripción que hace Milton de la concavidad sirve como epígrafe literario que precede al capítulo siete de Arrow y Hahn (1980, pág. 169), "Mercados con preferencias no convexas y producción", que presenta los resultados de Starr (1969).
  2. ^ El límite de una sucesión es un miembro del cierre del conjunto original , que es el conjunto cerrado más pequeño que contiene al conjunto original. La suma de Minkowski de dos conjuntos cerrados no necesita ser cerrada, por lo que la siguiente inclusión puede ser estricta
    Clos(P) + Clos(Q) ⊆ Clos( Clos(P) + Clos(Q) );
    Según Rockafellar (1997, pp. 49 y 75), la inclusión puede ser estricta incluso para dos conjuntos sumando cerrados y convexos . Para garantizar que la suma de conjuntos de Minkowski sea cerrada, se requiere la operación de clausura, que añade límites a las sucesiones convergentes.
  3. ^ Aubin & Ekeland (1976) y Ekeland (1999, pp. 362-364) también consideraron el cierre convexo  de un problema de minimización no convexa, es decir, el problema definido como la envoltura convexa cerrada del epígrafe del problema original. Su estudio de las brechas de dualidad fue extendido por Di Guglielmo al cierre cuasiconvexo de un problema de minimización no convexa , es decir, el problema definido como la envoltura convexa cerrada de los conjuntos de nivel inferior . [66]
  1. ^ abcde Starr (1969)
  2. ^ de Howe (1979, pág. 1)
  3. ^abc Estrella (2008)
  4. ^ abcde Ekeland (1999, pp. 357–359): Publicado en la primera edición en inglés de 1976, el apéndice de Ekeland prueba el lema de Shapley-Folkman, reconociendo también los experimentos de Lemaréchal en la página 373.
  5. ^ ab Bertsekas (1996, págs. 364–381) reconociendo a Ekeland (1999) en la página 374 y Aubin & Ekeland (1976) en la página 381:

    Bertsekas (1996, pp. 364-381) describe una aplicación de los métodos duales lagrangianos a la programación de plantas de energía eléctrica (" problemas de compromiso de unidad "), donde la no convexidad aparece debido a restricciones enteras :

    Bertsekas y otros (1983)

  6. ^ ab Artstein y Vitale (1975, págs. 881–882)
  7. ^ abcd Carter (2001, pág. 94)
  8. ^ Arrow y Hahn (1980, pág. 375)
  9. ^ por Rockafellar (1997, pág. 10)
  10. ^ Arrow y Hahn (1980, pág. 376), Rockafellar (1997, págs. 10-11) y Green y Heller (1981, pág. 37)
  11. ^ Arrow y Hahn (1980, pág. 385) y Rockafellar (1997, págs. 11-12)
  12. ^ Schneider (1993, pág. xi) y Rockafellar (1997, pág. 16)
  13. ^ Rockafellar (1997, pág. 17) y Starr (1997, pág. 78)
  14. ^ Schneider (1993, págs. 2-3)
  15. ^ Arrow y Hahn (1980, pág. 387)
  16. ^ Starr (1969, págs. 35-36)
  17. ^ Schneider (1993, p. 140) atribuye este resultado a Borwein y O'Brien (1978)
  18. ^ Starr (1969, pág. 36)
  19. ^ Schneider (1993, pág. 129)
  20. ^ abc Starr (1969, pág. 37)
  21. ^ Schneider (1993, págs. 129-130)
  22. ^ Arrow y Hahn (1980, págs. 392-395)
  23. ^ de Cassels (1975, págs. 435-436)
  24. ^ Schneider (1993, pág. 128)
  25. ^ Ekeland (1999, págs. 357–359)
  26. ^ Artstein (1980, pág. 180)
  27. ^ Anderson, Robert M. (14 de marzo de 2005). «1 El teorema de Shapley-Folkman» (PDF) . Economía 201B: preferencias no convexas y equilibrios aproximados . Berkeley, California: Departamento de Economía, Universidad de California, Berkeley. pp. 1–5 . Consultado el 1 de enero de 2011 .
  28. ^ Bertsekas, Dimitri P. (2009). Teoría de optimización convexa . Belmont, Mass.: Athena Scientific. ISBN 978-1-886529-31-1.
  29. ^ Starr, Ross M. (1981). "Aproximación de puntos de la envoltura convexa de una suma de conjuntos por puntos de la suma: un enfoque elemental". Journal of Economic Theory . 25 (2): 314–317. doi :10.1016/0022-0531(81)90010-7. MR  0640201.
  30. ^ Zhou, Lin (junio de 1993). "Una prueba simple del teorema de Shapley-Folkman". Teoría económica . 3 (2): 371–372. doi :10.1007/bf01212924. ISSN  0938-2259.
  31. ^ de Guesnerie (1989, pág. 138)
  32. ^ Mas-Colell (1985, págs. 58-61) y Arrow & Hahn (1980, págs. 76-79)
  33. ^ Arrow y Hahn (1980, págs. 79-81)
  34. ^ Starr (1969, p. 26): "Después de todo, uno puede ser indiferente entre un automóvil y un barco, pero en la mayoría de los casos no se puede ni conducir ni navegar la combinación de mitad barco, mitad coche".
  35. ^ Hotelling (1935, pág. 74)
  36. ^ Wold (1943b, págs. 231 y 239-240) y Wold & Juréen (1953, pág. 146)
  37. ^ Samuelson (1950, págs. 359-360):

    Cabe señalar que en un mercado competitivo no se pueden observar puntos en los que las curvas de indiferencia sean convexas en lugar de cóncavas. Estos puntos están envueltos en una oscuridad eterna, a menos que convirtamos a nuestro consumidor en un monopsonista y le permitamos elegir entre bienes que se encuentran en una "curva presupuestaria" muy convexa (a lo largo de la cual está afectando el precio de lo que compra). En este caso de monopsonio, todavía podríamos deducir la pendiente de la curva de indiferencia del hombre a partir de la pendiente de la restricción observada en el punto de equilibrio.

  38. ^ Diewert (1982, págs. 552–553)
  39. ^ Farrell (1959, 1961a, 1961b)
  40. ^ Bator (1961a, 1961b)
  41. ^ Koopmans (1961, p. 478) y otros—por ejemplo, Farrell (1959, pp. 390-391) y Farrell (1961a, p. 484), Bator (1961a, pp. 482-483), Rothenberg (1960, p. 438), y Starr (1969, p. 26)—comentaron sobre Koopmans (1957, pp. 1-126, especialmente 9-16 [1.3 Suma de conjuntos de oportunidades], 23-35 [1.6 Conjuntos convexos y las implicaciones de precio de la optimalidad], y 35-37 [1.7 El papel de los supuestos de convexidad en el análisis])
  42. ^ Rothenberg (1960, pág. 447, 1961)
  43. ^ Arrow y Hahn (1980, pág. 182)
  44. ^ Shapley y Shubik (1966, pág. 806)
  45. ^ ab Aumann (1966, págs. 1-2) utiliza resultados de Aumann (1964, 1965)
  46. ^ La adopción de la envoltura convexa de las preferencias no convexas ya había sido discutida anteriormente por Wold (1943b, p. 243) y por Wold & Juréen (1953, p. 146), según Diewert (1982, p. 552).
  47. ^ ab Starr y Stinchcombe (1999, págs. 217-218)
  48. ^ Arrow y Hahn (1980, págs. 169-182) y Starr (1969, págs. 27-33)
  49. ^ Green y Heller (1981, pág. 44)
  50. ^ Guesnerie (1989, pág. 99)
  51. ^ Mas-Colell (1987)
  52. ^ Varian (1992, págs. 393–394)

    Mas-Colell, Whinston y Green (1995, págs. 627–630)

  53. ^ Arrow y Hahn (1980, págs. 169-182)

    Mas-Colell (1985, págs. 52–55, 145–146, 152–153 y 274–275)

    Hildenbrand (1974, págs. 37, 115-116, 122 y 168)

    Starr (1997, pág. 169)

    Ellickson (1994, págs. xviii, 306–310, 312, 328–329, 347 y 352)

  54. ^ Laffont, Jean-Jacques (1988). "3. No convexidades". Fundamentos de la economía pública. Prensa del MIT . págs. 63–65. ISBN 0-262-12127-1.
  55. ^ Salanié (2000, págs. 112-113 y 107-115)
  56. ^ Ichiishi (1983, págs. 24-25)
  57. ^ Cassels (1981, págs. 127 y 33-34)
  58. ^ ab Aubin (2007, págs. 458–476)
  59. ^ Carter (2001, págs. 93-94, 143, 318-319, 375-377 y 416)
  60. ^ Trockel (1984, pág. 30)
  61. ^ de Bertsekas (1999, pág. 496)
  62. ^ Rokafellar (1997, pág. 23)
  63. ^ Lemaréchal (1973, p. 38) Los experimentos de Lemaréchal fueron discutidos en publicaciones posteriores:

    Aardal (1995, págs. 2-3)

    Hiriart-Urruty y Lemaréchal (1993, págs. 143-145, 151, 153 y 156)

  64. ^ ab Ekeland, Ivar (1974). "Una estimación a priori en programación no convexa". Comptes Rendus Hebdomadaires des Séances de l'Académie des Sciences . Serie A y B (en francés). 279 : 149-151. ISSN  0151-0509. SEÑOR  0395844.
  65. ^ Aubin y Ekeland (1976, págs.226, 233, 235, 238 y 241)
  66. ^ Di Guglielmo (1977, págs. 287–288)
  67. ^ Schneider y Weil (2008, pág.45)
  68. ^ Cassels (1975, págs. 433-434)
  69. ^ Molchanov (2005, págs. 195-198, 218, 232, 237-238 y 407)
  70. ^ ab Puri y Ralescu (1985, págs. 154-155)
  71. ^ Weil (1982, págs. 203 y 205-206)
  72. ^ Cerf (1999, pp. 243–244) utiliza aplicaciones del lema Shapley-Folkman de Puri y Ralescu (1985, pp. 154–155).
  73. ^ Ruzsa (1997, pág. 345)
  74. ^ Tardella (1990, págs. 478–479)
  75. Vind (1964, pp. 168 y 175) fue señalado por el ganador del Premio Nobel de Economía de 1983 , Gérard Debreu . Debreu (1991, p. 4) escribió:

    El concepto de conjunto convexo (es decir, un conjunto que contiene el segmento que conecta dos de sus puntos) había sido colocado repetidamente en el centro de la teoría económica antes de 1964. Apareció bajo una nueva luz con la introducción de la teoría de la integración en el estudio de la competencia económica: Si uno asocia con cada agente de una economía un conjunto arbitrario en el espacio de las mercancías y si uno promedia esos conjuntos individuales sobre una colección de agentes insignificantes, entonces el conjunto resultante es necesariamente convexo . [Debreu añade esta nota al pie: "Sobre esta consecuencia directa de un teorema de A. A. Lyapunov, véase Vind (1964)".] Pero las explicaciones de las ... funciones de los precios ... pueden basarse en la convexidad de los conjuntos derivados por ese proceso de promediado . La convexidad en el espacio de las mercancías obtenida por agregación sobre una colección de agentes insignificantes es una idea que la teoría económica debe ... a la teoría de la integración. [ Cursiva añadida ]

  76. ^ Artstein (1980, págs. 172-183)
  77. ^ Mas-Colell (1978, pág. 210)

Referencias

Enlaces externos