stringtranslate.com

Teoría del transporte (matemáticas)

En matemáticas y economía, teoría del transporte o teoría del transporte es un nombre que se le da al estudio del transporte óptimo y la asignación de recursos . El problema fue formalizado por el matemático francés Gaspard Monge en 1781. [1]

En la década de 1920, AN Tolstoi fue uno de los primeros en estudiar matemáticamente el problema del transporte . En 1930, en la colección Planificación del Transporte Volumen I para el Comisariado Nacional de Transporte de la Unión Soviética, publicó un artículo "Métodos para encontrar el kilometraje mínimo en el transporte de carga en el espacio". [2] [3]

El matemático y economista soviético Leonid Kantorovich realizó importantes avances en este campo durante la Segunda Guerra Mundial . [4] En consecuencia, el problema tal como se plantea a veces se conoce como el problema del transporte de Monge-Kantorovich . [5] La formulación de programación lineal del problema de transporte también se conoce como problema de transporte de Hitchcock - Kopmans . [6]

Motivación

Minas y fábricas

Supongamos que tenemos un conjunto de m minas que extraen mineral de hierro y un conjunto de n fábricas que utilizan el mineral de hierro que producen las minas. Supongamos, a efectos del argumento, que estas minas y fábricas forman dos subconjuntos disjuntos M y F del plano euclidiano R 2 . Supongamos también que tenemos una función de costos c  :  R 2  ×  R 2  → [0, ∞), de modo que c ( xy ) es el costo de transportar un envío de hierro de x a y . Para simplificar, ignoramos el tiempo necesario para realizar el transporte. También suponemos que cada mina puede abastecer sólo a una fábrica (sin dividir los envíos) y que cada fábrica requiere precisamente un envío para estar en operación (las fábricas no pueden trabajar a la mitad o al doble de su capacidad). Habiendo hecho los supuestos anteriores, un plan de transporte es una biyección T  : MF . En otras palabras, cada mina mM abastece precisamente a una fábrica objetivo T ( m ) ∈ F y cada fábrica es abastecida precisamente por una mina. Deseamos encontrar el plan de transporte óptimo , el plan T cuyo coste total

es el menor de todos los planes de transporte posibles de M a F. Este caso especial motivador del problema del transporte es un ejemplo del problema de asignación . Más específicamente, equivale a encontrar una coincidencia de peso mínimo en un gráfico bipartito .

Mover libros: la importancia de la función de costos

El siguiente ejemplo sencillo ilustra la importancia de la función de costos para determinar el plan de transporte óptimo. Supongamos que tenemos n libros de igual ancho en un estante (la línea real ), dispuestos en un solo bloque contiguo. Deseamos reorganizarlos en otro bloque contiguo, pero desplazamos un ancho de libro hacia la derecha. Se presentan dos candidatos obvios para el plan de transporte óptimo:

  1. mover todos los n libros un ancho de libro hacia la derecha ("muchos movimientos pequeños");
  2. mueva el libro más a la izquierda n anchos de libro hacia la derecha y deje todos los demás libros fijos ("un gran movimiento").

Si la función de costo es proporcional a la distancia euclidiana ( c ( xy ) = α| x  −  y | ), entonces estos dos candidatos son óptimos . Si, por otro lado, elegimos la función de costo estrictamente convexa proporcional al cuadrado de la distancia euclidiana ( c ( xy ) =  α | x  −  y | 2 ), entonces la opción "muchos movimientos pequeños" se convierte en el minimizador único .

Tenga en cuenta que las funciones de costos anteriores consideran solo la distancia horizontal recorrida por los libros, no la distancia horizontal recorrida por un dispositivo utilizado para levantar cada libro y moverlo a su posición. Si se considera en cambio este último, de los dos planes de transporte, el segundo siempre es óptimo para la distancia euclidiana, mientras que, siempre que haya al menos 3 libros, el primer plan de transporte es óptimo para la distancia euclidiana al cuadrado.

problema de hitchcock

La siguiente formulación del problema de transporte se atribuye a FL Hitchcock : [7]

Supongamos que hay m fuentes para un bien, con unidades de oferta en x i y n sumideros para el bien, con la demanda en y j . Si es el costo unitario de envío de x i a y j , encuentre un flujo que satisfaga la demanda de suministros y minimice el costo del flujo. Este desafío en logística fue asumido por DR Fulkerson [8] y en el libro Flows in Networks (1962) escrito con LR Ford Jr. [9]

A Tjalling Koopmans también se le atribuyen formulaciones de economía del transporte y asignación de recursos.

Formulación abstracta del problema.

Formulaciones de Monge y Kantorovich

El problema del transporte, tal como se plantea en la literatura moderna o más técnica, parece algo diferente debido al desarrollo de la geometría y la teoría de la medida de Riemann . El ejemplo de las minas y las fábricas, por simple que sea, es un punto de referencia útil cuando se piensa en el caso abstracto. En este contexto, permitimos la posibilidad de que no deseemos mantener todas las minas y fábricas abiertas al negocio y permitir que las minas abastezcan a más de una fábrica y que las fábricas acepten hierro de más de una mina.

Sean y dos espacios métricos separables tales que cualquier medida de probabilidad de (o ) sea una medida de radón (es decir, son espacios de radón ). Sea una función medible de Borel . Dadas las medidas de probabilidad una y otra vez , la formulación de Monge del problema de transporte óptimo es encontrar un mapa de transporte que realice el mínimo

donde denota el avance de by . Un mapa que alcanza este mínimo ( es decir , lo convierte en un mínimo en lugar de un mínimo) se denomina "mapa de transporte óptimo".

La formulación de Monge del problema de transporte óptimo puede estar mal planteada, porque a veces no hay nada satisfactorio : esto sucede, por ejemplo, cuando es una medida de Dirac pero no lo es.

Podemos mejorar esto adoptando la formulación de Kantorovich del problema de transporte óptimo, que consiste en encontrar una medida de probabilidad que alcance el mínimo

donde denota la colección de todas las medidas de probabilidad con marginales una y otra vez . Se puede demostrar [10] que siempre existe un minimizador para este problema cuando la función de costo es semicontinua inferior y es un conjunto ajustado de medidas (lo cual está garantizado para espacios de radón y ). (Compárese esta formulación con la definición de la métrica de Wasserstein en el espacio de medidas de probabilidad). Sigurd Angenent , Steven Haker y Allen Tannenbaum dieron una formulación de descenso de gradiente para la solución del problema de Monge-Kantorovich . [11]

Fórmula de dualidad

El mínimo del problema de Kantorovich es igual a

donde el supremum recorre todos los pares de funciones acotadas y continuas y tal que

Interpretación económica

La interpretación económica es más clara si se invierten los signos. Consideremos el vector de características de un trabajador, el vector de características de una empresa y la producción económica generada por el trabajador emparejado con la empresa . Configurando y , el problema de Monge-Kantorovich se reescribe:

doble
[12]

Solución del problema

Transporte óptimo en la línea real

Porque , denotemos el conjunto de medidas de probabilidad que tienen un momento finito . Sea y sea , donde es una función convexa .

  1. Si no tiene átomo , es decir, si la función de distribución acumulativa es una función continua , entonces es un mapa de transporte óptimo. Es el único mapa de transporte óptimo si es estrictamente convexo.
  2. Tenemos

La prueba de esta solución aparece en Rachev y Rüschendorf (1998). [13]

Versión discreta y formulación de programación lineal.

En el caso en que los márgenes y sean discretos, sean y las masas de probabilidad asignadas respectivamente a y , y sea la probabilidad de una asignación. La función objetivo en el problema primario de Kantorovich es entonces

y la restricción se expresa como

y

Para ingresar esto en un problema de programación lineal , necesitamos vectorizar la matriz apilando sus columnas o sus filas , a esta operación la llamamos . En el orden de la columna principal , las restricciones anteriores se reescriben como

y

donde es el producto de Kronecker , es una matriz de tamaño con todas las entradas de unos y es la matriz identidad de tamaño . Como resultado, al establecer , la formulación de programación lineal del problema es

que se puede ingresar fácilmente en un solucionador de programación lineal a gran escala (consulte el capítulo 3.4 de Galichon (2016) [12] ).

Caso semidiscreto

En el caso semidiscreto, y es una distribución continua sobre , mientras que es una distribución discreta que asigna masa de probabilidad al sitio . En este caso, podemos ver [14] que los problemas primario y dual de Kantorovich se reducen respectivamente a:

el descenso de gradiente

En el caso de , se puede demostrar que el conjunto de asignado a un sitio particular es un poliedro convexo. La configuración resultante se llama diagrama de potencia . [15]

Caso normal cuadrático

Supongamos el caso particular , y donde es invertible. Uno entonces tiene

La prueba de esta solución aparece en Galichon (2016). [12]

Espacios de Hilbert separables

Sea un espacio de Hilbert separable . Denotemos el conjunto de medidas de probabilidad que tienen un momento finito; denotemos aquellos elementos que son regulares gaussianos : si hay alguna medida gaussiana estrictamente positiva en y , entonces también.

Deja , , por . Entonces el problema de Kantorovich tiene una solución única , y esta solución es inducida por un mapa de transporte óptimo: es decir, existe un mapa de Borel tal que

Además, si tiene soporte acotado , entonces

para -casi todos para algunos localmente Lipschitz , c -cóncavo y máximo potencial de Kantorovich . (Aquí se indica el derivado Gateaux de ).

Regularización entrópica

Considere una variante del problema discreto anterior, donde hemos agregado un término de regularización entrópica a la función objetivo del problema primario.

Se puede demostrar que el problema dual regularizado es

donde, en comparación con la versión no regularizada, la restricción "dura" en el dual anterior ( ) ha sido reemplazada por una penalización "suave" de esa restricción (la suma de los términos ). Las condiciones de optimización en el problema dual se pueden expresar como

Ec. 5.1:
Ec. 5.2:

Denotando como la matriz del término , resolver el dual es, por lo tanto, equivalente a buscar dos matrices positivas diagonales y de tamaños respectivos y , tales que y . La existencia de tales matrices generaliza el teorema de Sinkhorn y las matrices se pueden calcular utilizando el algoritmo de Sinkhorn-Knopp , [16] que simplemente consiste en buscar iterativamente resolver la Ecuación 5.1 y resolver la Ecuación 5.2 . El algoritmo de Sinkhorn-Knopp es, por tanto, un algoritmo de descenso de coordenadas en el problema dual regularizado.

Aplicaciones

El transporte óptimo de Monge-Kantorovich ha encontrado aplicaciones en una amplia gama en diferentes campos. Entre ellos están:

Ver también

Referencias

  1. ^ G. Monge. Mémoire sur la théorie des déblais et des remblais. Histoire de l'Académie Royale des Sciences de Paris, con les Mémoires de Mathématique et de Physique pour la même année , páginas 666–704, 1781.
  2. ^ Schrijver, Alexander , Optimización combinatoria, Berlín; Nueva York: Springer, 2003. ISBN  3540443894 . Cf. pag. 362
  3. ^ Ivor Grattan-Guinness, Ivor, Enciclopedia complementaria de la historia y la filosofía de las ciencias matemáticas, Volumen 1, JHU Press, 2003. Cf. p.831
  4. ^ L. Kantorovich. Sobre la translocación de masas. CR (Doklady) Acad. Ciencia. URSS (NS), 37:199–201, 1942.
  5. ^ Cédric Villani (2003). Temas de transporte óptimo . Sociedad Matemática Estadounidense. pag. 66.ISBN _ 978-0-8218-3312-4.
  6. ^ Singiresu S. Rao (2009). Optimización de ingeniería: teoría y práctica (4ª ed.). John Wiley e hijos. pag. 221.ISBN _ 978-0-470-18352-6.
  7. ^ Frank L. Hitchcock (1941) "La distribución de un producto de varias fuentes a numerosas localidades", MIT Journal of Mathematics and Physics 20:224–230 MR 0004469.
  8. ^ DR Fulkerson (1956) Problema de transporte de Hitchcock, corporación RAND.
  9. ^ LR Ford Jr. y DR Fulkerson (1962) § 3.1 en Flujos en redes , página 95, Princeton University Press
  10. ^ L. Ambrosio, N. Gigli y G. Savaré. Flujos de gradiente en espacios métricos y en el espacio de medidas de probabilidad. Conferencias de Matemáticas ETH Zürich, Birkhäuser Verlag, Basilea. (2005)
  11. ^ Angenent, S.; Haker, S.; Tannenbaum, A. (2003). "Minimizar flujos para el problema Monge-Kantorovich". SIAM J. Matemáticas. Anal . 35 (1): 61–97. CiteSeerX 10.1.1.424.1064 . doi :10.1137/S0036141002410927. 
  12. ^ abc Galichon, Alfred . Métodos óptimos de transporte en economía . Prensa de la Universidad de Princeton, 2016.
  13. ^ Rachev, Svetlozar T. y Ludger Rüschendorf. Problemas de transporte masivo: Volumen I: Teoría . vol. 1. Springer, 1998.
  14. ^ Santambrogio, Filippo. Transporte óptimo para matemáticos aplicados . Birkhäuser Basel, 2016. En particular el capítulo 6, sección 4.2.
  15. ^ Aurenhammer, Franz (1987), "Diagramas de potencia: propiedades, algoritmos y aplicaciones", SIAM Journal on Computing , 16 (1): 78–96, doi :10.1137/0216006, MR  0873251.
  16. ^ Peyré, Gabriel y Marco Cuturi (2019), "Transporte óptimo computacional: con aplicaciones a la ciencia de datos", Fundamentos y tendencias del aprendizaje automático: vol. 11: núms. 5-6, págs. 355–607. DOI: 10.1561/2200000073.
  17. ^ Haker, Steven; Zhu, Lei; Tannenbaum, Allen; Angenent, Sigurd (1 de diciembre de 2004). "Transporte Masivo Óptimo para Registro y Deformación". Revista Internacional de Visión por Computadora . 60 (3): 225–240. CiteSeerX 10.1.1.59.4082 . doi :10.1023/B:VISI.0000036836.66311.97. ISSN  0920-5691. S2CID  13261370. 
  18. ^ Glimm, T.; Oliker, V. (1 de septiembre de 2003). "Diseño óptico de sistemas de reflector único y el problema de transferencia de masa de Monge-Kantorovich". Revista de Ciencias Matemáticas . 117 (3): 4096–4108. doi :10.1023/A:1024856201493. ISSN  1072-3374. S2CID  8301248.
  19. ^ Kasim, Muhammad Firmansyah; Ceurvorst, Lucas; Ratán, Naren; Sadler, James; Chen, Nicolás; Sävert, Alexander; Trines, Raoul; Bingham, Robert; Burrows, Philip N. (16 de febrero de 2017). "Sombragrafía cuantitativa y radiografía de protones para modulaciones de gran intensidad". Revisión física E. 95 (2): 023306. arXiv : 1607.04179 . Código bibliográfico : 2017PhRvE..95b3306K. doi : 10.1103/PhysRevE.95.023306. PMID  28297858. S2CID  13326345.
  20. ^ Metivier, Ludovic (24 de febrero de 2016). "Medición del desajuste entre sismogramas utilizando una distancia de transporte óptima: aplicación a la inversión completa de formas de onda". Revista Geofísica Internacional . 205 (1): 345–377. Código Bib : 2016GeoJI.205..345M. doi : 10.1093/gji/ggw014 .

Otras lecturas