La optimización multiobjetivo u optimización de Pareto (también conocida como programación multiobjetivo , optimización vectorial , optimización multicriterio u optimización multiatributo ) es un área de toma de decisiones de múltiples criterios que se ocupa de problemas de optimización matemática que involucran más de una función objetivo para optimizar simultáneamente. La optimización multiobjetivo es un tipo de optimización vectorial que se ha aplicado en muchos campos de la ciencia, incluida la ingeniería, la economía y la logística, donde se deben tomar decisiones óptimas en presencia de compensaciones entre dos o más objetivos en conflicto. Minimizar el costo mientras se maximiza la comodidad al comprar un automóvil y maximizar el rendimiento mientras se minimiza el consumo de combustible y la emisión de contaminantes de un vehículo son ejemplos de problemas de optimización multiobjetivo que involucran dos y tres objetivos, respectivamente. En problemas prácticos, puede haber más de tres objetivos.
En un problema de optimización multiobjetivo, no se garantiza que una única solución optimice simultáneamente cada objetivo. Se dice que las funciones objetivo están en conflicto. Una solución se denomina no dominada , óptima en el sentido de Pareto, eficiente en el sentido de Pareto o no inferior si no se puede mejorar el valor de ninguna de las funciones objetivo sin degradar algunos de los otros valores objetivos. Sin información adicional sobre las preferencias subjetivas , puede existir un número (posiblemente infinito) de soluciones óptimas en el sentido de Pareto, todas las cuales se consideran igualmente buenas. Los investigadores estudian los problemas de optimización multiobjetivo desde diferentes puntos de vista y, por lo tanto, existen diferentes filosofías de solución y objetivos al plantearlos y resolverlos. El objetivo puede ser encontrar un conjunto representativo de soluciones óptimas en el sentido de Pareto y/o cuantificar las compensaciones para satisfacer los diferentes objetivos y/o encontrar una única solución que satisfaga las preferencias subjetivas de un tomador de decisiones humano (DM).
La optimización bicriterio denota el caso especial en el que hay dos funciones objetivo.
Existe una relación directa entre la optimización multitarea y la optimización multiobjetivo. [1]
Un problema de optimización multiobjetivo es un problema de optimización que involucra múltiples funciones objetivo. [2] [3] [4] En términos matemáticos, un problema de optimización multiobjetivo se puede formular como
donde el entero es el número de objetivos y el conjunto es el conjunto factible de vectores de decisión, que normalmente es , pero depende del dominio de aplicación de dimensiones . El conjunto factible normalmente se define mediante algunas funciones de restricción. Además, la función objetivo con valor vectorial a menudo se define como
Si se quiere maximizar una función objetivo, es equivalente a minimizar su negativo o su inverso. Denotamos la imagen de una solución factible o una decisión factible y un vector objetivo o un resultado .
En la optimización multiobjetivo, normalmente no existe una solución factible que minimice todas las funciones objetivo simultáneamente. Por lo tanto, se presta atención a las soluciones óptimas de Pareto ; es decir, soluciones que no se pueden mejorar en ninguno de los objetivos sin degradar al menos uno de los otros objetivos. En términos matemáticos, se dice que una solución factible domina (Pareto) a otra solución , si
Una solución (y el resultado correspondiente ) se denomina óptima de Pareto si no existe otra solución que la domine. El conjunto de resultados óptimos de Pareto, denotado como , se suele denominar frente de Pareto , frontera de Pareto o límite de Pareto.
El frente de Pareto de un problema de optimización multiobjetivo está limitado por un denominado vector objetivo nadir y un vector objetivo ideal , si estos son finitos. El vector objetivo nadir se define como
y el vector objetivo ideal como
En otras palabras, los componentes de los vectores nadir y objetivo ideal definen los límites superior e inferior de la función objetivo de las soluciones óptimas de Pareto. En la práctica, el vector objetivo nadir solo se puede aproximar ya que, por lo general, se desconoce todo el conjunto óptimo de Pareto. Además, a menudo se define un vector objetivo utópico , tal que donde es una constante pequeña, debido a razones numéricas.
En economía , muchos problemas implican objetivos múltiples junto con restricciones sobre qué combinaciones de esos objetivos son alcanzables. Por ejemplo, la demanda del consumidor de diversos bienes está determinada por el proceso de maximización de las utilidades derivadas de esos bienes, sujeta a una restricción basada en cuánto ingreso está disponible para gastar en esos bienes y en los precios de esos bienes. Esta restricción permite que se compre más de un bien solo a costa de consumir menos de otro bien; por lo tanto, los diversos objetivos (se prefiere un mayor consumo de cada bien) están en conflicto entre sí. Un método común para analizar un problema de este tipo es utilizar un gráfico de curvas de indiferencia , que representan las preferencias, y una restricción presupuestaria, que representa las disyuntivas a las que se enfrenta el consumidor.
Otro ejemplo es la frontera de posibilidades de producción , que especifica qué combinaciones de distintos tipos de bienes puede producir una sociedad con determinadas cantidades de distintos recursos. La frontera especifica las disyuntivas a las que se enfrenta la sociedad: si la sociedad utiliza plenamente sus recursos, puede producir más de un bien sólo a expensas de producir menos de otro. Una sociedad debe entonces utilizar algún proceso para elegir entre las posibilidades de la frontera.
La formulación de políticas macroeconómicas es un contexto que requiere una optimización multiobjetivo. Normalmente, un banco central debe elegir una postura de política monetaria que equilibre objetivos en pugna (baja inflación , bajo desempleo , bajo déficit de la balanza comercial , etc.). Para ello, el banco central utiliza un modelo de la economía que describe cuantitativamente los diversos vínculos causales de la economía; simula el modelo repetidamente bajo diversas posturas posibles de política monetaria, a fin de obtener un menú de posibles resultados previstos para las diversas variables de interés. Luego, en principio, puede utilizar una función objetivo agregada para calificar los conjuntos alternativos de resultados previstos, aunque en la práctica los bancos centrales utilizan un proceso no cuantitativo, basado en el juicio, para clasificar las alternativas y tomar la decisión de política.
En finanzas , un problema común es elegir una cartera cuando hay dos objetivos en conflicto: el deseo de que el valor esperado de los rendimientos de la cartera sea lo más alto posible y el deseo de que el riesgo , a menudo medido por la desviación estándar de los rendimientos de la cartera, sea lo más bajo posible. Este problema se representa a menudo mediante un gráfico en el que la frontera eficiente muestra las mejores combinaciones de riesgo y rendimiento esperado que están disponibles, y en el que las curvas de indiferencia muestran las preferencias del inversor por varias combinaciones de riesgo y rendimiento esperado. El problema de optimizar una función del valor esperado (primer momento ) y la desviación estándar (raíz cuadrada del segundo momento central) del rendimiento de la cartera se denomina modelo de decisión de dos momentos .
En ingeniería y economía , muchos problemas implican múltiples objetivos que no se pueden describir como cuanto más, mejor o cuanto menos, mejor; en cambio, existe un valor objetivo ideal para cada objetivo, y el deseo es acercarse lo más posible al valor deseado de cada objetivo. Por ejemplo, los sistemas de energía suelen tener un equilibrio entre rendimiento y costo [5] [6] o uno podría querer ajustar el uso y la orientación del combustible de un cohete para que llegue tanto a un lugar específico como a una hora específica; o uno podría querer realizar operaciones de mercado abierto para que tanto la tasa de inflación como la tasa de desempleo estén lo más cerca posible de sus valores deseados.
A menudo, estos problemas están sujetos a restricciones de igualdad lineal que impiden que todos los objetivos se cumplan perfectamente de manera simultánea, especialmente cuando el número de variables controlables es menor que el número de objetivos y cuando la presencia de perturbaciones aleatorias genera incertidumbre. Por lo general, se utiliza una función objetivo cuadrática multiobjetivo , en la que el costo asociado con un objetivo aumenta cuadráticamente con la distancia del objetivo a su valor ideal. Dado que estos problemas suelen implicar ajustar las variables controladas en varios puntos del tiempo y/o evaluar los objetivos en varios puntos del tiempo, se emplean técnicas de optimización intertemporal . [7]
El diseño de productos y procesos se puede mejorar en gran medida utilizando técnicas modernas de modelado, simulación y optimización. [ cita requerida ] La pregunta clave en el diseño óptimo es medir lo que es bueno o deseable acerca de un diseño. Antes de buscar diseños óptimos, es importante identificar las características que más contribuyen al valor general del diseño. Un buen diseño generalmente implica múltiples criterios/objetivos como el costo/inversión de capital, el costo operativo, la ganancia, la calidad y/o recuperación del producto, la eficiencia, la seguridad del proceso, el tiempo de operación, etc. Por lo tanto, en aplicaciones prácticas, el desempeño del diseño de procesos y productos a menudo se mide con respecto a múltiples objetivos. Estos objetivos suelen ser conflictivos, es decir, lograr el valor óptimo para un objetivo requiere algún compromiso en uno o más objetivos.
Por ejemplo, al diseñar una fábrica de papel, se puede intentar reducir la cantidad de capital invertido en la misma y mejorar la calidad del papel simultáneamente. Si el diseño de una fábrica de papel se define por grandes volúmenes de almacenamiento y la calidad del papel se define por parámetros de calidad, entonces el problema del diseño óptimo de una fábrica de papel puede incluir objetivos como i) la minimización de la variación esperada de esos parámetros de calidad con respecto a sus valores nominales, ii) la minimización del tiempo esperado de pausas y iii) la minimización del costo de inversión de los volúmenes de almacenamiento. En este caso, el volumen máximo de torres es una variable de diseño. Este ejemplo de diseño óptimo de una fábrica de papel es una simplificación del modelo utilizado en [8] . La optimización del diseño multiobjetivo también se ha implementado en sistemas de ingeniería en circunstancias tales como la optimización del diseño del gabinete de control, [9] la optimización de la forma del perfil aerodinámico mediante flujos de trabajo científicos, [10] el diseño de nano- CMOS , [11] el diseño de sistemas en chip , el diseño de sistemas de irrigación con energía solar, [12] la optimización de los sistemas de moldes de arena, [13] [14] el diseño de motores, [15] [16] la implementación óptima de sensores [17] y el diseño óptimo de controladores. [18] [19]
La optimización multiobjetivo se ha empleado cada vez más en la ingeniería química y la fabricación . En 2009, Fiandaca y Fraga utilizaron el algoritmo genético multiobjetivo (MOGA) para optimizar el proceso de adsorción por oscilación de presión (proceso de separación cíclica). El problema de diseño implicó la maximización dual de la recuperación de nitrógeno y la pureza del nitrógeno. Los resultados se aproximaron bien a la frontera de Pareto con compensaciones aceptables entre los objetivos. [20]
En 2010, Sendín et al. resolvieron un problema multiobjetivo para el procesamiento térmico de alimentos. Abordaron dos casos de estudio (problemas biobjetivo y triple objetivo) con modelos dinámicos no lineales. Utilizaron un enfoque híbrido que consistía en el enfoque de Tchebycheff ponderado y el enfoque de intersección normal de límites. El nuevo enfoque híbrido fue capaz de construir un conjunto óptimo de Pareto para el procesamiento térmico de alimentos. [21]
En 2013, Ganesan et al. llevaron a cabo la optimización multiobjetivo de la combinación de reformado de dióxido de carbono y oxidación parcial de metano. Las funciones objetivo fueron la conversión de metano, la selectividad del monóxido de carbono y la relación hidrógeno/monóxido de carbono. Ganesan utilizó el método de intersección de límites normales (NBI) junto con dos técnicas basadas en enjambre (algoritmo de búsqueda gravitacional (GSA) y optimización de enjambre de partículas (PSO)) para abordar el problema. [22] Las aplicaciones que involucran extracción química [23] y procesos de producción de bioetanol [24] han planteado problemas multiobjetivo similares.
En 2013, Abakarov et al. propusieron una técnica alternativa para resolver problemas de optimización multiobjetivo que surgen en la ingeniería alimentaria. [25] El enfoque de funciones de agregación, el algoritmo de búsqueda aleatoria adaptativa y el enfoque de funciones de penalización se utilizaron para calcular el conjunto inicial de soluciones no dominadas u óptimas de Pareto. El proceso de jerarquía analítica y el método tabular se utilizaron simultáneamente para elegir la mejor alternativa entre el subconjunto calculado de soluciones no dominadas para procesos de deshidratación osmótica. [26]
En 2018, Pearce et al. formularon la asignación de tareas a trabajadores humanos y robóticos como un problema de optimización multiobjetivo, considerando el tiempo de producción y el impacto ergonómico en el trabajador humano como los dos objetivos considerados en la formulación. Su enfoque utilizó un Programa Lineal de Entero Mixto para resolver el problema de optimización para una suma ponderada de los dos objetivos para calcular un conjunto de soluciones óptimas de Pareto . La aplicación del enfoque a varias tareas de fabricación mostró mejoras en al menos un objetivo en la mayoría de las tareas y en ambos objetivos en algunos de los procesos. [27]
El propósito de la gestión de recursos de radio es satisfacer las tasas de datos que solicitan los usuarios de una red celular. [28] Los recursos principales son intervalos de tiempo, bloques de frecuencia y potencias de transmisión. Cada usuario tiene su propia función objetivo que, por ejemplo, puede representar alguna combinación de la tasa de datos, latencia y eficiencia energética. Estos objetivos son conflictivos ya que los recursos de frecuencia son muy escasos, por lo que existe la necesidad de una reutilización espacial ajustada de la frecuencia que causa una inmensa interferencia entre usuarios si no se controla adecuadamente. En la actualidad, se utilizan técnicas MIMO multiusuario para reducir la interferencia mediante precodificación adaptativa . Al operador de red le gustaría brindar una gran cobertura y altas tasas de datos, por lo que le gustaría encontrar una solución óptima de Pareto que equilibre el rendimiento total de los datos de la red y la equidad del usuario de una manera subjetiva apropiada.
La gestión de recursos de radio se suele resolver mediante escalarización, es decir, la selección de una función de utilidad de red que intenta equilibrar el rendimiento y la equidad del usuario. La elección de la función de utilidad tiene un gran impacto en la complejidad computacional del problema de optimización de objetivo único resultante. [28] Por ejemplo, la utilidad común de la tasa de suma ponderada da un problema NP-hard con una complejidad que escala exponencialmente con el número de usuarios, mientras que la utilidad de equidad máxima-mínima ponderada da como resultado un problema de optimización cuasi-convexo con solo una escala polinómica con el número de usuarios. [29]
La reconfiguración, mediante el intercambio de los vínculos funcionales entre los elementos del sistema, representa una de las medidas más importantes que pueden mejorar el rendimiento operativo de un sistema de distribución. El problema de optimización mediante la reconfiguración de un sistema de distribución de energía, en términos de su definición, es un problema histórico de un solo objetivo con restricciones. Desde 1975, cuando Merlin y Back [30] introdujeron la idea de la reconfiguración del sistema de distribución para la reducción de pérdidas de potencia activa, hasta la actualidad, muchos investigadores han propuesto diversos métodos y algoritmos para resolver el problema de reconfiguración como un problema de un solo objetivo. Algunos autores han propuesto enfoques basados en la optimalidad de Pareto (incluyendo pérdidas de potencia activa e índices de confiabilidad como objetivos). Para este propósito, se han utilizado diferentes métodos basados en inteligencia artificial: microgenética, [31] intercambio de ramas, [32] optimización por enjambre de partículas [33] y algoritmo genético de clasificación no dominada. [34]
La inspección autónoma de infraestructuras tiene el potencial de reducir costos, riesgos e impactos ambientales, así como de garantizar un mejor mantenimiento periódico de los activos inspeccionados. Por lo general, la planificación de dichas misiones se ha considerado como un problema de optimización de un solo objetivo, en el que se busca minimizar la energía o el tiempo invertidos en inspeccionar una estructura objetivo completa. [35] Sin embargo, para estructuras complejas del mundo real, no es factible cubrir el 100% de un objetivo de inspección, y la generación de un plan de inspección puede verse mejor como un problema de optimización multiobjetivo, en el que se busca maximizar la cobertura de la inspección y minimizar el tiempo y los costos. Un estudio reciente ha indicado que la planificación de inspecciones multiobjetivo de hecho tiene el potencial de superar a los métodos tradicionales en estructuras complejas [36].
Como normalmente existen múltiples soluciones óptimas de Pareto para problemas de optimización multiobjetivo, lo que significa resolver un problema de este tipo no es tan sencillo como lo es para un problema de optimización convencional de un solo objetivo. Por lo tanto, diferentes investigadores han definido el término "resolver un problema de optimización multiobjetivo" de diversas formas. Esta sección resume algunas de ellas y los contextos en los que se utilizan. Muchos métodos convierten el problema original con múltiples objetivos en un problema de optimización de un solo objetivo . Esto se llama problema escalarizado. Si se puede garantizar la optimalidad de Pareto de las soluciones de un solo objetivo obtenidas, la escalarización se caracteriza como realizada de manera ordenada.
La solución de un problema de optimización multiobjetivo a veces se entiende como la aproximación o el cálculo de todas o un conjunto representativo de soluciones óptimas de Pareto. [37] [38]
Cuando se hace hincapié en la toma de decisiones , el objetivo de resolver un problema de optimización multiobjetivo se refiere a ayudar a un tomador de decisiones a encontrar la solución óptima de Pareto más preferida de acuerdo con sus preferencias subjetivas. [2] [39] El supuesto subyacente es que se debe identificar una solución al problema para implementarla en la práctica. Aquí, un tomador de decisiones humano (DM) juega un papel importante. Se espera que el DM sea un experto en el dominio del problema.
Los resultados más preferidos se pueden encontrar utilizando diferentes filosofías. Los métodos de optimización multiobjetivo se pueden dividir en cuatro clases. [3]
En las siguientes secciones se ofrece más información y ejemplos de diferentes métodos en las cuatro clases.
Cuando un tomador de decisiones no articula explícitamente ninguna información de preferencia, el método de optimización multiobjetivo puede clasificarse como un método sin preferencia. [3] Un ejemplo bien conocido es el método de criterio global, [40] en el que se plantea un problema escalarizado de la forma
se resuelve. En el problema anterior, puede ser cualquier norma , con opciones comunes que incluyen , , y . [2] El método del criterio global es sensible a la escala de las funciones objetivo. Por lo tanto, se recomienda que los objetivos se normalicen en una escala uniforme y adimensional. [2] [39]
Los métodos a priori requieren que se exprese suficiente información de preferencia antes del proceso de solución. [3] Ejemplos conocidos de métodos a priori incluyen el método de función de utilidad, el método lexicográfico y la programación de objetivos .
El método de la función de utilidad supone que la función de utilidad del decisor está disponible. Una función es una función de utilidad si se cumple que si el decisor prefiere , y si es indiferente entre y . La función de utilidad especifica un ordenamiento de los vectores de decisión (recuerde que los vectores se pueden ordenar de muchas maneras diferentes). Una vez obtenido, basta con resolver
Pero en la práctica, es muy difícil construir una función de utilidad que represente con precisión las preferencias del tomador de decisiones, [2] particularmente porque el frente de Pareto es desconocido antes de que comience la optimización.
El método lexicográfico supone que los objetivos pueden clasificarse en orden de importancia. Suponemos que las funciones objetivo están en orden de importancia, de modo que sean la más importante y la menos importante para el que toma las decisiones. Sujeto a este supuesto, se pueden utilizar varios métodos para alcanzar la solución lexicográficamente óptima. Tenga en cuenta que aquí no se especifica un objetivo o valor objetivo para ningún objetivo, lo que lo hace diferente del método de programación lexicográfica por objetivos .
La escalarización de un problema de optimización multiobjetivo es un método a priori, lo que significa formular un problema de optimización de un solo objetivo de manera que las soluciones óptimas para el problema de optimización de un solo objetivo sean soluciones óptimas de Pareto para el problema de optimización multiobjetivo. [3] Además, a menudo se requiere que cada solución óptima de Pareto pueda alcanzarse con algunos parámetros de la escalarización. [3] Con diferentes parámetros para la escalarización, se producen diferentes soluciones óptimas de Pareto. Una formulación general para una escalarización de un problema de optimización multiobjetivo es
donde es un parámetro vectorial, el conjunto es un conjunto que depende del parámetro y es una función.
Ejemplos muy conocidos son:
Ejemplos algo más avanzados son los siguientes:
Por ejemplo, la optimización de carteras se realiza a menudo en términos de análisis de media-varianza . En este contexto, el conjunto eficiente es un subconjunto de las carteras parametrizadas por el rendimiento medio de la cartera en el problema de elegir las acciones de la cartera para minimizar la varianza del rendimiento de la cartera sujeta a un valor dado de ; consulte el teorema de separación de fondos mutuos para obtener más detalles. Alternativamente, el conjunto eficiente se puede especificar eligiendo las acciones de la cartera para maximizar la función ; el conjunto de carteras eficientes consta de las soluciones como rangos de cero a infinito.
Algunas de las escalarizaciones anteriores implican la invocación del principio minimax , donde siempre se optimiza el peor de los diferentes objetivos. [44]
Los métodos a posteriori tienen como objetivo producir todas las soluciones óptimas de Pareto o un subconjunto representativo de las soluciones óptimas de Pareto. La mayoría de los métodos a posteriori pertenecen a una de las tres clases siguientes:
Ejemplos bien conocidos de métodos a posteriori basados en programación matemática son los métodos de Intersección Normal de Límites (NBI), [45] Intersección Normal de Límites Modificada (NBIm), [46] Restricción Normal (NC), [47] [48] Optimización Sucesiva de Pareto (SPO), [49] y Dominio de Búsqueda Dirigida (DSD) [50] , que resuelven el problema de optimización multiobjetivo mediante la construcción de varias escalarizaciones. La solución a cada escalarización produce una solución óptima de Pareto, ya sea local o globalmente. Las escalarizaciones de los métodos NBI, NBIm, NC y DSD se construyen para obtener puntos de Pareto distribuidos uniformemente que dan una buena aproximación del conjunto real de puntos de Pareto.
Los algoritmos evolutivos son enfoques populares para generar soluciones óptimas de Pareto para un problema de optimización multiobjetivo. La mayoría de los algoritmos evolutivos de optimización multiobjetivo (EMO) aplican esquemas de clasificación basados en Pareto. Algoritmos evolutivos como el Algoritmo Genético de Ordenamiento No Dominado-II (NSGA-II), [51] su versión extendida NSGA-III, [52] [53] el Algoritmo Evolutivo de Fuerza de Pareto 2 (SPEA-2) [54] y variantes de evolución diferencial multiobjetivo se han convertido en enfoques estándar, aunque algunos esquemas basados en optimización de enjambre de partículas y recocido simulado [55] son significativos. La principal ventaja de los algoritmos evolutivos, cuando se aplican para resolver problemas de optimización multiobjetivo, es el hecho de que típicamente generan conjuntos de soluciones, lo que permite el cálculo de una aproximación de todo el frente de Pareto. La principal desventaja de los algoritmos evolutivos es su menor velocidad y la optimalidad de Pareto de las soluciones no se puede garantizar; solo se sabe que ninguna de las soluciones generadas está dominada por otra.
Recientemente se ha mejorado otro paradigma para la optimización multiobjetivo basado en la novedad mediante algoritmos evolutivos. [56] Este paradigma busca soluciones novedosas en el espacio objetivo (es decir, búsqueda de novedad [57] en el espacio objetivo) además de la búsqueda de soluciones no dominadas. La búsqueda de novedad es como un peldaño que guía la búsqueda hacia lugares previamente inexplorados. Es especialmente útil para superar sesgos y mesetas, así como para guiar la búsqueda en problemas de optimización de múltiples objetivos.
Los métodos condicionales de aprendizaje profundo son nuevos enfoques para generar varias soluciones óptimas de Pareto. La idea es utilizar la capacidad de generalización de las redes neuronales profundas para aprender un modelo de todo el frente de Pareto a partir de un número limitado de ejemplos de compensaciones a lo largo de ese frente, una tarea llamada aprendizaje del frente de Pareto . [58] Varios enfoques abordan esta configuración, incluido el uso de hiperredes [58] y el uso del descenso de gradiente variacional de Stein. [59]
A continuación se enumeran los métodos a posteriori más conocidos:
En los métodos interactivos de optimización de problemas con múltiples objetivos, el proceso de solución es iterativo y el tomador de decisiones interactúa continuamente con el método cuando busca la solución más preferida (ver, por ejemplo, Miettinen 1999, [2] Miettinen 2008 [70] ). En otras palabras, se espera que el tomador de decisiones exprese preferencias en cada iteración para obtener soluciones óptimas de Pareto que sean de interés para el tomador de decisiones y aprender qué tipo de soluciones son alcanzables.
Los siguientes pasos suelen estar presentes en los métodos interactivos de optimización: [70]
Los niveles de aspiración anteriores se refieren a valores de función objetivo deseables que forman un punto de referencia. En lugar de la convergencia matemática, que suele utilizarse como criterio de detención en los métodos de optimización matemática , en los métodos interactivos se suele hacer hincapié en la convergencia psicológica. En términos generales, un método se da por finalizado cuando el responsable de la toma de decisiones está seguro de haber encontrado la solución más preferida disponible .
Existen diferentes métodos interactivos que involucran distintos tipos de información de preferencias. Se pueden identificar tres tipos según
Por otra parte, un cuarto tipo de generación de una pequeña muestra de soluciones se incluye en: [71] [72] Un ejemplo del método interactivo que utiliza información de compensaciones es el método Zionts-Wallenius , [73] donde al tomador de decisiones se le muestran varias compensaciones objetivas en cada iteración, y se espera que diga si le gusta, le disgusta o es indiferente con respecto a cada compensación. En los métodos basados en puntos de referencia (ver, por ejemplo, [74] [75] ), se espera que el tomador de decisiones en cada iteración especifique un punto de referencia que consiste en valores deseados para cada objetivo y luego se calcula una o más soluciones óptimas de Pareto correspondientes y se les muestra para su análisis. En los métodos interactivos basados en la clasificación, se supone que el tomador de decisiones da preferencias en forma de clasificación de objetivos en la solución óptima de Pareto actual en diferentes clases, indicando cómo se deben cambiar los valores de los objetivos para obtener una solución más preferida. Luego, la información de clasificación se considera cuando se calculan nuevas soluciones óptimas de Pareto (más preferidas). En el método de compensación satisfactoria (STOM), [76] se utilizan tres clases: objetivos cuyos valores 1) deben mejorarse, 2) pueden relajarse y 3) son aceptables como tales. En el método NIMBUS, [77] [78] también se utilizan dos clases adicionales: objetivos cuyos valores 4) deben mejorarse hasta un límite dado y 5) pueden relajarse hasta un límite dado.
Existen diferentes métodos híbridos , pero aquí consideramos la hibridación de MCDM ( toma de decisiones multicriterio ) y EMO (optimización multiobjetivo evolutiva). Un algoritmo híbrido en optimización multiobjetivo combina algoritmos/enfoques de estos dos campos (ver, por ejemplo, [70] ). Los algoritmos híbridos de EMO y MCDM se utilizan principalmente para superar las deficiencias mediante el uso de las fortalezas. Se han propuesto varios tipos de algoritmos híbridos en la literatura, por ejemplo, incorporando enfoques MCDM en algoritmos EMO como un operador de búsqueda local, llevando un DM a la(s) solución(es) más preferida(s), etc. Un operador de búsqueda local se utiliza principalmente para mejorar la tasa de convergencia de los algoritmos EMO.
Las raíces de la optimización híbrida multiobjetivo se remontan al primer seminario Dagstuhl organizado en noviembre de 2004 (ver aquí). Aquí, algunas de las mejores mentes [ cita requerida ] en EMO (Profesor Kalyanmoy Deb, Profesor Jürgen Branke, etc.) y MCDM (Profesor Kaisa Miettinen, Profesor Ralph E. Steuer, etc.) se dieron cuenta del potencial de combinar ideas y enfoques de los campos MCDM y EMO para preparar híbridos de ellos. Posteriormente, se han organizado muchos más seminarios Dagstuhl para fomentar la colaboración. Recientemente, la optimización híbrida multiobjetivo se ha convertido en un tema importante en varias conferencias internacionales en el área de EMO y MCDM (ver por ejemplo, [79] [80] ).
La visualización del frente de Pareto es una de las técnicas de preferencia a posteriori de la optimización multiobjetivo. Las técnicas de preferencia a posteriori proporcionan una clase importante de técnicas de optimización multiobjetivo. [2] Por lo general, las técnicas de preferencia a posteriori incluyen cuatro pasos: (1) la computadora aproxima el frente de Pareto, es decir, el conjunto óptimo de Pareto en el espacio objetivo; (2) el tomador de decisiones estudia la aproximación del frente de Pareto; (3) el tomador de decisiones identifica el punto preferido en el frente de Pareto; (4) la computadora proporciona la decisión óptima de Pareto, cuyo resultado coincide con el punto objetivo identificado por el tomador de decisiones. Desde el punto de vista del tomador de decisiones, el segundo paso de las técnicas de preferencia a posteriori es el más complicado. Hay dos enfoques principales para informar al tomador de decisiones. Primero, se puede proporcionar una serie de puntos del frente de Pareto en forma de lista (se dan discusiones y referencias interesantes en [81] ) o utilizando mapas de calor. [82]
En el caso de problemas bi-objetivos, informar al decisor sobre el frente de Pareto se lleva a cabo generalmente mediante su visualización: el frente de Pareto, a menudo llamado curva de compensaciones en este caso, se puede dibujar en el plano objetivo. La curva de compensaciones proporciona información completa sobre los valores objetivos y sobre las compensaciones objetivas, que informan cómo la mejora de un objetivo se relaciona con el deterioro del segundo mientras se avanza a lo largo de la curva de compensaciones. El decisor tiene en cuenta esta información al especificar el punto objetivo óptimo de Pareto preferido. La idea de aproximar y visualizar el frente de Pareto fue introducida para problemas de decisión bi-objetivos lineales por S. Gass y T. Saaty. [83] Esta idea fue desarrollada y aplicada en problemas ambientales por JL Cohon. [84 ] En [85] se proporciona una revisión de métodos para aproximar el frente de Pareto para varios problemas de decisión con un pequeño número de objetivos (principalmente, dos).
Existen dos ideas genéricas para visualizar el frente de Pareto en problemas de decisión multiobjetivo de alto orden (problemas con más de dos objetivos). Una de ellas, que es aplicable en el caso de un número relativamente pequeño de puntos objetivos que representan el frente de Pareto, se basa en el uso de las técnicas de visualización desarrolladas en estadística (varios diagramas, etc.; ver la subsección correspondiente a continuación). La segunda idea propone la visualización de secciones transversales bi-objetivo (cortes) del frente de Pareto. Fue introducida por WS Meisel en 1973 [86], quien argumentó que tales cortes informan al tomador de decisiones sobre los compromisos objetivos. Las figuras que muestran una serie de cortes bi-objetivo del frente de Pareto para problemas de tres objetivos se conocen como mapas de decisión. Ofrecen una imagen clara de los compromisos entre los tres criterios. Las desventajas de este enfoque están relacionadas con los dos hechos siguientes. En primer lugar, los procedimientos computacionales para construir las porciones de bi-objetivos del frente de Pareto son inestables, ya que el frente de Pareto no suele ser estable. En segundo lugar, es aplicable en el caso de solo tres objetivos. En la década de 1980, la idea de WS Meisel se implementó de una forma diferente: en la forma de la técnica de Mapas de Decisión Interactivos (IDM). [87] Más recientemente, N. Wesner [88] propuso utilizar una combinación de un diagrama de Venn y múltiples diagramas de dispersión del espacio objetivo para explorar la frontera de Pareto y seleccionar soluciones óptimas.
{{cite book}}
: CS1 maint: location missing publisher (link){{cite journal}}
: CS1 maint: multiple names: authors list (link){{cite journal}}
: CS1 maint: multiple names: authors list (link)