Un sistema multiagente ( MAS o "sistema autoorganizado") es un sistema computarizado compuesto por múltiples agentes inteligentes que interactúan . [1] Los sistemas multiagente pueden resolver problemas que son difíciles o imposibles de resolver para un agente individual o un sistema monolítico . [2] La inteligencia puede incluir enfoques metódicos , funcionales , procedimentales , búsqueda algorítmica o aprendizaje de refuerzo . [3] Con los avances en los modelos de lenguaje grandes (LLM), los sistemas multiagente basados en LLM han surgido como una nueva área de investigación, permitiendo interacciones y coordinación más sofisticadas entre agentes. [4]
A pesar de la considerable superposición, un sistema multiagente no siempre es lo mismo que un modelo basado en agentes (ABM). El objetivo de un ABM es buscar información explicativa sobre el comportamiento colectivo de los agentes (que no necesariamente necesitan ser "inteligentes") que obedecen reglas simples, típicamente en sistemas naturales, en lugar de resolver problemas prácticos o de ingeniería específicos. La terminología de ABM tiende a usarse con más frecuencia en la ciencia, y MAS en ingeniería y tecnología. [5] Las aplicaciones en las que la investigación de sistemas multiagente puede ofrecer un enfoque adecuado incluyen el comercio en línea, [6] la respuesta a desastres, [7] [8] la vigilancia de objetivos [9] y el modelado de la estructura social. [10]
Concepto
Los sistemas multiagente constan de agentes y su entorno . Normalmente, la investigación sobre sistemas multiagente se refiere a agentes de software . Sin embargo, los agentes de un sistema multiagente podrían ser igualmente robots, humanos o equipos humanos. Un sistema multiagente puede contener equipos combinados de humanos y agentes.
Los agentes se pueden dividir en tipos que van desde lo simple a lo complejo. Las categorías incluyen:
Agentes pasivos [11] o “agente sin objetivos” (como obstáculo, manzana o llave en cualquier simulación simple)
Agentes activos [11] con objetivos simples (como las aves en bandadas o el lobo-oveja en el modelo presa-depredador )
Agentes cognitivos (cálculos complejos)
Los entornos de agente se pueden dividir en:
Virtual
Discreto
Continuo
Los entornos de los agentes también pueden organizarse según propiedades como la accesibilidad (si es posible recopilar información completa sobre el entorno), el determinismo (si una acción causa un efecto definido), la dinámica (cuántas entidades influyen en el entorno en el momento), la discreción (si el número de acciones posibles en el entorno es finito), la episodicidad (si las acciones del agente en ciertos períodos de tiempo influyen en otros períodos) [12] y la dimensionalidad (si las características espaciales son factores importantes del entorno y el agente considera el espacio en su toma de decisiones). [13] Las acciones del agente suelen estar mediadas por un middleware adecuado. Este middleware ofrece una abstracción de diseño de primera clase para sistemas multiagente, proporcionando medios para gobernar el acceso a los recursos y la coordinación de los agentes. [14]
Características
Los agentes en un sistema multiagente tienen varias características importantes: [15]
Autonomía: agentes al menos parcialmente independientes, conscientes de sí mismos, autónomos.
Vistas locales: ningún agente tiene una vista global completa o el sistema es demasiado complejo para que un agente pueda explotar dicho conocimiento
Descentralización: no se designa ningún agente como controlador (o el sistema se reduce efectivamente a un sistema monolítico) [16]
Autoorganización y autodirección
Los sistemas multiagente pueden manifestar autoorganización , así como autodirección y otros paradigmas de control y comportamientos complejos relacionados, incluso cuando las estrategias individuales de todos sus agentes son simples. [ cita requerida ] Cuando los agentes pueden compartir conocimiento utilizando cualquier lenguaje acordado, dentro de las limitaciones del protocolo de comunicación del sistema, el enfoque puede conducir a una mejora común. Algunos ejemplos de lenguajes son el lenguaje de manipulación de consultas de conocimiento (KQML) o el lenguaje de comunicación con agentes (ACL).
Paradigmas de sistemas
Muchos MAS se implementan en simulaciones por computadora, haciendo que el sistema avance a través de "pasos de tiempo" discretos. Los componentes del MAS se comunican típicamente utilizando una matriz de solicitud ponderada, por ejemplo
Velocidad-MUY_IMPORTANTE: min=45 mph, Longitud de ruta-IMPORTANCIA_MEDIANA: máx=60 esperadoMáx=40, Peso máximo: NO IMPORTANTE Prioridad de contrato-REGULAR
y una matriz de respuesta ponderada, por ejemplo
Velocidad mínima: 50 pero solo si el clima es soleado. Longitud del camino: 25 para soleado / 46 para lluvioso Prioridad de contrato-REGULAR Nota: la ambulancia anulará esta prioridad y tendrá que esperar.
Un esquema de contrato de desafío-respuesta es común en los sistemas MAS, donde
Primero se distribuye una pregunta de "¿ Quién puede? "
Sólo los componentes relevantes responden: " Puedo, a este precio " .
Finalmente, se establece un contrato, generalmente en varios pasos breves de comunicación entre las partes,
considerando también otros componentes, “contratos” evolutivos y los conjuntos de restricciones de los algoritmos de los componentes.
Otro paradigma que se utiliza habitualmente con MAS es el de las " feromonas ", en las que los componentes dejan información para otros componentes cercanos. Estas feromonas pueden evaporarse/concentrarse con el tiempo, es decir, sus valores pueden disminuir (o aumentar).
Propiedades
Los MAS tienden a encontrar la mejor solución para sus problemas sin intervención. Esto es muy similar a los fenómenos físicos, como la minimización de la energía, en la que los objetos físicos tienden a alcanzar la energía más baja posible dentro de un mundo físicamente limitado. Por ejemplo: muchos de los automóviles que ingresan a una metrópolis por la mañana estarán disponibles para salir de esa misma metrópolis por la tarde.
Los sistemas también tienden a prevenir la propagación de fallos, recuperarse automáticamente y ser tolerantes a fallos, principalmente debido a la redundancia de componentes.
Investigación
El estudio de los sistemas multiagente "se ocupa del desarrollo y análisis de arquitecturas sofisticadas de control y resolución de problemas de IA tanto para sistemas de un solo agente como para sistemas de múltiples agentes". [17] Los temas de investigación incluyen:
Los sistemas multiagente también presentan posibles aplicaciones en microrrobótica, [22] donde se aprovecha la interacción física entre los agentes para realizar tareas complejas como la manipulación y el ensamblaje de componentes pasivos.
Sistemas multiagente basados en modelos de lenguaje [4]
Marcos
Han surgido marcos que implementan estándares comunes (como los estándares FIPA y OMG MASIF). [23] Estos marcos, por ejemplo JADE , ahorran tiempo y ayudan en la estandarización del desarrollo de MAS. [24]
Sin embargo, actualmente no existe ningún estándar actualizado de FIPA o OMG. Los esfuerzos para un mayor desarrollo de agentes de software en el contexto industrial se llevan a cabo en el comité técnico de IEEE IES sobre agentes industriales. [25]
Con los avances en modelos de lenguaje grandes (LLM), como ChatGPT , los marcos multiagente basados en LLM han surgido como un nuevo paradigma para el desarrollo de aplicaciones multiagente, siendo CAMEL [26] [4] de CAMEL-AI.org el primer marco notable en este dominio.
Aplicaciones
Los MAS no solo se han aplicado en la investigación académica, sino también en la industria. [27] Los MAS se aplican en el mundo real a aplicaciones gráficas como juegos de computadora. Los sistemas de agentes se han utilizado en películas. [28] Se recomienda ampliamente su uso en redes y tecnologías móviles para lograr un equilibrio de carga automático y dinámico, alta escalabilidad y redes autorreparadoras. Se están utilizando para sistemas de defensa coordinados.
Además, los sistemas de inteligencia artificial multiagente (MAAI) se utilizan para simular sociedades, con el propósito de que sean útiles en los campos del clima, la energía, la epidemiología, la gestión de conflictos, el abuso infantil, .... [34] Algunas organizaciones que trabajan en el uso de modelos de sistemas multiagente incluyen el Centro de Modelado de Sistemas Sociales, el Centro de Investigación en Simulación Social, el Centro de Modelado de Políticas, la Sociedad de Modelado y Simulación Internacional. [34]
El tráfico vehicular con vehículos autónomos controlados se puede modelar como un sistema multiagente que involucra dinámicas de multitudes. [35]
Hallerbach et al. analizaron la aplicación de enfoques basados en agentes para el desarrollo y validación de sistemas de conducción automatizada a través de un gemelo digital del vehículo bajo prueba y una simulación de tráfico microscópica basada en agentes independientes. [36] Waymo ha creado un entorno de simulación multiagente Carcraft para probar algoritmos para automóviles autónomos . [37] [38] Simula interacciones de tráfico entre conductores humanos, peatones y vehículos automatizados. El comportamiento de las personas es imitado por agentes artificiales basados en datos del comportamiento humano real.
^ Yoav Shoham, Kevin Leyton-Brown. Sistemas multiagente: fundamentos algorítmicos, lógicos y de teoría de juegos. Cambridge University Press, 2009. http://www.masfoundations.org/
^ Hu, J.; Turgut, A.; Lennox, B.; Arvin, F., "Coordinación de formación robusta de enjambres de robots con dinámica no lineal y perturbaciones desconocidas: diseño y experimentos" IEEE Transactions on Circuits and Systems II: Express Briefs, 2021.
^ Stefano V. Albrecht, Filippos Christianos, Lukas Schäfer. Aprendizaje por refuerzo de múltiples agentes: fundamentos y enfoques modernos. Prensa del MIT, 2024. https://www.marl-book.com/
^ abc Li, Guohao (2023). "Camello: agentes comunicativos para la exploración de la "mente" de una sociedad con modelos lingüísticos amplios" (PDF) . Avances en sistemas de procesamiento de información neuronal . 36 : 51991–52008. doi :10.48550/arXiv.2303.17760. S2CID 257900712.
^ Niazi, Muaz; Hussain, Amir (2011). "Computación basada en agentes desde sistemas multiagente a modelos basados en agentes: un estudio visual" (PDF) . Scientometrics . 89 (2): 479–499. arXiv : 1708.05872 . doi :10.1007/s11192-011-0468-9. hdl :1893/3378. S2CID 17934527.
^ Rogers, Alex; David, E.; Schiff, J.; Jennings, NR (2007). "Los efectos de las pujas por proxy y los incrementos de puja mínima en las subastas de eBay". Transacciones ACM en la Web . 1 (2): 9–es. CiteSeerX 10.1.1.65.4539 . doi :10.1145/1255438.1255441. S2CID 207163424. Archivado desde el original el 2 de abril de 2010 . Consultado el 18 de marzo de 2008 .
^ Schurr, Nathan; Marecki, Janusz; Tambe, Milind; Scerri, Paul; Kasinadhuni, Nikhil; Lewis, JP (2005). "El futuro de la respuesta a desastres: seres humanos que trabajan con equipos multiagente utilizando DEFACTO". Archivado (PDF) desde el original el 3 de junio de 2013 . Consultado el 8 de enero de 2024 .
^ Genc, Zulkuf; et al. (2013). "Infraestructura de información basada en agentes para la gestión de desastres" (PDF) . Sistemas inteligentes para la gestión de crisis . Apuntes de clase sobre geoinformación y cartografía. págs. 349–355. doi :10.1007/978-3-642-33218-0_26. ISBN978-3-642-33217-3.
^ Hu, Junyan; Bhowmick, Parijat; Lanzon, Alexander (2020). "Seguimiento distribuido adaptativo de la formación de grupos que varían en el tiempo para sistemas multiagente con múltiples líderes en gráficos dirigidos". IEEE Transactions on Control of Network Systems . 7 : 140–150. doi : 10.1109/TCNS.2019.2913619 . S2CID 149609966.
^ Sun, Ron ; Naveh, Isaac (30 de junio de 2004). "Simulación de la toma de decisiones organizacionales utilizando un modelo de agente cognitivamente realista". Journal of Artificial Societies and Social Simulation .
^ ab Kubera, Yoann; Mathieu, Philippe; Picault, Sébastien (2010), "¡Todo puede ser agente!" (PDF) , Actas de la Novena Conferencia Conjunta Internacional sobre Agentes Autónomos y Sistemas Multiagente (AAMAS'2010) : 1547–1548
^ Russell, Stuart J.; Norvig , Peter (2003), Inteligencia artificial: un enfoque moderno (2.ª ed.), Upper Saddle River, Nueva Jersey: Prentice Hall, ISBN0-13-790395-2
^ Salamon, Tomas (2011). Diseño de modelos basados en agentes. Repin: Bruckner Publishing. p. 22. ISBN978-80-904661-1-1.
^ Weyns, Danny; Omicini, Amdrea; Odell, James (2007). "El entorno como una abstracción de primera clase en sistemas multiagente". Agentes autónomos y sistemas multiagente . 14 (1): 5–30. CiteSeerX 10.1.1.154.4480 . doi :10.1007/s10458-006-0012-0. S2CID 13347050.
^ Albrecht, Stefano; Stone, Peter (2017), "Aprendizaje multiagente: fundamentos y tendencias recientes. Tutorial", conferencia IJCAI-17 (PDF)
^ Cucker, Felipe; Steve Smale (2007). "Las matemáticas de la emergencia" (PDF) . Revista Japonesa de Matemáticas . 2 : 197–227. doi :10.1007/s11537-007-0647-x. S2CID 2637067 . Consultado el 9 de junio de 2008 .
^ Shen, Jackie (Jianhong) (2008). "Cucker-Smale Flocking under Hierarchical Leadership". SIAM J. Appl. Math . 68 (3): 694–719. arXiv : q-bio/0610048 . doi :10.1137/060673254. S2CID 14655317 . Consultado el 9 de junio de 2008 .
^ Ahmed, S.; Karsiti, MN (2007), "Un banco de pruebas para esquemas de control utilizando robots no holonómicos multiagente", Conferencia internacional IEEE de 2007 sobre tecnología electrónica/de la información, pág. 459, doi :10.1109/EIT.2007.4374547, ISBN978-1-4244-0940-2, Número de identificación del sujeto 2734931
^ Yang, Lidong; Li, Zhang (2021). "Control de movimiento en microrrobótica magnética: desde robots individuales y múltiples hasta enjambres". Revisión anual de control, robótica y sistemas autónomos . 4 : 509–534. doi :10.1146/annurev-control-032720-104318. S2CID 228892228.
^ "Documento OMG – orbos/97-10-05 (Actualización de la presentación revisada del MAF)". www.omg.org . Consultado el 19 de febrero de 2019 .
^ Ahmed, Salman; Karsiti, Mohd N.; Agustiawan, Herman (2007). "Un marco de desarrollo para robots colaborativos que utilizan control por retroalimentación" . Consultado el 8 de enero de 2024 .
^ "Comité técnico sobre agentes industriales (TC-IA) del IEEE IES". tcia.ieee-ies.org . Consultado el 19 de febrero de 2019 .
^ "CAMEL: En busca de la ley de escala de los agentes. El primer y mejor marco multiagente".
^ Leitao, Paulo; Karnouskos, Stamatis (26 de marzo de 2015). Agentes industriales: aplicaciones emergentes de agentes de software en la industria . Leitão, Paulo, Karnouskos, Stamatis. Ámsterdam, Países Bajos. ISBN978-0128003411.OCLC 905853947 .{{cite book}}: CS1 maint: location missing publisher (link)
^ "Muestra de cine". MASIVO . Consultado el 28 de abril de 2012 .
^ Leitao, Paulo; Karnouskos, Stamatis; Ribeiro, Luis; Lee, Jay; Strasser, Thomas; Colombo, Armando W. (2016). "Agentes inteligentes en sistemas ciberfísicos industriales". Actas del IEEE . 104 (5): 1086–1101. doi :10.1109/JPROC.2016.2521931. hdl : 10198/15438 . ISSN 0018-9219. S2CID 579475.
^ Xiao-Feng Xie, S. Smith, G. Barlow. Coordinación basada en programación para el control de la red de tráfico en tiempo real. Conferencia internacional sobre planificación y programación automatizadas (ICAPS), São Paulo, Brasil, 2012: 323–331.
^ Máhr, TS; Srour, J.; De Weerdt, M.; Zuidwijk, R. (2010). "¿Pueden los agentes estar a la altura? Un estudio comparativo de un enfoque de optimización en línea y basado en agentes para un problema de transporte con incertidumbre". Transportation Research Part C: Emerging Technologies . 18 : 99–119. CiteSeerX 10.1.1.153.770 . doi :10.1016/j.trc.2009.04.018.
^ Kazemi, Hamidreza; Liasi, Sahand; Sheikh-El-Eslami, Mohammadkazem (noviembre de 2018). "Planificación de la expansión de la generación considerando la dinámica de inversión de los participantes del mercado que utilizan un sistema multiagente". Conferencia sobre redes inteligentes (SGC) de 2018. págs. 1–6. doi :10.1109/SGC.2018.8777904. ISBN978-1-7281-1138-4. Recuperado el 8 de enero de 2024 .
^ Singh, Vijay; Samuel, Paulson (6 de junio de 2017). "Control de frecuencia de carga basado en sistema multiagente distribuido para sistema de energía multiárea en red inteligente". IEEE Transactions on Industrial Electronics . 64 (6): 5151–5160. doi :10.1109/TIE.2017.2668983 . Consultado el 8 de enero de 2024 .
^ ab "La IA puede predecir tu comportamiento futuro con nuevas y potentes simulaciones". New Scientist .
^ Gong, Xiaoqian; Herty, Michael; Piccoli, Benedetto; Visconti, Giuseppe (3 de mayo de 2023). "Dinámica de multitudes: modelado y control de sistemas multiagente". Revisión anual de control, robótica y sistemas autónomos . 6 (1): 261–282. doi : 10.1146/annurev-control-060822-123629 . ISSN 2573-5144.
^ Hallerbach, S.; Xia, Y.; Eberle, U.; Koester, F. (2018). "Identificación basada en simulación de escenarios críticos para vehículos cooperativos y automatizados". SAE International Journal of Connected and Automated Vehicles . 1 (2). SAE International: 93. doi :10.4271/2018-01-1066.
^ Madrigal, relato de Alexis C. "Dentro del mundo secreto de Waymo para el entrenamiento de coches autónomos". The Atlantic . Consultado el 14 de agosto de 2020 .
^ Connors, J.; Graham, S.; Mailloux, L. (2018). "Modelado cibernético sintético para aplicaciones de vehículo a vehículo". En la Conferencia internacional sobre ciberguerra y seguridad . Academic Conferences International Limited: 594-XI.
Shoham, Yoav; Leyton-Brown, Kevin (2008). Sistemas multiagente: fundamentos algorítmicos, lógicos y de teoría de juegos. Cambridge University Press . p. 496. ISBN 978-0-521-89943-7.
Mamadou, Tadiou Koné; Shimazu, A.; Nakajima, T. (agosto de 2000). "El estado del arte en lenguajes de comunicación de agentes (ACL)". Conocimiento y sistemas de información . 2 (2): 1–26.
Hewitt, Carl; Inman, Jeff (noviembre-diciembre de 1991). «DAI entre dos mundos: de los «agentes inteligentes» a la ciencia de sistemas abiertos» (PDF) . IEEE Transactions on Systems, Man, and Cybernetics . 21 (6): 1409–1419. doi :10.1109/21.135685. S2CID 39080989. Archivado desde el original (PDF) el 31 de agosto de 2017.
Keil, David; Goldin, Dina (2006). Weyns, Danny; Parunak, Van; Michel, Fabien (eds.). Interacción indirecta en entornos para sistemas multiagente. LNCS 3830. Vol. 3830. Springer . págs. 68–87. doi :10.1007/11678809_5. ISBN 978-3-540-32614-4. {{cite book}}: |journal=ignorado ( ayuda )
Serie Whitestein sobre tecnologías de agentes de software y computación autónoma , publicada por Springer Science+Business Media Group
Salamon, Tomas (2011). Diseño de modelos basados en agentes: desarrollo de simulaciones por computadora para una mejor comprensión de los procesos sociales. Bruckner Publishing. ISBN 978-80-904661-1-1.
Cao, Longbing, Gorodetsky, Vladimir, Mitkas, Pericles A. (2009). Minería de agentes: la sinergia de los agentes y la minería de datos, IEEE Intelligent Systems, vol. 24, núm. 3, 64-72.