stringtranslate.com

Sistema multiagente

Agente reflejo simple
Agente de aprendizaje

Un sistema multiagente ( MAS o "sistema autoorganizado") es un sistema computarizado compuesto por múltiples agentes inteligentes que interactúan . [1] Los sistemas multiagente pueden resolver problemas que son difíciles o imposibles de resolver para un agente individual o un sistema monolítico . [2] La inteligencia puede incluir enfoques metódicos , funcionales , procedimentales , búsqueda algorítmica o aprendizaje de refuerzo . [3]

A pesar de la considerable superposición, un sistema multiagente no siempre es lo mismo que un modelo basado en agentes (ABM). El objetivo de un ABM es buscar información explicativa sobre el comportamiento colectivo de los agentes (que no necesariamente necesitan ser "inteligentes") que obedecen reglas simples, típicamente en sistemas naturales, en lugar de resolver problemas prácticos o de ingeniería específicos. La terminología de ABM tiende a usarse con más frecuencia en la ciencia, y MAS en ingeniería y tecnología. [4] Las aplicaciones en las que la investigación de sistemas multiagente puede ofrecer un enfoque adecuado incluyen el comercio en línea, [5] la respuesta a desastres, [6] [7] la vigilancia de objetivos [8] y el modelado de la estructura social. [9]

Concepto

Los sistemas multiagente constan de agentes y su entorno . Normalmente, la investigación sobre sistemas multiagente se refiere a agentes de software . Sin embargo, los agentes de un sistema multiagente podrían ser igualmente robots, humanos o equipos humanos. Un sistema multiagente puede contener equipos combinados de humanos y agentes.

Los agentes se pueden dividir en tipos que van desde lo simple a lo complejo. Las categorías incluyen:

Los entornos de agente se pueden dividir en:

Los entornos de los agentes también pueden organizarse según propiedades como la accesibilidad (si es posible recopilar información completa sobre el entorno), el determinismo (si una acción causa un efecto definido), la dinámica (cuántas entidades influyen en el entorno en el momento), la discreción (si el número de acciones posibles en el entorno es finito), la episodicidad (si las acciones del agente en ciertos períodos de tiempo influyen en otros períodos) [11] y la dimensionalidad (si las características espaciales son factores importantes del entorno y el agente considera el espacio en su toma de decisiones). [12] Las acciones del agente suelen estar mediadas por un middleware adecuado. Este middleware ofrece una abstracción de diseño de primera clase para sistemas multiagente, proporcionando medios para gobernar el acceso a los recursos y la coordinación de los agentes. [13]

Características

Los agentes en un sistema multiagente tienen varias características importantes: [14]

Autoorganización y autodirección

Los sistemas multiagente pueden manifestar autoorganización , así como autodirección y otros paradigmas de control y comportamientos complejos relacionados, incluso cuando las estrategias individuales de todos sus agentes son simples. [ cita requerida ] Cuando los agentes pueden compartir conocimiento utilizando cualquier lenguaje acordado, dentro de las limitaciones del protocolo de comunicación del sistema, el enfoque puede conducir a una mejora común. Algunos ejemplos de lenguajes son el lenguaje de manipulación de consultas de conocimiento (KQML) o el lenguaje de comunicación con agentes (ACL).

Paradigmas de sistemas

Muchos MAS se implementan en simulaciones por computadora, haciendo que el sistema avance a través de "pasos de tiempo" discretos. Los componentes del MAS se comunican típicamente utilizando una matriz de solicitud ponderada, por ejemplo

Velocidad-MUY_IMPORTANTE: min=45 mph, Longitud de ruta-IMPORTANCIA_MEDIANA: máx=60 esperadoMáx=40, Peso máximo: NO IMPORTANTE Prioridad de contrato-REGULAR

y una matriz de respuesta ponderada, por ejemplo

Velocidad mínima: 50 pero solo si el clima es soleado. Longitud del camino: 25 para soleado / 46 para lluvioso Prioridad de contrato-REGULAR Nota: la ambulancia anulará esta prioridad y tendrá que esperar.

Un esquema de contrato de desafío-respuesta es común en los sistemas MAS, donde

considerando también otros componentes, “contratos” evolutivos y los conjuntos de restricciones de los algoritmos de los componentes.

Otro paradigma que se utiliza habitualmente con MAS es el de las " feromonas ", en las que los componentes dejan información para otros componentes cercanos. Estas feromonas pueden evaporarse/concentrarse con el tiempo, es decir, sus valores pueden disminuir (o aumentar).

Propiedades

Los MAS tienden a encontrar la mejor solución para sus problemas sin intervención. Esto es muy similar a los fenómenos físicos, como la minimización de la energía, en la que los objetos físicos tienden a alcanzar la energía más baja posible dentro de un mundo físicamente limitado. Por ejemplo: muchos de los automóviles que ingresan a una metrópolis por la mañana estarán disponibles para salir de esa misma metrópolis por la tarde.

Los sistemas también tienden a prevenir la propagación de fallos, recuperarse automáticamente y ser tolerantes a fallos, principalmente debido a la redundancia de componentes.

Investigación

El estudio de los sistemas multiagente "se ocupa del desarrollo y análisis de arquitecturas sofisticadas de control y resolución de problemas de IA tanto para sistemas de un solo agente como para sistemas de múltiples agentes". [16] Los temas de investigación incluyen:

Marcos

Han surgido marcos que implementan estándares comunes (como los estándares FIPA y OMG MASIF). [23] Estos marcos, por ejemplo JADE , ahorran tiempo y ayudan en la estandarización del desarrollo de MAS. [24]

Sin embargo, actualmente no existe ningún estándar actualizado de FIPA o OMG. Los esfuerzos para un mayor desarrollo de agentes de software en el contexto industrial se llevan a cabo en el comité técnico de IEEE IES sobre agentes industriales. [25]

Aplicaciones

Los MAS no solo se han aplicado en la investigación académica, sino también en la industria. [26] Los MAS se aplican en el mundo real a aplicaciones gráficas como juegos de computadora. Los sistemas de agentes se han utilizado en películas. [27] Se recomienda ampliamente su uso en redes y tecnologías móviles para lograr un equilibrio de carga automático y dinámico, alta escalabilidad y redes autorreparadoras. Se están utilizando para sistemas de defensa coordinados.

Otras aplicaciones [28] incluyen transporte , [29] logística, [30] gráficos, fabricación, sistema de energía , [31] redes inteligentes , [32] y SIG .

Además, los sistemas de inteligencia artificial multiagente (MAAI) se utilizan para simular sociedades, con el propósito de que sean útiles en los campos del clima, la energía, la epidemiología, la gestión de conflictos, el abuso infantil, .... [33] Algunas organizaciones que trabajan en el uso de modelos de sistemas multiagente incluyen el Centro de Modelado de Sistemas Sociales, el Centro de Investigación en Simulación Social, el Centro de Modelado de Políticas, la Sociedad de Modelado y Simulación Internacional. [33]

El tráfico vehicular con vehículos autónomos controlados se puede modelar como un sistema multiagente que involucra dinámicas de multitudes. [34] Hallerbach et al. analizaron la aplicación de enfoques basados ​​en agentes para el desarrollo y validación de sistemas de conducción automatizada a través de un gemelo digital del vehículo bajo prueba y una simulación de tráfico microscópica basada en agentes independientes. [35] Waymo ha creado un entorno de simulación multiagente Carcraft para probar algoritmos para automóviles autónomos . [36] [37] Simula interacciones de tráfico entre conductores humanos, peatones y vehículos automatizados. El comportamiento de las personas es imitado por agentes artificiales basados ​​en datos del comportamiento humano real.

Véase también

Referencias

  1. ^ Yoav Shoham, Kevin Leyton-Brown. Sistemas multiagente: fundamentos algorítmicos, lógicos y de teoría de juegos. Cambridge University Press, 2009. http://www.masfoundations.org/
  2. ^ Hu, J.; Turgut, A.; Lennox, B.; Arvin, F., "Coordinación de formación robusta de enjambres de robots con dinámica no lineal y perturbaciones desconocidas: diseño y experimentos" IEEE Transactions on Circuits and Systems II: Express Briefs, 2021.
  3. ^ Stefano V. Albrecht, Filippos Christianos, Lukas Schäfer. Aprendizaje por refuerzo de múltiples agentes: fundamentos y enfoques modernos. Prensa del MIT, 2024. https://www.marl-book.com/
  4. ^ Niazi, Muaz; Hussain, Amir (2011). "Computación basada en agentes desde sistemas multiagente a modelos basados ​​en agentes: un estudio visual" (PDF) . Scientometrics . 89 (2): 479–499. arXiv : 1708.05872 . doi :10.1007/s11192-011-0468-9. hdl :1893/3378. S2CID  17934527.
  5. ^ Rogers, Alex; David, E.; Schiff, J.; Jennings, NR (2007). "Los efectos de las pujas por proxy y los incrementos de puja mínima en las subastas de eBay". Transacciones ACM en la Web . 1 (2): 9–es. CiteSeerX 10.1.1.65.4539 . doi :10.1145/1255438.1255441. S2CID  207163424. Archivado desde el original el 2 de abril de 2010 . Consultado el 18 de marzo de 2008 . 
  6. ^ Schurr, Nathan; Marecki, Janusz; Tambe, Milind; Scerri, Paul; Kasinadhuni, Nikhil; Lewis, JP (2005). "El futuro de la respuesta a desastres: seres humanos que trabajan con equipos multiagente utilizando DEFACTO". Archivado (PDF) desde el original el 3 de junio de 2013 . Consultado el 8 de enero de 2024 .
  7. ^ Genc, ​​Zulkuf; et al. (2013). "Infraestructura de información basada en agentes para la gestión de desastres" (PDF) . Sistemas inteligentes para la gestión de crisis . Apuntes de clase sobre geoinformación y cartografía. págs. 349–355. doi :10.1007/978-3-642-33218-0_26. ISBN 978-3-642-33217-3.
  8. ^ Hu, Junyan; Bhowmick, Parijat; Lanzon, Alexander (2020). "Seguimiento distribuido adaptativo de la formación de grupos que varían en el tiempo para sistemas multiagente con múltiples líderes en gráficos dirigidos". IEEE Transactions on Control of Network Systems . 7 : 140–150. doi : 10.1109/TCNS.2019.2913619 . S2CID  149609966.
  9. ^ Sun, Ron ; Naveh, Isaac (30 de junio de 2004). "Simulación de la toma de decisiones organizacionales utilizando un modelo de agente cognitivamente realista". Journal of Artificial Societies and Social Simulation .
  10. ^ ab Kubera, Yoann; Mathieu, Philippe; Picault, Sébastien (2010), "¡Todo puede ser agente!" (PDF) , Actas de la Novena Conferencia Conjunta Internacional sobre Agentes Autónomos y Sistemas Multiagente (AAMAS'2010) : 1547–1548
  11. ^ Russell, Stuart J.; Norvig , Peter (2003), Inteligencia artificial: un enfoque moderno (2.ª ed.), Upper Saddle River, Nueva Jersey: Prentice Hall, ISBN 0-13-790395-2
  12. ^ Salamon, Tomas (2011). Diseño de modelos basados ​​en agentes. Repin: Bruckner Publishing. p. 22. ISBN 978-80-904661-1-1.
  13. ^ Weyns, Danny; Omicini, Amdrea; Odell, James (2007). "El entorno como una abstracción de primera clase en sistemas multiagente". Agentes autónomos y sistemas multiagente . 14 (1): 5–30. CiteSeerX 10.1.1.154.4480 . doi :10.1007/s10458-006-0012-0. S2CID  13347050. 
  14. ^ Wooldridge, Michael (2002). Introducción a los sistemas multiagente . John Wiley & Sons . pág. 366. ISBN. 978-0-471-49691-5.
  15. ^ Panait, Liviu; Luke, Sean (2005). "Aprendizaje cooperativo multiagente: el estado del arte" (PDF) . Agentes autónomos y sistemas multiagente . 11 (3): 387–434. CiteSeerX 10.1.1.307.6671 . doi :10.1007/s10458-005-2631-2. S2CID  19706. 
  16. ^ "The Multi-Agent Systems Lab". Universidad de Massachusetts Amherst . Consultado el 16 de octubre de 2009 .
  17. ^ Albrecht, Stefano; Stone, Peter (2017), "Aprendizaje multiagente: fundamentos y tendencias recientes. Tutorial", conferencia IJCAI-17 (PDF)
  18. ^ Cucker, Felipe; Steve Smale (2007). "Las matemáticas de la emergencia" (PDF) . Revista Japonesa de Matemáticas . 2 : 197–227. doi :10.1007/s11537-007-0647-x. S2CID  2637067 . Consultado el 9 de junio de 2008 .
  19. ^ Shen, Jackie (Jianhong) (2008). "Cucker-Smale Flocking under Hierarchical Leadership". SIAM J. Appl. Math . 68 (3): 694–719. arXiv : q-bio/0610048 . doi :10.1137/060673254. S2CID  14655317 . Consultado el 9 de junio de 2008 .
  20. ^ Ahmed, S.; Karsiti, MN (2007), "Un banco de pruebas para esquemas de control utilizando robots no holonómicos multiagente", Conferencia internacional IEEE de 2007 sobre tecnología electrónica/de la información, pág. 459, doi :10.1109/EIT.2007.4374547, ISBN 978-1-4244-0940-2, Número de identificación del sujeto  2734931
  21. ^ Yang, Lidong; Li, Zhang (2021). "Control de movimiento en microrrobótica magnética: desde robots individuales y múltiples hasta enjambres". Revisión anual de control, robótica y sistemas autónomos . 4 : 509–534. doi :10.1146/annurev-control-032720-104318. S2CID  228892228.
  22. ^ Pinan Basualdo, Franco; Misra, Sarthak (2023). "Agentes magnéticos colaborativos para agarre microrobótico 3D". Sistemas inteligentes avanzados . 5 (12). doi : 10.1002/aisy.202300365 . S2CID  262167298.
  23. ^ "Documento OMG – orbos/97-10-05 (Actualización de la presentación revisada del MAF)". www.omg.org . Consultado el 19 de febrero de 2019 .
  24. ^ Ahmed, Salman; Karsiti, Mohd N.; Agustiawan, Herman (2007). "Un marco de desarrollo para robots colaborativos que utilizan control por retroalimentación" . Consultado el 8 de enero de 2024 .
  25. ^ "Comité técnico sobre agentes industriales (TC-IA) del IEEE IES". tcia.ieee-ies.org . Consultado el 19 de febrero de 2019 .
  26. ^ Leitao, Paulo; Karnouskos, Stamatis (26 de marzo de 2015). Agentes industriales: aplicaciones emergentes de agentes de software en la industria . Leitão, Paulo, Karnouskos, Stamatis. Ámsterdam, Países Bajos. ISBN 978-0128003411.OCLC 905853947  .{{cite book}}: CS1 maint: location missing publisher (link)
  27. ^ "Muestra de cine". MASIVO . Consultado el 28 de abril de 2012 .
  28. ^ Leitao, Paulo; Karnouskos, Stamatis; Ribeiro, Luis; Lee, Jay; Strasser, Thomas; Colombo, Armando W. (2016). "Agentes inteligentes en sistemas ciberfísicos industriales". Actas del IEEE . 104 (5): 1086–1101. doi :10.1109/JPROC.2016.2521931. hdl : 10198/15438 . ISSN  0018-9219. S2CID  579475.
  29. ^ Xiao-Feng Xie, S. Smith, G. Barlow. Coordinación basada en programación para el control de la red de tráfico en tiempo real. Conferencia internacional sobre planificación y programación automatizadas (ICAPS), São Paulo, Brasil, 2012: 323–331.
  30. ^ Máhr, TS; Srour, J.; De Weerdt, M.; Zuidwijk, R. (2010). "¿Pueden los agentes estar a la altura? Un estudio comparativo de un enfoque de optimización en línea y basado en agentes para un problema de transporte con incertidumbre". Transportation Research Part C: Emerging Technologies . 18 : 99–119. CiteSeerX 10.1.1.153.770 . doi :10.1016/j.trc.2009.04.018. 
  31. ^ Kazemi, Hamidreza; Liasi, Sahand; Sheikh-El-Eslami, Mohammadkazem (noviembre de 2018). "Planificación de la expansión de la generación considerando la dinámica de inversión de los participantes del mercado que utilizan un sistema multiagente". Conferencia sobre redes inteligentes (SGC) de 2018. págs. 1–6. doi :10.1109/SGC.2018.8777904. ISBN 978-1-7281-1138-4. Recuperado el 8 de enero de 2024 .
  32. ^ Singh, Vijay; Samuel, Paulson (6 de junio de 2017). "Control de frecuencia de carga basado en sistema multiagente distribuido para sistema de energía multiárea en red inteligente". IEEE Transactions on Industrial Electronics . 64 (6): 5151–5160. doi :10.1109/TIE.2017.2668983 . Consultado el 8 de enero de 2024 .
  33. ^ ab "La IA puede predecir tu comportamiento futuro con nuevas y potentes simulaciones". New Scientist .
  34. ^ Gong, Xiaoqian; Herty, Michael; Piccoli, Benedetto; Visconti, Giuseppe (3 de mayo de 2023). "Dinámica de multitudes: modelado y control de sistemas multiagente". Revisión anual de control, robótica y sistemas autónomos . 6 (1): 261–282. doi : 10.1146/annurev-control-060822-123629 . ISSN  2573-5144.
  35. ^ Hallerbach, S.; Xia, Y.; Eberle, U.; Koester, F. (2018). "Identificación basada en simulación de escenarios críticos para vehículos cooperativos y automatizados". SAE International Journal of Connected and Automated Vehicles . 1 (2). SAE International: 93. doi :10.4271/2018-01-1066.
  36. ^ Madrigal, relato de Alexis C. "Dentro del mundo secreto de Waymo para el entrenamiento de coches autónomos". The Atlantic . Consultado el 14 de agosto de 2020 .
  37. ^ Connors, J.; Graham, S.; Mailloux, L. (2018). "Modelado cibernético sintético para aplicaciones de vehículo a vehículo". En la Conferencia internacional sobre ciberguerra y seguridad . Academic Conferences International Limited: 594-XI.

Lectura adicional