En los últimos años, el uso de métodos de inspiración biológica, como el algoritmo evolutivo, se ha empleado cada vez más para resolver y analizar problemas computacionales complejos. BELBIC (Controlador inteligente basado en el aprendizaje emocional del cerebro) es uno de esos controladores propuesto por Caro Lucas , Danial Shahmirzadi y Nima Sheikholeslami y adopta el modelo de red desarrollado por Moren y Balkenius para imitar aquellas partes del cerebro que se sabe que producen emociones (a saber, la amígdala , la corteza orbitofrontal , el tálamo y la corteza de entrada sensorial). [1]
Emociones y aprendizaje
Tradicionalmente, el estudio del aprendizaje en sistemas biológicos se ha llevado a cabo a costa de pasar por alto sus contrapartes menos conocidas: la motivación y la emoción . Sin embargo, estos fenómenos no pueden separarse. [2] La motivación es el impulso que hace que cualquier sistema haga algo; sin ella, no hay razón para actuar. Las emociones indican cuán exitosa ha sido una serie de acciones y si se debería haber tomado otro conjunto de acciones en su lugar; son una retroalimentación constante para el sistema de aprendizaje. El aprendizaje, por otro lado, garantiza que los subsistemas de motivación y emoción sean capaces de adaptarse a condiciones en constante cambio. [3]
Así, en el estudio de los organismos biológicos, las emociones han cobrado importancia como parte integral de cualquier sistema de inspiración biológica. Pero, ¿cómo se beneficia un organismo vivo de sus emociones? Es fundamental responder a esta pregunta a medida que intentamos emplear cada vez más métodos de inspiración biológica para resolver problemas computacionales.
Cada criatura tiene capacidades innatas que le permiten sobrevivir en el mundo. Puede identificar comida, refugio, compañeros y peligros. Pero estas "simples correlaciones entre estímulos y reacciones no serán suficientes para evitar que los organismos se enfrenten a problemas". [4] Por ejemplo, si un animal determinado sabe que su depredador tiene las cualidades A, B y C, escapará de todas las criaturas que tengan esas cualidades y, por lo tanto, desperdiciará gran parte de su energía y recursos en peligros inexistentes.
No podemos esperar que la evolución proporcione algoritmos más avanzados para evaluar el peligro, porque el depredador también evoluciona a la misma velocidad. Por lo tanto, los sistemas biológicos deben estar dotados de la capacidad de aprender. Este mecanismo de aprendizaje y reaprendizaje les permite adaptarse a situaciones altamente complejas y avanzadas. [3]
Para aprender de manera efectiva, todo organismo que aprende necesita una evaluación de la situación actual y también retroalimentación sobre cuán beneficiosos fueron los resultados del aprendizaje. [4] En su mayor parte, estos mecanismos de evaluación están incorporados. Y entonces nos encontramos con un nuevo problema: mientras que las criaturas toman medidas apropiadas en tiempo real en función de sus evaluaciones, estos procedimientos de evaluación incorporados se desarrollan en el tiempo evolutivo. Pero todas las criaturas necesitan aprender nuevas técnicas de evaluación a lo largo de su vida, al igual que aprenden las reacciones adecuadas.
Aquí es donde entra en juego la capacidad de condicionar las reacciones emocionales. Los organismos biológicos asocian estímulos emocionales innatos con otros estímulos que encuentran en el mundo y, por lo tanto, les otorgan un significado emocional cuando es necesario. [4] Estas evaluaciones pueden controlarse para que funcionen en momentos muy específicos, lugares específicos o cuando estén acompañadas de otros estímulos específicos.
Existe otra razón por la que estas observaciones son tan importantes y es la creación de sistemas artificiales. Estos sistemas no evolucionan con el tiempo, sino que están diseñados con ciertas capacidades desde el principio, por lo que su adaptabilidad debe ser innata.
Modelo computacional
Un modelo es una descripción simplificada de un fenómeno. Da vida a algunos aspectos de este fenómeno mientras que pasa por alto otros. Qué aspectos se mantienen en el modelo y cuáles se pasan por alto depende en gran medida del tema de estudio. Por lo tanto, la naturaleza de un modelo depende del propósito que el investigador planea llevar a cabo. Un modelo computacional es uno que puede analizarse, probarse y simularse matemáticamente utilizando sistemas informáticos. [4]
Para construir un modelo computacional del aprendizaje emocional en el cerebro se requiere un análisis exhaustivo de la amígdala y la corteza orbitofrontal y la interacción entre ellas: [5]
La amígdala es una zona con forma de almendra que está situada de forma que puede comunicarse con todas las demás cortezas del sistema límbico. El condicionamiento afectivo primario del sistema se produce en la amígdala, es decir, la asociación entre un estímulo y su consecuencia emocional tiene lugar en esta región. [4]
Se ha sugerido que el aprendizaje se produce en dos pasos fundamentales. [6] En primer lugar, un estímulo particular se correlaciona con una respuesta emocional. Este estímulo puede ser un sinfín de fenómenos, desde observar una cara hasta detectar un olor, oír un ruido, etc. En segundo lugar, esta consecuencia emocional configura una asociación entre el estímulo y la respuesta. [6] Este análisis es bastante influyente en parte porque fue uno de los primeros en sugerir que las emociones juegan un papel clave en el aprendizaje. [5] En estudios más recientes, se ha demostrado que la asociación entre un estímulo y su consecuencia emocional tiene lugar en la amígdala. [3] [7] "En esta región, las representaciones de estímulos altamente analizadas en la corteza se asocian con un valor emocional. Por lo tanto, las emociones son propiedades de los estímulos". [5]
La función de la amígdala es asignar un valor emocional primario a cada estímulo asociado a un reforzador primario [7] , que es la recompensa y el castigo que recibe el mamífero. El complejo orbitofrontal contribuye a esta tarea. "En términos de teoría del aprendizaje, la amígdala parece encargarse de la presentación del refuerzo primario, mientras que la corteza orbitofrontal participa en la detección de la omisión del refuerzo". [5]
Lo primero que observamos en el modelo computacional desarrollado por Moren y Balkenius es que en el cerebro existen numerosos sistemas de aprendizaje que interactúan y se ocupan del aprendizaje emocional. El modelo computacional se presenta a continuación, donde:
Jue : Tálamo
CX : Corteza sensorial
A : Estructuras de entrada en la amígdala
E : Estructuras de salida en la amígdala
O : Corteza orbitofrontal
Rew/Pun : Señales externas que identifican la presentación de recompensa y castigo.
V : Fuerza asociativa desde la representación cortical hasta la amígdala que se modifica con el aprendizaje
W : Conexión inhibitoria de la corteza orbitofrontal a la amígdala que se modifica durante el aprendizaje
Esta imagen muestra que la información sensorial ingresa a través del tálamo TH . En los sistemas biológicos, el tálamo asume la tarea de iniciar el proceso de respuesta a los estímulos. Lo hace al pasar la señal a la amígdala y a la corteza sensorial. [8]
Esta señal se analiza luego en el área cortical – CX . En los sistemas biológicos, la corteza sensorial funciona distribuyendo las señales entrantes de manera apropiada entre la amígdala y la corteza orbitofrontal. [9] Esta representación sensorial en CX se envía luego a la amígdala A , a través de la vía V .
Esta es la vía principal de aprendizaje en este modelo. La recompensa y el castigo ingresan a la amígdala para fortalecer la conexión entre la amígdala y la vía. En una etapa posterior, si se activa una representación similar en la corteza, se activa E y se produce una respuesta emocional.
O , la corteza orbitofrontal, opera en base a la diferencia entre la recompensa/castigo percibido (es decir, esperado) y la recompensa/castigo realmente recibido . Esta recompensa/castigo percibido es el que se ha desarrollado en el cerebro a lo largo del tiempo utilizando mecanismos de aprendizaje y llega a la corteza orbitofrontal a través de la corteza sensorial y la amígdala. La recompensa/castigo recibido, por otro lado, viene por cortesía del mundo exterior y es la recompensa/castigo real que la especie acaba de obtener. Si estos dos son idénticos, la salida es la misma que siempre a través de E. Si no, la corteza orbitofrontal inhibe y restringe la respuesta emocional para dar paso a un mayor aprendizaje. Por lo tanto, la vía W solo se activa en tales condiciones.
Controlador
En la mayoría de los procesos industriales que contienen no linealidades complejas, se utilizan algoritmos de control para crear modelos linealizados . [10] Una razón es que estos modelos lineales se desarrollan utilizando métodos sencillos a partir de datos de pruebas de proceso.
Sin embargo, si el proceso es altamente complejo y no lineal, sujeto a frecuentes perturbaciones, será necesario un modelo no lineal. [10] Los controladores inteligentes con motivaciones biológicas se han empleado cada vez más en estas situaciones. Entre ellos, la lógica difusa , las redes neuronales y los algoritmos genéticos son algunas de las herramientas más empleadas en aplicaciones de control con entornos no lineales y altamente complejos. [11] [12]
BELBIC es uno de esos controladores no lineales : un controlador neuromórfico basado en el modelo de aprendizaje computacional que se muestra arriba para producir la acción de control. Este modelo se emplea como un algoritmo en estas aplicaciones de ingeniería de control. En estos nuevos enfoques, la inteligencia no se le da al sistema desde afuera, sino que es adquirida por el propio sistema. [1] [10]
Este modelo simple se ha empleado como un controlador de retroalimentación para ser aplicado a problemas de diseño de control. Una lógica detrás de este uso en ingeniería de control es la creencia sostenida por muchos expertos en el campo de que se ha hecho demasiado hincapié en los enfoques deliberativos completamente racionales, mientras que en muchas circunstancias del mundo real, solo se nos proporciona una racionalidad limitada . Factores como la complejidad computacional, la multiplicidad de objetivos y la prevalencia de la incertidumbre conducen a un deseo de obtener enfoques más ad hoc y empíricos. La toma de decisiones emocional es muy capaz de abordar estos problemas porque no es ni completamente cognitiva ni completamente conductual. [13]
BELBIC, que es un controlador libre de modelos, sufre del mismo inconveniente que todos los controladores inteligentes libres de modelos: no se puede aplicar en sistemas inestables o sistemas con un punto de equilibrio inestable. Esto es un resultado natural del método de prueba y error del procedimiento de aprendizaje, es decir, la exploración para encontrar las señales de control adecuadas puede conducir a la inestabilidad. [14] [15] Al integrar el aprendizaje imitativo y los sistemas de inferencia difusa , BELBIC se generaliza para poder controlar sistemas inestables. [14] [15]
Aplicaciones
Hasta la fecha, BELBIC y sus versiones modificadas se han probado en las siguientes aplicaciones: [16]
Sistemas HVAC (calefacción, ventilación y aire acondicionado): son algunas de las plantas más desafiantes en cuanto a sistemas de control que consumen el 50% del consumo total de energía mundial . [17]
Sistemas inestables (o sistemas estables con punto de equilibrio inestable) [14] [15]
Microintercambiador de calor calentado eléctricamente : este dispositivo ha sido desarrollado para acelerar el intercambio de fluidos y calor en sistemas reducidos.
Simulación de rescate de RoboCup : un sistema grande con múltiples agentes es uno de los entornos más desafiantes para controlar y coordinar porque es necesario que haya una coordinación precisa entre los agentes. [19]
Control de lavadoras inteligentes : el control inteligente de los electrodomésticos ha ganado una considerable atención por parte de los científicos y la industria en los últimos años. En el caso de las lavadoras, el control inteligente podría significar tanto un uso más sencillo como la conservación de energía y agua. [20]
Control de vehículos de lanzamiento aeroespacial [24]
Competición Robocup de 4 patas de Impossibles AIBO
Predicción del índice de actividad geomagnética; [25] En esta aplicación, los investigadores proponen varios modelos extendidos. Babaei et al. presentaron un modelo multiagente del aprendizaje emocional cerebral y Lotfi y Akbarzadeh propusieron una versión de aprendizaje supervisado del aprendizaje emocional cerebral para pronosticar índices de actividad geomagnética. [26] [27]
^ ab Lucas, C.; Shahmirzadi, D.; Sheikholeslami, N. (2004), "Presentación de BELBIC: controlador inteligente basado en el aprendizaje emocional del cerebro", Intelligent Automation and Soft Computing , 10 : 11–22, doi : 10.1080/10798587.2004.10642862, S2CID 12854189
^ LeDoux, JE (1995), "En busca de un sistema emocional en el cerebro: pasando del miedo a la emoción y la conciencia", en Gazzaniga, M. S (ed.), The Cognitive Neurosciences , Hillsdale, NJ: Lawrence Erlbaum, págs. 1049-1061
^ abc LeDoux, JE (1996), El cerebro emocional , Simon and Schuster, Nueva York
^ abcde Moren, Jan (2002). Emoción y aprendizaje (Tesis). Universidad de Lund.
^ abcd Moren, J.; Balkenius, C. (2000). Un modelo computacional del aprendizaje emocional en la amígdala . Proc. 6.ª Conferencia internacional sobre simulación del comportamiento adaptativo, Cambridge, Mass. MIT Press.
^ ab Mower, OH (1973) [1960], Teoría del aprendizaje y comportamiento , Nueva York: Wiley
^ ab Rolls, ET (1995), "Una teoría de la emoción y la conciencia, y su aplicación para comprender la base neuronal de la emoción", en Gazzaniga, MS (ed.), The Cognitive Neurosciences , Hillsdale, NJ: Lawrence Erlbaum, págs. 127-155
^ Kelly, JP (1991), La base neuronal de la percepción y el movimiento, Principios de la ciencia neuronal , Londres: Prentice Hall
^ Shahmirzadi, D. (agosto de 2005). Modelado computacional del sistema límbico cerebral y su aplicación en ingeniería de control (tesis de maestría). Universidad Texas A&M. hdl : 1969.1/2601 .
^ abc Rouhani, H.; Jalili, M.; Araabi, BN; Eppler, W.; Lucas, C. (2006), "Controlador inteligente basado en el aprendizaje emocional del cerebro aplicado al modelo neurodifuso de microintercambiador de calor", Expert Systems with Applications , 32 (3): 911–918, doi :10.1016/j.eswa.2006.01.047
^ ab Mehrabian, AR; Lucas, C. (2007), "Control adaptativo inteligente de sistemas no lineales basado en un enfoque de aprendizaje emocional", Revista internacional sobre herramientas de inteligencia artificial , 16 (1): 69–85, doi :10.1142/S0218213007003205
^ ab Mehrabian, AR; Lucas, C. (2006), "Controlador adaptativo inteligente robusto basado en aprendizaje emocional para sistemas no lineales estables e inciertos", Revista internacional de inteligencia computacional , 2 (4): 246–252
^ Mehrabian, AR; Lucas, C.; Roshanian, J. (2006), "Control de vehículos de lanzamiento aeroespacial: un enfoque adaptativo inteligente", Ciencia y tecnología aeroespacial , 10 (2): 149–155, Bibcode :2006AeST...10..149M, doi :10.1016/j.ast.2005.11.002
^ abc Javan Roshtkhari, M.; Arami, A.; Lucas, C. (2010), "Controlador emocional basado en aprendizaje imitativo para sistemas desconocidos con equilibrio inestable" (PDF) , International Journal of Intelligent Computing and Cybernetics , 3 (2): 334–359, doi :10.1108/17563781011049232, archivado desde el original (PDF) el 2015-06-10 , consultado el 2012-09-26
^ abcd Javan Roshtkhari, M.; Arami, A.; Lucas, C. (2009). Control emocional del sistema de péndulo invertido: un cambio suave del aprendizaje imitativo al emocional . La 4.ª Conferencia internacional sobre robots y agentes autónomos (ICARA 09). págs. 651–656.
^ Lucas, C. (2011). "BELBIC y sus aplicaciones industriales: hacia el diseño integrado de un sistema de control neuroemocional". En Madjid Fathi; Alexander Holland; Fazel Ansari; Christian Weber (eds.). Sistemas integrados, diseño y tecnología 2010. Berlín: Springer. págs. 203–214. doi :10.1007/978-3-642-17384-4_17. ISBN .978-3-642-17383-7.
^ Sheikholeslami, N.; Shahmirzadi, D.; Semsar, E.; Lucas, C.; Yazdanpanah, MJ (2005), "Aplicación del algoritmo de aprendizaje emocional cerebral para el control multivariable de sistemas HVAC", Intelligent and Fuzzy Systems , 16 : 1–12
^ Shahmirzadi, D.; Langari, R. (2005), "Estabilidad del sistema de aprendizaje de la amígdala mediante el algoritmo de mapeo de célula a célula", Revista internacional de inteligencia computacional
^ Sharbafi, MA; Lucas, C.; Toroghi Haghighat, A.; Amirghiasvand, O.; Aghazade, O. (2006), "Uso del aprendizaje emocional en un entorno de simulación de rescate", Transactions of Engineering, Computing and Technology , 13 : 333–337
^ Milasi, RM; Lucas, C.; Araabi, BN (2005). Modelado y control inteligente de lavadoras mediante modelado LLNF y BELBIC modificado . Proc. Conferencia IEEE sobre control y automatización. págs. 812–817.
^ Lucas, C.; Moghimi, S. Aplicación de BELBIC (controlador inteligente basado en el aprendizaje emocional del cerebro) a un sistema de aterrizaje automático . WSEAS AIKED'03 (2003).
^ Rashidi, F.; Rashidi, M.; Hashemi, A., Aplicación de controladores inteligentes para la regulación de la velocidad de motores de CC
^ Jalili, M. "Aplicación del controlador inteligente basado en el aprendizaje emocional cerebral (BELBIC) a la gestión activa de colas". Apuntes de clase en ciencias de la computación . Vol. 3037/2004. págs. 662–665.
^ Mehrabian, AR; Lucas, C.; Roshanian, J. (2008), "Diseño de un piloto automático de vehículo de lanzamiento aeroespacial basado en un algoritmo de aprendizaje emocional optimizado", Cybernetics and Systems , 39 (3): 1–18, doi :10.1080/01969720801944364, S2CID 28928524
^ Gholipour, A.; Lucas, C.; Shahmirzadi, D. (2003). Predicción del índice de actividad geomagnética mediante un algoritmo de aprendizaje emocional cerebral . WSEAS AIKED'03 (2003).
^ Lotfi, E.; Akbarzadeh-T., MR (2012). "Supervised Brain Emotional Learning". Conferencia conjunta internacional sobre redes neuronales de 2012 (IJCNN) . Conferencia conjunta internacional sobre redes neuronales de 2012 (IJCNN). págs. 1–6. doi :10.1109/IJCNN.2012.6252391. ISBN978-1-4673-1490-9.S2CID6159346 .
^ Lotfi, E.; Keshavarz., A. (2014), "Clasificación de microarrays de expresión genética utilizando PCA–BEL", Computers in Biology and Medicine , 54 : 180–187, doi :10.1016/j.compbiomed.2014.09.008, PMID 25282708
^ Zandesh, G; Moghani, J; Lucas, C; Shahmirzadi, D; Araabi, BN; Namaki, O; Kord, H (enero de 2004). "Control de velocidad de un motor de reluctancia conmutada utilizando BELBIC". WSEAS Transactions on Systems . 3 : 1–7.
^ Jalili, M. "Control inteligente de microintercambiadores de calor con identificador lineal local y controlador basado en emociones". Apuntes de clases de informática . Vol. 3578/2005. págs. 179–186.
^ Jamali, MR; Arami, A., "Control emocional en tiempo real para el control antibalanceo y de posicionamiento de la grúa puente SIMO", Revista internacional de informática, información y control innovadores , 4 (5/2008): 2333–2344
^ Arami, A.; Javan Roshtkhari, M.; Lucas, C. (2008). Un controlador inteligente rápido basado en emociones fusionadas: una implementación de caso práctico . 16.ª Conferencia Mediterránea sobre Control y Automatización (MED08). págs. 596–602.
^ Jafarzadeh, S.; Mirheidari, R.; Jahed-Motlagh, MR; Barkhordari, M., "Diseño de control de piloto automático inteligente para un modelo de helicóptero de 2 grados de libertad", International Journal of Computers, Communications & Control , 3 (Actas de ICCCC 2008): 337–342
^ Jafarzadeh, S.; Mirheidari, R.; Jahed-Motlagh, MR; Barkhordari, M., "Diseño de controladores PID y BELBIC en el problema de seguimiento de trayectorias", International Journal of Computers, Communications & Control , 3 (Actas de ICCCC 2008): 343–348
^ Jafari, M.; Shahri, AM; Shouraki, SB (1 de agosto de 2013). "Control de actitud de un cuadricóptero utilizando un controlador inteligente basado en el aprendizaje emocional cerebral". 13.ª Conferencia iraní sobre sistemas difusos (IFSC) de 2013. págs. 1–5. doi :10.1109/IFSC.2013.6675672. ISBN978-1-4799-1228-5. Número de identificación del sujeto 2173266.
^ Jafari, M.; shahri, A. Mohammad; Shuraki, SB (1 de febrero de 2013). "Control de velocidad de un sistema servo digital mediante un controlador inteligente basado en el aprendizaje emocional cerebral". 4.ª Conferencia anual internacional sobre electrónica de potencia, sistemas de accionamiento y tecnologías . págs. 311–314. doi :10.1109/PEDSTC.2013.6506724. ISBN978-1-4673-4484-5.S2CID36370603 .
^ Jafari, M.; Xu, H.; Carrillo, LRG (mayo de 2017). "Controlador inteligente basado en el aprendizaje emocional del cerebro para la agrupación de sistemas multiagente". Conferencia Americana de Control (ACC) de 2017. págs. 1996–2001. doi :10.23919/ACC.2017.7963245. ISBN978-1-5090-5992-8. Número de identificación del sujeto 11687828.
^ Jafari, Mohammad; Xu, Hao (1 de marzo de 2019). "Un control de agrupamiento tolerante a fallos distribuido de inspiración biológica para sistemas multiagente en presencia de dinámicas inciertas y perturbaciones desconocidas". Aplicaciones de ingeniería de la inteligencia artificial . 79 : 1–12. doi :10.1016/j.engappai.2018.12.001. ISSN 0952-1976. S2CID 58371458.
^ Jafari, Mohammad; Ghasemkhani, Amir; Sarfi, Vahid; Livani, Hanif; Yang, Lei; Xu, Hao (24 de junio de 2019). "Control secundario inteligente adaptativo de inspiración biológica para MG bajo imperfecciones cibernéticas". Sistemas ciberfísicos del IET: teoría y aplicaciones . 4 (4): 341–352. doi : 10.1049/iet-cps.2018.5003 . ISSN 2398-3396.
^ Sadeghieh, A.; Sazgar, H.; Goodarzi, K.; Lucas, C. (2012), "Identificación y control de posición en tiempo real de un actuador rotatorio servohidráulico mediante un algoritmo motivado neurobiológicamente", ISA Transactions , 51 (1): 208–219, doi :10.1016/j.isatra.2011.09.006, ISSN 0019-0578, PMID 22015061
Enlaces externos
Un tutorial práctico sobre programación de algoritmos genéticos. Programación de un algoritmo genético paso a paso.