Motivación intrínseca (inteligencia artificial)

La motivación intrínseca en el estudio de la inteligencia artificial y cualquier robótica es un mecanismo que permite a los agentes artificiales (incluidos los robots ) exhibir comportamientos inherentemente gratificantes, como la exploración y la curiosidad, agrupados bajo el mismo término en el estudio de la psicología . Los psicólogos consideran que la motivación intrínseca en los humanos es el impulso de realizar una actividad por satisfacción inherente, solo por diversión o desafío. ^[1]

Definición

Un agente inteligente está intrínsecamente motivado a actuar si el contenido de la información por sí solo, o la experiencia resultante de la acción, es el factor motivador.

En este contexto, el contenido de información se mide en el sentido teórico de cuantificar la incertidumbre. Una motivación intrínseca típica es la búsqueda de situaciones inusuales y sorprendentes (exploración), en contraste con una motivación extrínseca típica, como la búsqueda de alimentos (homeostasis). ^[2] Las motivaciones extrínsecas se describen típicamente en la inteligencia artificial como dependientes de la tarea o dirigidas a un objetivo .

Orígenes en psicología

El estudio de la motivación intrínseca en psicología y neurociencia comenzó en la década de 1950 con algunos psicólogos que explicaban la exploración a través de impulsos para manipular y explorar, sin embargo, esta visión homeostática fue criticada por White. ^[3] Una explicación alternativa de Berlyne en 1960 fue la búsqueda de un equilibrio óptimo entre novedad y familiaridad. ^[4] Festinger describió la diferencia entre la visión interna y externa del mundo como una disonancia que los organismos están motivados a reducir. ^[5] Una visión similar fue expresada en los años 70 por Kagan como el deseo de reducir la incompatibilidad entre la estructura cognitiva y la experiencia. ^[6] En contraste con la idea de la incongruencia óptima, Deci y Ryan identificaron a mediados de los años 80 una motivación intrínseca basada en la competencia y la autodeterminación . ^[7]

Modelos computacionales

Un influyente enfoque computacional temprano para implementar la curiosidad artificial a principios de los años 1990 por Schmidhuber , desde entonces se ha desarrollado hasta convertirse en una "teoría formal de la creatividad, la diversión y la motivación intrínseca". ^[8]

La motivación intrínseca suele estudiarse en el marco del aprendizaje de refuerzo computacional ^[9]^[10] (introducido por Sutton y Barto ), donde las recompensas que impulsan el comportamiento del agente se derivan intrínsecamente en lugar de imponerse externamente y deben aprenderse del entorno. ^[11] El aprendizaje de refuerzo es agnóstico a cómo se genera la recompensa: un agente aprenderá una política (estrategia de acción) a partir de la distribución de recompensas proporcionadas por las acciones y el entorno. Cada enfoque de la motivación intrínseca en este esquema es esencialmente una forma diferente de generar la función de recompensa para el agente.

Curiosidad vs. exploración

Los agentes artificiales intrínsecamente motivados exhiben un comportamiento que se asemeja a la curiosidad o la exploración . La exploración en inteligencia artificial y robótica ha sido ampliamente estudiada en modelos de aprendizaje de refuerzo ^[12] , generalmente alentando al agente a explorar la mayor parte posible del entorno, para reducir la incertidumbre sobre la dinámica del entorno (aprendiendo la función de transición) y la mejor manera de lograr sus objetivos (aprendiendo la función de recompensa). La motivación intrínseca, por el contrario, alienta al agente a explorar primero los aspectos del entorno que le confieren más información, para buscar novedades. Un trabajo reciente que unificó la exploración del recuento de visitas de estado y la motivación intrínseca ha demostrado un aprendizaje más rápido en un entorno de videojuego ^{[13] .}

Tipos de modelos

Ouedeyer y Kaplan han hecho una contribución sustancial al estudio de la motivación intrínseca. ^[14]^[2]^[15] Definen la motivación intrínseca basándose en la teoría de Berlyne, ^[4] y dividen los enfoques para la implementación de la motivación intrínseca en tres categorías que, en líneas generales, siguen las raíces de la psicología: "modelos basados en el conocimiento", "modelos basados en la competencia" y "modelos morfológicos". ^[2] Los modelos basados en el conocimiento se subdividen a su vez en "teóricos de la información" y "predictivos". ^[15] Baldassare y Mirolli presentan una tipología similar, diferenciando los modelos basados en el conocimiento entre los basados en la predicción y los basados en la novedad. ^[16]

Motivación intrínseca basada en la teoría de la información

La cuantificación de la predicción y la novedad para impulsar el comportamiento generalmente se posibilita mediante la aplicación de modelos de teoría de la información, donde el estado del agente y la estrategia (política) a lo largo del tiempo se representan mediante distribuciones de probabilidad que describen un proceso de decisión de Markov y el ciclo de percepción y acción tratado como un canal de información. ^[17]^[18] Estos enfoques afirman la viabilidad biológica como parte de una familia de enfoques bayesianos para la función cerebral . La principal crítica y dificultad de estos modelos es la intratabilidad de calcular distribuciones de probabilidad en grandes espacios de estados discretos o continuos. ^[2] No obstante, se ha desarrollado un considerable cuerpo de trabajo que modela el flujo de información alrededor del ciclo sensoriomotor, lo que conduce a funciones de recompensa de facto derivadas de la reducción de la incertidumbre, incluida la inferencia activa , ^[19] pero también infotaxis, ^[20] información predictiva, ^[21]^[22] y empoderamiento . ^[23]

Modelos basados en competencias

El principio autotélico de Steels ^[24] es un intento de formalizar el flujo (psicología) . ^[25]

Modelos de logro, afiliación y poder

Otros motivos intrínsecos que se han modelado computacionalmente incluyen la motivación de logro, afiliación y poder. ^[26] Estos motivos pueden implementarse como funciones de probabilidad de éxito o incentivo. Las poblaciones de agentes pueden incluir individuos con diferentes perfiles de motivación de logro, afiliación y poder, modelando la diversidad de la población y explicando por qué diferentes individuos toman diferentes acciones cuando se enfrentan a la misma situación.

Más allá del logro, la afiliación y el poder

Una teoría computacional más reciente de la motivación intrínseca intenta explicar una gran variedad de hallazgos psicológicos basados en tales motivos. Cabe destacar que este modelo de motivación intrínseca va más allá del logro, la afiliación y el poder, ya que toma en consideración otros motivos humanos importantes. Los datos empíricos de la psicología se simularon computacionalmente y se tuvieron en cuenta utilizando este modelo. ^[27]

Aprendizaje intrínsecamente motivado

El aprendizaje intrínsecamente motivado (o impulsado por la curiosidad) es un tema de investigación emergente en inteligencia artificial y robótica de desarrollo ^[28] que tiene como objetivo desarrollar agentes que puedan aprender habilidades o comportamientos generales, que se puedan implementar para mejorar el rendimiento en tareas extrínsecas, como la adquisición de recursos. ^[29] El aprendizaje intrínsecamente motivado se ha estudiado como un enfoque para el aprendizaje autónomo permanente en máquinas ^[30]^[31] y el aprendizaje abierto en personajes de juegos de computadora. ^[32] En particular, cuando el agente aprende una representación abstracta significativa, se puede utilizar una noción de distancia entre dos representaciones para medir la novedad, lo que permite una exploración eficiente de su entorno. ^[33] A pesar del impresionante éxito del aprendizaje profundo en dominios específicos (por ejemplo, AlphaGo ), muchos en el campo (por ejemplo, Gary Marcus ) han señalado que la capacidad de generalizar sigue siendo un desafío fundamental en la inteligencia artificial. El aprendizaje intrínsecamente motivado, aunque prometedor en términos de poder generar objetivos a partir de la estructura del entorno sin tareas impuestas externamente, enfrenta el mismo desafío de generalización: cómo reutilizar políticas o secuencias de acción, cómo comprimir y representar espacios de estados continuos o complejos y retener y reutilizar las características sobresalientes que se han aprendido. ^[29]

Véase también

Referencias

^ Ryan, Richard M; Deci, Edward L (2000). "Motivaciones intrínsecas y extrínsecas: definiciones clásicas y nuevas direcciones". Psicología Educativa Contemporánea . 25 (1): 54–67. doi :10.1006/ceps.1999.1020. hdl : 20.500.12799/2958 . PMID 10620381. S2CID 1098145.
^ abcd Oudeyer, Pierre-Yves; Kaplan, Frederic (2008). "¿Cómo podemos definir la motivación intrínseca?". Actas de la 8.ª Conferencia sobre robótica epigenética . Vol. 5. págs. 29-31.
^ White, R. (1959). "Reconsideración de la motivación: el concepto de competencia". Psychological Review . 66 (5): 297–333. doi :10.1037/h0040934. PMID 13844397. S2CID 37385966.
^ ab Berlyne, D.: Conflicto, excitación y curiosidad. McGraw-Hill, Nueva York (1960)
^ Festinger, L.: Una teoría de la disonancia cognitiva. Evanston, Row, Peterson (1957)
^ Kagan, J.: Motivos y desarrollo. Revista de personalidad y psicología social 22, 51–66
^ Deci, EL, Ryan, RM: Motivación intrínseca y autodeterminación en la conducta humana. Plenum, Nueva York (1985)
^ Schmidhuber, J (2010). "Teoría formal de la creatividad, la diversión y la motivación intrínseca (1990-2010)". IEEE Trans. Auton. Mental Dev . 2 (3): 230–247. doi :10.1109/TAMD.2010.2056368. S2CID 234198.
^ Barto, A., Singh, S., Chentanez, N.: Aprendizaje intrínsecamente motivado de conjuntos jerárquicos de habilidades. En: ICDL 2004. Actas de la 3.ª Conferencia Internacional sobre Desarrollo y Aprendizaje, Instituto Salk, San Diego (2004)
^ Singh, S., Barto, AG y Chentanez, N. (2005). Aprendizaje por refuerzo intrínsecamente motivado. En Actas de la 18.ª Conferencia Anual sobre Sistemas de Procesamiento de Información Neural (NIPS), Vancouver, BC, Canadá.
^ Barto, AG: Motivación intrínseca y aprendizaje por refuerzo. En: Baldassarre, G., Mirolli, M. (eds.) Aprendizaje intrínsecamente motivado en sistemas naturales y artificiales. Springer, Berlín (2012)
^ Thrun, SB (1992). Exploración eficiente en el aprendizaje por refuerzo. https://doi.org/10.1007/978-1-4899-7687-1_244
^ Bellemare, MG, Srinivasan, S., Ostrovski, G., Schaul, T., Saxton, D. y Munos, R. (2016). Unificación de la exploración basada en el conteo y la motivación intrínseca. Avances en sistemas de procesamiento de información neuronal, 1479-1487.
^ Kaplan, F. y Oudeyer, P. (2004). Maximizar el progreso del aprendizaje: un sistema interno de recompensa para el desarrollo. Inteligencia artificial incorporada, páginas 629–629.
^ ab Oudeyer, PY, & Kaplan, F. (2009). ¿Qué es la motivación intrínseca? Una tipología de enfoques computacionales. Frontiers in Neurorobotics, 3(NOV). https://doi.org/10.3389/neuro.12.006.2007
^ Baldassarre, Gianluca; Mirolli, Marco (2013). "Sistemas de aprendizaje intrínsecamente motivados: una descripción general". Aprendizaje intrínsecamente motivado en sistemas naturales y artificiales . Roma, Italia: Springer. pp. 1–14.
^ Klyubin, A., Polani, D. y Nehaniv, C. (2008). Mantenga abiertas sus opciones: un principio de conducción basado en la información para sistemas sensoriomotores. PLOS ONE, 3(12):e4018. https://dx.doi.org/10.1371%2Fjournal.pone.0004018
^ Biehl, Martin; Guckelsberger, Christian; Salge, Christoph; Smith, Simón C.; Polani, Daniel (2018). "Expansión del panorama de la inferencia activa: más motivaciones intrínsecas en el ciclo de percepción-acción". Frontiers in Neurorobotics . 12 : 45. arXiv : 1806.08083 . doi : 10.3389/fnbot.2018.00045 . ISSN 1662-5218. PMC 6125413 . PMID 30214404.
^ Friston, Karl; Kilner, James; Harrison, Lee (2006). "Un principio de energía libre para el cerebro" (PDF) . Journal of Physiology-Paris . 100 (1–3). Elsevier BV: 70–87. doi :10.1016/j.jphysparis.2006.10.001. ISSN 0928-4257. PMID 17097864. S2CID 637885.
^ Vergassola, M., Villermaux, E., y Shraiman, BI (2007). 'Infotaxis' como estrategia de búsqueda sin gradientes. Nature, 445(7126), 406–409. https://doi.org/10.1038/nature05464
^ Ay, N., Bertschinger, N., Der, R., Güttler, F. y Olbrich, E. (2008), 'Información predictiva y comportamiento exploratorio de robots autónomos', The European Physical Journal B 63(3), 329–339.
^ Martius, G., Der, R. y Ay, N. (2013). Autoorganización basada en información de comportamientos robóticos complejos. PLOS ONE 8:e63400. doi: 10.1371/journal.pone.0063400
^ Salge, C; Glackin, C; Polani, D (2014). "Empoderamiento: una introducción". En Prokopenko, M (ed.). Autoorganización guiada: origen. Emergencia, complejidad y computación . Vol. 9. Springer. págs. 67–114. arXiv : 1310.1863 . doi :10.1007/978-3-642-53734-9_4. ISBN . 978-3-642-53733-2.S2CID 9662065 .
^ Steels, Luc: El principio autotélico. En: Iida, F., Pfeifer, R., Steels, L., Kuniyoshi, Y. (eds.) Inteligencia artificial incorporada. LNCS (LNAI), vol. 3139, págs. 231–242. Springer, Heidelberg (2004)
^ Csikszentmihalyi, M. (2000). Más allá del aburrimiento y la ansiedad. Jossey-Bass.
^ Merrick, KE (2016). Modelos computacionales de motivación para agentes que juegan videojuegos. Springer International Publishing, https://doi.org/10.1007/978-3-319-33459-2.
^ Sun, R., Bugrov, S. y Dai, D. (2022). Un marco unificado para interpretar una variedad de fenómenos de motivación y rendimiento. Cognitive Systems Research, 71, 24–40.
^ Lungarella, M., Metta, G., Pfeifer, R. y Sandini, G. (2003). Robótica de desarrollo: una encuesta. Connect. Sci. 15, 151–190. doi: 10.1080/09540090310001655110
^ ab Santucci, VG, Oudeyer, PY, Barto, A. y Baldassarre, G. (2020). Editorial: Aprendizaje abierto intrínsecamente motivado en robots autónomos. Fronteras en neurorobótica, 13 (enero), 2019-2021. https://doi.org/10.3389/fnbot.2019.00115
^ Barto, AG (2013). “Motivación intrínseca y aprendizaje por refuerzo”, en Aprendizaje intrínsecamente motivado en sistemas naturales y artificiales (Berlín; Heidelberg: Springer), 17–47
^ Mirolli, M., y Baldassarre, G. (2013). “Funciones y mecanismos de las motivaciones intrínsecas”, en Intrinsically Motivated Learning in Natural and Artificial Systems, eds G. Baldassarre y M. Mirolli (Berlín; Heidelberg: Springer), 49–72
^ Merrick, KE, Maher, ML (2009). Aprendizaje por refuerzo motivado: personajes curiosos para juegos multiusuario. Springer-Verlag Berlin Heidelberg, https://doi.org/10.1007/978-3-540-89187-1.
^ Tao, Ruo Yu y Francois-Lavet, Vincent y Pineau, Joelle (2020). Búsqueda de novedades en el espacio de representación para una exploración eficiente de muestras. Sistemas de procesamiento de información neuronal, 2020. https://arxiv.org/abs/2009.13579