IA neurosimbólica

La IA neurosimbólica es un tipo de inteligencia artificial que integra arquitecturas de IA neuronal y simbólica para abordar las debilidades de cada una, proporcionando una IA robusta capaz de razonar , aprender y modelar cognitivamente . Como argumentan Leslie Valiant ^[1] y otros, ^[2]^[3] la construcción eficaz de modelos cognitivos computacionales ricos exige la combinación de razonamiento simbólico y aprendizaje automático eficiente . Gary Marcus , argumentó: "No podemos construir modelos cognitivos ricos de una manera adecuada y automatizada sin el triunvirato de la arquitectura híbrida, el conocimiento previo rico y las técnicas sofisticadas de razonamiento". ^[4] Además, "Para construir un enfoque de IA sólido y basado en el conocimiento, debemos tener la maquinaria de manipulación de símbolos en nuestro conjunto de herramientas. Demasiado conocimiento útil es abstracto como para proceder sin herramientas que representen y manipulen la abstracción, y hasta la fecha, el La única maquinaria conocida que puede manipular de forma fiable ese conocimiento abstracto es el aparato de manipulación de símbolos. ^[5]

Henry Kautz , ^[6] Francesca Rossi , ^[7] y Bart Selman ^[8] también abogaron por una síntesis. Sus argumentos intentan abordar los dos tipos de pensamiento, como se analiza en el libro de Daniel Kahneman Thinking Fast and Slow . Describe que la cognición abarca dos componentes: el Sistema 1 es rápido, reflexivo, intuitivo e inconsciente. El sistema 2 es más lento, paso a paso y explícito. El sistema 1 se utiliza para el reconocimiento de patrones . El Sistema 2 maneja la planificación, la deducción y el pensamiento deliberativo. Desde este punto de vista, el aprendizaje profundo maneja mejor el primer tipo de cognición, mientras que el razonamiento simbólico maneja mejor el segundo tipo. Ambos son necesarios para una IA sólida y confiable que pueda aprender, razonar e interactuar con humanos para aceptar consejos y responder preguntas. Múltiples investigadores han trabajado en estos modelos de proceso dual con referencias explícitas a los dos sistemas contrastantes desde la década de 1990, tanto en IA como en ciencia cognitiva. ^[9]

Enfoques

Los enfoques para la integración son diversos. La taxonomía de arquitecturas neurosimbólicas de Henry Kautz , ^[10] junto con algunos ejemplos, es la siguiente:

Simbólico El simbólico neuronal es el enfoque actual de muchos modelos neuronales en el procesamiento del lenguaje natural , donde las palabras o tokens de subpalabras son la entrada y salida final de grandes modelos de lenguaje . Los ejemplos incluyen BERT , RoBERTa y GPT-3 .
Symbolic[Neural] está ejemplificado por AlphaGo , donde se utilizan técnicas simbólicas para invocar técnicas neuronales. En este caso, el enfoque simbólico es la búsqueda de árboles de Monte Carlo y las técnicas neuronales aprenden a evaluar las posiciones del juego.
Neuronales | Symbolic utiliza una arquitectura neuronal para interpretar datos perceptivos como símbolos y relaciones sobre las que se razona simbólicamente. El alumno de conceptos neuronales ^[11] es un ejemplo.
Neural: Simbólico → Neural se basa en el razonamiento simbólico para generar o etiquetar datos de entrenamiento que posteriormente se aprenden mediante un modelo de aprendizaje profundo, por ejemplo, para entrenar un modelo neuronal para el cálculo simbólico mediante el uso de un sistema matemático simbólico similar a Macsyma para crear o etiquetar ejemplos.
Neural_{Symbolic} utiliza una red neuronal que se genera a partir de reglas simbólicas. Un ejemplo es el Neural Theorem Prover, ^[12] que construye una red neuronal a partir de un árbol de prueba AND-OR generado a partir de reglas y términos de la base de conocimiento. Las redes tensoriales lógicas ^[13] también entran en esta categoría.
Neural[Simbólico] permite que un modelo neuronal llame directamente a un motor de razonamiento simbólico, por ejemplo, para realizar una acción o evaluar un estado. Un ejemplo sería ChatGPT usando un complemento para consultar Wolfram Alpha .

Estas categorías no son exhaustivas, ya que no consideran sistemas multiagente. En 2005, Bader y Hitzler presentaron una categorización más detallada que consideraba, por ejemplo, si el uso de símbolos incluía lógica y, si la incluía, si la lógica era proposicional o de primer orden. ^[14] La categorización de 2005 y la taxonomía de Kautz anterior se comparan y contrastan en un artículo de 2021. ^[10] Recientemente, Sepp Hochreiter argumentó que las redes neuronales gráficas "...son los modelos predominantes de la computación neuronal-simbólica" ^[15] ya que "describen las propiedades de las moléculas, simulan redes sociales o predicen estados futuros en Aplicaciones físicas y de ingeniería con interacciones entre partículas. ^[dieciséis]

Inteligencia artificial general

Gary Marcus sostiene que "... las arquitecturas híbridas que combinan el aprendizaje y la manipulación de símbolos son necesarias para una inteligencia robusta, pero no suficientes", ^[17] y que existen

...cuatro prerrequisitos cognitivos para construir una inteligencia artificial sólida:
Arquitecturas híbridas que combinan el aprendizaje a gran escala con los poderes representacionales y computacionales de la manipulación de símbolos.
bases de conocimiento a gran escala, probablemente aprovechando marcos innatos, que incorporan conocimiento simbólico junto con otras formas de conocimiento,
mecanismos de razonamiento capaces de aprovechar esas bases de conocimiento de manera manejable, y
modelos cognitivos ricos que funcionan junto con esos mecanismos y bases de conocimiento . ^[18]

Esto se hace eco de llamados anteriores a favor de modelos híbridos, ya en la década de 1990. ^[19]^[20]

Historia

Garcez y Lamb describieron que la investigación en esta área continúa al menos desde la década de 1990. ^[21]^[22] En ese momento, los términos IA simbólica y subsimbólica eran populares.

Desde 2005 se lleva a cabo anualmente una serie de talleres sobre IA neurosimbólica. Inteligencia artificial neurosimbólica. ^[23] A principios de la década de 1990, se organizó una serie inicial de talleres sobre este tema. ^[19]

Investigación

Quedan preguntas clave de investigación, ^[24] tales como:

¿Cuál es la mejor manera de integrar arquitecturas neuronales y simbólicas?
¿Cómo deberían representarse las estructuras simbólicas dentro de las redes neuronales y extraerse de ellas?
¿Cómo se debe aprender y razonar sobre el conocimiento de sentido común?
¿Cómo se puede manejar el conocimiento abstracto que es difícil de codificar lógicamente?

Implementaciones

Las implementaciones de enfoques neurosimbólicos incluyen:

AllegroGraph : una plataforma integrada basada en Knowledge Graph para el desarrollo de aplicaciones neurosimbólicas. ^[25]^[26]^[27]
Scallop: un lenguaje basado en Datalog que admite razonamiento lógico y relacional diferenciable. Scallop se puede integrar en Python y con un módulo de aprendizaje de PyTorch . ^[28]
Redes tensoriales lógicas: codifica fórmulas lógicas como redes neuronales y aprende simultáneamente codificaciones de términos, ponderaciones de términos y ponderaciones de fórmulas.
DeepProbLog: combina redes neuronales con el razonamiento probabilístico de ProbLog .
SymbolicAI: una biblioteca de programación composicional diferenciable.
Redes neuronales explicables (XNN): combinan redes neuronales con hipergrafos simbólicos y se entrenan mediante una mezcla de retropropagación y aprendizaje simbólico llamada inducción. ^[29]

Citas

^ Valiente 2008.
^ Garcez y col. 2015.
^ D'Ávila Garcez, Artur S.; Cordero, Luis C.; Gabbay, Dov M. (2009). Razonamiento cognitivo neuronal-simbólico . Tecnologías cognitivas. Saltador. ISBN 978-3-540-73245-7.
^ Marco 2020, pag. 44.
^ Marcus y Davis 2019, pag. 17.
^ Kautz 2020.
^ Rossi 2022.
^ Selman 2022.
^ Sol de 1995.
^ ab Sarker, doctor Kamruzzaman; Zhou, Lu; Eberhart, Aarón; Hitzler, Pascal (2021). "Inteligencia artificial neurosimbólica: tendencias actuales". Comunicaciones de IA . 34 (3): 197–209. doi :10.3233/AIC-210084. S2CID 239199144.
^ Mao y otros. 2019.
^ Rocktäschel, Tim; Riedel, Sebastián (2016). "Aprendizaje de la inferencia de la base de conocimientos con demostradores de teoremas neuronales". Actas del quinto taller sobre construcción automatizada de bases de conocimientos . San Diego, CA: Asociación de Lingüística Computacional. págs. 45–50. doi : 10.18653/v1/W16-1309 . Consultado el 6 de agosto de 2022 .
^ Serafini, Luciano; Garcez, Artur d'Ávila (2016). "Redes tensoriales lógicas: aprendizaje profundo y razonamiento lógico a partir de datos y conocimiento". arXiv : 1606.04422 [cs.AI].
^ Bader y Hitzler 2005.
^ LC Lamb, AS d'Avila Garcez, M.Gori, MOR Prates, PHC Avelar, MY Vardi (2020). "Las redes neuronales gráficas se encuentran con la computación neuronal-simbólica: una encuesta y una perspectiva ". CoRRabs/2003.00330 (2020)
^ Hochreiter, Sepp (abril de 2022). "Hacia una IA amplia". Comunicaciones de la ACM . 65 (4): 56–57. doi :10.1145/3512715. ISSN 0001-0782.
^ Marco 2020, pag. 50.
^ Marco 2020, pag. 48.
^ ab Sun y Bookman 1994.
^ Honavar 1995.
^ Garcez y Cordero 2020, pag. 2.
^ Garcez y col. 2002.
^ "Inteligencia artificial neurosimbólica". gente.cs.ksu.edu . Consultado el 11 de septiembre de 2023 .
^ Sol de 2001.
^ Harper, Jelani (29 de diciembre de 2023). "AllegroGraph 8.0 incorpora IA neurosimbólica, un camino hacia AGI". La nueva pila . Consultado el 13 de junio de 2024 .
^ "Introducción a la IA neurosimbólica y los modelos de lenguaje grandes | AllegroGraph 8.1.1". franz.com . Consultado el 13 de junio de 2024 .
^ "Franz Inc. presenta AllegroGraph Cloud: un servicio administrado para gráficos de conocimiento de IA neurosimbólica". Datanami . Consultado el 13 de junio de 2024 .
^ Li, Ziyang; Huang, Jiani; Naik, Mayur (2023). "Scallop: un lenguaje para la programación neurosimbólica". arXiv : 2304.04812 [cs.PL].
^ "Método de inducción de modelos para IA explicable". USPTO. 2021-05-06.

Referencias

Bader, Sebastián; Hitzler, Pascal (10 de noviembre de 2005). "Dimensiones de la integración neuronal-simbólica: una encuesta estructurada". arXiv : cs/0511042 .
Garcez, Artur S. d'Ávila; Broda, Krysia; Gabbay, Dov M.; Gabbay (2002). Sistemas de aprendizaje neuronal-simbólico: fundamentos y aplicaciones . Medios de ciencia y negocios de Springer. ISBN 978-1-85233-512-0.
Garcez, Artur; Besold, Tarek; De Raedt, Luc; Földiák, Peter; Hitzler, Pascal ; Icard, Thomas; Kühnberger, Kai-Uwe; Cordero, Luis; Mükkulainen, Risto; Plata, Daniel (2015). Aprendizaje y razonamiento neuronal-simbólico: contribuciones y desafíos. Simposio de primavera de AAAI: representación y razonamiento del conocimiento: integración de enfoques simbólicos y neuronales. Stanford, California. doi :10.13140/2.1.1779.4243.
Garcez, Artur d'Ávila; Gori, Marco; Cordero, Luis C.; Serafini, Luciano; Spranger, Michael; Tran, hijo N. (2019). "Computación neuronal-simbólica: una metodología eficaz para la integración de principios del razonamiento y el aprendizaje automático". arXiv : 1905.06088 [cs.AI].
Garcez, Artur d'Ávila; Cordero, Luis C. (2020). "IA neurosimbólica: la tercera ola". arXiv : 2012.05876 [cs.AI].
Hitzler, Pascal ; Sarker, Dr. Kamruzzaman (2022). Inteligencia artificial neurosimbólica: el estado del arte. Prensa IOS. ISBN 978-1-64368-244-0.
Hitzler, Pascal ; Sarker, Dr. Kamruzzaman; Eberhart, Aaron (2023). Compendio de Inteligencia Artificial Neurosimbólica. Prensa IOS. ISBN 978-1-64368-406-2.
Hochreiter, Sep. "Hacia una IA amplia". Comunitario. ACM 65(4): 56–57 (2022). Hacia una IA amplia
Honavar, Vasant (1995). Inteligencia artificial simbólica y redes neuronales artificiales numéricas: hacia una resolución de la dicotomía . Serie internacional Springer en ingeniería e informática. Springer Estados Unidos. págs. 351–388. doi :10.1007/978-0-585-29599-2_11.
Kautz, Henry (11 de febrero de 2020). El tercer verano de IA, Henry Kautz, Conferencia del premio en memoria de Robert S. Engelmore AAAI 2020 . Consultado el 6 de julio de 2022 .
Kautz, Henry (2022). "El tercer verano de IA: Conferencia en memoria de AAAI Robert S. Engelmore". Revista AI . 43 (1): 93-104. doi : 10.1609/aimag.v43i1.19122 . ISSN 2371-9621. S2CID 248213051 . Consultado el 12 de julio de 2022 .
Mao, Jiayuan; Gan, Chuang; Kohli, Pushmeet; Tenenbaum, Josué B.; Wu, Jiajun (2019). "El alumno de conceptos neurosimbólicos: interpretación de escenas, palabras y oraciones a partir de la supervisión natural". arXiv : 1904.12584 [cs.CV].
Marco, Gary; Davis, Ernesto (2019). Reiniciar la IA: construir una inteligencia artificial en la que podamos confiar . Antiguo.
Marcos, Gary (2020). "La próxima década en IA: cuatro pasos hacia una inteligencia artificial sólida". arXiv : 2002.06177 [cs.AI].
Rossi, Francesca (6 de julio de 2022). "AAAI2022: Pensar rápido y despacio en IA (charla invitada AAAI 2022)" . Consultado el 6 de julio de 2022 .
Selman, Bart (6 de julio de 2022). "AAAI2022: Discurso presidencial: El estado de la IA" . Consultado el 6 de julio de 2022 .
Serafini, Luciano; Garcez, Artur d'Ávila (7 de julio de 2016). "Redes tensoriales lógicas: aprendizaje profundo y razonamiento lógico a partir de datos y conocimiento". arXiv : 1606.04422 [cs.AI].
Sol, Ron (1995). "Razonamiento sólido: integración del razonamiento basado en reglas y basado en similitudes". Inteligencia artificial . 75 (2): 241–296. doi :10.1016/0004-3702(94)00028-Y.
Sol, Ron; Bookman, Lawrence (1994). Arquitecturas computacionales que integran procesos neuronales y simbólicos . Kluwer.
Sol, Ron; Alexandre, Federico (1997). Integración Simbólica Conexionista . Asociados de Lawrence Erlbaum.
Sol, R (2001). "Sistemas híbridos e implementacionalismo conexionista". Enciclopedia de ciencias cognitivas (MacMillan Publishing Company, 2001) .

Valiente, Leslie G (2008). "Infusión de conocimiento: en busca de la robustez de la inteligencia artificial". Conferencia anual de la IARCS sobre fundamentos de la tecnología de software y la informática teórica . doi : 10.4230/LIPIcs.FSTTCS.2008.1770 .

Ver también

enlaces externos

Inteligencia artificial: serie de talleres sobre aprendizaje y razonamiento neuronal-simbólico