Subcampo de la inteligencia artificial
La IA neurosimbólica es un tipo de inteligencia artificial que integra arquitecturas de IA neuronales y simbólicas para abordar las debilidades de cada una, proporcionando una IA robusta capaz de razonar , aprender y modelar cognitivamente . Como argumentaron Leslie Valiant y otros, [3] la construcción efectiva de modelos cognitivos computacionales ricos exige la combinación de razonamiento simbólico y aprendizaje automático eficiente . Gary Marcus argumentó: "No podemos construir modelos cognitivos ricos de una manera adecuada y automatizada sin el triunvirato de arquitectura híbrida, conocimiento previo rico y técnicas sofisticadas para el razonamiento". Además, "para construir un enfoque robusto e impulsado por el conocimiento para la IA, debemos tener la maquinaria de manipulación de símbolos en nuestro conjunto de herramientas. Demasiado conocimiento útil es abstracto para proceder sin herramientas que representen y manipulen la abstracción, y hasta la fecha, la única maquinaria conocida que puede manipular dicho conocimiento abstracto de manera confiable es el aparato de manipulación de símbolos".
Henry Kautz , Francesca Rossi , y Bart Selman también abogaron por una síntesis. Sus argumentos intentan abordar los dos tipos de pensamiento, como se analiza en el libro de Daniel Kahneman Pensar rápido, pensar despacio . Describe la cognición como algo que abarca dos componentes: el sistema 1 es rápido, reflexivo, intuitivo e inconsciente. El sistema 2 es más lento, paso a paso y explícito. El sistema 1 se utiliza para el reconocimiento de patrones . El sistema 2 maneja la planificación, la deducción y el pensamiento deliberativo. En esta visión, el aprendizaje profundo maneja mejor el primer tipo de cognición, mientras que el razonamiento simbólico maneja mejor el segundo tipo. Ambos son necesarios para una IA robusta y confiable que pueda aprender, razonar e interactuar con los humanos para aceptar consejos y responder preguntas. Estos modelos de proceso dual con referencias explícitas a los dos sistemas contrastantes han sido trabajados desde la década de 1990, tanto en IA como en Ciencia Cognitiva, por múltiples investigadores.
Aproches
Los enfoques para la integración son diversos. [10] A continuación se presenta la taxonomía de arquitecturas neurosimbólicas de Henry Kautz [11] , junto con algunos ejemplos:
- Simbólico neuronal El simbólico neuronal es el enfoque actual de muchos modelos neuronales en el procesamiento del lenguaje natural , donde las palabras o los tokens de subpalabras son la entrada y salida final de los grandes modelos de lenguaje . Algunos ejemplos incluyen BERT , RoBERTa y GPT-3 .
- Un ejemplo de Symbolic[Neural] es AlphaGo , donde se utilizan técnicas simbólicas para invocar técnicas neuronales. En este caso, el enfoque simbólico es la búsqueda en árbol de Monte Carlo y las técnicas neuronales aprenden a evaluar las posiciones del juego.
- Neural | Symbolic utiliza una arquitectura neuronal para interpretar datos perceptuales como símbolos y relaciones que se razonan simbólicamente. Neural-Concept Learner es un ejemplo.
- Neural: Simbólico → Neural se basa en el razonamiento simbólico para generar o etiquetar datos de entrenamiento que posteriormente son aprendidos por un modelo de aprendizaje profundo, por ejemplo, para entrenar un modelo neuronal para el cálculo simbólico utilizando un sistema de matemáticas simbólicas similar a Macsyma para crear o etiquetar ejemplos.
- Neural_{Symbolic} utiliza una red neuronal que se genera a partir de reglas simbólicas. Un ejemplo es el demostrador de teoremas neuronales [13] , que construye una red neuronal a partir de un árbol de prueba AND-OR generado a partir de reglas y términos de la base de conocimientos. Las redes tensoriales lógicas [14] también entran en esta categoría.
- Neural[Symbolic] permite que un modelo neuronal llame directamente a un motor de razonamiento simbólico, por ejemplo, para realizar una acción o evaluar un estado. Un ejemplo sería ChatGPT que utiliza un complemento para consultar Wolfram Alpha .
Estas categorías no son exhaustivas, ya que no consideran sistemas multiagente. En 2005, Bader y Hitzler presentaron una categorización más detallada que consideraba, por ejemplo, si el uso de símbolos incluía lógica y, en caso afirmativo, si la lógica era proposicional o lógica de primer orden. La categorización de 2005 y la taxonomía de Kautz anterior se comparan y contrastan en un artículo de 2021. [11] Recientemente, Sepp Hochreiter argumentó que las redes neuronales gráficas "...son los modelos predominantes de computación neuronal-simbólica" [16] ya que "describen las propiedades de las moléculas, simulan redes sociales o predicen estados futuros en aplicaciones físicas y de ingeniería con interacciones entre partículas". [17]
Inteligencia artificial general
Gary Marcus sostiene que "...las arquitecturas híbridas que combinan el aprendizaje y la manipulación de símbolos son necesarias para una inteligencia robusta, pero no suficientes", y que existen
...cuatro prerrequisitos cognitivos para construir una inteligencia artificial robusta:
- arquitecturas híbridas que combinan el aprendizaje a gran escala con los poderes de representación y cálculo de la manipulación de símbolos,
- bases de conocimiento a gran escala, que probablemente aprovechen marcos innatos, que incorporen conocimiento simbólico junto con otras formas de conocimiento,
- mecanismos de razonamiento capaces de aprovechar esas bases de conocimiento de manera manejable, y
- modelos cognitivos ricos que trabajan junto con esos mecanismos y bases de conocimiento .
Esto hace eco de pedidos anteriores de modelos híbridos que datan de la década de 1990.
Historia
Garcez y Lamb describieron la investigación en esta área como en curso al menos desde la década de 1990. En ese momento, los términos IA simbólica y subsimbólica eran populares.
Desde 2005 se celebran anualmente una serie de talleres sobre IA neurosimbólica. [24] A principios de los años 1990 se organizó un conjunto inicial de talleres sobre este tema.
Investigación
Quedan por resolver preguntas de investigación clave, tales como:
- ¿Cuál es la mejor manera de integrar arquitecturas neuronales y simbólicas?
- ¿Cómo deben representarse las estructuras simbólicas dentro de las redes neuronales y extraerse de ellas?
- ¿Cómo debe aprenderse y razonarse el conocimiento de sentido común?
- ¿Cómo se puede manejar el conocimiento abstracto que es difícil de codificar lógicamente?
Implementaciones
Las implementaciones de enfoques neurosimbólicos incluyen:
- AllegroGraph : una plataforma integrada basada en gráficos de conocimiento para el desarrollo de aplicaciones neurosimbólicas. [26] [27] [28]
- Scallop: un lenguaje basado en Datalog que admite razonamiento lógico y relacional diferenciable. Scallop se puede integrar en Python y con un módulo de aprendizaje de PyTorch . [29]
- Redes tensoriales lógicas: codifican fórmulas lógicas como redes neuronales y aprenden simultáneamente codificaciones de términos, pesos de términos y pesos de fórmulas.
- DeepProbLog: combina redes neuronales con el razonamiento probabilístico de ProbLog .
- SymbolicAI: una biblioteca de programación compositiva diferenciable.
- Redes neuronales explicables (XNN): combinan redes neuronales con hipergrafos simbólicos y se entrenan utilizando una mezcla de retropropagación y aprendizaje simbólico llamada inducción. [30]
Citas
- ^ D'Ávila Garcez, Artur S.; Cordero, Luis C.; Gabbay, Dov M. (2009). Razonamiento cognitivo neurosimbólico . Tecnologías cognitivas. Saltador. ISBN 978-3-540-73245-7.
- ^ "Desenredando atributos visuales con arquitecturas neuro-vectoriales-simbólicas, computación en memoria y ruido de dispositivos". IBM Research . 2021-02-09 . Consultado el 2024-10-20 .
- ^ ab Sarker, doctor Kamruzzaman; Zhou, Lu; Eberhart, Aarón; Hitzler, Pascal (2021). "Inteligencia artificial neurosimbólica: tendencias actuales". Comunicaciones de IA . 34 (3): 197–209. doi :10.3233/AIC-210084. S2CID 239199144.
- ^ Rocktäschel, Tim; Riedel, Sebastian (2016). "Aprendizaje de la inferencia de bases de conocimiento con demostradores de teoremas neuronales". Actas del 5.º taller sobre construcción automatizada de bases de conocimiento . San Diego, CA: Association for Computational Linguistics. págs. 45–50. doi : 10.18653/v1/W16-1309 . Consultado el 6 de agosto de 2022 .
- ^ Serafini, Luciano; Garcez, Artur d'Avila (2016). "Redes tensoriales lógicas: aprendizaje profundo y razonamiento lógico a partir de datos y conocimiento". arXiv : 1606.04422 [cs.AI].
- ^ LC Lamb, AS d'Avila Garcez, M. Gori, MOR Prates, PHC Avelar, MY Vardi (2020). "Las redes neuronales gráficas se encuentran con la computación neuronal simbólica: un estudio y una perspectiva ". CoRR abs/2003.00330 (2020)
- ^ Hochreiter, Sepp (abril de 2022). "Hacia una IA amplia". Comunicaciones de la ACM . 65 (4): 56–57. doi :10.1145/3512715. ISSN 0001-0782.
- ^ "Inteligencia artificial neurosimbólica". people.cs.ksu.edu . Consultado el 11 de septiembre de 2023 .
- ^ Harper, Jelani (29 de diciembre de 2023). "AllegroGraph 8.0 incorpora IA neurosimbólica, un camino hacia la inteligencia artificial general". The New Stack . Consultado el 13 de junio de 2024 .
- ^ "Introducción a la IA neurosimbólica y a los modelos de lenguaje de gran tamaño | AllegroGraph 8.1.1". franz.com . Consultado el 13 de junio de 2024 .
- ^ "Franz Inc. presenta AllegroGraph Cloud: un servicio administrado para gráficos de conocimiento de IA neurosimbólicos". Datanami . Consultado el 13 de junio de 2024 .
- ^ Li, Ziyang; Huang, Jiani; Naik, Mayur (2023). "Scallop: un lenguaje para la programación neurosimbólica". arXiv : 2304.04812 [cs.PL].
- ^ "Método de inducción de modelos para una IA explicable". USPTO. 6 de mayo de 2021.
Referencias
- Bader, Sebastian; Hitzler, Pascal (10 de noviembre de 2005). "Dimensiones de la integración neural-simbólica: un estudio estructurado". arXiv : cs/0511042 .
- Garcez, Artur S. d'Avila; Broda, Krysia; Gabbay, Dov M.; Gabbay (2002). Sistemas de aprendizaje neuronal-simbólico: fundamentos y aplicaciones . Springer Science & Business Media. ISBN 978-1-85233-512-0.
- Garcez, Artur; Besold, Tarek; De Raedt, Luc; Földiák, Peter; Hitzler, Pascal ; Icard, Thomas; Kühnberger, Kai-Uwe; Lamb, Luís; Miikkulainen, Risto; Silver, Daniel (2015). Aprendizaje y razonamiento neuronal-simbólico: contribuciones y desafíos. Simposio de primavera de la AAAI: Representación del conocimiento y razonamiento: integración de enfoques simbólicos y neuronales. Stanford, CA. doi :10.13140/2.1.1779.4243.
- Garcez, Artur d'Avila; Gori, Marco; Lamb, Luis C.; Serafini, Luciano; Spranger, Michael; Tran, Son N. (2019). "Computación neurosimbólica: una metodología eficaz para la integración basada en principios del aprendizaje automático y el razonamiento". arXiv : 1905.06088 [cs.AI].
- Garcez, Artur d'Ávila; Cordero, Luis C. (2020). "IA neurosimbólica: la tercera ola". arXiv : 2012.05876 [cs.AI].
- Hitzler, Pascal ; Sarker, Md Kamruzzaman (2022). Inteligencia artificial neurosimbólica: el estado del arte. IOS Press. ISBN 978-1-64368-244-0.
- Hitzler, Pascal ; Sarker, Md Kamruzzaman; Eberhart, Aaron (2023). Compendio de inteligencia artificial neurosimbólica. IOS Press. ISBN 978-1-64368-406-2.
- Hochreiter, Sepp. "Hacia una IA amplia". Commun. ACM 65(4): 56–57 (2022). Hacia una IA amplia
- Honavar, Vasant (1995). Inteligencia artificial simbólica y redes neuronales artificiales numéricas: hacia una resolución de la dicotomía . Serie internacional Springer en ingeniería y ciencias de la computación. Springer US. págs. 351–388. doi :10.1007/978-0-585-29599-2_11.
- Kautz, Henry (11 de febrero de 2020). El tercer verano de IA, Henry Kautz, Conferencia conmemorativa del premio Robert S. Engelmore 2020 de la AAAI . Consultado el 6 de julio de 2022 .
- Kautz, Henry (2022). "El tercer verano de IA: conferencia conmemorativa AAAI Robert S. Engelmore". Revista de IA . 43 (1): 93–104. doi : 10.1609/aimag.v43i1.19122 . ISSN 2371-9621. S2CID 248213051 . Consultado el 12 de julio de 2022 .
- Mao, Jiayuan; Gan, Chuang; Kohli, Pushmeet; Tenenbaum, Joshua B.; Wu, Jiajun (2019). "El aprendiz de conceptos neurosimbólicos: interpretación de escenas, palabras y oraciones a partir de la supervisión natural". arXiv : 1904.12584 [cs.CV].
- Marcus, Gary; Davis, Ernest (2019). Reiniciando la IA: construyendo una inteligencia artificial en la que podamos confiar . Vintage.
- Marcus, Gary (2020). "La próxima década en IA: cuatro pasos hacia una inteligencia artificial robusta". arXiv : 2002.06177 [cs.AI].
- Rossi, Francesca (6 de julio de 2022). "AAAI2022: Pensar rápido y despacio en IA (Charla invitada de AAAI 2022)" . Consultado el 6 de julio de 2022 .
- Selman, Bart (6 de julio de 2022). "AAAI2022: Discurso presidencial: El estado de la IA" . Consultado el 6 de julio de 2022 .
- Serafini, Luciano; Garcez, Artur d'Avila (7 de julio de 2016). "Redes tensoriales lógicas: aprendizaje profundo y razonamiento lógico a partir de datos y conocimiento". arXiv : 1606.04422 [cs.AI].
- Sun, Ron (1995). "Razonamiento robusto: integración del razonamiento basado en reglas y en similitudes". Inteligencia artificial . 75 (2): 241–296. doi :10.1016/0004-3702(94)00028-Y.
- Sun, Ron; Bookman, Lawrence (1994). Arquitecturas computacionales que integran procesos neuronales y simbólicos . Kluwer.
- Sun, Ron; Alexandre, Frederic (1997). Integración simbólica conexionista . Lawrence Erlbaum Associates.
- Sun, R (2001). "Sistemas híbridos e implementacionismo conexionista". Enciclopedia de la ciencia cognitiva (MacMillan Publishing Company, 2001) .
- Valiant, Leslie G (2008). "Infusión de conocimiento: en busca de la robustez en la inteligencia artificial". Conferencia anual de la IARCS sobre fundamentos de la tecnología de software y la informática teórica . doi : 10.4230/LIPIcs.FSTTCS.2008.1770 .
Véase también
Enlaces externos
- Inteligencia artificial: Serie de talleres sobre aprendizaje y razonamiento neuronal-simbólico