stringtranslate.com

IA neurosimbólica

La IA neurosimbólica es un tipo de inteligencia artificial que integra arquitecturas de IA neuronales y simbólicas para abordar las debilidades de cada una, proporcionando una IA robusta capaz de razonar , aprender y modelar cognitivamente . Como argumentaron Leslie Valiant [1] y otros, [2] [3] la construcción efectiva de modelos cognitivos computacionales ricos exige la combinación de razonamiento simbólico y aprendizaje automático eficiente . Gary Marcus argumentó: "No podemos construir modelos cognitivos ricos de una manera adecuada y automatizada sin el triunvirato de arquitectura híbrida, conocimiento previo rico y técnicas sofisticadas para el razonamiento". [4] Además, "para construir un enfoque robusto e impulsado por el conocimiento para la IA, debemos tener la maquinaria de manipulación de símbolos en nuestro conjunto de herramientas. Demasiado conocimiento útil es abstracto para proceder sin herramientas que representen y manipulen la abstracción, y hasta la fecha, la única maquinaria conocida que puede manipular dicho conocimiento abstracto de manera confiable es el aparato de manipulación de símbolos". [5]

Henry Kautz , [6] Francesca Rossi , [7] y Bart Selman [8] también abogaron por una síntesis. Sus argumentos intentan abordar los dos tipos de pensamiento, como se analiza en el libro de Daniel Kahneman Pensar rápido, pensar despacio . Describe la cognición como algo que abarca dos componentes: el sistema 1 es rápido, reflexivo, intuitivo e inconsciente. El sistema 2 es más lento, paso a paso y explícito. El sistema 1 se utiliza para el reconocimiento de patrones . El sistema 2 maneja la planificación, la deducción y el pensamiento deliberativo. En esta visión, el aprendizaje profundo maneja mejor el primer tipo de cognición, mientras que el razonamiento simbólico maneja mejor el segundo tipo. Ambos son necesarios para una IA robusta y confiable que pueda aprender, razonar e interactuar con los humanos para aceptar consejos y responder preguntas. Estos modelos de proceso dual con referencias explícitas a los dos sistemas contrastantes han sido trabajados desde la década de 1990, tanto en IA como en Ciencia Cognitiva, por múltiples investigadores. [9]

Aproches

Los enfoques para la integración son diversos. [10] A continuación se presenta la taxonomía de arquitecturas neurosimbólicas de Henry Kautz [11] , junto con algunos ejemplos:

Estas categorías no son exhaustivas, ya que no consideran sistemas multiagente. En 2005, Bader y Hitzler presentaron una categorización más detallada que consideraba, por ejemplo, si el uso de símbolos incluía lógica y, en caso afirmativo, si la lógica era proposicional o lógica de primer orden. [15] La categorización de 2005 y la taxonomía de Kautz anterior se comparan y contrastan en un artículo de 2021. [11] Recientemente, Sepp Hochreiter argumentó que las redes neuronales gráficas "...son los modelos predominantes de computación neuronal-simbólica" [16] ya que "describen las propiedades de las moléculas, simulan redes sociales o predicen estados futuros en aplicaciones físicas y de ingeniería con interacciones entre partículas". [17]

Inteligencia artificial general

Gary Marcus sostiene que "...las arquitecturas híbridas que combinan el aprendizaje y la manipulación de símbolos son necesarias para una inteligencia robusta, pero no suficientes", [18] y que existen

...cuatro prerrequisitos cognitivos para construir una inteligencia artificial robusta:

Esto hace eco de pedidos anteriores de modelos híbridos que datan de la década de 1990. [20] [21]

Historia

Garcez y Lamb describieron la investigación en esta área como en curso al menos desde la década de 1990. [22] [23] En ese momento, los términos IA simbólica y subsimbólica eran populares.

Desde 2005 se celebran anualmente una serie de talleres sobre IA neurosimbólica. [24] A principios de los años 1990 se organizó un conjunto inicial de talleres sobre este tema. [20]

Investigación

Quedan por resolver preguntas de investigación clave, [25] tales como:

Implementaciones

Las implementaciones de enfoques neurosimbólicos incluyen:

Citas

  1. ^ Valiente 2008.
  2. ^ Garcez y otros. 2015.
  3. ^ D'Ávila Garcez, Artur S.; Cordero, Luis C.; Gabbay, Dov M. (2009). Razonamiento cognitivo neurosimbólico . Tecnologías cognitivas. Saltador. ISBN 978-3-540-73245-7.
  4. ^ Marcus 2020, pág. 44.
  5. ^ Marcus y Davis 2019, pág. 17.
  6. ^ Kautz 2020.
  7. ^ Rossi 2022.
  8. ^ Selman 2022.
  9. ^ Sol 1995.
  10. ^ "Desenredando atributos visuales con arquitecturas neuro-vectoriales-simbólicas, computación en memoria y ruido de dispositivos". IBM Research . 2021-02-09 . Consultado el 2024-10-20 .
  11. ^ ab Sarker, doctor Kamruzzaman; Zhou, Lu; Eberhart, Aarón; Hitzler, Pascal (2021). "Inteligencia artificial neurosimbólica: tendencias actuales". Comunicaciones de IA . 34 (3): 197–209. doi :10.3233/AIC-210084. S2CID  239199144.
  12. ^ Mao y otros. 2019.
  13. ^ Rocktäschel, Tim; Riedel, Sebastian (2016). "Aprendizaje de la inferencia de bases de conocimiento con demostradores de teoremas neuronales". Actas del 5.º taller sobre construcción automatizada de bases de conocimiento . San Diego, CA: Association for Computational Linguistics. págs. 45–50. doi : 10.18653/v1/W16-1309 . Consultado el 6 de agosto de 2022 .
  14. ^ Serafini, Luciano; Garcez, Artur d'Avila (2016). "Redes tensoriales lógicas: aprendizaje profundo y razonamiento lógico a partir de datos y conocimiento". arXiv : 1606.04422 [cs.AI].
  15. ^ Bader y Hitzler 2005.
  16. ^ LC Lamb, AS d'Avila Garcez, M. Gori, MOR Prates, PHC Avelar, MY Vardi (2020). "Las redes neuronales gráficas se encuentran con la computación neuronal simbólica: un estudio y una perspectiva ". CoRR abs/2003.00330 (2020)
  17. ^ Hochreiter, Sepp (abril de 2022). "Hacia una IA amplia". Comunicaciones de la ACM . 65 (4): 56–57. doi :10.1145/3512715. ISSN  0001-0782.
  18. ^ Marcus 2020, pág. 50.
  19. ^ Marcus 2020, pág. 48.
  20. ^ desde Sun y Bookman 1994.
  21. ^ Honavar 1995.
  22. ^ Garcez y Lamb 2020, pág. 2.
  23. ^ Garcez y otros. 2002.
  24. ^ "Inteligencia artificial neurosimbólica". people.cs.ksu.edu . Consultado el 11 de septiembre de 2023 .
  25. ^ Sol 2001.
  26. ^ Harper, Jelani (29 de diciembre de 2023). "AllegroGraph 8.0 incorpora IA neurosimbólica, un camino hacia la inteligencia artificial general". The New Stack . Consultado el 13 de junio de 2024 .
  27. ^ "Introducción a la IA neurosimbólica y a los modelos de lenguaje de gran tamaño | AllegroGraph 8.1.1". franz.com . Consultado el 13 de junio de 2024 .
  28. ^ "Franz Inc. presenta AllegroGraph Cloud: un servicio administrado para gráficos de conocimiento de IA neurosimbólicos". Datanami . Consultado el 13 de junio de 2024 .
  29. ^ Li, Ziyang; Huang, Jiani; Naik, Mayur (2023). "Scallop: un lenguaje para la programación neurosimbólica". arXiv : 2304.04812 [cs.PL].
  30. ^ "Método de inducción de modelos para una IA explicable". USPTO. 6 de mayo de 2021.

Referencias

Véase también

Enlaces externos