Proyecto de inteligencia artificial
Cyc (pronunciado SYKE ) es un proyecto inteligencia artificial a largo plazo que tiene como objetivo ensamblar una ontología integral y una base de conocimiento que abarque los conceptos y reglas básicas sobre cómo funciona el mundo. Con la esperanza de capturar el conocimiento de sentido común , Cyc se centra en el conocimiento implícito . El proyecto comenzó en julio de 1984 en MCC y fue desarrollado más tarde por la empresa Cycorp .
El nombre "Cyc" (de "enciclopedia") es una marca registrada propiedad de Cycorp. CycL tiene una especificación publicada públicamente y se describieron docenas de módulos HL en el libro de texto de Lenat y Guha, [1] pero el código del motor de inferencia Cyc y la lista completa de módulos HL son propiedad de Cycorp. [2]
Historia
El proyecto comenzó en julio de 1984 por Douglas Lenat como un proyecto de la Microelectronics and Computer Technology Corporation (MCC), un consorcio de investigación iniciado por dos corporaciones con sede en Estados Unidos "para contrarrestar un esfuerzo japonés en IA, el llamado proyecto de ' quinta generación '". [3] Estados Unidos aprobó la Ley Nacional de Investigación Cooperativa de 1984, que por primera vez permitió a las empresas estadounidenses "coludir" en la investigación a largo plazo. Desde enero de 1995, el proyecto ha estado bajo desarrollo activo por Cycorp, donde Douglas Lenat era el director ejecutivo .
El lenguaje de representación CycL comenzó como una extensión de RLL [4] [5] (el lenguaje de representación desarrollado en 1979-1980 por Lenat y su estudiante de posgrado Russell Greiner mientras estaban en la Universidad de Stanford ). En 1989, [6] CycL se había expandido en poder expresivo a la lógica de orden superior (HOL).
La ontología de Cyc creció hasta aproximadamente 100.000 términos en 1994 y, en 2017, contenía aproximadamente 1.500.000 términos. La base de conocimiento de Cyc que incluye términos ontológicos se creó en gran parte mediante escritura axiomática a mano; en 1994, contaba con aproximadamente 1 millón y, en 2017, contaba con aproximadamente 24,5 millones.
En 2008, los recursos de Cyc se asignaron a muchos artículos de Wikipedia . [7] Actualmente, Cyc está conectado a Wikidata .
Base de conocimientos
La base de conocimiento se divide en microteorías . A diferencia de la base de conocimiento en su conjunto, cada microteoría debe estar libre de contradicciones monótonas. Cada microteoría es un objeto de primera clase en la ontología Cyc; tiene un nombre que es una constante regular. Los nombres de los conceptos en Cyc son términos o constantes CycL . [6] Las constantes comienzan con un opcional #$
y distinguen entre mayúsculas y minúsculas. Hay constantes para:
- Elementos individuales conocidos como individuos , como por ejemplo
#$BillClinton
o #$France
. - Colecciones , como
#$Tree-ThePlant
(que contiene todos los árboles) o #$EquivalenceRelation
(que contiene todas las relaciones de equivalencia ). Un miembro de una colección se denomina instancia de esa colección. [1] - Funciones que producen nuevos términos a partir de los términos dados. Por ejemplo,
#$FruitFn
cuando se le proporciona un argumento que describe un tipo (o colección) de plantas, devolverá la colección de sus frutos. Por convención, las constantes de función comienzan con una letra mayúscula y terminan con la cadena Fn
. - Funciones de verdad , que pueden aplicarse a uno o más conceptos y devolver verdadero o falso. Por ejemplo,
#$siblings
es la relación entre hermanos, verdadera si los dos argumentos son hermanos . Por convención, las constantes de funciones de verdad comienzan con una letra minúscula.
Para cada instancia de la colección #$ChordataPhylum
(es decir, para cada cordado ), existe un animal hembra (instancia de #$FemaleAnimal
), que es su madre (descrita por el predicado #$biologicalMother
). [1]
Motor de inferencia
Un motor de inferencia es un programa informático que intenta derivar respuestas a partir de una base de conocimientos. El motor de inferencia Cyc realiza deducciones lógicas generales . [8] También realiza razonamiento inductivo , aprendizaje automático estadístico y aprendizaje automático simbólico , y razonamiento abductivo .
El motor de inferencia Cyc separa el problema epistemológico del problema heurístico . Para este último, Cyc utilizó una arquitectura de comunidad de agentes en la que los módulos especializados, cada uno con su propio algoritmo, se priorizaban si podían avanzar en el subproblema.
Lanzamientos
Ciclo abierto
La primera versión de OpenCyc se publicó en la primavera de 2002 y contenía sólo 6.000 conceptos y 60.000 hechos. La base de conocimientos se publicó bajo la licencia Apache . Cycorp manifestó su intención de publicar OpenCyc bajo licencias paralelas y sin restricciones para satisfacer las necesidades de sus usuarios. El intérprete CycL y SubL (el programa que permite a los usuarios explorar y editar la base de datos, así como extraer inferencias) se publicó de forma gratuita, pero sólo como binario, sin código fuente . Se puso a disposición para Linux y Microsoft Windows . El proyecto de código abierto Texai [9] publicó el contenido compatible con RDF extraído de OpenCyc. [10] La versión OpenCyc 4.0 se publicó en junio de 2012. OpenCyc 4.0 contenía 239.000 conceptos y 2.093.000 hechos; sin embargo, se trata principalmente de afirmaciones taxonómicas .
InvestigaciónCyc
En julio de 2006, Cycorp lanzó el ejecutable de ResearchCyc 1.0, una versión de Cyc dirigida a la comunidad de investigación, sin cargo. (ResearchCyc estuvo en la etapa beta de desarrollo durante todo 2004; se lanzó una versión beta en febrero de 2005). Además de la información taxonómica, ResearchCyc incluye más conocimiento semántico; también incluye un gran léxico, herramientas de generación y análisis del inglés e interfaces basadas en Java para la edición y consulta de conocimientos. Contiene un sistema para la integración de datos basada en ontología .
Aplicaciones
Durante más de una década, Glaxo ha utilizado Cyc para integrar de forma semiautomática los grandes tesauros de términos de la industria farmacéutica. [11] Anteriormente, utilizaban personal para hacerlo manualmente. La Clínica Cleveland ha utilizado Cyc para desarrollar una interfaz de consulta en lenguaje natural de información biomédica sobre cirugías cardiotorácicas . [12] Una consulta se analiza en un conjunto de fragmentos de CycL con variables abiertas. [13] La Base de conocimiento sobre terrorismo fue una aplicación de Cyc que intentó contener conocimiento sobre descripciones relacionadas con "terroristas". El conocimiento se almacena como declaraciones en lógica matemática. [14] [15]
Una aplicación de Cyc tiene como objetivo declarado ayudar a los estudiantes a resolver problemas de matemáticas a nivel de sexto grado. [16] La aplicación, llamada MathCraft, [17] se suponía que desempeñaría el papel de un compañero de estudios que está un poco más confundido que el usuario sobre el tema. Como el usuario da buenos consejos, Cyc permite que el avatar cometa menos errores.
Críticas
El proyecto Cyc ha sido descrito como "uno de los proyectos más controvertidos de la historia de la inteligencia artificial". [18] Catherine Havasi , CEO de Luminoso, dice que Cyc es el proyecto predecesor de Watson de IBM . [19] El científico de aprendizaje automático Pedro Domingos se refiere al proyecto como un "fracaso catastrófico" por la cantidad interminable de datos necesarios para producir resultados viables y la incapacidad de Cyc para evolucionar por sí solo. [20]
Gary Marcus , científico cognitivo y cofundador de una empresa de inteligencia artificial llamada Geometric Intelligence, dice que "representa un enfoque muy diferente de todo el material de aprendizaje profundo que ha estado en las noticias". [21] Esto es consistente con la posición de Doug Lenat de que "A veces la apariencia de inteligencia no es suficiente". [22]
Empleados notables
Esta es una lista de algunas de las personas notables que trabajan o han trabajado en Cyc mientras era un proyecto en MCC (donde se inició Cyc) o Cycorp.
Véase también
Referencias
- ^ abc Lenat, Douglas B.; Guha, RV (1989). Construcción de grandes sistemas basados en el conocimiento; representación e inferencia en el proyecto Cyc (1.ª ed.). Boston, MA, EE. UU.: Addison-Wesley Longman Publishing Co., Inc. ISBN 978-0201517521.
- ^ Lenat, Douglas . "El legado de Hal: la computadora de 2001 como sueño y realidad. De 2001 a 2001: el sentido común y la mente de HAL" (PDF) . Cycorp, Inc. Archivado (PDF) desde el original el 2019-12-09 . Consultado el 2006-09-26 .
- ^ Wood, Lamont (2002). "El mundo en una caja". Scientific American . 286 (1): 18–19. Código Bibliográfico :2002SciAm.286a..18W. doi :10.1038/scientificamerican0102-18.
- ^ "Un lenguaje de representación". www.aaai.org . Consultado el 27 de noviembre de 2017 .
- ^ Russell, Greiner (octubre de 1980). RLL-1: A Representation Language Language (informe). Archivado desde el original el 8 de febrero de 2015.
- ^ ab Lenat, Douglas B.; Guha, RV (junio de 1991). "La evolución de CycL, el lenguaje de representación Cyc". Boletín ACM SIGART . 2 (3): 84–87. doi :10.1145/122296.122308. ISSN 0163-5719. S2CID 10306053.
- ^ "Integración de Cyc y Wikipedia: la folksonomía se encuentra con el sentido común rigurosamente definido" (PDF) . Consultado el 10 de mayo de 2013 .
- ^ "Motor de inferencia cíclica". Archivado desde el original el 9 de diciembre de 2019. Consultado el 4 de junio de 2015 .
- ^ "El proyecto de código abierto Texai". Archivado desde el original el 16 de febrero de 2009.
- ^ "Archivos de proyecto de Texai SourceForge".
- ^ HILTZIK, MICHAEL A. (21 de junio de 2001). "El nacimiento de una máquina pensante". Los Angeles Times . ISSN 0458-3035 . Consultado el 29 de noviembre de 2017 .
- ^ "Estudio de caso: un repositorio de contenido web semántico para la investigación clínica". www.w3.org . Consultado el 28 de febrero de 2018 .
- ^ Lenat, Douglas; Witbrock, Michael; Baxter, David; Blackstone, Eugene; Deaton, Chris; Schneider, Dave; Scott, Jerry; Shepard, Blake (28 de julio de 2010). "Aprovechamiento de Cyc para responder a las consultas ad hoc de los investigadores clínicos". AI Magazine . 31 (3): 13. doi : 10.1609/aimag.v31i3.2299 . ISSN 0738-4602.
- ^ Chris Deaton; Blake Shepard; Charles Klein; Corrinne Mayans; Brett Summers; Antoine Brusseau; Michael Witbrock; Doug Lenat (2005). "La base de conocimientos integral sobre terrorismo en Cyc". Actas de la Conferencia internacional de 2005 sobre análisis de inteligencia . CiteSeerX 10.1.1.70.9247 .
- ^ Douglas B. Lenat; Chris Deaton (abril de 2008). TERRORISM KNOWLEDGE BASE (TKB) Final Technical Report (Informe técnico). Rome Research Site, Roma, Nueva York : Dirección de Información del Laboratorio de Investigación de la Fuerza Aérea . AFRL-RI-RS-TR-2008-125.
- ^ Lenat, Douglas B.; Durlach, Paula J. (1 de septiembre de 2014). "Reforzar el conocimiento matemático mediante la inmersión de los estudiantes en una experiencia simulada de aprendizaje mediante la enseñanza". Revista internacional de inteligencia artificial en educación . 24 (3): 216–250. doi : 10.1007/s40593-014-0016-x . ISSN 1560-4292.
- ^ "Mathcraft de Cycorp". www.mathcraft.ai . Consultado el 29 de noviembre de 2017 .
- ^ Bertino, Piero y Zarría 2001, p. 275
- ^ Havasi, Catherine (9 de agosto de 2014). "Quiénes razonan con sentido común y por qué es importante". TechCrunch . Consultado el 29 de noviembre de 2017 .
- ^ Domingos, Pedro (2015). El algoritmo maestro: cómo la búsqueda de la máquina de aprendizaje definitiva transformará nuestro mundo . Basic Books. ISBN 978-0465065707.
- ^ Knight, Will (14 de marzo de 2016). "Una IA que pasó 30 años aprendiendo algo de sentido común está lista para trabajar". MIT Technology Review . Consultado el 29 de noviembre de 2017 .
- ^ Doug Lenat (15 de mayo de 2017). "A veces, la apariencia de inteligencia no es suficiente". CogWorld . Consultado el 29 de noviembre de 2017 .
Lectura adicional
- Alan Belasco et al. (2004). "Representing Knowledge Gaps Effectively". En: D. Karagiannis, U. Reimer (Eds.): Practical Aspects of Knowledge Management, Actas de PAKM 2004, Viena, Austria, 2 y 3 de diciembre de 2004. Springer-Verlag, Berlín Heidelberg.
- Bertino, Elisa ; Piero, Gian; Zarria, BC (2001). Sistemas de bases de datos inteligentes . Addison-Wesley Professional.
- John Cabral y otros (2005). "Convertir el metaconocimiento semántico en sesgo inductivo". En: Actas de la 15.ª Conferencia internacional sobre programación lógica inductiva . Bonn, Alemania, agosto de 2005.
- Jon Curtis et al. (2005). "Sobre el uso eficaz de Cyc en un sistema de preguntas y respuestas". En: Documentos del taller del IJCAI sobre conocimiento y razonamiento para responder preguntas . Edimburgo, Escocia: 2005.
- Chris Deaton y otros (2005). "La base de conocimientos integral sobre terrorismo en Cyc". En: Actas de la Conferencia internacional de 2005 sobre análisis de inteligencia, McLean, Virginia, mayo de 2005.
- Kenneth Forbus et al. (2005) . "Combinación de analogía, recuperación inteligente de información e integración de conocimientos para el análisis: un informe preliminar". En: Actas de la Conferencia Internacional de 2005 sobre Análisis de Inteligencia , McLean, Virginia, mayo de 2005
- Douglas Foxvog (2010), "Cyc". En: Teoría y aplicaciones de la ontología: aplicaciones informáticas Archivado el 12 de noviembre de 2018 en Wayback Machine . , Springer .
- Fritz Lehmann y D. Foxvog (1998), "Darle cuerpo a los huesos: cuestiones que surgen al crear bases de conocimiento anatómico con estructuras relacionales enriquecidas". En: Intercambio de conocimientos entre sistemas basados en conocimientos biológicos y médicos , AAAI .
- Douglas Lenat y RV Guha (1990). Construcción de grandes sistemas basados en el conocimiento: representación e inferencia en el proyecto Cyc . Addison-Wesley. ISBN 0-201-51752-3 .
- James Masters (2002). "Integración de fuentes de conocimiento estructurado y sus aplicaciones a la fusión de información". En: Actas de la Quinta Conferencia Internacional sobre Fusión de Información . Annapolis, Maryland, julio de 2002.
- James Masters y Z. Güngördü (2003). "Integración de fuentes de conocimiento estructurado: un informe de progreso" En: Integración de sistemas multiagente intensivos en conocimiento . Cambridge, Massachusetts, EE. UU., 2003.
- Cynthia Matuszek et al. (2006). "Introducción a la sintaxis y el contenido de Cyc." En: Actas del Simposio de primavera de la AAAI de 2006 sobre formalización y compilación de conocimientos previos y sus aplicaciones a la representación del conocimiento y la respuesta a preguntas . Stanford, 2006
- Cynthia Matuszek et al. (2005) . "Buscando sentido común: poblando Cyc desde la Web". En: Actas de la Vigésima Conferencia Nacional sobre Inteligencia Artificial . Pittsburgh, Pensilvania, julio de 2005.
- Tom O'Hara et al. (2003). "Inducción de criterios para asignaciones léxicas de sustantivos en masa utilizando la base de conocimiento Cyc y su extensión a WordNet". En: Actas del quinto taller internacional sobre semántica computacional . Tilburg, 2003.
- Fabrizio Morbini y Lenhart Schubert (2009). "Evaluación de EPILOG: un razonador para la lógica episódica". Universidad de Rochester, Conferencia Commonsense '09 (describe la biblioteca de Cyc de aproximadamente 1600 "pruebas de sentido común")
- Kathy Panton et al. (2002). "Formación de conocimiento y diálogo utilizando el conjunto de herramientas KRAKEN". En: Decimoctava Conferencia Nacional sobre Inteligencia Artificial . Edmonton, Canadá, 2002.
- Deepak Ramachandran P. Reagan y K. Goolsbey (2005). "First-Orderized ResearchCyc: Expressivity and Efficiency in a Common-Sense Ontology" Archivado el 24 de marzo de 2014 en Wayback Machine . En: Documentos del taller de la AAAI sobre contextos y ontologías: teoría, práctica y aplicaciones . Pittsburgh, Pensilvania, julio de 2005.
- Stephen Reed y D. Lenat (2002). "Mapping Ontologies into Cyc". En: Taller de la conferencia AAAI 2002 sobre ontologías para la Web semántica . Edmonton, Canadá, julio de 2002.
- Benjamin Rode et al. (2005). "Hacia un modelo de recuperación de patrones en datos relacionales". En: Actas de la Conferencia internacional de 2005 sobre análisis de inteligencia . McLean, Virginia, mayo de 2005.
- Dave Schneider et al. (2005). "Recopilación y gestión de datos para el análisis de inteligencia". En: Actas de la Conferencia internacional de 2005 sobre análisis de inteligencia . McLean, Virginia, mayo de 2005.
- Schneider, D., y Witbrock, MJ (mayo de 2015). "Gramática de construcción semántica: superando la brecha entre lógica y lenguaje natural" en Actas de la 24.ª Conferencia Internacional sobre la World Wide Web (pp. 673–678).
- Blake Shepard et al. (2005). "Un enfoque basado en el conocimiento para la seguridad de redes: aplicación de Cyc en el ámbito de la evaluación de riesgos de redes". En: Actas de la decimoséptima conferencia sobre aplicaciones innovadoras de la inteligencia artificial . Pittsburgh, Pensilvania, julio de 2005.
- Nick Siegel et al. (2004). "Arquitecturas de agentes: combinación de las fortalezas de la ingeniería de software y los sistemas cognitivos". En: Documentos del taller AAAI sobre arquitecturas de agentes inteligentes: combinación de las fortalezas de la ingeniería de software y los sistemas cognitivos . Informe técnico WS-04-07, págs. 74-79. Menlo Park, California: AAAI Press, 2004.
- Nick Siegel et al. (2005). Generación de hipótesis y ensamblaje de evidencias para el análisis de inteligencia: la aplicación Nooscape de Cycorp. En Actas de la Conferencia Internacional de 2005 sobre Análisis de Inteligencia, McLean, Virginia, mayo de 2005.
- Michael Witbrock et al. (2002). "Un sistema de diálogo interactivo para la adquisición de conocimientos en Cyc". En: Actas de la Decimoctava Conferencia Conjunta Internacional sobre Inteligencia Artificial . Acapulco, México, 2003.
- Michael Witbrock et al. (2004). "Anotación automatizada de OWL asistida por una gran base de conocimiento". En: Notas del taller de 2004 sobre marcado de conocimiento y anotación semántica en la 3.ª Conferencia Internacional de Web Semántica ISWC2004 . Hiroshima, Japón, noviembre de 2004, págs. 71–80.
- Michael Witbrock et al. (2005). "El conocimiento genera conocimiento: pasos hacia la adquisición asistida de conocimiento en ciclo". En: Documentos del Simposio de primavera de la AAAI de 2005 sobre recopilación de conocimiento de colaboradores voluntarios (KCVC) . Págs. 99-105. Stanford, California, marzo de 2005.
- William Jarrold (2001). "Validación de la inteligencia en grandes sistemas basados en reglas con sentido común". "Validación de la inteligencia basada en modelos: artículos del simposio AAAI de 2001" (Informe técnico SS-01-04 de la AAAI).
- William Jarrold (2003). Uso de una ontología para evaluar una gran ontología basada en reglas: teoría y práctica. {\em Métricas de rendimiento para sistemas inteligentes PerMIS '03} (Publicación especial NIST 1014).
Enlaces externos