Mente abierta, sentido común

Open Mind Common Sense ( OMCS ) es un proyecto de inteligencia artificial con sede en el Media Lab del Instituto Tecnológico de Massachusetts (MIT) cuyo objetivo es crear y utilizar una gran base de conocimientos de sentido común a partir de las contribuciones de miles de personas de toda la Web. Ha estado activo desde 1999 hasta 2016.

Desde su fundación, ha acumulado más de un millón de datos en inglés de más de 15.000 colaboradores, además de bases de conocimiento en otros idiomas. Gran parte del software de OMCS se basa en tres representaciones interconectadas: el corpus de lenguaje natural con el que las personas interactúan directamente, una red semántica construida a partir de este corpus llamada ConceptNet y una representación basada en matrices de ConceptNet llamada AnalogySpace que puede inferir nuevos conocimientos mediante la reducción de dimensionalidad . ^[1] El conocimiento recopilado por Open Mind Common Sense ha hecho posible proyectos de investigación en el MIT y en otros lugares.

Historia

El proyecto fue una creación de Marvin Minsky , Push Singh, Catherine Havasi y otros. El trabajo de desarrollo comenzó en septiembre de 1999 y el proyecto se abrió a Internet un año después. Havasi lo describió en su tesis como "un intento de... aprovechar parte del poder computacional humano distribuido de Internet, una idea que entonces estaba apenas en sus primeras etapas". ^[2] El OMCS original estaba influenciado por el sitio web Everything2 y su predecesor, y presenta una interfaz minimalista inspirada en Google .

Push Singh se habría convertido en profesor en el Media Lab del MIT y habría dirigido el grupo Common Sense Computing en 2007, pero se suicidó el 28 de febrero de 2006. ^[3]

El proyecto lo dirige actualmente el Grupo de Intuición Digital del MIT Media Lab, dirigido por Catherine Havasi. ^{[ cita requerida ]}

Base de datos y sitio web

Existen muchos tipos diferentes de conocimiento en OMCS. Algunas afirmaciones transmiten relaciones entre objetos o eventos, expresadas como frases simples de lenguaje natural: algunos ejemplos incluyen "Un abrigo se usa para mantenerse caliente", "El sol es muy fuerte" y "Lo último que haces cuando cocinas la cena es lavar los platos". La base de datos también contiene información sobre el contenido emocional de las situaciones, en afirmaciones como "Pasar tiempo con amigos causa felicidad" y "Tener un accidente de coche hace que uno se enoje". OMCS contiene información sobre los deseos y objetivos de las personas, tanto grandes como pequeños, como "La gente quiere ser respetada" y "La gente quiere un buen café". ^[1]

Originalmente, estas afirmaciones se podían introducir en el sitio web como oraciones de texto sin restricciones, que debían analizarse más tarde. La versión actual del sitio web recopila información únicamente mediante plantillas más estructuradas para rellenar espacios en blanco. OMCS también utiliza datos recopilados por el juego con un propósito "Verbosity". ^[4]

En su forma nativa, la base de datos OMCS es simplemente una colección de oraciones cortas que transmiten un conocimiento común. Para poder utilizar este conocimiento computacionalmente, debe transformarse en una representación más estructurada.

ConceptoNet

ConceptNet es una red semántica basada en la información de la base de datos OMCS. ConceptNet se expresa como un gráfico dirigido cuyos nodos son conceptos y cuyos bordes son afirmaciones de sentido común sobre estos conceptos. Los conceptos representan conjuntos de frases de lenguaje natural estrechamente relacionadas, que pueden ser frases nominales, frases verbales, frases adjetivas u oraciones. ^[5]

ConceptNet se crea a partir de las afirmaciones en lenguaje natural de OMCS comparándolas con patrones mediante un analizador sintáctico superficial. Las afirmaciones se expresan como relaciones entre dos conceptos, seleccionados de un conjunto limitado de relaciones posibles. Las diversas relaciones representan patrones de oraciones comunes que se encuentran en el corpus de OMCS y, en particular, cada plantilla de "completar espacios en blanco" utilizada en el sitio web de recopilación de conocimientos está asociada con una relación particular. ^[5]

Las estructuras de datos que componen ConceptNet se reorganizaron significativamente en 2007 y se publicaron como ConceptNet 3. ^[5] El grupo de Agentes de Software distribuye actualmente una base de datos y una API para la nueva versión 4.0. ^[6]

En 2010, la cofundadora y directora de OMCS, Catherine Havasi, junto con Robyn Speer, Dennis Clark y Jason Alonso, crearon Luminoso , una empresa de software de análisis de texto que se basa en ConceptNet. ^[7]^[8]^[9]^[10] Utiliza ConceptNet como su principal recurso léxico para ayudar a las empresas a comprender y obtener información de grandes cantidades de datos cualitativos, incluidas encuestas, reseñas de productos y redes sociales. ^[7]^[11]^[12]

Herramientas de aprendizaje automático

La información contenida en ConceptNet se puede utilizar como base para algoritmos de aprendizaje automático . Una representación, denominada AnalogySpace, utiliza la descomposición en valores singulares para generalizar y representar patrones en el conocimiento de ConceptNet, de forma que pueda utilizarse en aplicaciones de IA. Sus creadores distribuyen un kit de herramientas de aprendizaje automático de Python llamado Divisi ^[13] para realizar aprendizaje automático basado en corpus de texto, bases de conocimiento estructuradas como ConceptNet y combinaciones de ambos.

Comparación con otros proyectos

Otros proyectos similares incluyen Never-Ending Language Learning , Mindpixel (descontinuado), Cyc , Learner, SenticNet, Freebase , YAGO , DBpedia y Open Mind 1001 Questions, que han explorado enfoques alternativos para recopilar conocimiento y proporcionar incentivos para la participación.

El proyecto Open Mind Common Sense se diferencia de Cyc porque se ha centrado en representar el conocimiento de sentido común que ha recopilado como oraciones en inglés, en lugar de utilizar una estructura lógica formal. Uno de sus creadores, Hugo Liu, describe a ConceptNet como una estructura más parecida a WordNet que a Cyc, debido a su "énfasis en la conectividad conceptual informal por encima del rigor lingüístico formal". ^[14]

También existe la iniciativa brasileña Open Mind Common Sense in Brazil (OMCS-Br), liderada por el Laboratorio de Interacción Avanzada de la Universidad Federal de São Carlos ( LIA-UFSCar ). Este proyecto, que comenzó en 2005 en colaboración con el Grupo de Agentes de Software del MIT Media Lab, tiene como objetivo principal recopilar el sentido común expresado en portugués brasileño y utilizarlo para desarrollar aplicaciones de software culturalmente sensibles basadas en la extracción de conocimientos de perfiles culturales de ConceptNet. Esto tiene como objetivo ayudar a los desarrolladores y usuarios con un software de contenido culturalmente contextualizado, haciendo que las aplicaciones finales sean más flexibles, adaptables, accesibles y utilizables. Las principales aplicaciones se centran en la educación y la atención sanitaria. ^{[ cita requerida ]}

Véase también

Referencias

^ por Robyn Speer, Catherine Havasi y Henry Lieberman. AnalogySpace: Reducción de la dimensionalidad del conocimiento del sentido común Archivado el 9 de julio de 2010 en Wayback Machine . AAAI 2008.
^ Catherine Havasi. Descubrimiento de relaciones semánticas mediante técnicas basadas en la descomposición en valores singulares. Tesis doctoral, Brandeis University, junio de 2009.
^ MIT News Office (8 de marzo de 2006). "Se ha programado un servicio conmemorativo para mañana en honor de Pushpinder Singh". MIT Tech Talk . Consultado el 7 de octubre de 2009 .
^ "Perfil de verbosidad". Open Mind Commons Sense. Archivado desde el original el 25 de junio de 2010.
^ abc Catherine Havasi, Robyn Speer y Jason Alonso. ConceptNet 3: una red semántica flexible y multilingüe para el conocimiento del sentido común. Actas de los últimos avances en el procesamiento del lenguaje natural, 2007. Pruebe ConceptNet 3:... Archivado el 29 de mayo de 2015 en Wayback Machine.
^ Iniciativa de computación con sentido común (24 de febrero de 2009). «API ConceptNet en Launchpad» . Consultado el 7 de octubre de 2009 .
^ ab Lohr, Steve (27 de junio de 2014). "El partido entre Estados Unidos y Alemania a través de las redes sociales". New York Times . Consultado el 3 de marzo de 2015 .
^ Rusli, Evelyn (14 de abril de 2014). "Las empresas utilizan la inteligencia artificial para captar las opiniones de los compradores". The Wall Street Journal . Consultado el 3 de marzo de 2015 .
^ Alba, Davey (12 de febrero de 2015). "La startup que te ayuda a analizar las conversaciones de Twitter en tiempo real". Wired . Consultado el 3 de marzo de 2015 .
^ Noyes, Katherine (11 de febrero de 2015). «Luminoso para empresas: esto es lo que realmente significa todo ese parloteo». PC World . Consultado el 3 de marzo de 2015 .
^ Miller, Ron (2 de julio de 2014). "Luminoso obtiene $6,5 millones en la Serie A para seguir desarrollando un servicio de análisis de texto en la nube". TechCrunch . Consultado el 3 de marzo de 2015 .
^ Darrow, Barb (11 de febrero de 2015). "Luminoso incorpora su inteligencia de análisis de texto a la transmisión de datos". GigaOm . Consultado el 3 de marzo de 2015 .
^ Commonsense Computing Initiative (24 de febrero de 2009). "Divisi en Launchpad" . Consultado el 7 de octubre de 2009 .
^ "El proyecto ConceptNet V2.1" . Consultado el 17 de diciembre de 2008 .

Enlaces externos

Mente abierta, sentido común
Meta-repositorio de Open Mind Common Sense en Github
ConceptoNet
AnalogíaEspacio
El conjunto de herramientas de inferencia de Divisi
Página web de Commonsense Computing Initiative (El sitio no existe)
La Iniciativa de Mente Abierta (Sitio no existente)
OMCSNetCPP: motor de inferencia C++ de código abierto que utiliza los datos de OMCSNet
Mente abierta y sentido común en Brasil (Sitio web roto)
Sentido común a corazón abierto: sentido común emocional con arte (página Legacy)
Laboratorio de Interacción Avanzada