En la investigación de inteligencia artificial , el conocimiento de sentido común consiste en hechos sobre el mundo cotidiano, como "Los limones son ácidos" o "Las vacas dicen mu", que se espera que todos los humanos conozcan. Actualmente es un problema sin resolver en la inteligencia artificial general . El primer programa de IA que abordó el conocimiento de sentido común fue Advice Taker en 1959 de John McCarthy . [1]
El conocimiento de sentido común puede sustentar un proceso de razonamiento de sentido común , para intentar inferencias como "Podrías hornear un pastel porque quieres que la gente se lo coma". Se puede adjuntar un proceso de procesamiento del lenguaje natural a la base de conocimiento de sentido común para permitir que la base de conocimiento intente responder preguntas sobre el mundo. [2] El conocimiento de sentido común también ayuda a resolver problemas ante la falta de información . Utilizando creencias generalizadas sobre objetos cotidianos, o conocimiento de sentido común , los sistemas de IA hacen suposiciones de sentido común o suposiciones predeterminadas sobre lo desconocido de forma similar a como lo hacen las personas. En un sistema de IA o en inglés, esto se expresa como "Normalmente se cumple P", "Usualmente P" o "Típicamente P, así que supongamos P". Por ejemplo, si conocemos el hecho de que "Tweety es un pájaro", porque conocemos la creencia común sobre los pájaros, "normalmente los pájaros vuelan", sin saber nada más sobre Tweety, podemos asumir razonablemente el hecho de que "Tweety puede volar". A medida que se descubre o aprende más conocimiento del mundo con el tiempo, el sistema de IA puede revisar sus suposiciones sobre Tweety utilizando un proceso de mantenimiento de la verdad . Si más tarde nos enteramos de que "Tweety es un pingüino", entonces el mantenimiento de la verdad revisa esta suposición porque también sabemos que "los pingüinos no vuelan".
El razonamiento de sentido común simula la capacidad humana de usar el conocimiento de sentido común para hacer presunciones sobre el tipo y la esencia de las situaciones ordinarias que encuentran todos los días, y para cambiar sus "mentes" si sale a la luz nueva información. Esto incluye el tiempo, la información faltante o incompleta y la causa y el efecto. La capacidad de explicar la causa y el efecto es un aspecto importante de la IA explicable . Los algoritmos de mantenimiento de la verdad proporcionan automáticamente una facilidad de explicación porque crean registros elaborados de presunciones. En comparación con los humanos, todos los programas informáticos existentes que intentan una IA de nivel humano tienen un rendimiento extremadamente bajo en las pruebas de referencia modernas de "razonamiento de sentido común", como el Desafío de esquemas de Winograd . [3] El problema de alcanzar la competencia de nivel humano en tareas de "conocimiento de sentido común" se considera probablemente " IA completa " (es decir, resolverlo requeriría la capacidad de sintetizar una inteligencia de nivel humano completo), [4] [5] aunque algunos se oponen a esta noción y creen que la inteligencia compasiva también es necesaria para la IA de nivel humano. [6] El razonamiento de sentido común se ha aplicado con éxito en dominios más limitados, como el procesamiento del lenguaje natural [7] [8] y el diagnóstico [9] o análisis automatizado . [10]
La compilación de bases de conocimiento integrales de afirmaciones de sentido común (CSKB, por sus siglas en inglés) es un desafío de larga data en la investigación de IA. Desde los primeros esfuerzos impulsados por expertos como CYC y WordNet , se lograron avances significativos a través del proyecto OpenMind Commonsense de colaboración colectiva , que condujo a la KB ConceptNet de colaboración colectiva. Varios enfoques han intentado automatizar la construcción de CSKB, en particular, a través de la minería de texto (WebChild, Quasimodo, TransOMCS, Ascent), así como la recolección de estos directamente de modelos de lenguaje preentrenados (AutoTOMIC). Estos recursos son significativamente más grandes que ConceptNet, aunque la construcción automatizada en su mayoría los hace de calidad moderadamente inferior. También persisten desafíos en la representación del conocimiento de sentido común: la mayoría de los proyectos CSKB siguen un modelo de datos triple, que no es necesariamente el más adecuado para descomponer afirmaciones de lenguaje natural más complejas. Una excepción notable aquí es GenericsKB, que no aplica más normalización a las oraciones, sino que las conserva en su totalidad.
Alrededor de 2013, los investigadores del MIT desarrollaron BullySpace, una extensión de la base de conocimiento de sentido común ConceptNet , para detectar comentarios burlones en las redes sociales. BullySpace incluía más de 200 afirmaciones semánticas basadas en estereotipos, para ayudar al sistema a inferir que comentarios como "Ponte una peluca y un lápiz labial y sé quien realmente eres" tienen más probabilidades de ser un insulto si se dirigen a un niño que a una niña. [11] [12] [13]
ConceptNet también ha sido utilizado por chatbots [14] y por computadoras que componen ficción original. [15] En el Laboratorio Nacional Lawrence Livermore , el conocimiento del sentido común se utilizó en un agente de software inteligente para detectar violaciones de un tratado de prohibición integral de pruebas nucleares . [16]
A modo de ejemplo, a partir de 2012 ConceptNet incluye estas 21 relaciones independientes del lenguaje: [17]