En la inteligencia artificial (IA), el razonamiento basado en el sentido común es una capacidad similar a la humana para hacer suposiciones sobre el tipo y la esencia de las situaciones ordinarias que los seres humanos afrontan todos los días. Estas suposiciones incluyen juicios sobre la naturaleza de los objetos físicos, las propiedades taxonómicas y las intenciones de las personas. Un dispositivo que exhiba razonamiento basado en el sentido común podría ser capaz de extraer conclusiones similares a la psicología popular de los seres humanos (la capacidad innata de los seres humanos para razonar sobre el comportamiento y las intenciones de las personas) y a la física ingenua (la comprensión natural de los seres humanos del mundo físico). [1]
Algunas definiciones y caracterizaciones del sentido común de diferentes autores incluyen:
El profesor de la Universidad de Nueva York Ernest Davis caracteriza el conocimiento de sentido común como "lo que un niño típico de siete años sabe sobre el mundo", incluidos los objetos físicos, las sustancias, las plantas, los animales y la sociedad humana. Por lo general, excluye el aprendizaje mediante libros, el conocimiento especializado y el conocimiento de las convenciones; pero a veces incluye el conocimiento sobre esos temas. Por ejemplo, saber jugar a las cartas es un conocimiento especializado, no un "conocimiento de sentido común"; pero saber que la gente juega a las cartas por diversión sí cuenta como "conocimiento de sentido común". [7]
En comparación con los humanos, la IA actual carece de varias características del razonamiento de sentido común humano; en particular, los humanos tienen mecanismos poderosos para razonar sobre la " física ingenua ", como el espacio, el tiempo y las interacciones físicas. Esto permite que incluso los niños pequeños hagan inferencias fácilmente como "Si hago rodar este bolígrafo desde una mesa, caerá al suelo". Los humanos también tienen un poderoso mecanismo de " psicología popular " que los ayuda a interpretar oraciones en lenguaje natural como "Los concejales de la ciudad negaron un permiso a los manifestantes porque abogaban por la violencia". (Una IA genérica tiene dificultades para discernir si los que supuestamente abogan por la violencia son los concejales o los manifestantes). [1] [8] [9] Esta falta de "conocimiento común" significa que la IA a menudo comete errores diferentes a los de los humanos, de maneras que pueden parecer incomprensibles. Por ejemplo, los automóviles autónomos existentes no pueden razonar sobre la ubicación ni las intenciones de los peatones de la misma manera que lo hacen los humanos, y en su lugar deben usar modos de razonamiento no humanos para evitar accidentes. [10] [11] [12]
Los subtemas superpuestos del razonamiento de sentido común incluyen cantidades y medidas, tiempo y espacio, física, mentes, sociedad, planes y objetivos, y acciones y cambio. [13]
El problema del conocimiento del sentido común es un proyecto actual en el ámbito de la inteligencia artificial para crear una base de datos que contenga el conocimiento general que se espera que tengan la mayoría de los individuos, representado de forma accesible a los programas de inteligencia artificial [14] que utilizan lenguaje natural. Debido al amplio alcance del conocimiento del sentido común, este problema se considera uno de los problemas más difíciles en la investigación de la IA. [15] Para que cualquier tarea se realice como lo haría una mente humana, se requiere que la máquina parezca tan inteligente como un ser humano. Tales tareas incluyen el reconocimiento de objetos , la traducción automática y la minería de texto . Para realizarlas, la máquina tiene que ser consciente de los mismos conceptos que reconoce un individuo, que posee conocimiento de sentido común.
En 1961, Bar Hillel fue el primero en analizar la necesidad y la importancia del conocimiento práctico para el procesamiento del lenguaje natural en el contexto de la traducción automática. [16] Algunas ambigüedades se resuelven mediante el uso de reglas sencillas y fáciles de adquirir. Otras requieren un amplio conocimiento del mundo circundante, por lo que requieren un conocimiento más basado en el sentido común. Por ejemplo, cuando se utiliza una máquina para traducir un texto, surgen problemas de ambigüedad que podrían resolverse fácilmente si se logra una comprensión concreta y verdadera del contexto. Los traductores en línea a menudo resuelven las ambigüedades utilizando palabras análogas o similares. Por ejemplo, al traducir las oraciones "El electricista está trabajando" y "El teléfono está funcionando" al alemán, la máquina traduce correctamente "trabajando" en el sentido de "laborando" en la primera y como "funcionando correctamente" en la segunda. La máquina ha visto y leído en el cuerpo de los textos que las palabras alemanas para "laborando" y "electricista" se utilizan con frecuencia en una combinación y se encuentran juntas. Lo mismo se aplica a "teléfono" y "funcionando correctamente". Sin embargo, el proxy estadístico que funciona en casos simples a menudo falla en casos complejos. Los programas informáticos existentes realizan tareas lingüísticas simples manipulando frases cortas o palabras sueltas, pero no intentan una comprensión más profunda y se centran en resultados a corto plazo.
Este tipo de problemas surgen en la visión artificial. [1] [17] Por ejemplo, al mirar una fotografía de un baño, algunos elementos que son pequeños y solo se ven parcialmente, como toallitas y botellas, son reconocibles debido a los objetos circundantes (inodoro, lavabo, bañera), que sugieren el propósito de la habitación. En una imagen aislada, sería difícil identificarlos. Las películas resultan ser tareas aún más difíciles. Algunas películas contienen escenas y momentos que no se pueden entender simplemente haciendo coincidir plantillas memorizadas con imágenes. Por ejemplo, para comprender el contexto de la película, el espectador debe hacer inferencias sobre las intenciones de los personajes y hacer presunciones en función de su comportamiento. En el estado actual de la técnica, es imposible construir y administrar un programa que realice tareas como el razonamiento, es decir, predecir las acciones de los personajes. Lo máximo que se puede hacer es identificar acciones básicas y rastrear a los personajes.
La necesidad e importancia del razonamiento basado en el sentido común en robots autónomos que trabajan en un entorno real sin control es evidente. Por ejemplo, si un robot está programado para realizar las tareas de un camarero en una fiesta y ve que el vaso que había cogido está roto, el robot-camarero no debería verter el líquido en el vaso, sino coger otro. Estas tareas parecen obvias cuando un individuo posee un razonamiento basado en el sentido común, pero garantizar que un robot evite tales errores es todo un reto. [1]
Se han logrado avances significativos en el campo del razonamiento automatizado de sentido común en las áreas del razonamiento taxonómico, el razonamiento de acciones y cambios y el razonamiento sobre el tiempo. Cada una de estas esferas tiene una teoría bien reconocida para una amplia gama de inferencias de sentido común. [18]
La taxonomía es el conjunto de individuos y categorías y sus relaciones. Tres relaciones básicas son:
La transitividad es un tipo de inferencia en taxonomía. Dado que Tweety es una instancia de robin y robin es un subconjunto de bird , se deduce que Tweety es una instancia de bird . La herencia es otro tipo de inferencia. Dado que Tweety es una instancia de robin , que es un subconjunto de bird y bird está marcado con la propiedad canfly , se deduce que Tweety y robin tienen la propiedad canfly . Cuando un individuo taxonomiza categorías más abstractas, delinear y delimitar categorías específicas se vuelve más problemático. Las estructuras taxonómicas simples se utilizan con frecuencia en programas de IA. Por ejemplo, WordNet es un recurso que incluye una taxonomía, cuyos elementos son significados de palabras en inglés. Los sistemas de minería web utilizados para recopilar conocimiento de sentido común de documentos web se centran en las relaciones taxonómicas y, específicamente, en la recopilación de relaciones taxonómicas. [1]
La teoría de la acción, los acontecimientos y el cambio es otro ámbito del razonamiento de sentido común. [19] Existen métodos de razonamiento establecidos para dominios que satisfacen las restricciones que se enumeran a continuación:
El razonamiento temporal es la capacidad de hacer presunciones sobre el conocimiento que tienen los humanos de tiempos, duraciones e intervalos de tiempo. Por ejemplo, si un individuo sabe que Mozart nació después de Haydn y murió antes que él, puede usar su conocimiento de razonamiento temporal para deducir que Mozart había muerto más joven que Haydn. Las inferencias involucradas se reducen a resolver sistemas de desigualdades lineales. [20] Integrar ese tipo de razonamiento con propósitos concretos, como la interpretación del lenguaje natural , es más desafiante, porque las expresiones del lenguaje natural tienen una interpretación dependiente del contexto. [21] Las tareas simples como asignar marcas de tiempo a los procedimientos no se pueden realizar con total precisión.
El razonamiento cualitativo [22] es la forma de razonamiento de sentido común analizada con cierto éxito. Se ocupa de la dirección del cambio en cantidades interrelacionadas. Por ejemplo, si el precio de una acción sube, la cantidad de acciones que se van a vender bajará. Si algún ecosistema contiene lobos y corderos y el número de lobos disminuye, la tasa de mortalidad de los corderos también bajará. Esta teoría fue formulada por primera vez por Johan de Kleer, quien analizó un objeto que se movía en una montaña rusa. La teoría del razonamiento cualitativo se aplica en muchas esferas, como la física, la biología, la ingeniería, la ecología, etc. Sirve como base para muchos programas prácticos, mapeo analógico y comprensión de textos.
A partir de 2014, existen algunos sistemas comerciales que intentan hacer que el uso del razonamiento de sentido común sea significativo. Sin embargo, utilizan información estadística como sustituto del conocimiento de sentido común, donde el razonamiento está ausente. Los programas actuales manipulan palabras individuales, pero no intentan ni ofrecen una comprensión más profunda. Según Ernest Davis y Gary Marcus , cinco obstáculos principales interfieren con la producción de un "razonador de sentido común" satisfactorio. [1]
En comparación con los humanos, a partir de 2018 los programas informáticos existentes tienen un rendimiento extremadamente bajo en las pruebas de referencia modernas de "razonamiento de sentido común", como el Winograd Schema Challenge . [23] Se considera que el problema de alcanzar una competencia a nivel humano en tareas de "conocimiento de sentido común" probablemente sea " completo para la IA " (es decir, resolverlo requeriría la capacidad de sintetizar una inteligencia a nivel humano ). [24] [25] Algunos investigadores creen que los datos de aprendizaje supervisado son insuficientes para producir una inteligencia general artificial capaz de razonar con sentido común y, por lo tanto, han recurrido a técnicas de aprendizaje menos supervisadas. [26]
El estudio del razonamiento de Commonsense se divide en enfoques basados en el conocimiento y enfoques que se basan en el aprendizaje automático sobre un gran corpus de datos y que lo utilizan con interacciones limitadas entre estos dos tipos de enfoques [ cita requerida ] . También existen enfoques de colaboración colectiva, que intentan construir una base de conocimiento vinculando el conocimiento colectivo y el aporte de personas no expertas. Los enfoques basados en el conocimiento se pueden separar en enfoques basados en la lógica matemática [ cita requerida ] .
En los enfoques basados en el conocimiento, los expertos analizan las características de las inferencias que se requieren para razonar en un área específica o para una tarea determinada. Los enfoques basados en el conocimiento consisten en enfoques basados en matemáticas, enfoques informales basados en el conocimiento y enfoques a gran escala. Los enfoques basados en matemáticas son puramente teóricos y el resultado es un documento impreso en lugar de un programa. El trabajo se limita a la gama de dominios y las técnicas de razonamiento sobre las que se está reflexionando. En los enfoques informales basados en el conocimiento, las teorías del razonamiento se basan en datos anecdóticos e intuiciones que son resultados de la psicología conductual empírica. Los enfoques informales son comunes en la programación informática. Otras dos técnicas populares para extraer conocimiento de sentido común de documentos web son la minería web y el crowdsourcing .
COMET (2019), que utiliza tanto la arquitectura del modelo de lenguaje GPT de OpenAI como las bases de conocimiento de sentido común existentes, como ConceptNet , afirma generar inferencias de sentido común a un nivel que se acerca a los puntos de referencia humanos. Al igual que muchos otros esfuerzos actuales, COMET se basa demasiado en patrones de lenguaje superficiales y se considera que carece de una comprensión profunda a nivel humano de muchos conceptos de sentido común. Otros enfoques de modelos de lenguaje incluyen el entrenamiento en escenas visuales en lugar de solo texto, y el entrenamiento en descripciones textuales de escenarios que involucran física de sentido común. [6] [27]
{{cite journal}}
: Requiere citar revista |journal=
( ayuda )