Una red semántica , o red de marcos , es una base de conocimiento que representa relaciones semánticas entre conceptos en una red. Esto se usa a menudo como una forma de representación del conocimiento . Es un gráfico dirigido o no dirigido que consta de vértices , que representan conceptos , y aristas , que representan relaciones semánticas entre conceptos , [1] que mapean o conectan campos semánticos . Una red semántica puede instanciarse como, por ejemplo, una base de datos de gráficos o un mapa conceptual . Las redes semánticas estandarizadas típicas se expresan como triples semánticos .
Las redes semánticas se utilizan en aplicaciones de neurolingüística y procesamiento del lenguaje natural , como el análisis semántico [2] y la desambiguación del sentido de las palabras . [3] Las redes semánticas también se pueden utilizar como método para analizar textos extensos e identificar los temas y tópicos principales (por ejemplo, de publicaciones en redes sociales ), para revelar sesgos (por ejemplo, en la cobertura de noticias) o incluso para mapear un campo de investigación completo. [4]
Los ejemplos del uso de redes semánticas en lógica , como los grafos acíclicos dirigidos como herramienta mnemotécnica, se remontan a siglos atrás. El primer uso documentado se remonta al comentario del filósofo griego Porfirio sobre las categorías de Aristóteles en el siglo III d. C.
En la historia de la informática , las "Redes Semánticas" para el cálculo proposicional fueron implementadas por primera vez para computadoras por Richard H. Richens de la Unidad de Investigación de Lenguaje de Cambridge en 1956 como una " interlingua " para la traducción automática de lenguajes naturales , [5] aunque la importancia de este trabajo y de la Unidad de Investigación de Lenguaje de Cambridge se comprendió sólo tardíamente.
Las redes semánticas también fueron implementadas independientemente por Robert F. Simmons [6] y Sheldon Klein, usando el cálculo de predicados de primer orden como base, después de ser inspirados por una demostración de Victor Yngve . La "línea de investigación fue originada por el primer presidente de la Asociación de Lingüística Computacional , Victor Yngve, quien en 1960 había publicado descripciones de algoritmos para usar una gramática de estructura de frase para generar oraciones sin sentido sintácticamente bien formadas. Sheldon Klein y yo alrededor de 1962-1964 estábamos fascinados por la técnica y la generalizamos a un método para controlar el sentido de lo que se generaba respetando las dependencias semánticas de las palabras tal como aparecían en el texto". [7] Otros investigadores, más notablemente M. Ross Quillian [8] y otros en System Development Corporation ayudaron a contribuir a su trabajo a principios de la década de 1960 como parte del proyecto SYNTHEX. Son estas publicaciones de System Development Corporation las que la mayoría de los derivados modernos del término "red semántica" citan como antecedentes. Trabajos posteriores destacados fueron realizados por Allan M. Collins y Quillian (por ejemplo, Collins y Quillian; [9] [10] Collins y Loftus [11] Quillian [12] [13] [14] [15] ). Aún más tarde, en 2006, Hermann Helbig describió completamente MultiNet . [16]
A finales de la década de 1980, dos universidades de los Países Bajos , Groningen y Twente , comenzaron conjuntamente un proyecto llamado Gráficos de conocimiento , que son redes semánticas pero con la restricción adicional de que los bordes están restringidos a ser de un conjunto limitado de relaciones posibles, para facilitar las álgebras en el gráfico . [17] En las décadas siguientes, la distinción entre redes semánticas y gráficos de conocimiento se desdibujó. [18] [19] En 2012, Google le dio a su gráfico de conocimiento el nombre de Gráfico de conocimiento .
La red de enlaces semánticos se estudió sistemáticamente como un método de redes sociales semánticas . Su modelo básico consiste en nodos semánticos, enlaces semánticos entre nodos y un espacio semántico que define la semántica de los nodos y enlaces y reglas de razonamiento sobre enlaces semánticos. La teoría y el modelo sistemáticos se publicaron en 2004. [20] Esta dirección de investigación se puede rastrear hasta la definición de reglas de herencia para la recuperación eficiente del modelo en 1998 [21] y el Active Document Framework ADF. [22] Desde 2003, la investigación se ha desarrollado hacia las redes semánticas sociales. [23] Este trabajo es una innovación sistemática en la era de la World Wide Web y las redes sociales globales en lugar de una aplicación o una simple extensión de la Red Semántica (Red). Su propósito y alcance son diferentes de los de la Red Semántica (o red). [24] Las reglas para el razonamiento y la evolución y el descubrimiento automático de enlaces implícitos juegan un papel importante en la Red de Enlaces Semánticos. [25] [26] Recientemente se ha desarrollado para apoyar la Inteligencia Ciberfísica-Social. [27] Se utilizó para crear un método de resumen general. [28] La Red de Enlace Semántico autoorganizada se integró con un espacio de categorías multidimensional para formar un espacio semántico para apoyar aplicaciones avanzadas con abstracciones multidimensionales y enlaces semánticos autoorganizados. [29] [30] Se ha verificado que la Red de Enlace Semántico juega un papel importante en la comprensión y representación a través de aplicaciones de resumen de texto . [31] [32] La Red de Enlace Semántico se ha extendido desde el ciberespacio al espacio ciberfísico-social. La relación de competencia y la relación de simbiosis, así como sus roles en la sociedad en evolución, se estudiaron en el tema emergente: Inteligencia Ciberfísica-Social. [33]
Se han creado formas más especializadas de redes semánticas para usos específicos. Por ejemplo, en 2008, la tesis doctoral de Fawsy Bendeck formalizó la Red de Similitud Semántica (SSN, por sus siglas en inglés), que contiene relaciones especializadas y algoritmos de propagación para simplificar la representación y los cálculos de la similitud semántica . [34]
Una red semántica se utiliza cuando se tiene conocimiento que se entiende mejor como un conjunto de conceptos relacionados entre sí.
La mayoría de las redes semánticas tienen una base cognitiva. Consisten en arcos (radios) y nodos (centros) que pueden organizarse en una jerarquía taxonómica. También es posible conectar distintas redes semánticas mediante nodos puente. Las redes semánticas contribuyeron a las ideas de propagación de la activación , la herencia y los nodos como protoobjetos.
Un proceso de construcción de redes semánticas, también conocidas como redes de coocurrencia , incluye la identificación de palabras clave en el texto, el cálculo de las frecuencias de coocurrencia y el análisis de las redes para encontrar palabras centrales y grupos de temas en la red. [35]
En el campo de la lingüística , las redes semánticas representan la forma en que la mente humana maneja los conceptos asociados. Normalmente, los conceptos en una red semántica pueden tener una de dos relaciones diferentes: semántica o asociativa.
Si son semánticas, los dos conceptos están vinculados por cualquiera de las siguientes relaciones semánticas: sinonimia , antonimia , hiperonimia , hiponimia , holonimia , meronimia , metonimia o polisemia . Estas no son las únicas relaciones semánticas, pero sí algunas de las más comunes.
Si la relación es asociativa, los dos conceptos están vinculados en función de la frecuencia con la que aparecen juntos. Estas asociaciones son accidentales, lo que significa que no hay nada en sus significados individuales que los obligue a estar asociados entre sí, sino que normalmente lo están. Ejemplos de esto serían cerdo y granja, cerdo y comedero, o cerdo y barro. Si bien no hay nada en el significado de cerdo que lo obligue a estar asociado con granjas, ya que los cerdos pueden ser salvajes, el hecho de que los cerdos se encuentren con tanta frecuencia en granjas crea una relación de asociación accidental. Estas relaciones temáticas son comunes dentro de las redes semánticas y son resultados notables en las pruebas de asociación libre .
A medida que se da la palabra inicial, comienza la activación de los conceptos más estrechamente relacionados, que se extienden hacia los conceptos menos asociados. Un ejemplo de esto sería la palabra inicial cerdo que da lugar a mamífero, luego animal y luego respira. Este ejemplo muestra que las relaciones taxonómicas son inherentes a las redes semánticas. Los conceptos más estrechamente relacionados suelen compartir características semánticas , que son determinantes de las puntuaciones de similitud semántica. Las palabras con puntuaciones de similitud más altas están más estrechamente relacionadas, por lo que tienen una mayor probabilidad de ser una palabra cercana en la red semántica.
Estas relaciones pueden sugerirse al cerebro mediante el priming , en el que se muestran ejemplos previos de la misma relación antes de que se muestre la palabra objetivo. El efecto del priming en la vinculación de una red semántica se puede ver a través de la velocidad del tiempo de reacción a la palabra. El priming puede ayudar a revelar la estructura de una red semántica y qué palabras están más estrechamente asociadas con la palabra original.
La interrupción de una red semántica puede provocar un déficit semántico, que no es lo mismo que una demencia semántica .
También existe una manifestación física de las relaciones semánticas en el cerebro. Los circuitos semánticos específicos de categorías muestran que las palabras que pertenecen a diferentes categorías se procesan en circuitos ubicados de manera diferente en todo el cerebro. Por ejemplo, los circuitos semánticos para una palabra asociada con la cara o la boca (como lamer) se ubican en un lugar diferente del cerebro que una palabra asociada con la pierna o el pie (como patear). Este es un resultado principal de un estudio de 2013 publicado por Friedemann Pulvermüller [ cita requerida ] . Estos circuitos semánticos están directamente vinculados a sus áreas sensoriomotoras del cerebro. Esto se conoce como semántica corporizada, un subtema del procesamiento del lenguaje corporizado .
Si se produce un daño cerebral, el procesamiento normal de las redes semánticas podría verse alterado, lo que llevaría a una preferencia sobre qué tipo de relaciones dominan la red semántica en la mente.
El siguiente código muestra un ejemplo de una red semántica en el lenguaje de programación Lisp utilizando una lista de asociación .
( setq *database* ' (( canario ( es-un pájaro ) ( color amarillo ) ( tamaño pequeño )) ( pingüino ( es-un pájaro ) ( movimiento nadar )) ( pájaro ( es-un vertebrado ) ( tiene-parte alas ) ( reproducción puesta de huevos ))))
Para extraer toda la información sobre el tipo "canario", se utilizaría la assoc
función con una clave de "canario". [36]
Un ejemplo de red semántica es WordNet , una base de datos léxica del inglés . Agrupa las palabras inglesas en conjuntos de sinónimos llamados synsets , proporciona definiciones breves y generales y registra las diversas relaciones semánticas entre estos conjuntos de sinónimos. Algunas de las relaciones semánticas más comunes definidas son la meronimia (A es un merónimo de B si A es parte de B), la holonimia (B es un holónimo de A si B contiene a A), la hiponimia (o troponimia ) (A es subordinada de B; A es una especie de B), la hiperonimia (A es superordinada de B), la sinonimia (A denota lo mismo que B) y la antonimia (A denota lo opuesto de B).
Las propiedades de WordNet se han estudiado desde una perspectiva de teoría de redes y se han comparado con otras redes semánticas creadas a partir del tesauro de Roget y tareas de asociación de palabras . Desde esta perspectiva, las tres son una estructura de mundo pequeño . [37]
También es posible representar descripciones lógicas utilizando redes semánticas como los grafos existenciales de Charles Sanders Peirce o los grafos conceptuales relacionados de John F. Sowa . [1] Estos tienen un poder expresivo igual o superior a la lógica de predicados de primer orden estándar . A diferencia de WordNet u otras redes léxicas o de navegación, las redes semánticas que utilizan estas representaciones se pueden utilizar para una deducción lógica automatizada confiable. Algunos razonadores automáticos explotan las características de teoría de grafos de las redes durante el procesamiento.
Otros ejemplos de redes semánticas son los modelos Gellish . El inglés Gellish , con su diccionario Gellish English , es un lenguaje formal que se define como una red de relaciones entre conceptos y nombres de conceptos. El inglés Gellish es un subconjunto formal del inglés natural, al igual que el holandés Gellish es un subconjunto formal del holandés, mientras que varios idiomas comparten los mismos conceptos. Otras redes Gellish consisten en modelos de conocimiento y modelos de información que se expresan en el lenguaje Gellish. Una red Gellish es una red de relaciones (binarias) entre cosas. Cada relación en la red es una expresión de un hecho que se clasifica por un tipo de relación. Cada tipo de relación en sí es un concepto que se define en el diccionario del lenguaje Gellish. Cada cosa relacionada es un concepto o una cosa individual que se clasifica por un concepto. Las definiciones de conceptos se crean en forma de modelos de definición (redes de definición) que juntos forman un diccionario Gellish. Una red Gellish se puede documentar en una base de datos Gellish y es interpretable por computadora.
SciCrunch es una base de conocimiento editada de forma colaborativa para recursos científicos. Proporciona identificadores inequívocos (identificadores de recursos de investigación o RRID) para software, herramientas de laboratorio, etc. y también ofrece opciones para crear vínculos entre RRID y comunidades.
Otro ejemplo de redes semánticas, basadas en la teoría de categorías , son los ologs . En este caso, cada tipo es un objeto que representa un conjunto de cosas y cada flecha es un morfismo que representa una función. También se prescriben diagramas conmutativos para limitar la semántica.
En las ciencias sociales, a veces se utiliza el término red semántica para referirse a las redes de coocurrencia . [38] [39] La idea básica es que las palabras que coocurren en una unidad de texto, por ejemplo, una oración, están relacionadas semánticamente entre sí. Los vínculos basados en la coocurrencia se pueden utilizar para construir redes semánticas. Este proceso incluye la identificación de palabras clave en el texto, la construcción de redes de coocurrencia y el análisis de las redes para encontrar palabras centrales y grupos de temas en la red. Es un método particularmente útil para analizar textos grandes y big data . [40]
También existen tipos elaborados de redes semánticas conectadas con conjuntos correspondientes de herramientas de software utilizadas para la ingeniería del conocimiento léxico , como el Sistema de Procesamiento de Redes Semánticas ( SNePS ) de Stuart C. Shapiro [41] o el paradigma MultiNet de Hermann Helbig, [42] especialmente adecuado para la representación semántica de expresiones de lenguaje natural y utilizado en varias aplicaciones de PNL .
Las redes semánticas se utilizan en tareas especializadas de recuperación de información, como la detección de plagio . Proporcionan información sobre relaciones jerárquicas para emplear la compresión semántica con el fin de reducir la diversidad lingüística y permitir que el sistema haga coincidir los significados de las palabras, independientemente de los conjuntos de palabras utilizados.
El Grafo de Conocimiento propuesto por Google en 2012 es en realidad una aplicación de la red semántica en los motores de búsqueda.
El modelado de datos multirelacionales como redes semánticas en espacios de baja dimensión a través de formas de incrustación tiene beneficios en la expresión de relaciones entre entidades, así como en la extracción de relaciones de medios como el texto. Existen muchos enfoques para aprender estas incrustaciones, en particular el uso de marcos de agrupamiento bayesiano o marcos basados en energía, y más recientemente, TransE [43] ( NeurIPS 2013). Las aplicaciones de la incrustación de datos de bases de conocimiento incluyen el análisis de redes sociales y la extracción de relaciones .
La primera red semántica para computadoras fue Nude, creada por RH Richens de la Unidad de Investigación de Lenguajes de Cambridge en 1956 como una interlingua para la traducción automática de lenguajes naturales.
El uso [del término 'gráfico de conocimiento'] ha evolucionado