El análisis semántico , también denominado relación semántica , es el uso de ontologías para analizar el contenido de los recursos web . Este campo de investigación combina análisis de texto y tecnologías de Web Semántica como RDF . La analítica semántica mide la relación de diferentes conceptos ontológicos.
Algunos grupos de investigación académica que tienen proyectos activos en esta área incluyen el Centro Kno.e.sis de la Universidad Estatal de Wright, entre otros.
En 1996 se produjo un hito importante en los inicios de la analítica semántica, aunque la progresión histórica de estos algoritmos es en gran medida subjetiva. En la publicación de su estudio fundamental, Philip Resnik estableció que las computadoras tienen la capacidad de emular el juicio humano. Abarcando las publicaciones de múltiples revistas, las mejoras en la precisión de los cálculos analíticos semánticos generales pretendían revolucionar el campo. Sin embargo, la falta de una terminología estándar a finales de la década de 1990 fue la causa de mucha falta de comunicación. Esto llevó a Budanitsky & Hirst a estandarizar el tema en 2006 con un resumen que también estableció un marco para el análisis moderno de ortografía y gramática. [1]
En los primeros días del análisis semántico, era difícil obtener bases de conocimiento suficientemente grandes y confiables. En 2006, Strube y Ponzetto demostraron que Wikipedia podía utilizarse en cálculos analíticos semánticos. [2] El uso de una gran base de conocimientos como Wikipedia permite aumentar tanto la precisión como la aplicabilidad del análisis semántico.
Dada la naturaleza subjetiva del campo, los diferentes métodos utilizados en análisis semántico dependen del dominio de aplicación. Ningún método singular se considera correcto; sin embargo, uno de los métodos más efectivos y aplicables es el análisis semántico explícito (ESA). [3] La ESA fue desarrollada por Evgeniy Gabrilovich y Shaul Markovitch a finales de la década de 2000. [4] Utiliza técnicas de aprendizaje automático para crear un intérprete semántico, que extrae fragmentos de texto de artículos en una lista ordenada. Los fragmentos se ordenan según su relación con el texto circundante.
El análisis semántico latente (LSA) es otro método común que no utiliza ontologías, solo considera el texto en el espacio de entrada.
La aplicación de métodos de análisis semántico generalmente agiliza los procesos organizacionales de cualquier sistema de gestión del conocimiento. Las bibliotecas académicas suelen utilizar una aplicación de dominio específico para crear un sistema organizativo más eficiente. Al clasificar las publicaciones científicas utilizando la semántica y Wikipedia, los investigadores ayudan a las personas a encontrar recursos más rápido. Los motores de búsqueda como Semantic Scholar brindan acceso organizado a millones de artículos.