El análisis superficial (también fragmentación o análisis ligero ) es un análisis de una oración que primero identifica las partes constituyentes de las oraciones (sustantivos, verbos, adjetivos, etc.) y luego las vincula a unidades de orden superior que tienen significados gramaticales discretos ( grupos de sustantivos o frases) . , grupos verbales, etc.). Mientras que los algoritmos de fragmentación más elementales simplemente vinculan partes constituyentes sobre la base de patrones de búsqueda elementales (por ejemplo, según lo especificado por expresiones regulares ), los enfoques que utilizan técnicas de aprendizaje automático (clasificadores, modelado de temas , etc.) pueden tener en cuenta información contextual y, por lo tanto, componer fragmentos de tal manera que reflejen mejor las relaciones semánticas entre los constituyentes básicos. [1] Es decir, estos métodos más avanzados solucionan el problema de que las combinaciones de constituyentes elementales pueden tener diferentes significados de nivel superior dependiendo del contexto de la oración.
Es una técnica muy utilizada en el procesamiento del lenguaje natural . Es similar al concepto de análisis léxico para lenguajes informáticos. Bajo el nombre de "hipótesis de estructura superficial", también se utiliza como una explicación de por qué los estudiantes de una segunda lengua a menudo no logran analizar correctamente oraciones complejas. [2]
{{cite journal}}
: Mantenimiento CS1: varios nombres: lista de autores ( enlace )