El análisis superficial (también chunking o análisis ligero ) es un análisis de una oración que primero identifica las partes constituyentes de las oraciones (sustantivos, verbos, adjetivos, etc.) y luego las vincula a unidades de orden superior que tienen significados gramaticales discretos ( grupos de sustantivos o frases , grupos de verbos, etc.). Mientras que los algoritmos de chunking más elementales simplemente vinculan las partes constituyentes sobre la base de patrones de búsqueda elementales (por ejemplo, como se especifica mediante expresiones regulares ), los enfoques que utilizan técnicas de aprendizaje automático (clasificadores, modelado de temas , etc.) pueden tener en cuenta la información contextual y, por lo tanto, componer fragmentos de tal manera que reflejen mejor las relaciones semánticas entre los constituyentes básicos. [1] Es decir, estos métodos más avanzados evitan el problema de que las combinaciones de constituyentes elementales pueden tener diferentes significados de nivel superior según el contexto de la oración.
Se trata de una técnica muy utilizada en el procesamiento del lenguaje natural . Es similar al concepto de análisis léxico para lenguajes informáticos. Con el nombre de "hipótesis de la estructura superficial", también se utiliza como explicación de por qué los estudiantes de una segunda lengua a menudo no logran analizar correctamente oraciones complejas. [2]
{{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace )