La gramática de estructura de frase generalizada ( GPSG ) es un marco para describir la sintaxis y la semántica de los lenguajes naturales . Es un tipo de gramática de estructura de frase basada en restricciones . Las gramáticas basadas en restricciones se basan en definir ciertos procesos sintácticos como no gramaticalmente correctos para un idioma determinado y asumir que todo lo que no se descarte de esa manera es gramatical dentro de ese idioma. Las gramáticas de estructura de frase basan su marco en relaciones de circunscripción, considerando las palabras en una oración como jerarquizadas, con algunas palabras dominando a las demás. Por ejemplo, en la oración "El perro corre", "corre" se considera que domina a "perro" ya que es el foco principal de la oración. Esta visión contrasta con las gramáticas de dependencia , que basan su estructura asumida en la relación entre una sola palabra en una oración (la cabeza de la oración) y sus dependientes. [1]
La GPSG fue desarrollada inicialmente a finales de los años 1970 por Gerald Gazdar . Otros colaboradores incluyen a Ewan Klein, Ivan Sag y Geoffrey Pullum . Su libro Generalized Phrase Structure Grammar , publicado en 1985, es la principal monografía sobre la GPSG, especialmente en lo que se refiere a la sintaxis inglesa. La GPSG fue en parte una reacción contra las teorías transformacionales de la sintaxis . De hecho, se afirma que las extensiones de notación a las gramáticas libres de contexto (CFG) desarrolladas en la GPSG hacen que las transformaciones sean redundantes. [2]
Uno de los principales objetivos de GPSG es demostrar que la sintaxis de los lenguajes naturales puede describirse mediante gramáticas de función de contexto (escritas como gramáticas ID/LP ), con algunas convenciones adecuadas destinadas a facilitar la escritura de dichas gramáticas a los sintácticos. Entre estas convenciones se encuentran un sofisticado sistema de estructura de características y las llamadas "metarreglas", que son reglas que generan las producciones de una gramática independiente del contexto. GPSG aumenta aún más las descripciones sintácticas con anotaciones semánticas que pueden utilizarse para calcular el significado compositivo de una oración a partir de su árbol de derivación sintáctica. [3] Sin embargo, se ha argumentado (por ejemplo, por Robert Berwick) que estas extensiones requieren algoritmos de análisis de un orden de complejidad computacional superior al que se utiliza para las gramáticas de función de contexto básicas.
Existen varias formas de representar una oración en la gramática de estructura de frase generalizada. Uno de estos métodos es un árbol sintáctico , que representa todas las palabras de una oración como nodos de hoja en un árbol de análisis, como se puede ver en la imagen proporcionada. Sin embargo, existen otras formas de representar oraciones en GPSG. Ciertos constituyentes se pueden ilustrar sin dibujar un árbol completo colocando el constituyente en cuestión dentro de corchetes de la siguiente manera:
¿A quién dijiste que [Hilary le gustaba] y [Leslie despreciaba]? [4]
Sin embargo, pronto surgió evidencia de que las CFG no podían describir todo el lenguaje natural (con ejemplos en particular de dependencias entre series en holandés y suizo-alemán [5] [6] ), y Gazdar, junto con la mayoría de los otros sintácticos, aceptaron que los lenguajes naturales de hecho no pueden ser descritos adecuadamente por CFG. [7] Como resultado, la Gramática de Estructura de Frase Generalizada pronto fue abandonada como marco para describir lenguajes naturales, aunque las CFG todavía se usan en lenguajes informáticos. La mayoría de las innovaciones sintácticas de GPSG se incorporaron posteriormente a la gramática de estructura de frase impulsada por la cabeza .