La gramática categorial combinatoria ( CCG ) es un formalismo gramatical que se puede analizar de manera eficiente y, a la vez, es lingüísticamente expresivo. Tiene una interfaz transparente entre la sintaxis superficial y la representación semántica subyacente, que incluye la estructura predicado-argumento, la cuantificación y la estructura de la información. El formalismo genera estructuras basadas en constituyentes (a diferencia de las basadas en dependencias) y, por lo tanto, es un tipo de gramática de estructura sintagmática (a diferencia de una gramática de dependencias ).
El cálculo lambda se basa en la lógica combinatoria , que tiene el mismo poder expresivo que el cálculo lambda , pero construye sus expresiones de forma diferente. Los primeros argumentos lingüísticos y psicolingüísticos para basar la gramática en combinadores fueron propuestos por Steedman y Szabolcsi .
Los defensores más destacados de este enfoque en los últimos tiempos son Pauline Jacobson y Jason Baldridge. En estos nuevos enfoques, el combinador B (el compositor) es útil para crear dependencias a larga distancia, como en "¿De quién crees que está hablando Mary?", y el combinador W (el duplicador) es útil como interpretación léxica de pronombres reflexivos, como en "Mary habla de sí misma". Junto con I (el mapeo de identidad) y C (el permutador), forman un conjunto de combinadores primitivos, no interdefinibles. Jacobson interpreta los pronombres personales como el combinador I, y su vinculación se ve facilitada por un combinador complejo Z, como en "Mary perdió su camino". Z se puede definir utilizando W y B.
El formalismo CCG define una serie de combinadores (los más comunes son los de aplicación, composición y elevación de tipos). Estos funcionan sobre elementos léxicos tipificados sintácticamente, mediante pruebas de estilo de deducción natural . El objetivo de la prueba es encontrar alguna forma de aplicar los combinadores a una secuencia de elementos léxicos hasta que no quede ningún elemento léxico sin usar en la prueba. El tipo resultante después de que se complete la prueba es el tipo de la expresión completa. Por lo tanto, probar que alguna secuencia de palabras es una oración de algún idioma equivale a probar que las palabras se reducen al tipo S .
El tipo sintáctico de un elemento léxico puede ser un tipo primitivo, como S , N o NP , o complejo, como S\NP o NP/N .
Los tipos complejos, esquematizables como X/Y y X\Y , denotan tipos de funtores que toman un argumento de tipo Y y devuelven un objeto de tipo X . Una barra diagonal indica que el argumento debe aparecer a la derecha, mientras que una barra invertida indica que el argumento debe aparecer a la izquierda. Cualquier tipo puede reemplazar a X e Y aquí, lo que hace que los tipos sintácticos en CCG sean un sistema de tipos recursivo.
Los combinadores de aplicaciones, a menudo denotados por > para la aplicación hacia adelante y < para la aplicación hacia atrás, aplican un elemento léxico con un tipo de funtor a un argumento con un tipo apropiado. La definición de aplicación se da como:
Los combinadores de composición, a menudo denotados por para composición hacia adelante y para composición hacia atrás, son similares a la composición de funciones de las matemáticas y se pueden definir de la siguiente manera:
Los combinadores de elevación de tipo, a menudo denominados para elevación de tipo hacia adelante y para elevación de tipo hacia atrás, toman tipos de argumentos (normalmente tipos primitivos) en tipos de funtores, que toman como argumento los funtores que, antes de la elevación de tipo, los habrían tomado como argumentos.
La oración "el perro mordió a Juan" tiene varias demostraciones posibles. A continuación se presentan algunas de ellas. La variedad de demostraciones demuestra el hecho de que en la gramática común, las oraciones no tienen una estructura única, como en otros modelos gramaticales.
Sean los tipos de estos elementos léxicos
Podemos realizar la prueba más simple (cambiando ligeramente la notación para abreviar) como:
Si optamos por la clasificación de tipos y la composición de algunos, podríamos obtener una prueba totalmente incremental, de izquierda a derecha. La capacidad de construir una prueba de este tipo es un argumento a favor de la plausibilidad psicolingüística de la CCG, porque los oyentes, de hecho, construyen interpretaciones parciales (sintácticas y semánticas) de los enunciados antes de que se hayan completado.
Se sabe que los CCG pueden generar el lenguaje (que es un lenguaje indexado no libre de contexto ). Se puede encontrar una gramática para este lenguaje en Vijay-Shanker y Weir (1994). [1]
Vijay-Shanker y Weir (1994) [1] demuestran que las gramáticas indexadas lineales , las gramáticas categoriales combinatorias, las gramáticas contiguas a árboles y las gramáticas principales son formalismos débilmente equivalentes , en el sentido de que todos ellos definen los mismos lenguajes de cadenas. Kuhlmann et al. (2015) [2] muestran que esta equivalencia, y la capacidad de CCG para describir , dependen fundamentalmente de la capacidad de restringir el uso de las reglas combinatorias a ciertas categorías, de maneras no explicadas anteriormente.