La teoría del significado-texto ( TMT ) es un marco lingüístico teórico , propuesto por primera vez en Moscú por Aleksandr Žolkovskij e Igor Mel'čuk [1] , para la construcción de modelos del lenguaje natural. La teoría proporciona una base amplia y elaborada para la descripción lingüística y, debido a su carácter formal , se presta particularmente bien a las aplicaciones informáticas , incluidas la traducción automática , la fraseología y la lexicografía . [ cita requerida ]
Los modelos lingüísticos de la teoría del significado-texto se basan en el principio de que el lenguaje consiste en una correspondencia entre el contenido o significado (semántica) de un enunciado y su forma o texto (fonética). Entre estos polos hay niveles adicionales de representación en los niveles sintáctico y morfológico.
Las representaciones en los diferentes niveles se mapean, en secuencia, desde la red desordenada de la representación semántica (SemR), pasando por las estructuras de árbol de dependencia de la representación sintáctica (SyntR), hasta una cadena linealizada de morfemas de la representación morfológica (MorphR) y, en última instancia, la cadena de fonemas temporalmente ordenada de la representación fonética (PhonR) (que no se aborda en general en los trabajos de esta teoría). Las relaciones entre las representaciones en los diferentes niveles se consideran traducciones o mapeos, en lugar de transformaciones, y están mediadas por conjuntos de reglas, llamados "componentes", que garantizan las transiciones apropiadas y específicas del lenguaje entre niveles.
Las representaciones semánticas (SemR) en la teoría del significado-texto consisten principalmente en una estructura semántica tipo red (SemS) que se combina con otras estructuras de nivel semántico (más notablemente la estructura semántico-comunicativa [SemCommS], [2] que representa lo que comúnmente se conoce como " estructura de información " en otros marcos). La SemS en sí consiste en una red de predicaciones , representadas como nodos con flechas que van desde los nodos de predicado hasta los nodos de argumento . Los argumentos pueden ser compartidos por múltiples predicados, y los predicados pueden ser ellos mismos argumentos de otros predicados. Los nodos generalmente corresponden a significados léxicos y gramaticales ya que estos son expresados directamente por elementos en el léxico o por medios flexivos, pero la teoría permite la opción de descomponer significados en representaciones más detalladas a través de procesos de paráfrasis semántica, [3] que también son clave para tratar la sinonimia y las equivalencias de traducción entre idiomas. Los SemR se asignan al siguiente nivel de representación, la representación sintáctica profunda, mediante las reglas del componente semántico, que permiten una relación de uno a muchos entre niveles (es decir, un SemR puede expresarse potencialmente mediante una variedad de estructuras sintácticas, dependiendo de la elección léxica, la complejidad del SemR, etc.). La descripción estructural y la generación (semi) automática de SemR son objeto de investigación. [4] Aquí la descomposición aprovecha los primos semánticos del metalenguaje semántico natural para determinar un criterio de terminación de la descomposición.
Las representaciones sintácticas (SyntR) en la teoría del significado-texto se implementan utilizando árboles de dependencia , que constituyen la estructura sintáctica (SyntS). SyntS está acompañada por varios otros tipos de estructura, más notablemente la estructura comunicativa sintáctica y la estructura anafórica. Hay dos niveles de sintaxis en la teoría del significado-texto, la representación sintáctica profunda (DSyntR) y la representación sintáctica superficial (SSyntR). Una buena descripción general de la sintaxis de la teoría del significado-texto, incluida su aplicación descriptiva, se puede encontrar en Mel'čuk (1988). [5] Un modelo integral de la sintaxis superficial del inglés se presenta en Mel'čuk y Pertsov (1987). [6]
La representación sintáctica profunda (DSyntR) está relacionada directamente con SemS y busca capturar los aspectos "universales" de la estructura sintáctica. Los árboles en este nivel representan relaciones de dependencia entre lexemas (o entre lexemas y un inventario limitado de entidades abstractas como funciones léxicas). Las relaciones sintácticas profundas entre lexemas en DSyntR están restringidas a un inventario universal de una docena de relaciones sintácticas que incluyen siete relaciones actanciales (argumentales) jerarquizadas, la relación modificativa y la relación coordinativa. Los lexemas con función puramente gramatical como las preposiciones gobernadas léxicamente no se incluyen en este nivel de representación; los valores de las categorías flexivas que se derivan de SemR pero que se implementan mediante la morfología se representan como subíndices en los nodos léxicos relevantes a los que se refieren. DSyntR se asigna al siguiente nivel de representación mediante reglas del componente sintáctico profundo.
La representación sintáctica superficial (SSyntR) representa la estructura sintáctica específica de la lengua de un enunciado e incluye nodos para todos los elementos léxicos (incluidos aquellos con una función puramente gramatical) en la oración. Las relaciones sintácticas entre elementos léxicos en este nivel no están restringidas y se consideran completamente específicas de la lengua, aunque se cree que muchas son similares (o al menos isomorfas) en las distintas lenguas. SSyntR se asigna al siguiente nivel de representación mediante reglas del componente sintáctico superficial.
Las representaciones morfológicas (MorphR) en la teoría del significado-texto se implementan como cadenas de morfemas dispuestas en un orden lineal fijo que refleja el orden de los elementos en el enunciado real. Este es el primer nivel de representación en el que la precedencia lineal se considera lingüísticamente significativa, agrupando efectivamente el orden de las palabras junto con los procesos morfológicos y la prosodia , como uno de los tres medios no léxicos con los que las lenguas pueden codificar la estructura sintáctica. Al igual que con la representación sintáctica, hay dos niveles de representación morfológica: representación morfológica profunda y superficial. Se encuentran descripciones detalladas de las representaciones morfológicas de la teoría del significado-texto en Mel'čuk (1993-2000) [7] y Mel'čuk (2006). [8]
La representación morfológica profunda (DMorphR) consiste en cadenas de lexemas y morfemas, por ejemplo, THE SHOE + PL ON BILL + POSS FOOT + PL . El componente morfológico profundo de las reglas asigna esta cadena a la representación morfológica de superficie (SMorphR), convirtiendo los morfemas en los morfos apropiados y realizando operaciones morfológicas que implementan procesos morfológicos no concatenativo; en el caso de nuestro ejemplo anterior, nos da /the shoe+s on Bill+s feet/. Las reglas del componente morfológico de superficie, un subconjunto del cual incluye reglas morfofonémicas, asignan SMorphR a una representación fonética [ðə ʃuz on bɪlz fi:t].
Un aspecto crucial de la teoría del significado-texto es el léxico, considerado como un catálogo completo de las unidades léxicas (UL) de una lengua, siendo estas unidades los lexemas, las colocaciones y otros sintagmas , las construcciones y otras configuraciones de elementos lingüísticos que los usuarios de la lengua aprenden e implementan en el habla. El léxico en la teoría del significado-texto está representado por un diccionario combinatorio explicativo (ECD) [9] [10] que incluye entradas para todas las LU de una lengua junto con información que los hablantes deben saber sobre su sintaxis (las reglas y condiciones específicas de la LU en su combinatoria). Un ECD para el ruso fue producido por Mel'čuk et al. (1984), [11] y los ECD para el francés fueron publicados como Mel'čuk et al. (1999) [12] y Mel'čuk & Polguère (2007). [13]
Un descubrimiento importante de la lingüística de significado-texto fue el reconocimiento de que las UL de una lengua pueden estar relacionadas entre sí en un sentido semántico abstracto y que esta misma relación también se mantiene en muchos pares o conjuntos de UL no relacionados léxicamente. Estas relaciones se representan en la teoría de significado-texto como funciones léxicas (LF). [14] Un ejemplo de una LF simple es Magn(L), que representa colocaciones utilizadas en la intensificación, como lluvia intensa , viento fuerte o bombardeo intenso . Un hablante de inglés sabe que para un lexema L dado, como LLUVIA, el valor de Magn(LLUVIA) = PESADO, mientras que Magn(VIENTO) = FUERTE, y así sucesivamente. La teoría de significado-texto reconoce actualmente varias docenas de LF estándar que se sabe que se repiten en todos los idiomas.