Teoría del significado del texto

La teoría del significado-texto ( TMT ) es un marco lingüístico teórico , propuesto por primera vez en Moscú por Aleksandr Žolkovskij e Igor Mel'čuk ^[1] , para la construcción de modelos del lenguaje natural. La teoría proporciona una base amplia y elaborada para la descripción lingüística y, debido a su carácter formal , se presta particularmente bien a las aplicaciones informáticas , incluidas la traducción automática , la fraseología y la lexicografía . ^{[ cita requerida ]}

Niveles de representación

Los modelos lingüísticos de la teoría del significado-texto se basan en el principio de que el lenguaje consiste en una correspondencia entre el contenido o significado (semántica) de un enunciado y su forma o texto (fonética). Entre estos polos hay niveles adicionales de representación en los niveles sintáctico y morfológico.

Niveles de representación en la teoría del significado-texto ^{[ contradictorio ]}

Las representaciones en los diferentes niveles se mapean, en secuencia, desde la red desordenada de la representación semántica (SemR), pasando por las estructuras de árbol de dependencia de la representación sintáctica (SyntR), hasta una cadena linealizada de morfemas de la representación morfológica (MorphR) y, en última instancia, la cadena de fonemas temporalmente ordenada de la representación fonética (PhonR) (que no se aborda en general en los trabajos de esta teoría). Las relaciones entre las representaciones en los diferentes niveles se consideran traducciones o mapeos, en lugar de transformaciones, y están mediadas por conjuntos de reglas, llamados "componentes", que garantizan las transiciones apropiadas y específicas del lenguaje entre niveles.

Representación semántica

Las representaciones semánticas (SemR) en la teoría del significado-texto consisten principalmente en una estructura semántica tipo red (SemS) que se combina con otras estructuras de nivel semántico (más notablemente la estructura semántico-comunicativa [SemCommS], ^[2] que representa lo que comúnmente se conoce como " estructura de información " en otros marcos). La SemS en sí consiste en una red de predicaciones , representadas como nodos con flechas que van desde los nodos de predicado hasta los nodos de argumento . Los argumentos pueden ser compartidos por múltiples predicados, y los predicados pueden ser ellos mismos argumentos de otros predicados. Los nodos generalmente corresponden a significados léxicos y gramaticales ya que estos son expresados directamente por elementos en el léxico o por medios flexivos, pero la teoría permite la opción de descomponer significados en representaciones más detalladas a través de procesos de paráfrasis semántica, ^[3] que también son clave para tratar la sinonimia y las equivalencias de traducción entre idiomas. Los SemR se asignan al siguiente nivel de representación, la representación sintáctica profunda, mediante las reglas del componente semántico, que permiten una relación de uno a muchos entre niveles (es decir, un SemR puede expresarse potencialmente mediante una variedad de estructuras sintácticas, dependiendo de la elección léxica, la complejidad del SemR, etc.). La descripción estructural y la generación (semi) automática de SemR son objeto de investigación. ^[4] Aquí la descomposición aprovecha los primos semánticos del metalenguaje semántico natural para determinar un criterio de terminación de la descomposición.

Representación sintáctica

Las representaciones sintácticas (SyntR) en la teoría del significado-texto se implementan utilizando árboles de dependencia , que constituyen la estructura sintáctica (SyntS). SyntS está acompañada por varios otros tipos de estructura, más notablemente la estructura comunicativa sintáctica y la estructura anafórica. Hay dos niveles de sintaxis en la teoría del significado-texto, la representación sintáctica profunda (DSyntR) y la representación sintáctica superficial (SSyntR). Una buena descripción general de la sintaxis de la teoría del significado-texto, incluida su aplicación descriptiva, se puede encontrar en Mel'čuk (1988). ^[5] Un modelo integral de la sintaxis superficial del inglés se presenta en Mel'čuk y Pertsov (1987). ^[6]

La representación sintáctica profunda (DSyntR) está relacionada directamente con SemS y busca capturar los aspectos "universales" de la estructura sintáctica. Los árboles en este nivel representan relaciones de dependencia entre lexemas (o entre lexemas y un inventario limitado de entidades abstractas como funciones léxicas). Las relaciones sintácticas profundas entre lexemas en DSyntR están restringidas a un inventario universal de una docena de relaciones sintácticas que incluyen siete relaciones actanciales (argumentales) jerarquizadas, la relación modificativa y la relación coordinativa. Los lexemas con función puramente gramatical como las preposiciones gobernadas léxicamente no se incluyen en este nivel de representación; los valores de las categorías flexivas que se derivan de SemR pero que se implementan mediante la morfología se representan como subíndices en los nodos léxicos relevantes a los que se refieren. DSyntR se asigna al siguiente nivel de representación mediante reglas del componente sintáctico profundo.

La representación sintáctica superficial (SSyntR) representa la estructura sintáctica específica de la lengua de un enunciado e incluye nodos para todos los elementos léxicos (incluidos aquellos con una función puramente gramatical) en la oración. Las relaciones sintácticas entre elementos léxicos en este nivel no están restringidas y se consideran completamente específicas de la lengua, aunque se cree que muchas son similares (o al menos isomorfas) en las distintas lenguas. SSyntR se asigna al siguiente nivel de representación mediante reglas del componente sintáctico superficial.

Representación morfológica

Las representaciones morfológicas (MorphR) en la teoría del significado-texto se implementan como cadenas de morfemas dispuestas en un orden lineal fijo que refleja el orden de los elementos en el enunciado real. Este es el primer nivel de representación en el que la precedencia lineal se considera lingüísticamente significativa, agrupando efectivamente el orden de las palabras junto con los procesos morfológicos y la prosodia , como uno de los tres medios no léxicos con los que las lenguas pueden codificar la estructura sintáctica. Al igual que con la representación sintáctica, hay dos niveles de representación morfológica: representación morfológica profunda y superficial. Se encuentran descripciones detalladas de las representaciones morfológicas de la teoría del significado-texto en Mel'čuk (1993-2000) ^[7] y Mel'čuk (2006). ^[8]

La representación morfológica profunda (DMorphR) consiste en cadenas de lexemas y morfemas, por ejemplo, THE SHOE + PL ON BILL + POSS FOOT + PL . El componente morfológico profundo de las reglas asigna esta cadena a la representación morfológica de superficie (SMorphR), convirtiendo los morfemas en los morfos apropiados y realizando operaciones morfológicas que implementan procesos morfológicos no concatenativo; en el caso de nuestro ejemplo anterior, nos da /the shoe+s on Bill+s feet/. Las reglas del componente morfológico de superficie, un subconjunto del cual incluye reglas morfofonémicas, asignan SMorphR a una representación fonética [ðə ʃuz on bɪlz fi:t].

El léxico

Un aspecto crucial de la teoría del significado-texto es el léxico, considerado como un catálogo completo de las unidades léxicas (UL) de una lengua, siendo estas unidades los lexemas, las colocaciones y otros sintagmas , las construcciones y otras configuraciones de elementos lingüísticos que los usuarios de la lengua aprenden e implementan en el habla. El léxico en la teoría del significado-texto está representado por un diccionario combinatorio explicativo (ECD) ^[9]^[10] que incluye entradas para todas las LU de una lengua junto con información que los hablantes deben saber sobre su sintaxis (las reglas y condiciones específicas de la LU en su combinatoria). Un ECD para el ruso fue producido por Mel'čuk et al. (1984), ^[11] y los ECD para el francés fueron publicados como Mel'čuk et al. (1999) ^[12] y Mel'čuk & Polguère (2007). ^[13]

Funciones léxicas

Un descubrimiento importante de la lingüística de significado-texto fue el reconocimiento de que las UL de una lengua pueden estar relacionadas entre sí en un sentido semántico abstracto y que esta misma relación también se mantiene en muchos pares o conjuntos de UL no relacionados léxicamente. Estas relaciones se representan en la teoría de significado-texto como funciones léxicas (LF). ^[14] Un ejemplo de una LF simple es Magn(L), que representa colocaciones utilizadas en la intensificación, como lluvia intensa , viento fuerte o bombardeo intenso . Un hablante de inglés sabe que para un lexema L dado, como LLUVIA, el valor de Magn(LLUVIA) = PESADO, mientras que Magn(VIENTO) = FUERTE, y así sucesivamente. La teoría de significado-texto reconoce actualmente varias docenas de LF estándar que se sabe que se repiten en todos los idiomas.

Véase también

Generación de lenguaje natural

Referencias

^ Žolkovskij, Aleksandr K.; Igor A. Mel'čuk (1965). "O vozmožnom metode i instrumentax semantičeskogo sinteza (Sobre un posible método e instrumentos para la síntesis semántica)". Naučno-texničeskaja Información . 5 : 23–28.
^ Mel'čuk, Igor A. (2001). Organización comunicativa en el lenguaje natural: la estructura semántico-comunicativa de las oraciones . Ámsterdam: John Benjamins.
^ Milićević, Jasmina (2007). La paráfrasis. Modelización de la lengua de paráfrasis . Berna: Peter Lang.
^ Fähndrich, J. et al. 2014: "Descomposición del lenguaje formal en primos semánticos". ADCAIJ: Advances in Distributed Computing and Artificial Intelligence Journal 3.8 (2014): 56-73.
^ Mel'čuk, Igor A. (1988). Sintaxis de dependencia: teoría y práctica . Albany, NY: SUNY Press.
^ Mel'čuk, Igor A.; Nikolai V. Pertsov (1987). Sintaxis superficial del inglés: un modelo formal dentro del marco del texto-significado . Ámsterdam: John Benjamins.
^ Mel'čuk, Igor A. (1993-2000). Curso de morfología general . Montreal: Les Presses de l'Université de Montréal.
^ Mel'čuk, Igor A. (2006). Aspectos de la teoría de la morfología . Berlín: Mouton de Gruyter.
^ Mel'čuk, Igor A.; André Clas; Alain Polguere (1995). Introducción a la lexicología explicativa y combinatoria . París: Duculot.
^ Mel'čuk, Igor A. (2006). Sica, G (ed.). "Diccionario combinatorio explicativo". Problemas abiertos en lingüística y lexicografía . Monza: Polimetrica: 222–355.
^ Mel'čuk, Igor A.; Aleksandr K. Žolkovsky; Juri Apresjan (1984). Толково-комбинаторный словарь современного русского языка: Опыты семантико-синтаксического описания русской лексики. [Diccionario combinatorio explicativo del ruso moderno: estudios semántico-sintácticos del vocabulario ruso] . Wiener Slawistischer Almanach: Viena.
^ Mel'čuk, Igor A.; N. Arbatchewsky-Jumarie; Lida Iordanskaja; S. Mantha; Alain Polguere (1999). Diccionario explicativo y combinado del francés contemporáneo. Investigaciones léxico-sémantiques IV . Montreal: Les Presses de l'Université de Montréal.
^ Mel'čuk, Igor A.; Alain Polguere (2007). Lexique actif du français: L'apprentissage du vocabulaire fondé sur 20000 derivations sémantiques et collocations du français . París: Duculot.
^ Mel'čuk, Igor A. (1996). Wanner, Leo (ed.). "Funciones léxicas: una herramienta para la descripción de relaciones léxicas en un léxico". Funciones léxicas en lexicografía y procesamiento del lenguaje natural : 37–102.

Lectura adicional

Reseñas generales

Mel'čuk, Igor A. (1981). "Modelos de significado-texto: una tendencia reciente en la lingüística soviética". Revista Anual de Antropología . 10 : 27–62. doi :10.1146/annurev.an.10.100181.000331.
Mel'čuk, Igor A. (1988). Sintaxis de dependencia: teoría y práctica. Albany, NY: SUNY Press. ISBN 9780887064500.

General

Žolkovskij, AK y Mel'čuk, Igor A. (1965). O vozmožnom metode i instrumentax semantičeskogo sinteza (Sobre un posible método e instrumentos para la síntesis semántica). Naučno-texničeskaja informacija 5, 23–28.
И. A. Мельчук . Опыт теории лингвистических моделей «Смысл ↔ Текст». М., 1974 (2ª ed., 1999).
И. A. Мельчук. Русский язык в модели «Смысл ↔ Текст». Moscú-Вена, 1995.
IA Mel'čuk. Vers une linguistique Sens-Texte. Leçon inaugural. P.: Collège de France, Chaire internationale, 1997.
Leo Wanner (ed.), Tendencias recientes en la teoría del significado del texto. Ámsterdam, Filadelfia: J. Benjamins Pub., 1997. ISBN 1-55619-925-2 , ISBN 90-272-3042-0
IA Bolshakov, AF Gelbukh. El modelo del texto-significado: treinta años después, J. International Forum on Information and Documentation, FID 519, ISSN 0304-9701, N 1, 2000.

Sintaxis

И. A. Мельчук. Поверхностный синтаксис русских числовых выражений. Viena: Wiener Slawistischer Almanach, 1985.
IA Mel'čuk y NV Pertsov. Sintaxis superficial del inglés: un modelo formal dentro del marco de referencia del texto-significado. Ámsterdam, Filadelfia: Benjamins, 1987. ISBN 90-272-1515-4
IA Mel'čuk. Sintaxis de dependencia: teoría y práctica. Albany, NY: SUNY, 1988. ISBN 0-88706-450-7 , ISBN 0-88706-451-5
IA Mel'čuk. Actantes en semántica y sintaxis. I, II, Lingüística, 2004, 42:1, 1–66; 42:2, 247—291.

Morfología

IA Mel'čuk. Curso de morfología general, vol. 1–5. Montreal: Les Presses de l'Université de Montréal/París: CNRS Éditions, 1993—2000
IA Mel'čuk. Aspectos de la teoría de la morfología. Berlín; Nueva York: Mouton de Gruyter, 2006. ISBN 3-11-017711-0

Lexicografía

IA Mel'čuk, AK Zholkovsky, Ju. D. Apresjan et al. Diccionario combinatorio explicativo del ruso moderno: estudios semántico-sintácticos del vocabulario ruso ской лексики. Viena: Wiener Slawistischer Almanach, 1984.
IA Mel'čuk, A. Clas y A. Polguère. Introducción a la lexicología explicativa y combinatoria. P.: Duculot, 1995. — ISBN 2-8011-1106-6
IA Mel'čuk et al. Diccionario explicativo y combinado del francés contemporáneo. Recherches lexico-sémantiques IV, Montreal: Les Presses de l'Université de Montréal, 1999. — ISBN 2-7606-1738-6

Enlaces externos

El sitio web de la Teoría del Texto-Significado alberga las actas de la conferencia bianual MTT
Observatorio lingüístico Sens-Texte (OLST)
Significado–Texto @ neuvel.net, una excelente introducción a la teoría
Significado–Biblioteca de textos en línea

Significado del software de texto

Máquina virtual lingüística Carabao proporcionada por LinguaSys
Sistema de procesamiento lingüístico ETAP-3 , descrito como 'una implementación completa de la teoría del significado del texto en PNL' (sitio oficial)