stringtranslate.com

Expresión de varias palabras

Una expresión multipalabra ( MWE ), también llamada frasema [ cita requerida ] , es una unidad similar a un lexema formada por una secuencia de dos o más lexemas que tiene propiedades que no son predecibles a partir de las propiedades de los lexemas individuales o su modo normal de combinación. Las MWE se diferencian de los lexemas en que muchas fuentes requieren que estos últimos tengan un significado que no se puede derivar del significado de componentes separados. Si bien las MWE deben tener algunas propiedades que no se pueden derivar de la misma propiedad de los componentes, la propiedad en cuestión no necesita ser el significado.

Para una definición más breve, las MWE pueden describirse como "interpretaciones idiosincrásicas que cruzan los límites de las palabras (o espacios)". [1]

Una expresión de varias palabras puede ser un compuesto , un fragmento de oración o una oración. El grupo de lexemas que componen una expresión de varias palabras puede ser continuo o discontinuo. No siempre es posible marcar una expresión de varias palabras con una parte del discurso .

Un MWE puede estar más o menos congelado.

Ejemplo n.° 1 en inglés: to kick the bucket , que significa morir en lugar de golpear un balde con el pie . En este ejemplo, que es un compuesto endocéntrico , la parte gramatical puede determinarse como un verbo . La MWE está congelada, en el sentido de que no es posible ninguna variación.

Ejemplo n.° 2 en inglés: to throw <somebody> to the lions (arrojar a <alguien> a los leones) . El patrón <somebody> restringe el uso. La expresión está semicongelada porque es posible un cierto grado de variación, pero no todo es posible. No es posible, por ejemplo, decir to the three lions (a los tres leones) . Al igual que en el ejemplo anterior, la parte gramatical es un verbo.

Ejemplo n.° 3 en francés: la moutarde <me,te,lui,nous,vous,leur> monte au nez . Este MWE está más congelado que los otros ejemplos. Agreguemos que se permite una variación temporal para el verbo, pero no podemos determinar cuál es la parte del discurso para toda la expresión porque es una oración.

Traducción automática (TM)

Según Sag et al. (2002), las expresiones multipalabra son, además de la desambiguación, uno de los dos problemas clave para el procesamiento del lenguaje natural (PLN) y especialmente para la traducción automática (TA).

Se estima que la cantidad de palabras simples en el léxico de un hablante es del mismo orden de magnitud que la cantidad de palabras individuales. El vocabulario de un dominio especializado está compuesto abrumadoramente de palabras simples, por lo tanto, la proporción de palabras simples aumentará a medida que un sistema agregue vocabulario para nuevos dominios, porque cada dominio agrega más palabras simples que palabras simples.

Problemas

El mayor problema para traducir MWE podría ser el problema de idiomaticidad , ya que muchas MWE tienen un sentido idiomático, en mayor o menor grado.

Por ejemplo, es difícil predecir para un sistema que una expresión como kick the bucket tenga un significado que no esté relacionado en absoluto con el significado de kick , the y bucket y que parezca ajustarse a la gramática del inglés Vps. Los modismos no se pueden traducir literalmente, porque en muchos casos no existen en una forma equivalente en el idioma de destino. Se debe prestar atención a la (no)equivalencia sintáctica y semántica.

Además, no todas las MWE del idioma de origen tienen también una MWE en el idioma de destino. Por ejemplo, la MWE alemana ins Auge fassen solo se puede traducir con el término de una sola palabra en inglés envisage .

Aproches

El enfoque más prometedor para el desafío de traducir MWE es la TA basada en ejemplos, porque en este caso cada MWE puede enumerarse como un ejemplo con su equivalente de traducción en el idioma de destino.

Para la traducción automática basada en reglas, sería muy difícil definir reglas para traducir MWE, debido a la magnitud de los diferentes tipos de MWE.

Sin embargo, un sistema de traducción automática basado en ejemplos tiene que aplicar reglas diferentes para la traducción de MWE continuos y discontinuos, ya que es más difícil identificar un MWE discontinuo en una oración donde se insertan palabras entre los diferentes componentes de un MWE.

Véase también

Referencias

  1. ^ Sag, Ivan A.; Baldwin, Timothy; Bond, Francis; Copestake, Ann; Flickinger, Dan (2002). "Expresiones multipalabra: un dolor de cabeza para la PNL". Lingüística computacional y procesamiento inteligente de textos . doi :10.1007/3-540-45715-1_1. hdl : 10356/79581 .

Enlaces externos