stringtranslate.com

Expresión de varias palabras

Una expresión de varias palabras ( MWE ), también llamada frasema [ cita necesaria ] , es una unidad similar a un lexema formada por una secuencia de dos o más lexemas que tiene propiedades que no son predecibles a partir de las propiedades de los lexemas individuales o su modo normal de combinación. Los MWE se diferencian de los lexemas en que muchas fuentes exigen que estos últimos tengan un significado que no puede derivarse del significado de componentes separados. Si bien las MWE deben tener algunas propiedades que no pueden derivarse de la misma propiedad de los componentes, no es necesario que la propiedad en cuestión tenga significado.

Para una definición más breve, las MWE pueden describirse como "interpretaciones idiosincrásicas que cruzan los límites (o espacios) de las palabras". [1]

Una expresión de varias palabras puede ser un compuesto , un fragmento de una oración o una oración. El conjunto de lexemas que componen un MWE puede ser continuo o discontinuo. No siempre es posible marcar un MWE con una parte del discurso .

Una MWE puede estar más o menos congelada.

Ejemplo #1 en inglés: to kick the cube , que significa morir en lugar de golpear un balde con el pie . En este ejemplo, que es un compuesto endocéntrico , la parte del discurso puede determinarse como un verbo . El MWE está congelado, en el sentido de que no es posible ninguna variación.

Ejemplo #2 en inglés: tirar a <alguien> a los leones . El patrón <alguien> restringe el uso. La expresión está medio congelada porque es posible cierto grado de variación pero no todo es posible. No es posible, por ejemplo, decir a los tres leones . Como en el ejemplo anterior, la parte del discurso es un verbo.

Ejemplo #3 en francés: la moutarde <me,te,lui,nous,vous,leur> monte au nez . Este MWE está más congelado que los otros ejemplos. Agreguemos que se permite una variación de tiempo para el verbo pero no podemos determinar cuál es la parte gramatical de la expresión completa porque es una oración.

Traducción automática (MT)

Según Sag et al. (2002), las expresiones de varias palabras son, además de la desambiguación, uno de los dos problemas clave para el procesamiento del lenguaje natural (PLN) y especialmente para la traducción automática (TA).

Se estima que el número de MWE en el léxico de un hablante es del mismo orden de magnitud que el número de palabras individuales. El vocabulario de dominio especializado se compone abrumadoramente de MWE, por lo tanto, la proporción de MWE aumentará a medida que un sistema agregue vocabulario para nuevos dominios, porque cada dominio agrega más MWE que palabras simplex.

Problemas

El mayor problema para traducir MWE podría ser el problema de idiomaticidad , ya que muchos MWE tienen un sentido idiomático, en mayor o menor grado.

Por ejemplo, es difícil predecir para un sistema que una expresión como kick the bucket tenga un significado que no tenga ninguna relación con el significado de kick , the y bucket , aunque parezca ajustarse a la gramática del inglés Vps. Los modismos no se pueden traducir literalmente porque en muchos casos el modismo no existe en una forma equivalente en el idioma de destino. Hay que prestar atención a la (no)equivalencia sintáctica y semántica.

Además, no todos los MWE del idioma de origen tienen también un MWE en el idioma de destino. Por ejemplo, el término alemán MWE ins Auge fassen solo se puede traducir por el término inglés de una palabra envisage .

Enfoques

El enfoque más prometedor para el desafío de traducir MWE es la traducción automática basada en ejemplos, porque en este caso cada MWE puede enumerarse como un ejemplo con su equivalente de traducción en el idioma de destino.

Para la MT basada en reglas sería demasiado difícil definir reglas para traducir MWE, debido a la magnitud de los diferentes tipos de MWE.

Sin embargo, un sistema de MT basado en ejemplos tiene que aplicar reglas diferentes para la traducción de MWE continuas y discontinuas, ya que es más difícil identificar una MWE discontinua en una oración donde se insertan palabras entre los diferentes componentes de una MWE.

Ver también

Referencias

  1. ^ Sagitario, Ivan A.; Baldwin, Timoteo; Vínculo, Francisco; Copestake, Ann; Flickinger, Dan (2002). "Expresiones de varias palabras: un dolor de cabeza para la PNL". Lingüística Computacional y Procesamiento Inteligente de Textos . doi :10.1007/3-540-45715-1_1. hdl : 10356/79581 .

enlaces externos