La traducción automática basada en ejemplos ( EBMT ) es un método de traducción automática que a menudo se caracteriza por el uso de un corpus bilingüe con textos paralelos como su principal base de conocimiento en tiempo de ejecución. Es esencialmente una traducción por analogía y puede verse como una implementación de un enfoque de razonamiento basado en casos para el aprendizaje automático .
La base de la traducción automática basada en ejemplos es la idea de la traducción por analogía. Cuando se aplica al proceso de traducción humana, la idea de que la traducción se realiza por analogía supone un rechazo a la idea de que las personas traducen oraciones mediante un análisis lingüístico profundo. En cambio, se basa en la creencia de que las personas traducen primero descomponiendo una oración en ciertas frases, luego traduciendo estas frases y, finalmente, componiendo adecuadamente estos fragmentos en una oración larga. Las traducciones de frases se traducen por analogía con traducciones anteriores. El principio de la traducción por analogía se codifica en la traducción automática basada en ejemplos a través de las traducciones de ejemplo que se utilizan para entrenar dicho sistema.
Otros enfoques de la traducción automática, incluida la traducción automática estadística , también utilizan corpus bilingües para aprender el proceso de traducción.
La traducción automática basada en ejemplos fue propuesta por primera vez por Makoto Nagao en 1984 [1]. Señaló que está especialmente adaptada a la traducción entre dos idiomas totalmente diferentes, como el inglés y el japonés. En este caso, una oración puede traducirse en varias oraciones bien estructuradas en otro idioma, por lo que no sirve de nada realizar el análisis lingüístico profundo característico de la traducción automática basada en reglas .
Los sistemas de traducción automática basados en ejemplos se entrenan a partir de corpus paralelos bilingües que contienen pares de oraciones como el ejemplo que se muestra en la tabla anterior. Los pares de oraciones contienen oraciones en un idioma con sus traducciones a otro. El ejemplo en particular muestra un ejemplo de un par mínimo , lo que significa que las oraciones varían en solo un elemento. Estas oraciones facilitan el aprendizaje de traducciones de partes de una oración. Por ejemplo, un sistema de traducción automática basado en ejemplos aprendería tres unidades de traducción a partir del ejemplo anterior:
La composición de estas unidades puede utilizarse para producir traducciones novedosas en el futuro. Por ejemplo, si hemos sido entrenados utilizando un texto que contiene las oraciones:
El presidente Kennedy fue asesinado a tiros durante el desfile. y El convicto escapó el 15 de julio. , entonces podríamos traducir la oración El convicto fue asesinado a tiros durante el desfile. sustituyendo las partes apropiadas de las oraciones.
La traducción automática basada en ejemplos es la más adecuada para fenómenos que ocurren en sublenguajes, como los verbos frasales . Los verbos frasales tienen significados que dependen en gran medida del contexto. Son comunes en inglés, donde se componen de un verbo seguido de un adverbio o una preposición , que se denominan partículas del verbo. Los verbos frasales producen significados especializados y específicos del contexto que pueden no derivarse del significado de los constituyentes. Casi siempre hay una ambigüedad durante la traducción palabra por palabra del idioma de origen al idioma de destino.
Como ejemplo, consideremos el verbo frasal "put on" y su traducción al indostánico . Puede usarse de cualquiera de las siguientes maneras: