stringtranslate.com

Traducción automática basada en reglas

La traducción automática basada en reglas ( RBMT ; "enfoque clásico" de MT) son sistemas de traducción automática basados ​​en información lingüística sobre los idiomas de origen y de destino, básicamente recuperada de diccionarios y gramáticas (unilingües, bilingües o multilingües) que cubren los principales aspectos semánticos, morfológicos y sintácticos. regularidades de cada lengua respectivamente. Al tener oraciones de entrada (en algún idioma de origen), un sistema RBMT las genera para generar oraciones (en algún idioma de destino) sobre la base del análisis morfológico, sintáctico y semántico de los idiomas de origen y de destino involucrados en una tarea de traducción concreta.

Historia

Los primeros sistemas RBMT se desarrollaron a principios de los años 1970. Los pasos más importantes de esta evolución fueron la aparición de los siguientes sistemas RBMT:

Hoy en día, otros sistemas RBMT comunes incluyen:

Tipos de RBMT

Hay tres tipos diferentes de sistemas de traducción automática basados ​​en reglas:

  1. Los sistemas directos ( traducción automática basada en diccionarios ) asignan la entrada a la salida con reglas básicas.
  2. Los sistemas Transfer RBMT ( traducción automática basada en transferencia ) emplean análisis morfológico y sintáctico.
  3. Los sistemas RBMT interlingüísticos ( Interlingua ) utilizan un significado abstracto. [1] [2]

Los sistemas RBMT también se pueden caracterizar como sistemas opuestos a los sistemas de traducción automática basados ​​en ejemplos ( traducción automática basada en ejemplos ), mientras que los sistemas de traducción automática híbridos utilizan muchos principios derivados de RBMT.

Principios básicos

El enfoque principal de los sistemas RBMT se basa en vincular la estructura de la oración de entrada dada con la estructura de la oración de salida demandada, preservando necesariamente su significado único. El siguiente ejemplo puede ilustrar el marco general de RBMT:

Una niña come una manzana. Idioma de origen = inglés; Idioma de destino solicitado = alemán

Como mínimo, para obtener una traducción al alemán de esta frase en inglés se necesita:

  1. Un diccionario que asignará cada palabra en inglés a una palabra alemana apropiada.
  2. Reglas que representan la estructura regular de oraciones en inglés.
  3. Reglas que representan la estructura regular de las oraciones alemanas.

Y finalmente, necesitamos reglas según las cuales se puedan relacionar estas dos estructuras.

En consecuencia, podemos enunciar las siguientes etapas de traducción :

Primero: obtener información básica de parte del discurso de cada palabra fuente:
a = indef.artículo; niña = sustantivo; come = verbo; an = indef.artículo; manzana = sustantivo
2º: obtener información sintáctica sobre el verbo "comer":
NP-comer-NP; aquí: comer – Presente simple, tercera persona del singular, voz activa
Tercero: analizando la oración fuente:
(NP una manzana) = el objeto de comer

A menudo, sólo un análisis parcial es suficiente para llegar a la estructura sintáctica de la oración de origen y mapearla en la estructura de la oración de destino.

4to: traducir palabras del inglés al alemán
a (categoría = indef.artículo) => ein (categoría = indef.artículo)
niña (categoría = sustantivo) => Mädchen (categoría = sustantivo)
comer (categoría = verbo) => essen (categoría = verbo)
an (categoría = artículo indef.) => ein (categoría = artículo indef.)
manzana (categoría = sustantivo) => Apfel (categoría = sustantivo)
5to: Mapeo de entradas del diccionario en formas flexionadas apropiadas ( generación final ):
Una niña come una manzana. => Ein Mädchen isst einen Apfel.

Componentes

El sistema RBMT contiene:

un diccionario SL : necesario para el analizador morfológico del idioma de origen para el análisis morfológico,
un diccionario bilingüe : utilizado por el traductor para traducir palabras del idioma de origen a palabras del idioma de destino,
un diccionario TL : lo necesita el generador morfológico del idioma de destino para generar palabras en el idioma de destino. [3]

El sistema RBMT hace uso de lo siguiente:

Ventajas

Deficiencias

Referencias

  1. ^ Koehn, Philipp (2010). Traducción automática estadística. Cambridge: Prensa de la Universidad de Cambridge. pag. 15.ISBN​ 9780521874151.
  2. ^ Nirenburg, Sergei (1989). "Traducción automática basada en el conocimiento". Transcripción de máquinas 4 (1989), 5 - 24 . 4 (1). Editores académicos de Kluwer: 5–24. JSTOR  40008396.
  3. ^ Hettige, B.; Karunananda, AS (2011). "Modelo computacional de gramática para la traducción automática del inglés al cingalés". 2011 Conferencia Internacional sobre Avances en TIC para Regiones Emergentes (ICTer) . págs. 26-31. doi :10.1109/ICTer.2011.6075022. ISBN 978-1-4577-1114-5. S2CID  45871137.
  4. ^ Lonsdale, Deryle; Mitamura, Teruko; Nyberg, Eric (1995). "Adquisición de grandes léxicos para traducción automática basada en conocimientos prácticos". Máquina traductora . 9 (3–4). Editores académicos de Kluwer: 251–283. doi :10.1007/BF00980580. S2CID  1106335.
  5. ^ Lagarda, AL; Alabau, V.; Casacuberta, F.; Silva, R.; Díaz-de-Liaño, E. (2009). "Pos-edición estadística de un sistema de traducción automática basado en reglas" (PDF) . Actas de NAACL HLT 2009: artículos breves, páginas 217–220, Boulder, Colorado . Asociación de Lingüística Computacional . Consultado el 20 de junio de 2012 .

Literatura

Enlaces