La traducción automática es el uso de técnicas computacionales para traducir texto o voz de un idioma a otro, incluidos los matices contextuales, idiomáticos y pragmáticos de ambos idiomas.
Los primeros métodos se basaban principalmente en reglas o en métodos estadísticos . Desde entonces, estos métodos han sido reemplazados por la traducción automática neuronal [1] y los grandes modelos lingüísticos [2] .
Los orígenes de la traducción automática se remontan al trabajo de Al-Kindi , un criptógrafo árabe del siglo IX que desarrolló técnicas para la traducción sistemática de idiomas, incluyendo el criptoanálisis , el análisis de frecuencia y la probabilidad y estadística , que se utilizan en la traducción automática moderna. [3] La idea de la traducción automática apareció más tarde en el siglo XVII. En 1629, René Descartes propuso un lenguaje universal, con ideas equivalentes en diferentes lenguas que compartían un símbolo. [4]
La idea de utilizar ordenadores digitales para traducir lenguajes naturales fue propuesta en 1947 por el inglés AD Booth [5] y Warren Weaver en la Fundación Rockefeller ese mismo año. "El memorando escrito por Warren Weaver en 1949 es quizás la publicación más influyente en los primeros días de la traducción automática". [6] [7] Otros siguieron su ejemplo. En 1954 se hizo una demostración en la máquina APEXC del Birkbeck College ( Universidad de Londres ) de una traducción rudimentaria del inglés al francés. En esa época se publicaron varios artículos sobre el tema, e incluso artículos en revistas populares (por ejemplo, un artículo de Cleave y Zacharov en la edición de septiembre de 1955 de Wireless World ). Una aplicación similar, también iniciada en el Birkbeck College en esa época, era la lectura y composición de textos en Braille por ordenador.
El primer investigador en este campo, Yehoshua Bar-Hillel , comenzó su investigación en el MIT (1951). Un equipo de investigación de MT de la Universidad de Georgetown , dirigido por el profesor Michael Zarechnak, siguió (1951) con una demostración pública de su sistema experimental Georgetown-IBM en 1954. Los programas de investigación de MT surgieron en Japón [8] [9] y Rusia (1955), y la primera conferencia de MT se celebró en Londres (1956). [10] [11]
David G. Hays "escribió sobre el procesamiento del lenguaje asistido por ordenador ya en 1957" y "fue líder del proyecto de lingüística computacional en Rand entre 1955 y 1968". [12]
Los investigadores siguieron sumándose al campo a medida que se formaba la Asociación para la Traducción Automática y la Lingüística Computacional en los EE. UU. (1962) y la Academia Nacional de Ciencias formó el Comité Asesor de Procesamiento Automático del Lenguaje (ALPAC) para estudiar la traducción automática (TA) (1964). Sin embargo, el progreso real fue mucho más lento y después del informe de ALPAC (1966), que concluyó que la investigación de diez años de duración no había cumplido las expectativas, la financiación se redujo considerablemente. [13] Según un informe de 1972 del Director de Investigación e Ingeniería de Defensa (DDR&E), la viabilidad de la traducción automática a gran escala se restableció gracias al éxito del sistema Logos MT en la traducción de manuales militares al vietnamita durante ese conflicto.
El Instituto Textil Francés también utilizó la traducción automática para traducir resúmenes desde y hacia el francés, el inglés, el alemán y el español (1970); la Universidad Brigham Young inició un proyecto para traducir textos mormones mediante traducción automática (1971).
SYSTRAN , que "fue pionero en el campo bajo contratos del gobierno de los EE. UU." [14] en la década de 1960, fue utilizado por Xerox para traducir manuales técnicos (1978). A partir de finales de la década de 1980, a medida que la potencia computacional aumentó y se volvió menos costosa, se mostró más interés en los modelos estadísticos para la traducción automática . La TA se volvió más popular después del advenimiento de las computadoras. [15] El primer sistema de implementación de SYSTRAN fue implementado en 1988 por el servicio en línea del Servicio Postal Francés llamado Minitel. [16] También se lanzaron varias empresas de traducción basadas en computadora, incluida Trados (1984), que fue la primera en desarrollar y comercializar la tecnología de memoria de traducción (1989), aunque esto no es lo mismo que la TA. El primer sistema de TA comercial para ruso / inglés / alemán-ucraniano se desarrolló en la Universidad Estatal de Járkov (1991).
En 1998, "por tan sólo 29,95 dólares" se podía "comprar un programa para traducir en una dirección entre el inglés y un idioma europeo importante de su elección" para ejecutarlo en un PC. [14]
La traducción automática en la web comenzó con SYSTRAN, que ofrecía traducción gratuita de textos pequeños (1996) y luego la proporcionó a través de AltaVista Babelfish, [14] que acumuló 500.000 solicitudes al día (1997). [17] El segundo servicio de traducción gratuito en la web fue GlobaLink de Lernout & Hauspie . [14] La revista Atlantic escribió en 1998 que "Babelfish de Systran y Comprende de GlobaLink" manejaron el problema de "No cuente con ello" con un "rendimiento competente". [18]
Franz Josef Och (el futuro director de Desarrollo de Traducción de Google) ganó la competencia de traducción automática rápida de DARPA (2003). [19] Otras innovaciones durante esta época incluyeron MOSES, el motor de traducción automática estadística de código abierto (2007), un servicio de traducción de texto/SMS para móviles en Japón (2008) y un teléfono móvil con funcionalidad de traducción de voz a voz incorporada para inglés, japonés y chino (2009). En 2012, Google anunció que Google Translate traduce aproximadamente suficiente texto para llenar un millón de libros en un día.
Antes de la llegada de los métodos de aprendizaje profundo , los métodos estadísticos requerían muchas reglas acompañadas de anotaciones morfológicas , sintácticas y semánticas .
El enfoque de traducción automática basada en reglas se utilizó principalmente en la creación de diccionarios y programas de gramática. Su mayor inconveniente era que todo tenía que ser explícito: las variaciones ortográficas y las entradas erróneas debían formar parte del analizador del idioma de origen para poder lidiar con ellas, y se debían escribir reglas de selección léxica para todos los casos de ambigüedad.
La traducción automática basada en transferencia era similar a la traducción automática interlingüística en el sentido de que creaba una traducción a partir de una representación intermedia que simulaba el significado de la oración original. A diferencia de la traducción automática interlingüística, dependía parcialmente del par de idiomas involucrado en la traducción.
La traducción automática interlingüística fue un ejemplo de enfoques de traducción automática basados en reglas. En este enfoque, el idioma de origen, es decir, el texto que se va a traducir, se transformó en un idioma interlingüístico, es decir, una representación "neutral" que es independiente de cualquier idioma. Luego, el idioma de destino se generó a partir de la interlingua . El único sistema de traducción automática interlingüística que se puso en funcionamiento a nivel comercial fue el sistema KANT (Nyberg y Mitamura, 1992), que fue diseñado para traducir el inglés técnico de Caterpillar (CTE) a otros idiomas.
La traducción automática utiliza un método basado en entradas de diccionario , lo que significa que las palabras se traducen tal como están en el diccionario.
La traducción automática estadística intentó generar traducciones utilizando métodos estadísticos basados en corpus de textos bilingües, como el corpus Hansard canadiense , el registro inglés-francés del parlamento canadiense y EUROPARL , el registro del Parlamento Europeo . Cuando se disponía de dichos corpus, se lograron buenos resultados traduciendo textos similares, pero dichos corpus eran poco frecuentes para muchos pares de idiomas. El primer software de traducción automática estadística fue CANDIDE de IBM . En 2005, Google mejoró sus capacidades de traducción interna utilizando aproximadamente 200 mil millones de palabras de materiales de las Naciones Unidas para entrenar su sistema; la precisión de la traducción mejoró. [20]
Las mayores desventajas de SMT incluían su dependencia de enormes cantidades de textos paralelos, sus problemas con idiomas ricos en morfología (especialmente con la traducción a dichos idiomas) y su incapacidad para corregir errores singleton.
Se han realizado algunos trabajos en el uso de corpus multiparalelos , es decir, un conjunto de textos que se han traducido a tres o más idiomas. Mediante estos métodos, un texto que se ha traducido a dos o más idiomas se puede utilizar en combinación para proporcionar una traducción más precisa a un tercer idioma en comparación con si se utilizara solo uno de esos idiomas de origen. [21] [22] [23]
La traducción automática neuronal , un enfoque basado en el aprendizaje profundo para la traducción automática, ha avanzado rápidamente en los últimos años. Sin embargo, el consenso actual es que la denominada paridad humana lograda no es real, ya que se basa completamente en dominios limitados, pares de idiomas y ciertos puntos de referencia de prueba [24], es decir, carece de poder de significación estadística. [25]
Las traducciones realizadas mediante herramientas de traducción automática neuronal como DeepL Translator , que se cree que suele ofrecer los mejores resultados de traducción automática a partir de 2022, normalmente todavía necesitan posedición por parte de un humano. [26] [27] [28]
En lugar de entrenar modelos de traducción especializados en conjuntos de datos paralelos, también se pueden solicitar directamente modelos generativos de lenguaje grande como GPT para traducir un texto. [29] [30] [31] Este enfoque se considera prometedor, [32] pero aún requiere más recursos que los modelos de traducción especializados.
Los estudios que utilizan la evaluación humana (por ejemplo, por parte de traductores literarios profesionales o lectores humanos) han identificado sistemáticamente varios problemas con los últimos resultados avanzados de TA. [31] Los problemas comunes incluyen la traducción de partes ambiguas cuya traducción correcta requiere un procesamiento del lenguaje semántico o un contexto similar al sentido común. [31] También puede haber errores en los textos fuente, falta de datos de entrenamiento de alta calidad y la gravedad de la frecuencia de varios tipos de problemas puede no reducirse con las técnicas utilizadas hasta la fecha, lo que requiere cierto nivel de participación activa humana.
La desambiguación del sentido de las palabras se refiere a la búsqueda de una traducción adecuada cuando una palabra puede tener más de un significado. El problema fue planteado por primera vez en la década de 1950 por Yehoshua Bar-Hillel . [33] Señaló que sin una "enciclopedia universal", una máquina nunca podría distinguir entre los dos significados de una palabra. [34] Hoy en día existen numerosos enfoques diseñados para superar este problema. Se pueden dividir aproximadamente en enfoques "superficiales" y enfoques "profundos".
Los métodos superficiales presuponen que no se conoce el texto y simplemente aplican métodos estadísticos a las palabras que rodean la palabra ambigua. Los métodos profundos presuponen un conocimiento exhaustivo de la palabra. Hasta ahora, los métodos superficiales han tenido más éxito. [35]
Claude Piron , traductor de larga trayectoria para las Naciones Unidas y la Organización Mundial de la Salud , escribió que la traducción automática, en el mejor de los casos, automatiza la parte más fácil del trabajo de un traductor; la parte más difícil y que requiere más tiempo suele implicar realizar una investigación exhaustiva para resolver ambigüedades en el texto de origen , que las exigencias gramaticales y léxicas del idioma de destino requieren resolver:
¿Por qué un traductor necesita una jornada laboral completa para traducir cinco páginas, y no una o dos horas? ..... Aproximadamente el 90% de un texto medio responde a estas sencillas condiciones. Pero, por desgracia, existe el otro 10%. Es esa parte la que requiere seis [más] horas de trabajo. Hay ambigüedades que hay que resolver. Por ejemplo, el autor del texto original, un médico australiano, citó el ejemplo de una epidemia que se declaró durante la Segunda Guerra Mundial en un "campo de prisioneros de guerra japoneses". ¿Se refería a un campo americano con prisioneros japoneses o a un campo japonés con prisioneros americanos? El inglés tiene dos sentidos. Es necesario, por tanto, investigar, tal vez hasta el punto de llamar por teléfono a Australia. [36]
El enfoque profundo ideal requeriría que el software de traducción hiciera por sí solo toda la investigación necesaria para este tipo de desambiguación, pero esto requeriría un grado de inteligencia artificial mayor que el alcanzado hasta ahora. Un enfoque superficial que simplemente adivinara el sentido de la frase ambigua en inglés que menciona Piron (basándose, quizás, en qué tipo de campo de prisioneros de guerra se menciona con más frecuencia en un corpus determinado) tendría una probabilidad razonable de equivocarse con bastante frecuencia. Un enfoque superficial que implicara "preguntar al usuario sobre cada ambigüedad" automatizaría, según los cálculos de Piron, solo alrededor del 25% del trabajo de un traductor profesional, dejando el 75% más difícil para que lo hiciera un humano.
Una de las principales desventajas de la traducción automática es su incapacidad para traducir un lenguaje no estándar con la misma precisión que el lenguaje estándar. La traducción automática basada en heurística o estadística toma información de varias fuentes en la forma estándar de un idioma. La traducción basada en reglas, por naturaleza, no incluye usos no estándar comunes. Esto provoca errores en la traducción de una fuente vernácula o al lenguaje coloquial. Las limitaciones en la traducción del habla informal presentan problemas en el uso de la traducción automática en dispositivos móviles.
En la extracción de información , las entidades nombradas, en sentido estricto, se refieren a entidades concretas o abstractas del mundo real, como personas, organizaciones, empresas y lugares que tienen un nombre propio: George Washington, Chicago, Microsoft. También se refieren a expresiones de tiempo, espacio y cantidad, como 1 de julio de 2011, $500.
En la oración "Smith es el presidente de Fabrionix", tanto Smith como Fabrionix son entidades nombradas y pueden calificarse con más detalle mediante el nombre de pila u otra información; "presidente" no lo es, ya que Smith podría haber ocupado anteriormente otro puesto en Fabrionix, por ejemplo, vicepresidente. El término designador rígido es lo que define estos usos para el análisis en la traducción automática estadística.
Las entidades nombradas deben primero identificarse en el texto; de lo contrario, pueden traducirse erróneamente como sustantivos comunes, lo que probablemente no afectaría la calificación BLEU de la traducción, pero cambiaría la legibilidad humana del texto. [37] Pueden omitirse de la traducción de salida, lo que también tendría implicaciones para la legibilidad y el mensaje del texto.
La transliteración incluye la búsqueda de las letras en el idioma de destino que más se corresponden con el nombre en el idioma de origen. Sin embargo, se ha señalado que esto a veces empeora la calidad de la traducción. [38] En el caso de "Southern California", la primera palabra debe traducirse directamente, mientras que la segunda debe transliterarse. Las máquinas a menudo transliteran ambas palabras porque las tratan como una sola entidad. Palabras como estas son difíciles de procesar para los traductores automáticos, incluso para aquellos con un componente de transliteración.
El uso de una lista de “no traducir”, que tiene el mismo objetivo final (la transliteración en lugar de la traducción), [39] todavía depende de la identificación correcta de las entidades nombradas.
Un tercer enfoque es un modelo basado en clases. Las entidades nombradas se reemplazan con un token para representar su "clase"; "Ted" y "Erica" se reemplazarían con el token de clase "persona". Luego, la distribución estadística y el uso de los nombres de personas, en general, se pueden analizar en lugar de observar las distribuciones de "Ted" y "Erica" individualmente, de modo que la probabilidad de un nombre dado en un idioma específico no afecte la probabilidad asignada de una traducción. Un estudio de Stanford sobre la mejora de esta área de la traducción da los ejemplos de que se asignarán diferentes probabilidades a "David va a caminar" y "Ankit va a caminar" para el inglés como idioma de destino debido al diferente número de ocurrencias para cada nombre en los datos de entrenamiento. Un resultado frustrante del mismo estudio de Stanford (y otros intentos de mejorar la traducción de reconocimiento de nombres) es que muchas veces, una disminución en las puntuaciones BLEU para la traducción resultará de la inclusión de métodos para la traducción de entidades nombradas. [39]
Si bien ningún sistema ofrece el ideal de una traducción automática de alta calidad de texto sin restricciones, muchos sistemas totalmente automatizados producen resultados razonables. [40] [41] [42] La calidad de la traducción automática mejora sustancialmente si el dominio está restringido y controlado. [43] Esto permite utilizar la traducción automática como una herramienta para acelerar y simplificar las traducciones, así como para producir traducciones defectuosas pero útiles, de bajo costo o ad hoc.
También se han lanzado aplicaciones de traducción automática para la mayoría de los dispositivos móviles, incluidos teléfonos móviles, Pocket PC, PDA, etc. Debido a su portabilidad, estos instrumentos han llegado a ser designados como herramientas de traducción móvil que permiten la creación de redes comerciales móviles entre socios que hablan diferentes idiomas, o facilitan tanto el aprendizaje de idiomas extranjeros como los viajes sin acompañante a países extranjeros sin la necesidad de la intermediación de un traductor humano.
Por ejemplo, la aplicación Google Translate permite a los extranjeros traducir rápidamente el texto de su entorno a través de la realidad aumentada usando la cámara del teléfono inteligente que superpone el texto traducido sobre el texto. [44] También puede reconocer el habla y luego traducirla. [45]
A pesar de sus limitaciones inherentes, los programas de traducción automática se utilizan en todo el mundo. Probablemente el mayor usuario institucional sea la Comisión Europea . En 2012, con el objetivo de reemplazar una traducción automática basada en reglas por una traducción automática más nueva basada en estadísticas, la Comisión Europea contribuyó con 3,072 millones de euros (a través de su programa ISA). [46]
La traducción automática también se ha utilizado para traducir artículos de Wikipedia y podría desempeñar un papel más importante en la creación, actualización, expansión y mejora general de los artículos en el futuro, especialmente a medida que mejoren las capacidades de traducción automática. Existe una "herramienta de traducción de contenido" que permite a los editores traducir artículos más fácilmente en varios idiomas seleccionados. [47] [48] [49] Se cree que los artículos en inglés suelen ser más completos y menos sesgados que sus equivalentes no traducidos en otros idiomas. [50] En 2022, la Wikipedia en inglés tiene más de 6,5 millones de artículos, mientras que las Wikipedias en alemán y sueco solo tienen cada una más de 2,5 millones de artículos, [51] cada una de ellas a menudo mucho menos completa.
Tras los ataques terroristas en países occidentales, incluido el 11 de septiembre , Estados Unidos y sus aliados han estado muy interesados en desarrollar programas de traducción automática árabe , pero también en traducir los idiomas pastún y dari . [ cita requerida ] Dentro de estos idiomas, el enfoque está en frases clave y comunicación rápida entre miembros militares y civiles mediante el uso de aplicaciones de teléfonos móviles. [52] La Oficina de Tecnología de Procesamiento de Información en DARPA albergó programas como TIDES y Babylon translater . La Fuerza Aérea de Estados Unidos ha otorgado un contrato de $ 1 millón para desarrollar una tecnología de traducción de idiomas. [53]
El notable auge de las redes sociales en la web en los últimos años ha creado otro nicho para la aplicación de software de traducción automática (en utilidades como Facebook o clientes de mensajería instantánea como Skype , Google Talk , MSN Messenger , etc.) permitiendo a usuarios que hablan diferentes idiomas comunicarse entre sí.
Lineage W ganó popularidad en Japón debido a sus funciones de traducción automática que permitían a jugadores de diferentes países comunicarse. [54]
A pesar de que en 1966 el Comité Asesor sobre Procesamiento Automático del Lenguaje creado por el gobierno de los Estados Unidos la calificó de competidora indigna de la traducción humana, [55] la calidad de la traducción automática ha mejorado hasta tal punto que se está investigando su aplicación en la colaboración en línea y en el campo médico. La aplicación de esta tecnología en entornos médicos donde no hay traductores humanos es otro tema de investigación, pero surgen dificultades debido a la importancia de las traducciones precisas en los diagnósticos médicos. [56]
Los investigadores advierten que el uso de la traducción automática en medicina podría generar errores de traducción que pueden ser peligrosos en situaciones críticas. [57] [58] La traducción automática puede facilitar la comunicación de los médicos con sus pacientes en las actividades cotidianas, pero se recomienda utilizar la traducción automática solo cuando no haya otra alternativa y que los textos médicos traducidos sean revisados por traductores humanos para comprobar su precisión. [59] [60]
El lenguaje jurídico plantea un desafío importante para las herramientas de traducción automática debido a su naturaleza precisa y al uso atípico de palabras normales. Por este motivo, se han desarrollado algoritmos especializados para su uso en contextos legales. [61] Debido al riesgo de errores de traducción que surgen de los traductores automáticos, los investigadores recomiendan que las traducciones automáticas sean revisadas por traductores humanos para comprobar su precisión, y algunos tribunales prohíben su uso en procedimientos formales . [62]
El uso de la traducción automática en el ámbito jurídico ha suscitado inquietudes sobre los errores de traducción y la confidencialidad del cliente . Los abogados que utilizan herramientas de traducción gratuitas como Google Translate pueden violar accidentalmente la confidencialidad del cliente al exponer información privada a los proveedores de las herramientas de traducción. [61] Además, se ha argumentado que el consentimiento para un registro policial obtenido con traducción automática no es válido, y distintos tribunales han emitido veredictos diferentes sobre si estos argumentos son válidos o no. [57]
Los avances en redes neuronales convolucionales en los últimos años y en la traducción automática de bajos recursos (cuando solo hay una cantidad muy limitada de datos y ejemplos disponibles para el entrenamiento) permitieron la traducción automática de idiomas antiguos, como el acadio y sus dialectos, el babilónico y el asirio. [63]
Existen muchos factores que afectan la forma en que se evalúan los sistemas de traducción automática. Estos factores incluyen el uso previsto de la traducción, la naturaleza del software de traducción automática y la naturaleza del proceso de traducción.
Diferentes programas pueden funcionar bien para diferentes propósitos. Por ejemplo, la traducción automática estadística (SMT) generalmente supera a la traducción automática basada en ejemplos (EBMT), pero los investigadores descubrieron que al evaluar la traducción del inglés al francés, la EBMT funciona mejor. [64] El mismo concepto se aplica a los documentos técnicos, que se pueden traducir más fácilmente mediante SMT debido a su lenguaje formal.
Sin embargo, en ciertas aplicaciones, por ejemplo, descripciones de productos escritas en un lenguaje controlado , un sistema de traducción automática basado en diccionario ha producido traducciones satisfactorias que no requieren intervención humana salvo para la inspección de calidad. [65]
Existen varios métodos para evaluar la calidad de los resultados de los sistemas de traducción automática. El más antiguo es el uso de jueces humanos [66] para evaluar la calidad de una traducción. Si bien la evaluación humana requiere mucho tiempo, sigue siendo el método más confiable para comparar diferentes sistemas, como los basados en reglas y los estadísticos. [67] Los medios automáticos de evaluación incluyen BLEU , NIST , METEOR y LEPOR . [68]
Confiar exclusivamente en la traducción automática sin editar ignora el hecho de que la comunicación en el lenguaje humano está arraigada en el contexto y que se necesita una persona para comprender el contexto del texto original con un grado razonable de probabilidad. Es ciertamente cierto que incluso las traducciones generadas puramente por humanos son propensas a errores. Por lo tanto, para garantizar que una traducción generada por una máquina sea útil para un ser humano y que se logre una traducción de calidad publicable, dichas traducciones deben ser revisadas y editadas por un humano. [69] El difunto Claude Piron escribió que la traducción automática, en el mejor de los casos, automatiza la parte más fácil del trabajo de un traductor; la parte más difícil y que requiere más tiempo generalmente implica realizar una investigación exhaustiva para resolver ambigüedades en el texto fuente , que las exigencias gramaticales y léxicas del idioma de destino requieren que se resuelvan. Dicha investigación es un preludio necesario para la preedición necesaria para proporcionar información para el software de traducción automática de modo que el resultado no sea sin sentido . [70]
Además de los problemas de desambiguación, la precisión puede disminuir debido a los diferentes niveles de datos de entrenamiento para los programas de traducción automática. Tanto la traducción automática basada en ejemplos como la traducción automática estadística dependen de una amplia gama de oraciones de ejemplo reales como base para la traducción, y cuando se analizan demasiadas o muy pocas oraciones, la precisión se ve comprometida. Los investigadores descubrieron que cuando un programa se entrena con 203.529 pares de oraciones, la precisión en realidad disminuye. [64] El nivel óptimo de datos de entrenamiento parece ser un poco más de 100.000 oraciones, posiblemente porque a medida que aumentan los datos de entrenamiento, aumenta la cantidad de oraciones posibles, lo que dificulta encontrar una coincidencia de traducción exacta.
Las fallas en la traducción automática se han notado por su valor de entretenimiento . Dos videos subidos a YouTube en abril de 2017 involucran dos caracteres hiragana japonesesえぐ ( e y gu ) que se pegan repetidamente en Google Translate, y las traducciones resultantes se degradan rápidamente a frases sin sentido como "DECEARING EGG" y "Deep-sea squeeze trees", que luego se leen en voces cada vez más absurdas; [71] [72] la versión completa del video actualmente tiene 6,9 millones de vistas a marzo de 2022. [73][actualizar]
A principios de la década de 2000, las opciones de traducción automática entre lenguajes hablados y de señas eran muy limitadas. Era una creencia común que las personas sordas podían utilizar traductores tradicionales. Sin embargo, el acento, la entonación, el tono y el ritmo se transmiten de manera muy diferente en los idiomas hablados en comparación con los lenguajes de señas. Por lo tanto, una persona sorda puede malinterpretar o confundirse sobre el significado de un texto escrito basado en un lenguaje hablado. [74]
Los investigadores Zhao, et al. (2000) desarrollaron un prototipo llamado TEAM (traducción del inglés al ASL por máquina) que completaba traducciones del inglés al lenguaje de señas americano (ASL). El programa primero analizaba los aspectos sintácticos, gramaticales y morfológicos del texto en inglés. Después de este paso, el programa accedía a un sintetizador de señas, que actuaba como un diccionario para el ASL. Este sintetizador albergaba el proceso que uno debe seguir para completar las señas del ASL, así como los significados de estas señas. Una vez que se analizaba todo el texto y se ubicaban en el sintetizador las señas necesarias para completar la traducción, aparecía un humano generado por computadora que usaba el ASL para firmar el texto en inglés para el usuario. [74]
Sólo las obras originales están sujetas a protección de derechos de autor , por lo que algunos académicos afirman que los resultados de la traducción automática no tienen derecho a protección de derechos de autor porque la traducción automática no implica creatividad . [ 75] Los derechos de autor en cuestión son para una obra derivada ; el autor de la obra original en el idioma original no pierde sus derechos cuando se traduce una obra: un traductor debe tener permiso para publicar una traducción. [ cita requerida ]
わが国では1956年、当時の電気試験所が英和翻訳専用機「ヤマト」を実験している。この機械は1962年頃には中学1年の教科書で90点以上の能力に達したと報告されている。(traducción (asistida por Google Translate ): En 1959 Japón, el Instituto Nacional de Ciencia y Tecnología Industrial Avanzada (AIST) probó la máquina traductora adecuada inglés-japonés Yamato , que informó en 1964 que alcanzó un nivel de potencia superior a los 90 puntos en el libro de texto de primer grado de secundaria. -escuela.)
fue líder del proyecto de lingüística computacional en Rand de 1955 a 1968.
{{cite book}}
: CS1 maint: falta la ubicación del editor ( enlace ) CS1 maint: otros ( enlace ){{cite report}}
: CS1 maint: varios nombres: lista de autores ( enlace )