Máquina traductora

Una aplicación para teléfonos móviles que traduce textos del español al inglés

La traducción automática es el uso de enfoques de aprendizaje automático basados en reglas o probabilísticos (es decir, estadísticos y, más recientemente, basados en redes neuronales) para la traducción de texto o voz de un idioma a otro, incluidos los matices contextuales, idiomáticos y pragmáticos de ambos idiomas. .

Historia

Orígenes

Los orígenes de la traducción automática se remontan al trabajo de Al-Kindi , un criptógrafo árabe del siglo IX que desarrolló técnicas para la traducción sistémica de idiomas, incluido el criptoanálisis , el análisis de frecuencia y la probabilidad y estadística , que se utilizan en la traducción automática moderna. ^[1] La idea de la traducción automática apareció más tarde en el siglo XVII. En 1629, René Descartes propuso un lenguaje universal, en el que ideas equivalentes en diferentes lenguas compartían un símbolo. ^[2]

La idea de utilizar computadoras digitales para la traducción de lenguajes naturales fue propuesta ya en 1947 por AD Booth ^[3] de Inglaterra y Warren Weaver de la Fundación Rockefeller ese mismo año. "El memorando escrito por Warren Weaver en 1949 es quizás la publicación más influyente en los primeros días de la traducción automática". ^[4]^[5] Otros siguieron. En 1954 se hizo una demostración en la máquina APEXC del Birkbeck College ( Universidad de Londres ) de una traducción rudimentaria del inglés al francés. En ese momento se publicaron varios artículos sobre el tema, e incluso artículos en revistas populares (por ejemplo, un artículo de Cleave y Zacharov en la edición de septiembre de 1955 de Wireless World ). Una aplicación similar, también pionera en Birkbeck College en ese momento, consistía en leer y componer textos en Braille por computadora.

década de 1950

El primer investigador en este campo, Yehoshua Bar-Hillel , inició sus investigaciones en el MIT (1951). Un equipo de investigación de MT de la Universidad de Georgetown , dirigido por el profesor Michael Zarechnak, siguió (1951) con una demostración pública de su sistema experimental Georgetown-IBM en 1954. Surgieron programas de investigación de MT en Japón ^[6]^[7] y Rusia (1955). y la primera conferencia MT se celebró en Londres (1956). ^[8]^[9]

David G. Hays "escribió sobre el procesamiento del lenguaje asistido por computadora ya en 1957" y "fue líder de proyecto sobre lingüística computacional en Rand de 1955 a 1968". ^[10]

1960-1975

Los investigadores continuaron uniéndose a este campo cuando se formó la Asociación para la Traducción Automática y la Lingüística Computacional en los EE. UU. (1962) y la Academia Nacional de Ciencias formó el Comité Asesor de Procesamiento Automático del Lenguaje (ALPAC) para estudiar la MT (1964). Sin embargo, el progreso real fue mucho más lento y después del informe ALPAC (1966), que encontró que la investigación de diez años no había cumplido las expectativas, la financiación se redujo considerablemente. ^[11] Según un informe de 1972 del Director de Investigación e Ingeniería de Defensa (DDR&E), la viabilidad de la MT a gran escala se restableció gracias al éxito del sistema Logos MT en la traducción de manuales militares al vietnamita durante ese conflicto.

El Instituto Textil Francés también utilizó MT para traducir resúmenes del francés, inglés, alemán y español (1970); La Universidad Brigham Young inició un proyecto para traducir textos mormones mediante traducción automática (1971).

1975 y más allá

SYSTRAN , que "fue pionero en este campo gracias a contratos del gobierno de Estados Unidos" ^[12] en los años 1960, fue utilizado por Xerox para traducir manuales técnicos (1978). A partir de finales de la década de 1980, a medida que la potencia computacional aumentó y se volvió menos costosa, se mostró más interés en los modelos estadísticos para la traducción automática . La MT se hizo más popular después de la llegada de las computadoras. ^[13] El primer sistema de implementación de SYSTRAN fue implementado en 1988 por el servicio en línea del Servicio Postal Francés llamado Minitel. ^[14] También se lanzaron varias empresas de traducción por computadora, incluida Trados (1984), que fue la primera en desarrollar y comercializar tecnología de memoria de traducción (1989), aunque no es lo mismo que la traducción automática. El primer sistema de traducción automática comercial para ruso, inglés y alemán-ucraniano se desarrolló en la Universidad Estatal de Jarkov (1991).

En 1998, "por tan solo 29,95 dólares" se podía "comprar un programa para traducir en una dirección entre el inglés y uno de los principales idiomas europeos de su elección" para ejecutarlo en una PC. ^[12]

La MT en la web comenzó con SYSTRAN ofreciendo traducción gratuita de textos pequeños (1996) y luego ofreciéndola a través de AltaVista Babelfish, ^[12] que acumuló 500.000 solicitudes por día (1997). ^[15] El segundo servicio de traducción gratuito en la web fue GlobaLink de Lernout & Hauspie . ^[12] Atlantic Magazine escribió en 1998 que "Babelfish de Systran y Comprende de GlobaLink" manejaron "Don't bank on it" con un "desempeño competente". ^[dieciséis]

Franz Josef Och (futuro director de Desarrollo de Traducción de Google) ganó el concurso de MT rápida de DARPA (2003). ^[17] Más innovaciones durante este tiempo incluyeron MOSES, el motor estadístico de traducción automática de código abierto (2007), un servicio de traducción de texto/SMS para móviles en Japón (2008) y un teléfono móvil con traducción de voz a voz incorporada. funcionalidad para inglés, japonés y chino (2009). En 2012, Google anunció que Google Translate traduce aproximadamente suficiente texto para llenar 1 millón de libros en un día.

Enfoques

Antes de la llegada de los métodos de aprendizaje profundo , los métodos estadísticos requerían muchas reglas acompañadas de anotaciones morfológicas , sintácticas y semánticas .

Basado en reglas

El enfoque de traducción automática basado en reglas se utilizó principalmente en la creación de diccionarios y programas gramaticales. Su mayor inconveniente fue que todo tenía que ser explícito: la variación ortográfica y la entrada errónea debían formar parte del analizador de la lengua fuente para poder hacer frente a ello, y debían escribirse reglas de selección léxica para todos los casos de ambigüedad.

Traducción automática basada en transferencias

La traducción automática basada en transferencias era similar a la traducción automática interlingüística en que creaba una traducción a partir de una representación intermedia que simulaba el significado de la oración original. A diferencia de la traducción automática interlingüística, dependía parcialmente del par de idiomas involucrados en la traducción.

Interlingüístico

La traducción automática interlingüística fue un ejemplo de enfoques de traducción automática basados en reglas. En este enfoque, la lengua de origen, es decir, el texto a traducir, se transformó en una lengua interlingüística, es decir, una representación "lenguaje neutral" que es independiente de cualquier lengua. A continuación, se generó la lengua de destino a partir de la interlingua . El único sistema de traducción automática interlingüístico que se puso operativo a nivel comercial fue el sistema KANT (Nyberg y Mitamura, 1992), que fue diseñado para traducir el inglés técnico (CTE) de Caterpillar a otros idiomas.

Basado en diccionario

La traducción automática utilizó un método basado en entradas de diccionario , lo que significa que las palabras fueron traducidas tal como están por un diccionario.

Estadístico

La traducción automática estadística intentó generar traducciones utilizando métodos estadísticos basados en corpus de textos bilingües, como el corpus canadiense Hansard , el registro inglés-francés del parlamento canadiense y EUROPARL , el registro del Parlamento Europeo . Cuando dichos corpus estaban disponibles, se lograron buenos resultados al traducir textos similares, pero dichos corpus eran raros en muchos pares de idiomas. El primer software de traducción automática estadística fue CANDIDE de IBM . En 2005, Google mejoró sus capacidades de traducción interna utilizando aproximadamente 200 mil millones de palabras de materiales de las Naciones Unidas para entrenar su sistema; Se mejoró la precisión de la traducción. ^[18]

La mayor caída de SMT incluyó su dependencia de grandes cantidades de textos paralelos, sus problemas con lenguajes ricos en morfología (especialmente con la traducción a dichos idiomas) y su incapacidad para corregir errores únicos.

MT neuronal

La traducción automática neuronal, un enfoque de la traducción automática basado en el aprendizaje profundo , ha progresado rápidamente en los últimos años. Sin embargo, el consenso actual es que la llamada paridad humana lograda no es real, ya que se basa totalmente en dominios limitados, pares de idiomas y ciertos puntos de referencia de prueba ^[19] , es decir, carece de poder de significación estadística. ^[20]

Las traducciones realizadas mediante herramientas de traducción automática neuronal como DeepL Translator , que se cree que suele ofrecer los mejores resultados de traducción automática a partir de 2022, normalmente todavía necesitan una posedición por parte de un humano. ^[21]^[22]^[23]

En lugar de entrenar modelos de traducción especializados en conjuntos de datos paralelos, también se pueden solicitar directamente modelos generativos de lenguaje grande como GPT para traducir un texto. ^[24]^[25]^[26] Este enfoque se considera prometedor, ^[27] pero aún requiere más recursos que los modelos de traducción especializados.

Problemas mayores

Los estudios que utilizan evaluación humana (por ejemplo, por traductores literarios profesionales o lectores humanos) han identificado sistemáticamente varios problemas con los últimos resultados avanzados de MT. ^[26] Los problemas comunes incluyen la traducción de partes ambiguas cuya traducción correcta requiere un procesamiento o contexto del lenguaje semántico similar al sentido común. ^[26] También puede haber errores en los textos fuente, falta de datos de capacitación de alta calidad y la gravedad de la frecuencia de varios tipos de problemas puede no reducirse con las técnicas utilizadas hasta la fecha, lo que requiere cierto nivel de participación humana activa.

Desambiguación

La desambiguación del sentido de las palabras implica encontrar una traducción adecuada cuando una palabra puede tener más de un significado. El problema fue planteado por primera vez en la década de 1950 por Yehoshua Bar-Hillel . ^[28] Señaló que sin una "enciclopedia universal", una máquina nunca sería capaz de distinguir entre los dos significados de una palabra. ^[29] Hoy en día existen numerosos enfoques diseñados para superar este problema. Se pueden dividir aproximadamente en enfoques "superficiales" y enfoques "profundos".

Los enfoques superficiales suponen que no se tiene ningún conocimiento del texto. Simplemente aplican métodos estadísticos a las palabras que rodean la palabra ambigua. Los enfoques profundos suponen un conocimiento integral de la palabra. Hasta ahora, los enfoques superficiales han tenido más éxito. ^[30]

Claude Piron , traductor desde hace mucho tiempo de las Naciones Unidas y la Organización Mundial de la Salud , escribió que la traducción automática, en el mejor de los casos, automatiza la parte más fácil del trabajo de un traductor; la parte más difícil y que requiere más tiempo generalmente implica realizar una investigación exhaustiva para resolver ambigüedades en el texto de origen , que las exigencias gramaticales y léxicas del idioma de destino requieren ser resueltas:

¿Por qué un traductor necesita toda una jornada laboral para traducir cinco páginas y no una o dos horas? ..... Aproximadamente el 90% de un texto medio corresponde a estas sencillas condiciones. Pero lamentablemente queda el otro 10%. Es esa parte la que requiere seis [más] horas de trabajo. Hay ambigüedades que uno tiene que resolver. Por ejemplo, el autor del texto original, un médico australiano, citó el ejemplo de una epidemia que se declaró durante la Segunda Guerra Mundial en un "campo de prisioneros de guerra japoneses". ¿Estaba hablando de un campo estadounidense con prisioneros japoneses o de un campo japonés con prisioneros estadounidenses? El inglés tiene dos sentidos. Por lo tanto, es necesario investigar, tal vez hasta el punto de hacer una llamada telefónica a Australia. ^[31]

El enfoque profundo ideal requeriría que el software de traducción hiciera por sí solo toda la investigación necesaria para este tipo de desambiguación; pero esto requeriría un grado de IA mayor que el que se ha alcanzado hasta ahora. Un enfoque superficial que simplemente adivinara el sentido de la ambigua frase inglesa que menciona Piron (basándose, tal vez, en qué tipo de campo de prisioneros de guerra se menciona con más frecuencia en un corpus determinado) tendría una probabilidad razonable de adivinar bastante mal. a menudo. Un enfoque superficial que implique "preguntar al usuario sobre cada ambigüedad", según la estimación de Piron, sólo automatizaría alrededor del 25% del trabajo de un traductor profesional, dejando el 75% más difícil aún para que lo haga un humano.

Discurso no estándar

Uno de los principales problemas de la traducción automática es su incapacidad para traducir un lenguaje no estándar con la misma precisión que el lenguaje estándar. La MT basada en heurística o estadística recibe información de varias fuentes en la forma estándar de un lenguaje. La traducción basada en reglas, por naturaleza, no incluye usos comunes no estándar. Esto provoca errores en la traducción de una fuente vernácula o al lenguaje coloquial. Las limitaciones a la traducción del discurso informal presentan problemas en el uso de la traducción automática en dispositivos móviles.

Entidades nombradas

En extracción de información , las entidades nombradas, en sentido estricto, se refieren a entidades concretas o abstractas del mundo real como personas, organizaciones, empresas y lugares que tienen un nombre propio: George Washington, Chicago, Microsoft. También se refiere a expresiones de tiempo, espacio y cantidad como el 1 de julio de 2011, 500 dólares.

En la oración "Smith es el presidente de Fabrionix", tanto Smith como Fabrionix son entidades nombradas y pueden calificarse aún más mediante el nombre u otra información; "presidente" no lo es, ya que Smith podría haber ocupado antes otro puesto en Fabrionix, por ejemplo, vicepresidente. El término designador rígido es lo que define estos usos para el análisis en la traducción automática estadística.

Las entidades nombradas primero deben identificarse en el texto; de lo contrario, pueden traducirse erróneamente como sustantivos comunes, lo que probablemente no afectaría la calificación BLEU de la traducción, pero sí cambiaría la legibilidad humana del texto. ^[32] Pueden omitirse en la traducción resultante, lo que también tendría implicaciones para la legibilidad y el mensaje del texto.

La transliteración incluye encontrar las letras en el idioma de destino que más se correspondan con el nombre en el idioma de origen. Sin embargo, se ha citado que esto a veces empeora la calidad de la traducción. ^[33] Para "California del Sur", la primera palabra debe traducirse directamente, mientras que la segunda palabra debe transliterarse. Las máquinas a menudo transliteran ambos porque los tratan como una sola entidad. Palabras como estas son difíciles de procesar para los traductores automáticos, incluso aquellos con un componente de transliteración.

Uso de una lista de "no traducir", que tiene el mismo objetivo final: transliteración en lugar de traducción. ^[34] todavía se basa en la identificación correcta de las entidades nombradas.

Un tercer enfoque es un modelo basado en clases. Las entidades nombradas se reemplazan con un token para representar su "clase"; "Ted" y "Erica" serían reemplazados por un token de clase "persona". Entonces, la distribución estadística y el uso de nombres de personas, en general, se pueden analizar en lugar de observar las distribuciones de "Ted" y "Erica" individualmente, de modo que la probabilidad de un nombre determinado en un idioma específico no afectará la probabilidad asignada. de una traducción. Un estudio de Stanford sobre la mejora de esta área de la traducción da ejemplos de que se asignarán diferentes probabilidades a "David va a caminar" y "Ankit va a caminar" para el inglés como idioma de destino debido al diferente número de apariciones. para cada nombre en los datos de entrenamiento. Un resultado frustrante del mismo estudio de Stanford (y otros intentos de mejorar la traducción de reconocimiento de nombres) es que muchas veces, una disminución en las puntuaciones BLEU para la traducción resultará de la inclusión de métodos para la traducción de entidades nombradas. ^[34]

Traducción de fuentes multiparalelas

Se han realizado algunos trabajos en la utilización de corpus multiparalelos , es decir, un cuerpo de texto que ha sido traducido a 3 o más idiomas. Usando estos métodos, un texto que ha sido traducido a 2 o más idiomas se puede utilizar en combinación para proporcionar una traducción más precisa a un tercer idioma en comparación con si solo uno de esos idiomas de origen se usara solo. ^[35]^[36]^[37]

Ontologías en MT

Una ontología es una representación formal del conocimiento que incluye los conceptos (como objetos, procesos, etc.) en un dominio y algunas relaciones entre ellos. Si la información almacenada es de naturaleza lingüística, se puede hablar de léxico. ^[38] En PNL , las ontologías se pueden utilizar como fuente de conocimiento para sistemas de traducción automática. Con acceso a una gran base de conocimientos, se puede permitir que los sistemas resuelvan muchas ambigüedades (especialmente léxicas) por sí solos. En los siguientes ejemplos clásicos, como humanos, podemos interpretar la frase preposicional según el contexto porque utilizamos nuestro conocimiento del mundo, almacenado en nuestro léxico:

Vi un hombre/estrella/molécula con un microscopio/telescopio/binoculares. ^[38]

Inicialmente, un sistema de traducción automática no sería capaz de diferenciar los significados porque la sintaxis no cambia. Sin embargo, con una ontología lo suficientemente grande como fuente de conocimiento, se pueden reducir las posibles interpretaciones de palabras ambiguas en un contexto específico. Otras áreas de uso de las ontologías dentro de la PNL incluyen la recuperación de información , la extracción de información y el resumen de texto . ^[38]

Construyendo ontologías

La ontología generada para el sistema de traducción automática basado en el conocimiento PANGLOSS en 1993 puede servir como ejemplo de cómo se puede compilar una ontología para fines de PNL : ^[39]^[40]

Es necesaria una ontología a gran escala para ayudar a analizar los módulos activos del sistema de traducción automática.
En el ejemplo de PANGLOSS, se pretendía incluir alrededor de 50.000 nodos en la región superior (abstracta) más pequeña y construida manualmente de la ontología. Debido a su tamaño, tuvo que crearse automáticamente.
El objetivo era fusionar los dos recursos LDOCE en línea y WordNet para combinar los beneficios de ambos: definiciones concisas de Longman y relaciones semánticas que permitieran la taxonomización semiautomática de la ontología de WordNet.
- Se creó un algoritmo de coincidencia de definiciones para fusionar automáticamente los significados correctos de palabras ambiguas entre los dos recursos en línea, basándose en las palabras que las definiciones de esos significados tienen en común en LDOCE y WordNet. Utilizando una matriz de similitud , el algoritmo proporcionó coincidencias entre significados, incluido un factor de confianza. Sin embargo, este algoritmo por sí solo no correspondía correctamente a todos los significados.
- Por lo tanto, se creó un segundo algoritmo de coincidencia de jerarquías que utiliza las jerarquías taxonómicas que se encuentran en WordNet (jerarquías profundas) y parcialmente en LDOCE (jerarquías planas). Esto funciona primero haciendo coincidir significados inequívocos y luego limitando el espacio de búsqueda solo a los respectivos ancestros y descendientes de esos significados coincidentes. Por lo tanto, el algoritmo coincidió con significados localmente inequívocos (por ejemplo, si bien la palabra foca como tal es ambigua, sólo hay un significado de foca en la subjerarquía animal ).
Ambos algoritmos se complementaron y ayudaron a construir una ontología a gran escala para el sistema de traducción automática. Las jerarquías de WordNet, junto con las definiciones coincidentes de LDOCE, estaban subordinadas a la región superior de la ontología . Como resultado, el sistema PANGLOSS MT pudo hacer uso de esta base de conocimiento, principalmente en su elemento de generación.

Aplicaciones

Si bien ningún sistema ofrece el ideal de traducción automática de alta calidad de texto sin restricciones, muchos sistemas totalmente automatizados producen resultados razonables. ^[41]^[42]^[43] La calidad de la traducción automática mejora sustancialmente si el dominio está restringido y controlado. ^[44] Esto permite utilizar la traducción automática como herramienta para acelerar y simplificar las traducciones, así como producir traducciones ad hoc o de bajo costo defectuosas pero útiles.

Viajar

También se han lanzado aplicaciones de traducción automática para la mayoría de los dispositivos móviles, incluidos teléfonos móviles, PC de bolsillo, PDA, etc. Debido a su portabilidad, estos instrumentos han llegado a designarse como herramientas de traducción móviles que permiten establecer contactos comerciales móviles entre socios que hablan diferentes idiomas, o facilitando tanto el aprendizaje de idiomas extranjeros como los viajes no acompañados a países extranjeros sin la necesidad de la intermediación de un traductor humano.

Por ejemplo, la aplicación Google Translate permite a los extranjeros traducir rápidamente texto de su entorno a través de realidad aumentada utilizando la cámara del teléfono inteligente que superpone el texto traducido sobre el texto. ^[45] También puede reconocer el habla y luego traducirla. ^[46]

Administración Pública

A pesar de sus limitaciones inherentes, los programas de TA se utilizan en todo el mundo. Probablemente el mayor usuario institucional sea la Comisión Europea . En 2012, con el objetivo de sustituir un MT basado en reglas por un MT@EC más nuevo y basado en estadísticas, la Comisión Europea aportó 3.072 millones de euros (a través de su programa ISA). ^[47]

Wikipedia

La traducción automática también se ha utilizado para traducir artículos de Wikipedia y podría desempeñar un papel más importante en la creación, actualización, ampliación y mejora general de artículos en el futuro, especialmente a medida que las capacidades de traducción automática puedan mejorar. Existe una "herramienta de traducción de contenido" que permite a los editores traducir más fácilmente artículos en varios idiomas seleccionados. ^[48]^[49]^[50] Se cree que los artículos en inglés suelen ser más completos y menos sesgados que sus equivalentes no traducidos en otros idiomas. ^[51] A partir de 2022, la Wikipedia en inglés tiene más de 6,5 millones de artículos, mientras que las Wikipedias en alemán y sueco solo tienen cada una más de 2,5 millones de artículos, ^[52] cada una de ellas a menudo mucho menos completa.

Vigilancia y ejército.

Después de los ataques terroristas en los países occidentales, incluido el 11 de septiembre , Estados Unidos y sus aliados han estado muy interesados en desarrollar programas de traducción automática al árabe , pero también en traducir los idiomas pashto y dari . ^{[ cita necesaria ]} Dentro de estos idiomas, la atención se centra en frases clave y comunicación rápida entre miembros militares y civiles mediante el uso de aplicaciones de teléfonos móviles. ^[53] La Oficina de Tecnología de Procesamiento de Información de DARPA albergaba programas como TIDES y el traductor Babylon . La Fuerza Aérea de EE. UU. ha adjudicado un contrato de 1 millón de dólares para desarrollar una tecnología de traducción de idiomas. ^[54]

Medios de comunicación social

El notable auge de las redes sociales en la web en los últimos años ha creado otro nicho más para la aplicación de software de traducción automática (en utilidades como Facebook o clientes de mensajería instantánea como Skype , Google Talk , MSN Messenger , etc.) que permiten a los usuarios Hablar diferentes idiomas para comunicarse entre sí.

Juegos en línea

Lineage W ganó popularidad en Japón debido a sus funciones de traducción automática que permiten comunicarse a jugadores de diferentes países. ^[55]

Medicamento

A pesar de haber sido etiquetada como un competidor indigno de la traducción humana en 1966 por el Comité Asesor sobre Procesamiento Automatizado de Idiomas creado por el gobierno de los Estados Unidos, ^[56] la calidad de la traducción automática ha mejorado ahora a niveles tales que su aplicación en la colaboración en línea y en el campo médico está siendo investigado. La aplicación de esta tecnología en entornos médicos donde no hay traductores humanos es otro tema de investigación, pero surgen dificultades debido a la importancia de traducciones precisas en los diagnósticos médicos. ^[57]

Los investigadores advierten que el uso de la traducción automática en medicina podría provocar errores de traducción que pueden ser peligrosos en situaciones críticas. ^[58]^[59] La traducción automática puede facilitar que los médicos se comuniquen con sus pacientes en las actividades diarias, pero se recomienda utilizar la traducción automática sólo cuando no haya otra alternativa, y que los textos médicos traducidos deben ser revisados por traductores humanos para mayor precisión. ^[60]^[61]

Ley

El lenguaje jurídico plantea un desafío importante para las herramientas de traducción automática debido a su naturaleza precisa y al uso atípico de palabras normales. Por este motivo, se han desarrollado algoritmos especializados para su uso en contextos legales. ^[62] Debido al riesgo de errores de traducción que surgen de los traductores automáticos, los investigadores recomiendan que las traducciones automáticas sean revisadas por traductores humanos para verificar su precisión, y algunos tribunales prohíben su uso en procedimientos formales . ^[63]

El uso de la traducción automática en el ámbito jurídico ha generado preocupaciones sobre errores de traducción y confidencialidad del cliente . Los abogados que utilizan herramientas de traducción gratuitas como Google Translate pueden violar accidentalmente la confidencialidad del cliente al exponer información privada a los proveedores de las herramientas de traducción. ^[62] Además, ha habido argumentos de que el consentimiento para un registro policial que se obtiene con traducción automática no es válido, y diferentes tribunales han emitido diferentes veredictos sobre si estos argumentos son válidos o no. ^[64]

lenguas antiguas

Los avances en las redes neuronales convolucionales en los últimos años y en la traducción automática de bajos recursos (cuando solo hay una cantidad muy limitada de datos y ejemplos disponibles para la capacitación) permitieron la traducción automática de idiomas antiguos, como el acadio y sus dialectos babilónico y asirio. ^{[sesenta y cinco]}

Evaluación

Hay muchos factores que afectan la forma en que se evalúan los sistemas de traducción automática. Estos factores incluyen el uso previsto de la traducción, la naturaleza del software de traducción automática y la naturaleza del proceso de traducción.

Diferentes programas pueden funcionar bien para diferentes propósitos. Por ejemplo, la traducción automática estadística (SMT) suele superar a la traducción automática basada en ejemplos (EBMT), pero los investigadores descubrieron que al evaluar la traducción del inglés al francés, la EBMT funciona mejor. ^[66] El mismo concepto se aplica a los documentos técnicos, que SMT puede traducir más fácilmente debido a su lenguaje formal.

Sin embargo, en determinadas aplicaciones, por ejemplo, descripciones de productos escritas en un lenguaje controlado , un sistema de traducción automática basado en diccionarios ha producido traducciones satisfactorias que no requieren intervención humana salvo la inspección de calidad. ^[67]

Existen varios medios para evaluar la calidad de los resultados de los sistemas de traducción automática. El más antiguo es el uso de jueces humanos ^[68] para evaluar la calidad de una traducción. Aunque la evaluación humana requiere mucho tiempo, sigue siendo el método más confiable para comparar diferentes sistemas, como los basados en reglas y los estadísticos. ^{[69] Los medios} automatizados de evaluación incluyen BLEU , NIST , METEOR y LEPOR . ^[70]

Depender exclusivamente de la traducción automática sin editar ignora el hecho de que la comunicación en el lenguaje humano está incrustada en el contexto y que se necesita una persona para comprender el contexto del texto original con un grado razonable de probabilidad. Es cierto que incluso las traducciones puramente generadas por humanos son propensas a errores. Por lo tanto, para garantizar que una traducción generada automáticamente sea útil para un ser humano y que se logre una traducción de calidad publicable, dichas traducciones deben ser revisadas y editadas por un humano. ^[71] El difunto Claude Piron escribió que la traducción automática, en el mejor de los casos, automatiza la parte más fácil del trabajo de un traductor; la parte más difícil y que requiere más tiempo generalmente implica realizar una investigación exhaustiva para resolver ambigüedades en el texto de origen , que las exigencias gramaticales y léxicas del idioma de destino requieren que se resuelvan. Esta investigación es un preludio necesario a la preedición necesaria para proporcionar información para el software de traducción automática de modo que el resultado no carezca de significado . ^[72]

Además de los problemas de desambiguación, puede producirse una menor precisión debido a los diferentes niveles de datos de entrenamiento para los programas de traducción automática. Tanto la traducción automática basada en ejemplos como la estadística se basan en una amplia gama de oraciones de ejemplo reales como base para la traducción, y cuando se analizan demasiadas o muy pocas oraciones, se pone en peligro la precisión. Los investigadores descubrieron que cuando un programa se entrena con 203.529 pares de oraciones, la precisión en realidad disminuye. ^[66] El nivel óptimo de datos de entrenamiento parece ser un poco más de 100.000 oraciones, posiblemente porque a medida que aumentan los datos de entrenamiento, aumenta el número de oraciones posibles, lo que hace que sea más difícil encontrar una traducción exacta.

Los defectos de la traducción automática se han destacado por su valor de entretenimiento . Dos videos subidos a YouTube en abril de 2017 involucran dos caracteres hiragana japonesesえぐ ( e y gu ) que se pegan repetidamente en Google Translate, y las traducciones resultantes se degradan rápidamente en frases sin sentido como "DECEARING HUEVO" y "Árboles exprimidores de aguas profundas". que luego se leen con voces cada vez más absurdas; ^[73]^[74] la versión completa del video tiene actualmente 6,9 millones de visitas en marzo de 2022. ^[75]

Traducción automática y lenguas de signos

A principios de la década de 2000, las opciones de traducción automática entre lenguas hablada y de señas eran muy limitadas. Era una creencia común que las personas sordas podían utilizar traductores tradicionales. Sin embargo, el acento, la entonación, el tono y el tiempo se transmiten de manera muy diferente en las lenguas habladas que en las lenguas de señas. Por lo tanto, una persona sorda puede malinterpretar o confundirse acerca del significado de un texto escrito basado en un lenguaje hablado. ^[76]

Los investigadores Zhao, et al. (2000), desarrollaron un prototipo llamado TEAM (traducción automática del inglés al ASL) que completaba traducciones del inglés al lenguaje de señas americano (ASL). El programa analizaría primero los aspectos sintácticos, gramaticales y morfológicos del texto en inglés. Tras este paso, el programa accedió a un sintetizador de signos, que actuaba como diccionario para ASL. Este sintetizador albergaba el proceso que se debe seguir para completar los signos de ASL, así como el significado de estos signos. Una vez que se analiza todo el texto y se ubican en el sintetizador los signos necesarios para completar la traducción, apareció un humano generado por computadora que usaría ASL para firmar el texto en inglés al usuario. ^[76]

Derechos de autor

Sólo las obras originales están sujetas a protección de derechos de autor , por lo que algunos académicos afirman que los resultados de la traducción automática no tienen derecho a protección de derechos de autor porque la traducción automática no implica creatividad . ^[77] El derecho de autor en cuestión se refiere a una obra derivada ; el autor de la obra original en el idioma original no pierde sus derechos cuando se traduce una obra: un traductor debe tener permiso para publicar una traducción.

Ver también

Notas

^ DuPont, Quinn (enero de 2018). "Los orígenes criptológicos de la traducción automática: de al-Kindi a Weaver". Un moderno . Archivado desde el original el 14 de agosto de 2019 . Consultado el 2 de septiembre de 2019 .
^ Knowlson, James (1975). Esquemas de lenguaje universal en Inglaterra y Francia, 1600-1800 . Toronto: Prensa de la Universidad de Toronto. ISBN 0-8020-5296-7.
^ Booth, Andrew D. (1 de mayo de 1953). "TRADUCCIÓN MECÁNICA". Computadoras y automatización 1953-05: Vol 2, edición 4. Archivo de Internet. Empresas de Berkeley. pag. 6.
^ J. Hutchins (2000). "Warren Weaver y el lanzamiento de MT". Primeros años en la traducción automática (PDF) . Estudios de Historia de las Ciencias del Lenguaje. vol. 97. pág. 17. doi :10.1075/sihols.97.05hut. ISBN 978-90-272-4586-1. S2CID 163460375. Archivado desde el original (PDF) el 28 de febrero de 2020, a través de Semantic Scholar .
^ "Warren Weaver, matemático estadounidense". 13 de julio de 2020. Archivado desde el original el 6 de marzo de 2021 . Consultado el 7 de agosto de 2020 .
^ 上野, 俊夫 (13 de agosto de 1986).パーソナルコンピュータによる機械翻訳プログラムの制作(en japonés). Tokio: (株)ラッセル社. pag. 16.ISBN 494762700X.わが国では1956年、当時の電気試験所が英和翻訳専用機「ヤマト」を実験している。この機械は1962年頃には中学1年の教科書で90点以上の能力に達したと報告されている。(traducción (asistido por Google Translate ): En 1959 Japón, el Instituto Nacional de Ciencia y Tecnología Industrial Avanzada (AIST) probó la máquina de traducción inglés-japonés adecuada Yamato , que informó en 1964 que había alcanzado el nivel de potencia superior a la partitura. de 90 puntos en el libro de texto del primer grado de la escuela secundaria).
^ "機械翻訳専用機「やまと」-コンピュータ博物館". Archivado desde el original el 19 de octubre de 2016 . Consultado el 4 de abril de 2017 .
^ Nye, Mary Jo (2016). "Hablar en lenguas: la búsqueda de un lenguaje común durante siglos por parte de la ciencia". Destilaciones . 2 (1): 40–43. Archivado desde el original el 3 de agosto de 2020 . Consultado el 20 de marzo de 2018 .
^ Gordin, Michael D. (2015). Babel científica: cómo se hacía ciencia antes y después del inglés global . Chicago, Illinois: Prensa de la Universidad de Chicago. ISBN 9780226000299.
^ Wolfgang Saxon (28 de julio de 1995). "David G. Hays, 66 años, desarrollador del estudio de idiomas por computadora". Los New York Times . Archivado desde el original el 7 de febrero de 2020 . Consultado el 7 de agosto de 2020 . Escribió sobre el procesamiento del lenguaje asistido por computadora ya en 1957. Fue líder de proyecto sobre lingüística computacional en Rand de 1955 a 1968.
^ 上野, 俊夫 (13 de agosto de 1986).パーソナルコンピュータによる機械翻訳プログラムの制作(en japonés). Tokio: (株)ラッセル社. pag. 16.ISBN 494762700X.
^ abcd Budiansky, Stephen (diciembre de 1998). "Perdido en la traducción". Revista Atlántico . págs. 81–84.
^ Schank, Roger C. (2014). Procesamiento de Información Conceptual . Nueva York: Elsevier. pag. 5.ISBN 9781483258799.
^ Adiós, David; Gerber, Laurie; Hovy, Eduard (29 de junio de 2003). La traducción automática y la sopa de información: Tercera Conferencia de la Asociación de Traducción Automática en las Américas, AMTA'98, Langhorne, PA, EE. UU., 28 al 31 de octubre de 1998 Actas . Berlín: Springer. pag. 276.ISBN 3540652590.
^ Barron, Brenda (18 de noviembre de 2019). "Babel Fish: ¿Qué pasó con la solicitud de traducción original?: Investigamos". Digital.com . Archivado desde el original el 20 de noviembre de 2019 . Consultado el 22 de noviembre de 2019 .
^ y también dio otros ejemplos
^ Chan, Sin-Wai (2015). Enciclopedia de tecnología de traducción de Routledge . Oxon: Routledge. pag. 385.ISBN 9780415524841.
^ "Traductor de Google: el lenguaje universal". Blog.outer-court.com. 25 de enero de 2007. Archivado desde el original el 20 de noviembre de 2008 . Consultado el 12 de junio de 2012 .
^ Antonio Toral, Sheila Castilho, Ke Hu y Andy Way. 2018. ¿Alcanzar lo inalcanzable? Reevaluación de las afirmaciones de paridad humana en la traducción automática neuronal. CoRR, abs/1808.10432.
^ Yvette, Graham; Barry, Haddow; Koehn, Philipp (2019). "Traduccionista en evaluación de traducción automática". arXiv : 1906.09833 [cs.CL].
^ Katsnelson, Alla (29 de agosto de 2022). "¿Pobres conocimientos de inglés? Las nuevas IA ayudan a los investigadores a escribir mejor". Naturaleza . 609 (7925): 208–209. Código Bib :2022Natur.609..208K. doi : 10.1038/d41586-022-02767-9 . PMID 36038730. S2CID 251931306.
^ Korab, Petr (18 de febrero de 2022). "DeepL: un traductor de idiomas excepcionalmente magnífico". Medio . Consultado el 9 de enero de 2023 .
^ "DeepL supera a Google Translate - DW - 05/12/2018". Deutsche Welle . Consultado el 9 de enero de 2023 .
^ Hendy, Amr; Abdelrehim, Mohamed; Sharaf, Amr; Raunak, Vikas; Gabr, Mohamed; Matsushita, Hitokazu; Kim, joven Jin; Afify, Mohamed; Awadalla, Hany (18 de febrero de 2023). "¿Qué tan buenos son los modelos GPT en traducción automática? Una evaluación completa". arXiv : 2302.09210 [cs.CL].
^ Fadelli, Ingrid. "Un estudio evalúa la calidad de las traducciones literarias de la IA comparándolas con las traducciones humanas". techxplore.com . Consultado el 18 de diciembre de 2022 .
^ abc tailandés, Katherine; Karpinska, Marzena; Krishna, Kalpesh; Rayo, Bill; Inghilleri, Moira; Wieting, John; Iyyer, Mohit (25 de octubre de 2022). "Exploración de la traducción automática literaria a nivel de documento con párrafos paralelos de la literatura mundial". arXiv : 2210.14250 [cs.CL].
^ Kocmi, Tom; Avramidis, Eleftherios; Bawden, Raquel; Bojar, Ondřej; Dvorkovich, Antón; Federmann, cristiano; Fishel, Marcos; Freitag, Markus; Gowda, Thammé; Grundkiewicz, romano; Haddow, Barry; Koehn, Philipp; María, Benjamín; Monz, Christof; Morishita, Makoto (2023). Koehn, Philipp; Haddow, Barry; Kocmi, Tom; Monz, Christof (eds.). Hallazgos de la Conferencia sobre traducción automática de 2023 (WMT23): los LLM están aquí, pero aún no han llegado. Actas de la Octava Conferencia sobre Traducción Automática . Singapur: Asociación de Lingüística Computacional. págs. 1–42. doi : 10.18653/v1/2023.wmt-1.1 .
^ Hitos en traducción automática - No.6: Bar-Hillel y la inviabilidad de FAHQT Archivado el 12 de marzo de 2007 en Wayback Machine por John Hutchins
^ Bar-Hillel (1960), "Traducción automática de idiomas". Disponible en línea en http://www.mt-archive.info/Bar-Hillel-1960.pdf Archivado el 28 de septiembre de 2011 en Wayback Machine.
^ Enfoques híbridos para la traducción automática . Costa-jussà, Marta R., Rapp, Reinhard, Lambert, Patrik, Eberle, Kurt, Banchs, Rafael E., Babych, Bogdan. Suiza. 21 de julio de 2016. ISBN 9783319213101. OCLC 953581497.{{cite book}}: CS1 maint: location missing publisher (link) CS1 maint: others (link)
^ Claude Piron , Le défi des langues (El desafío del idioma), París, L'Harmattan, 1994.
^ Babych, Bogdan; Hartley, Antonio (2003). Mejora de la calidad de la traducción automática con el reconocimiento automático de entidades nombradas (PDF) . Documento presentado en el Séptimo Taller Internacional EAMT sobre MT y otras herramientas tecnológicas lingüísticas... Archivado desde el original (PDF) el 14 de mayo de 2006 . Consultado el 4 de noviembre de 2013 .
^ Hermajakob, U., Knight, K. y Hal, D. (2008). Traducción de nombres en traducción automática estadística Aprender cuándo transliterar Archivado el 4 de enero de 2018 en Wayback Machine . Asociación de Lingüística Computacional. 389–397.
^ ab Neeraj Agrawal; Ankush Singla. Uso del reconocimiento de entidades nombradas para mejorar la traducción automática (PDF) . Archivado (PDF) desde el original el 21 de mayo de 2013 . Consultado el 4 de noviembre de 2013 .
^ Schwartz, carril (2008). Métodos de traducción de múltiples fuentes (PDF) . Trabajo presentado en la 8va Conferencia Bienal de la Asociación de Traducción Automática en las Américas. Archivado (PDF) desde el original el 29 de junio de 2016 . Consultado el 3 de noviembre de 2017 .
^ Cohn, Trevor; Lapata, Mirella (2007). Traducción automática por triangulación: uso eficaz de corpus multiparalelos (PDF) . Trabajo presentado en la 45ª Reunión Anual de la Asociación de Lingüística Computacional, 23 al 30 de junio de 2007, Praga, República Checa. Archivado (PDF) desde el original el 10 de octubre de 2015 . Consultado el 3 de febrero de 2015 .
^ Nakov, Preslav; Ng, Hwee Tou (2012). "Mejora de la traducción automática estadística para un idioma con pocos recursos utilizando lenguajes relacionados ricos en recursos". Revista de investigación en inteligencia artificial . 44 : 179–222. arXiv : 1401.6876 . doi : 10.1613/jair.3540 .
^ abc Vossen, Piek: Ontologías . En: Mitkov, Ruslan (ed.) (2003): Manual de lingüística computacional, capítulo 25. Oxford: Oxford University Press.
^ Caballero, Kevin (1993). "Construcción de una gran ontología para la traducción automática". Tecnología del lenguaje humano: actas de un taller celebrado en Plainsboro, Nueva Jersey, del 21 al 24 de marzo de 1993 . Princeton, Nueva Jersey: Asociación de Lingüística Computacional. págs. 185-190. doi : 10.3115/1075671.1075713 . ISBN 978-1-55860-324-0.
^ Caballero, Kevin; Luk, Steve K. (1994). Creación de una base de conocimientos a gran escala para la traducción automática . Trabajo presentado en el XII Congreso Nacional de Inteligencia Artificial. arXiv : cmp-lg/9407029 .
^ Melby, Alan. La posibilidad del lenguaje (Ámsterdam: Benjamins, 1995, 27-41). Benjamins.com. 1995.ISBN 9789027216144. Archivado desde el original el 25 de mayo de 2011 . Consultado el 12 de junio de 2012 .
^ Wooten, Adam (14 de febrero de 2006). "Un modelo simple que describe la tecnología de traducción". Negocios de T&I . Archivado desde el original el 16 de julio de 2012 . Consultado el 12 de junio de 2012 .
^ "Apéndice III de 'El estado actual de la traducción automática de idiomas', Advances in Computers, vol.1 (1960), p.158-163. Reimpreso en Y.Bar-Hillel: Language and information (Reading, Mass.: Addison-Wesley, 1964), páginas 174-179" (PDF) . Archivado desde el original (PDF) el 28 de septiembre de 2018 . Consultado el 12 de junio de 2012 .
^ "Solución de traducción automática de calidad humana de Ta contigo" (en español). Tauyou.com. 15 de abril de 2009. Archivado desde el original el 22 de septiembre de 2009 . Consultado el 12 de junio de 2012 .
^ "Google Translate agrega 20 idiomas a la aplicación de realidad aumentada". Ciencia popular . 30 de julio de 2015 . Consultado el 9 de enero de 2023 .
^ Whitney, lanza. "Se dice que la actualización de la aplicación Google Translate facilita aún más la conversión de voz a texto". CNET . Consultado el 9 de enero de 2023 .
^ "Servicio de traducción automática". 5 de agosto de 2011. Archivado desde el original el 8 de septiembre de 2013 . Consultado el 13 de septiembre de 2013 .
^ Wilson, Kyle (8 de mayo de 2019). "Wikipedia tiene un problema con el Traductor de Google". El borde . Consultado el 9 de enero de 2023 .
^ "Wikipedia recurre a Google para ayudar a los editores a traducir artículos". VentureBeat . 9 de enero de 2019 . Consultado el 9 de enero de 2023 .
^ "La herramienta de traducción de contenido ayuda a crear más de medio millón de artículos de Wikipedia". Fundación Wikimedia . 23 de septiembre de 2019 . Consultado el 10 de enero de 2023 .
^ Revista, Undark (12 de agosto de 2021). "Wikipedia tiene un problema de idioma. Aquí se explica cómo solucionarlo". Revista No Oscura . Consultado el 9 de enero de 2023 .
^ "Lista de Wikipedias - Meta". meta.wikimedia.org . Consultado el 9 de enero de 2023 .
^ Gallafent, Alex (26 de abril de 2011). "Traducción automática para militares". "El PRI es el mundo ". Archivado desde el original el 9 de mayo de 2013 . Consultado el 17 de septiembre de 2013 .
^ Jackson, William (9 de septiembre de 2003). "GCN - La fuerza aérea quiere construir un traductor universal". Gcn.com. Archivado desde el original el 16 de junio de 2011 . Consultado el 12 de junio de 2012 .
^ Young-sil, Yoon (26 de junio de 2023). "Los juegos coreanos ganan popularidad en el difícil mercado de juegos japonés". Negocios Corea . Consultado el 8 de agosto de 2023 .
^ Comité Asesor de Procesamiento Automático del Lenguaje, División de Ciencias del Comportamiento, Academia Nacional de Ciencias, Consejo Nacional de Investigación (1966). Lenguaje y máquinas: computadoras en traducción y lingüística (PDF) (Reporte). Washington, DC: Consejo Nacional de Investigación, Academia Nacional de Ciencias. Archivado (PDF) desde el original el 21 de octubre de 2013 . Consultado el 21 de octubre de 2013 .{{cite report}}: CS1 maint: multiple names: authors list (link)
^ Randhawa, Gurdeeshpal; Ferreyra, Mariella; Ahmed, Rukhsana; Ezzat, Omar; Pottie, Kevin (abril de 2013). "Uso de la traducción automática en la práctica clínica". Médico de familia canadiense . 59 (4): 382–383. PMC 3625087 . PMID 23585608. Archivado desde el original el 4 de mayo de 2013 . Consultado el 21 de octubre de 2013 .
^ Vieira, Lucas Nunes; O'Hagan, Minako; O'Sullivan, Carol (18 de agosto de 2021). "Comprender los impactos sociales de la traducción automática: una revisión crítica de la literatura sobre casos de uso médicos y legales". Información, Comunicación y Sociedad . 24 (11): 1515-1532. doi : 10.1080/1369118X.2020.1776370 . hdl : 1983/29727bd1-a1ae-4600-9e8e-018f11ec75fb . ISSN 1369-118X. S2CID 225694304.
^ Khoong, Elaine C.; Steinbrook, Eric; Marrón, Cortlyn; Fernández, Alicia (1 de abril de 2019). "Evaluación del uso de Google Translate para traducciones al español y chino de las instrucciones de alta del departamento de emergencias". JAMA Medicina Interna . 179 (4): 580–582. doi :10.1001/jamainternmed.2018.7653. ISSN 2168-6106. PMC 6450297 . PMID 30801626.
^ Piccoli, Vanessa (5 de julio de 2022). "Plurilingüismo, multimodalidad y traducción automática en las consultas médicas: Un estudio de caso". Estudios de Traducción e Interpretación . 17 (1): 42–65. doi :10.1075/tis.21012.pic. ISSN 1932-2798. S2CID 246780731.
^ Herrera-Espejel, Paula Sofía; Rach, Stefan (20 de noviembre de 2023). "El uso de la traducción automática para la divulgación y la comunicación sanitaria en epidemiología y salud pública: revisión del alcance". JMIR Salud Pública y Vigilancia . 9 : e50814. doi : 10.2196/50814 . ISSN 2369-2960. PMC 10696499 . PMID 37983078.
^ ab legalj (2 de enero de 2023). "El hombre contra la máquina: implicaciones sociales y legales de la traducción automática". Revista jurídica de Princeton . Consultado el 4 de diciembre de 2023 .
^ Chávez, Edward L. (2008). "El éxito de Nuevo México con los jurados que no hablan inglés". Revista de innovación judicial . 1 : 303.
^ Vieira, Lucas Nunes; O'Hagan, Minako; O'Sullivan, Carol (18 de agosto de 2021). "Comprender los impactos sociales de la traducción automática: una revisión crítica de la literatura sobre casos de uso médicos y legales". Información, Comunicación y Sociedad . 24 (11): 1515-1532. doi : 10.1080/1369118X.2020.1776370 . hdl : 1983/29727bd1-a1ae-4600-9e8e-018f11ec75fb . ISSN 1369-118X. S2CID 225694304.
^ Gutherz, Gai; Gordin, Shai; Sáenz, Luis; Levy, Omer; Berant, Jonathan (2 de mayo de 2023). Kearns, Michael (ed.). "Traducción del acadio al inglés con traducción automática neuronal". Nexo PNAS . 2 (5): pgad096. doi : 10.1093/pnasnexus/pgad096. ISSN 2752-6542. PMC 10153418 . PMID 37143863.
^ ab manera, Andy; Nano Gough (20 de septiembre de 2005). "Comparación de la traducción automática estadística y basada en ejemplos". Ingeniería del Lenguaje Natural . 11 (3): 295–309. doi :10.1017/S1351324905003888. S2CID 3242163.
^ Muegge (2006), "Traducción automática totalmente automática de alta calidad de texto restringido: un estudio de caso archivado el 17 de octubre de 2011 en Wayback Machine ", en La traducción y la computadora 28. Actas de la vigésima octava conferencia internacional sobre la traducción y la computadora , 16 y 17 de noviembre de 2006, Londres , Londres: Aslib. ISBN 978-0-85142-483-5 .
^ "Comparación de sistemas de traducción automática mediante evaluación humana, mayo de 2008". Morfológico.hu. Archivado desde el original el 19 de abril de 2012 . Consultado el 12 de junio de 2012 .
^ Anderson, DD (1995). La traducción automática como herramienta en el aprendizaje de una segunda lengua Archivado el 4 de enero de 2018 en Wayback Machine . Revista CALICO. 13(1). 68–96.
^ Han y col. (2012), "LEPOR: A Robust Assessment Metric for Machine Translation with Augmented Factors Archivado el 4 de enero de 2018 en Wayback Machine ", en Actas de la 24.ª Conferencia Internacional sobre Lingüística Computacional (COLING 2012): carteles, páginas 441–450 , Mumbai , India.
↑ JM Cohen observa (p.14): "La traducción científica es el objetivo de una época que reduciría todas las actividades a técnicas . Sin embargo, es imposible imaginar una máquina de traducción literaria menos compleja que el propio cerebro humano, con todos sus conocimientos". , lectura y discriminación."
^ Consulte las pruebas NIST realizadas anualmente desde 2001. Archivado el 22 de marzo de 2009 en Wayback Machine y suplente de evaluación bilingüe.
^ Abadi, Marcos. "4 veces Google Translate dejó caer la pelota por completo". Business Insider .
^ "回数を重ねるほど狂っていく Google翻訳で「えぐ」を英訳すると奇妙な世界に迷い込むと話題に".ねとらぼ.
^ "えぐ" - a través de www.youtube.com.
^ ab Zhao, L., Kipper, K., Schuler, W., Vogler, C. y Palmer, M. (2000). Un sistema de traducción automática del inglés al lenguaje de señas americano Archivado el 20 de julio de 2018 en Wayback Machine . Apuntes de conferencias sobre informática, 1934: 54–67.
^ "Traducción automática: ¿No hay derechos de autor sobre el resultado?". Traductor SEO, citando a Zimbabwe Independent . Archivado desde el original el 29 de noviembre de 2012 . Consultado el 24 de noviembre de 2012 .

Otras lecturas

Cohen, JM (1986), "Traducción", Enciclopedia Americana , vol. 27, págs. 12-15
Hutchins, W. John ; Somers, Harold L. (1992). Introducción a la traducción automática . Londres: Academic Press. ISBN 0-12-362830-X.
Lewis-Kraus, Gideon (7 de junio de 2015). "Torre del Balbuceo". Revista del New York Times . págs. 48–52.
Weber, Steven; Mehandru, Nikita (2022). "La economía política de la traducción automática de la década de 2020". Negocios y Política . 24 (1): 96-112. arXiv : 2011.01007 . doi :10.1017/bap.2021.17. S2CID 226236853.

enlaces externos

Wikiversidad tiene recursos de aprendizaje sobre el tema: Lingüística computacional

Las ventajas y desventajas de la traducción automática
Asociación Internacional de Traducción Automática (IAMT) Archivado el 24 de junio de 2010 en Wayback Machine.
Archivo de traducción automática Archivado el 1 de abril de 2019 en Wayback Machine por John Hutchins . Un depósito electrónico (y bibliografía) de artículos, libros y artículos en el campo de la traducción automática y la tecnología de traducción basada en computadora.
Traducción automática (traducción por computadora): publicaciones de John Hutchins (incluye archivos PDF de varios libros sobre traducción automática)
Traducción automática y lenguas minoritarias
John Hutchins 1999 Archivado el 7 de septiembre de 2007 en Wayback Machine.
Slator Noticias y análisis de las últimas novedades en traducción automática
Del aula al mundo real: cómo la traducción automática está cambiando el panorama del aprendizaje de lenguas extranjeras