Traductor automático de idiomas

El Traductor Automático de Idiomas de IBM era un sistema de traducción automática que convertía documentos rusos al inglés . Utilizó un disco óptico que almacenaba 170.000 traducciones palabra por palabra y declaración por declaración y una computadora personalizada para buscarlas a alta velocidad. Construido para la División de Tecnología Extranjera de la Fuerza Aérea de EE. UU., el AN/GSQ-16 (o XW-2 ), como lo conocía la Fuerza Aérea, se utilizó principalmente para convertir documentos técnicos soviéticos para su distribución a científicos occidentales. El traductor se instaló en 1959, se actualizó drásticamente en 1964 y finalmente fue reemplazado por una computadora central que ejecutaba SYSTRAN en 1970.

Historia

tienda fotoscópica

El traductor comenzó en junio de 1953 con un contrato de la Marina de los EE. UU. para la International Telemeter Corporation (ITC) de Los Ángeles. No se trataba de un sistema de traducción, sino simplemente de un contrato de investigación y desarrollo para un medio de almacenamiento fotográfico en línea de alto rendimiento compuesto por pequeños rectángulos negros incrustados en un disco de plástico. Cuando finalizó el contrato inicial, el entonces Centro de Desarrollo Aéreo de Roma (RADC) recibió más financiación a partir de 1954. ^[1]

El sistema fue desarrollado por Gilbert King, jefe de ingeniería del ITC, junto con un equipo que incluía a Louis Ridenour . Evolucionó hasta convertirse en un disco de plástico de 16 pulgadas con datos registrados como una serie de rectángulos negros microscópicos o puntos claros. Sólo las 4 pulgadas más exteriores del disco se utilizaron para almacenamiento, lo que aumentó la velocidad lineal de la parte a la que se accedía. Cuando el disco giraba a 2400 RPM, tenía una velocidad de acceso de aproximadamente 1 Mbit/seg. En total, el sistema almacenó 30 Mbits, lo que lo convierte en el sistema en línea de mayor densidad de su época. ^[1]^[un]

marca yo

En 1954, IBM realizó una influyente demostración de traducción automática, conocida hoy como el " experimento Georgetown-IBM ". Ejecutado en una computadora central IBM 704 , el sistema de traducción conocía sólo 250 palabras de ruso limitadas al campo de la química orgánica, y sólo 6 reglas gramaticales para combinarlas. Sin embargo, los resultados fueron extremadamente prometedores y ampliamente difundidos en la prensa. ^[2]

En ese momento, la mayoría de los investigadores en el naciente campo de la traducción automática sintieron que el mayor desafío para proporcionar traducciones razonables era construir una biblioteca grande, ya que los dispositivos de almacenamiento de la época eran demasiado pequeños y demasiado lentos para ser útiles en esta función. ^[3] King consideró que el almacén de fotografías era una solución natural al problema y propuso a la Fuerza Aérea la idea de un sistema de traducción automatizado basado en el almacén de fotografías. El RADC demostró interés y otorgó una subvención de investigación en mayo de 1956. En ese momento, la Fuerza Aérea también otorgó una subvención a investigadores de la Universidad de Washington que estaban trabajando en el problema de producir un diccionario de traducción óptimo para el proyecto.

King abogó por un enfoque simple, palabra por palabra, para las traducciones. Pensó que las redundancias naturales del lenguaje permitirían entender incluso una traducción deficiente, y que el contexto local era suficiente por sí solo para proporcionar conjeturas razonables cuando se enfrentaban términos ambiguos. Afirmó que "el éxito del ser humano en lograr una probabilidad de .50 al anticipar las palabras de una oración se debe en gran medida a su experiencia y a los significados reales de las palabras ya descubiertas". ^[4] En otras palabras, simplemente traducir las palabras permitiría a un ser humano leer efectivamente un documento, porque podría razonar el significado apropiado a partir del contexto proporcionado por las palabras anteriores.

En 1958, King se mudó al Centro de Investigación Thomas J. Watson de IBM y continuó el desarrollo del traductor basado en photoshop. Con el tiempo, King cambió el enfoque de un traductor puro palabra por palabra a uno que almacenaba "raíces y terminaciones", que dividía las palabras en partes que podían combinarse nuevamente para formar palabras completas nuevamente. ^[4]

La primera máquina, "Mark I", se demostró en julio de 1959 y consistía en un diccionario de 65.000 palabras y una computadora personalizada basada en un tubo para realizar las búsquedas. ^[3] Los textos se copiaron a mano en tarjetas perforadas utilizando terminales cirílicos personalizados y luego se introdujeron en la máquina para traducirlos. Los resultados no fueron nada impresionantes, pero fueron suficientes para sugerir que una máquina más grande y más rápida sería un desarrollo razonable. Mientras tanto, la Marca I se aplicó a las traducciones del periódico soviético Pravda . Los resultados continuaron siendo cuestionables, pero King lo declaró un éxito y afirmó en Scientific American que el sistema "... encontró, en una evaluación operativa, que era bastante útil para el Gobierno". ^[3]

Marco II

El 4 de octubre de 1957 la URSS lanzó el Sputnik 1 , el primer satélite artificial. Esto provocó una ola de preocupación en Estados Unidos, cuyo propio Proyecto Vanguard fue tomado por sorpresa y luego demostró fracasar repetidas veces de manera espectacular. Este vergonzoso giro de los acontecimientos llevó a una enorme inversión en ciencia y tecnología estadounidense, incluida la formación de DARPA , la NASA y una variedad de esfuerzos de inteligencia que intentarían evitar ser sorprendidos de esta manera nuevamente.

Después de un corto período, los esfuerzos de inteligencia se centralizaron en la Base de la Fuerza Aérea Wright-Patterson como la División de Tecnología Extranjera (FTD, ahora conocida como Centro Nacional de Inteligencia Aérea y Espacial ), dirigida por la Fuerza Aérea con aportes de la DIA y otras organizaciones. . A FTD se le encomendó la traducción de revistas técnicas y científicas soviéticas y de otros países del Bloque de Varsovia para que los investigadores del "oeste" pudieran mantenerse al día sobre los acontecimientos detrás de la Cortina de Hierro . La mayoría de estos documentos estaban disponibles públicamente, pero FTD también realizó una serie de traducciones únicas de otros materiales a pedido.

Suponiendo que había escasez de traductores calificados, la FTD se interesó mucho en los esfuerzos de King en IBM. Pronto llegó la financiación para una máquina mejorada y se comenzó a trabajar en un sistema "Mark II" basado en una computadora transistorizada con un disco óptico de vidrio de 10 pulgadas más rápido y de mayor capacidad que gira a 2400 RPM. Otra adición fue un lector óptico de caracteres proporcionado por un tercero, que esperaban eliminaría el lento proceso de copiar el texto ruso en tarjetas legibles por máquina. ^[3]

En 1960, el equipo de Washington también se unió a IBM, trayendo consigo sus esfuerzos en materia de diccionarios. El diccionario continuó expandiéndose a medida que se dispuso de almacenamiento adicional, alcanzando 170.000 palabras y términos cuando se instaló en el FTD. También se incorporó una importante actualización de software en el Mark II, a la que King se refirió como "relleno de diccionario". El relleno fue un intento de abordar los problemas de las palabras ambiguas "rellenándolas" con prefijos de palabras anteriores del texto. ^[3] Estas palabras modificadas coincidirían con palabras similares en el diccionario, lo que reduciría el número de falsos positivos.

En 1962 King dejó IBM por Itek , un contratista militar en proceso de adquirir rápidamente nuevas tecnologías. El desarrollo en IBM continuó y el sistema entró en pleno funcionamiento en FTD en febrero de 1964. El sistema se demostró en la Feria Mundial de Nueva York de 1964 . La versión presentada en la Feria incluía un diccionario de 150.000 palabras, con aproximadamente 1/3 de las palabras en frases. Aproximadamente 3.500 de ellas se almacenaron en la memoria central para mejorar el rendimiento y se afirmó una velocidad promedio de 20 palabras por minuto. Los resultados del texto de entrada cuidadosamente seleccionado fueron bastante impresionantes. ^[5] Después de su regreso al FTD, se usó continuamente hasta 1970, cuando fue reemplazada por una máquina que ejecutaba SYSTRAN . ^[6]

Informe ALPAC

En 1964, el Departamento de Defensa de Estados Unidos encargó a la Academia Nacional de Ciencias (NAS) de Estados Unidos la elaboración de un informe sobre el estado de la traducción automática. La NAS formó el "Comité Asesor de Procesamiento Automático del Idioma", o ALPAC , y publicó sus hallazgos en 1966. El informe, Language and Machines: Computers in Translation and Linguistics , fue muy crítico con los esfuerzos existentes, demostrando que los sistemas no eran más rápidos. que las traducciones humanas, al tiempo que demostró que la supuesta falta de traductores era en realidad un excedente y, como resultado de problemas de oferta y demanda , la traducción humana era relativamente barata: alrededor de 6 dólares por cada 1.000 palabras. Peor aún, el FTD también fue más lento; Las pruebas que utilizaron artículos de física como entrada demostraron que el traductor era "un 10 por ciento menos preciso, un 21 por ciento más lento y tenía un nivel de comprensión un 29 por ciento más bajo que cuando utilizaba la traducción humana". ^[7]

El informe ALPAC fue tan influyente como lo había sido el experimento de Georgetown una década antes; Inmediatamente después de su publicación, el gobierno de Estados Unidos suspendió casi todos los fondos para la investigación en traducción automática. ^[8] El trabajo en curso en IBM e Itek había terminado en 1966, dejando el campo a los europeos, quienes continuaron el desarrollo de sistemas como SYSTRAN y Logos.

Notas

^ Estos números para los primeros sistemas de disco parecen ser inexactos; otro documento del mismo autor sugiere que estas cifras son en realidad para la versión posterior utilizada en el traductor Mark II.

Referencias

Citas

^ ab Hutchins, pág. 171
^ John Hutchins, "La primera demostración pública de traducción automática: el sistema Georgetown-IBM, 7 de enero de 1954" Archivado el 3 de marzo de 2016 en Wayback Machine.
^ abcde Hutchins, pág. 172
^ ab Rey, 1956
^ Hutchins, pág. 174
^ Hutchins, pág. 175
^ ALPAC, pág. 20
^ John Hutchins, "ALPAC: el (in)famoso informe" Archivado el 6 de octubre de 2007 en Wayback Machine.

Bibliografía

GW King, GW Brown y LN Ridenour, "Photographic Techniques for Information Storage", Actas de la IRE , Volumen 41, Número 10 (octubre de 1953), págs. 1421-1428
GW King, "Métodos estocásticos de traducción mecánica", Mechanical Translation , volumen 3, número 2 (1956), págs. 38–39
JL Craft, EH Goldman, WB Strohm, "Una máquina de búsqueda de tablas para el procesamiento de lenguajes naturales", IBM Journal , julio de 1961, págs. 192-203
Comité Asesor de Procesamiento del Lenguaje, "Lenguaje y Máquinas: Computadoras en Traducción y Lingüística", Consejo Nacional de Investigación , 1966 (ampliamente conocido como el "Informe ALPAC")
John Hutchins (ed), "Gilbert W. King y el traductor IBM-USAF", Primeros años en la traducción automática , Joh Benjamins, 2000, ISBN 90-272-4586-X (RADC-TDR-62-105)
Charles Bourne y Trudi Bellardo Hahn, "Una historia de los servicios de información en línea, 1963-1976", MIT Press, 2003, ISBN 0-262-02538-8

Ver también

Lista de electrónica militar de los Estados Unidos.