El Traductor Automático de Lenguajes de IBM era un sistema de traducción automática que convertía documentos rusos al inglés . Utilizaba un disco óptico que almacenaba 170.000 traducciones palabra por palabra y enunciado por enunciado y una computadora personalizada para buscarlas a alta velocidad. Construido para la División de Tecnología Exterior de la Fuerza Aérea de los EE. UU., el AN/GSQ-16 (o XW-2 ), como era conocido en la Fuerza Aérea, se utilizó principalmente para convertir documentos técnicos soviéticos para su distribución a científicos occidentales. El traductor se instaló en 1959, se actualizó drásticamente en 1964 y finalmente fue reemplazado por un mainframe que ejecutaba SYSTRAN en 1970.
El traductor comenzó en junio de 1953 con un contrato de la Marina de los Estados Unidos con la International Telemeter Corporation (ITC) de Los Ángeles. No se trataba de un sistema de traducción, sino de un contrato de investigación y desarrollo para un medio de almacenamiento fotográfico en línea de alto rendimiento que consistía en pequeños rectángulos negros incrustados en un disco de plástico. Cuando el contrato inicial expiró, el entonces Centro de Desarrollo Aéreo de Roma (RADC) obtuvo más financiación a partir de 1954. [1]
El sistema fue desarrollado por Gilbert King, jefe de ingeniería en ITC, junto con un equipo que incluía a Louis Ridenour . Evolucionó hasta convertirse en un disco de plástico de 16 pulgadas con datos registrados como una serie de rectángulos negros microscópicos o puntos transparentes. Solo las 4 pulgadas más externas del disco se usaban para almacenamiento, lo que aumentaba la velocidad lineal de la porción a la que se accedía. Cuando el disco giraba a 2400 RPM tenía una velocidad de acceso de aproximadamente 1 Mbit/seg. En total, el sistema almacenaba 30 Mbits, lo que lo convertía en el sistema en línea de mayor densidad de su era. [1] [a]
En 1954, IBM realizó una demostración influyente de traducción automática, conocida hoy como el " experimento Georgetown-IBM ". El sistema de traducción, que funcionaba en un mainframe IBM 704 , sólo conocía 250 palabras del ruso, limitadas al campo de la química orgánica, y sólo 6 reglas gramaticales para combinarlas. No obstante, los resultados fueron extremadamente prometedores y se difundieron ampliamente en la prensa. [2]
En ese momento, la mayoría de los investigadores en el naciente campo de la traducción automática pensaban que el mayor desafío para proporcionar traducciones razonables era construir una gran biblioteca, ya que los dispositivos de almacenamiento de la época eran demasiado pequeños y demasiado lentos para ser útiles en esta función. [3] King pensó que el almacén fotoscópico era una solución natural al problema y presentó la idea de un sistema de traducción automática basado en el almacén fotoscópico a la Fuerza Aérea. El RADC se mostró interesado y proporcionó una beca de investigación en mayo de 1956. En ese momento, la Fuerza Aérea también proporcionó una beca a los investigadores de la Universidad de Washington que estaban trabajando en el problema de producir un diccionario de traducción óptimo para el proyecto.
King defendía un enfoque simple palabra por palabra para las traducciones. Pensaba que las redundancias naturales del lenguaje permitirían que se entendiera incluso una traducción deficiente, y que el contexto local era suficiente por sí solo para proporcionar conjeturas razonables ante términos ambiguos. Afirmaba que "el éxito del ser humano en lograr una probabilidad de 0,50 al anticipar las palabras de una oración se debe en gran medida a su experiencia y a los significados reales de las palabras ya descubiertos". [4] En otras palabras, simplemente traducir las palabras permitiría a un ser humano leer eficazmente un documento, porque sería capaz de deducir el significado correcto a partir del contexto proporcionado por las palabras anteriores.
En 1958, King se trasladó al Centro de Investigación Thomas J. Watson de IBM y continuó con el desarrollo del traductor basado en Photoshop. Con el tiempo, King cambió el enfoque de un traductor puramente palabra por palabra a uno que almacenaba "raíces y terminaciones", que dividía las palabras en partes que se podían volver a combinar para formar palabras completas de nuevo. [4]
La primera máquina, "Mark I", se presentó en julio de 1959 y consistía en un diccionario de 65.000 palabras y una computadora personalizada basada en tubos para realizar las búsquedas. [3] Los textos se copiaban a mano en tarjetas perforadas utilizando terminales cirílicos personalizados y luego se ingresaban en la máquina para su traducción. Los resultados no fueron nada impresionantes, pero fueron suficientes para sugerir que una máquina más grande y más rápida sería un desarrollo razonable. Mientras tanto, el Mark I se aplicó a las traducciones del periódico soviético Pravda . Los resultados siguieron siendo cuestionables, pero King lo declaró un éxito, afirmando en Scientific American que el sistema "... fue considerado, en una evaluación operativa, bastante útil por el Gobierno". [3]
El 4 de octubre de 1957, la URSS lanzó el Sputnik 1 , el primer satélite artificial. Esto provocó una ola de preocupación en los Estados Unidos, cuyo Proyecto Vanguard fue tomado por sorpresa y luego demostró fallar repetidamente de manera espectacular. Este vergonzoso giro de los acontecimientos condujo a una enorme inversión en ciencia y tecnología estadounidense, incluida la formación de DARPA , la NASA y una variedad de esfuerzos de inteligencia que intentarían evitar ser sorprendidos de esta manera nuevamente.
Después de un breve período, los esfuerzos de inteligencia se centralizaron en la base aérea Wright-Patterson como la División de Tecnología Extranjera (FTD, ahora conocida como el Centro Nacional de Inteligencia Aérea y Espacial ), dirigida por la Fuerza Aérea con aportes de la DIA y otras organizaciones. La FTD se encargó de la traducción de revistas técnicas y científicas soviéticas y de otros países del Bloque de Varsovia para que los investigadores en "Occidente" pudieran mantenerse al día sobre los acontecimientos que ocurrían detrás de la Cortina de Hierro . La mayoría de estos documentos estaban disponibles públicamente, pero la FTD también realizó una serie de traducciones puntuales de otros materiales a pedido.
Suponiendo que había escasez de traductores calificados, el FTD se interesó mucho en los esfuerzos de King en IBM. Pronto se consiguió financiación para una máquina mejorada y se comenzó a trabajar en un sistema "Mark II" basado en una computadora transistorizada con un disco óptico de vidrio de 10 pulgadas, más rápido y de mayor capacidad, que giraba a 2400 RPM. Otra adición fue un lector óptico de caracteres proporcionado por el tercero, que esperaban que eliminara el lento proceso de copiar el texto ruso en tarjetas legibles por máquina. [3]
En 1960, el equipo de Washington también se unió a IBM, y llevó consigo sus esfuerzos en la creación de diccionarios. El diccionario continuó expandiéndose a medida que se disponía de más capacidad de almacenamiento, y alcanzó las 170.000 palabras y términos cuando se instaló en el FTD. También se incorporó una importante actualización de software en el Mark II, a la que King se refirió como "relleno del diccionario". El relleno era un intento de solucionar los problemas de las palabras ambiguas "rellenándolas" con prefijos de palabras anteriores en el texto. [3] Estas palabras modificadas coincidirían con palabras rellenadas de manera similar en el diccionario, lo que reduciría la cantidad de falsos positivos.
En 1962, King dejó IBM para irse a Itek , un contratista militar en pleno proceso de adquisición rápida de nuevas tecnologías. El desarrollo en IBM continuó y el sistema entró en pleno funcionamiento en FTD en febrero de 1964. El sistema se demostró en la Feria Mundial de Nueva York de 1964. La versión en la Feria incluía un diccionario de 150.000 palabras, con aproximadamente 1/3 de las palabras en frases. Aproximadamente 3.500 de ellas se almacenaron en la memoria central para mejorar el rendimiento y se afirmó una velocidad media de 20 palabras por minuto. Los resultados del texto de entrada cuidadosamente seleccionado fueron bastante impresionantes. [5] Después de su regreso a FTD, se utilizó de forma continua hasta 1970, cuando fue sustituido por una máquina que ejecutaba SYSTRAN . [6]
En 1964, el Departamento de Defensa de los Estados Unidos encargó a la Academia Nacional de Ciencias de los Estados Unidos (NAS) que preparara un informe sobre el estado de la traducción automática. La NAS formó el "Comité Asesor de Procesamiento Automático del Lenguaje", o ALPAC , y publicó sus hallazgos en 1966. El informe, Language and Machines: Computers in Translation and Linguistics (El lenguaje y las máquinas: las computadoras en la traducción y la lingüística) , fue muy crítico con los esfuerzos existentes, demostrando que los sistemas no eran más rápidos que las traducciones humanas, al tiempo que demostraba que la supuesta falta de traductores era de hecho un excedente y, como resultado de problemas de oferta y demanda , la traducción humana era relativamente barata: alrededor de 6 dólares por cada 1.000 palabras. Peor aún, el FTD también era más lento; las pruebas que utilizaban artículos de física como entrada demostraron que el traductor era "un 10 por ciento menos preciso, un 21 por ciento más lento y tenía un nivel de comprensión un 29 por ciento más bajo que cuando utilizaba la traducción humana". [7]
El informe de ALPAC fue tan influyente como lo había sido el experimento de Georgetown una década antes; inmediatamente después de su publicación, el gobierno de Estados Unidos suspendió casi todos los fondos para la investigación en traducción automática. [8] El trabajo en curso en IBM e Itek había terminado en 1966, dejando el campo en manos de los europeos, quienes continuaron el desarrollo de sistemas como SYSTRAN y Logos.