El experimento de Georgetown-IBM fue una demostración influyente de traducción automática , que se realizó el 7 de enero de 1954. Desarrollado conjuntamente por la Universidad de Georgetown e IBM , el experimento implicó la traducción completamente automática de más de sesenta oraciones rusas al inglés . [1] [2]
Concebido y ejecutado principalmente con el fin de atraer el interés y la financiación gubernamentales y públicos mostrando las posibilidades de la traducción automática, no era en absoluto un sistema completo: tenía solo seis reglas gramaticales y 250 elementos léxicos en su vocabulario (de raíces y terminaciones). [3] Las palabras del vocabulario pertenecían a los campos de la política, el derecho, las matemáticas, la química, la metalurgia, las comunicaciones y los asuntos militares. El vocabulario se perforaba en tarjetas perforadas . [4] Este diccionario completo nunca se mostró en su totalidad (solo la versión extendida del artículo de Garvin). Aparte de los temas generales, el sistema estaba especializado en el dominio de la química orgánica . [ cita requerida ] La traducción se llevó a cabo utilizando una computadora central IBM 701 [4] (lanzada en abril de 1953).
El experimento de Georgetown-IBM es el resultado más conocido de la conferencia del MIT de junio de 1952 a la que fueron invitados todos los investigadores activos en el campo de la traducción automática. En la conferencia, Duncan Harkin, del Departamento de Defensa de los EE. UU., sugirió que su departamento financiaría un nuevo proyecto de traducción automática. [5] Jerome Weisner apoyó la idea y ofreció financiación del Laboratorio de Investigación de Electrónica del MIT. Leon Dostert había sido invitado al proyecto por su experiencia previa con la corrección automática de traducciones (en aquel entonces, "traducción mecánica"); su sistema de interpretación tuvo un fuerte impacto en el Tribunal de Crímenes de Guerra de Núremberg . La parte lingüística de la demostración fue realizada en su mayor parte por el lingüista Paul Garvin, que también tenía buenos conocimientos de ruso .
Un operador de computadora que no sabía ruso ingresó en la máquina más de 60 declaraciones en ruso romanizadas sobre una amplia gama de temas políticos, legales, matemáticos y científicos, y las traducciones al inglés resultantes aparecieron en una impresora.
Las oraciones que se iban a traducir se seleccionaron cuidadosamente. Muchas operaciones para la demostración se ajustaron a palabras y oraciones específicas. Además, no se utilizó ningún análisis relacional o de oraciones que pudiera reconocer la estructura de la oración. El enfoque era principalmente "lexicográfico" y se basaba en un diccionario donde una palabra específica tenía una conexión con reglas y pasos específicos. [6]
El algoritmo primero traduce las palabras rusas en códigos numéricos, luego realiza el siguiente análisis de caso en cada código numérico para elegir entre posibles traducciones de palabras en inglés, reordenar las palabras en inglés u omitir algunas palabras en inglés.
El diagrama de flujo del algoritmo se reproduce en [7] . Consulte la Tabla 1 para las 6 reglas.
Cómo analiza Vyelyichyina ugla opryedyelyayetsya otnoshyenyiyem dlyini dugi k radyiusu (figura 2 de [7] ). [4]
El experimento, que recibió una gran publicidad por parte de los periodistas y se percibió como un éxito, animó a los gobiernos a invertir en lingüística computacional . Los autores afirmaban que en un plazo de tres o cinco años la traducción automática podría ser un problema resuelto. Sin embargo, el progreso real fue mucho más lento y, tras el informe ALPAC de 1966, que concluyó que los diez años de investigación no habían cumplido las expectativas, la financiación se redujo drásticamente.
La manifestación recibió una amplia cobertura en la prensa extranjera, pero sólo una pequeña fracción de los periodistas llamó la atención sobre intentos previos de traducción automática. [8]