Jaime Guillermo Carbonell (29 de julio de 1953 – 28 de febrero de 2020) fue un científico informático que realizó contribuciones fundamentales al desarrollo de herramientas y tecnologías de procesamiento del lenguaje natural . Su extensa investigación en traducción automática resultó en el desarrollo de varios sistemas de inteligencia artificial y traducción de idiomas de última generación. Obtuvo sus títulos de licenciatura en Física y Matemáticas del MIT en 1975 e hizo su doctorado con el Dr. Roger Schank en la Universidad de Yale en 1979. Se unió a la Universidad Carnegie Mellon como profesor asistente de informática en 1979 y vivió en Pittsburgh desde entonces. Estuvo afiliado al Instituto de Tecnologías del Lenguaje , al Departamento de Ciencias de la Computación, al Departamento de Aprendizaje Automático y al Departamento de Biología Computacional de la Universidad Carnegie Mellon. [1]
Sus intereses abarcaron varias áreas de inteligencia artificial , tecnologías del lenguaje y aprendizaje automático . En particular, su investigación se centró en áreas como la minería de texto (extracción, categorización, detección de novedad) y en nuevos marcos teóricos como una teoría unificada basada en la utilidad que une la recuperación de información , el resumen , la respuesta a preguntas de texto libre y tareas relacionadas. También trabajó en traducción automática , tanto en traducción automática basada en conocimiento de alta precisión como en aprendizaje automático para traducción automática basada en corpus (como la traducción automática generalizada basada en ejemplos ).
Carbonell fue profesor de informática de la cátedra Allen Newell y director del Instituto de Tecnologías del Lenguaje de la Universidad Carnegie Mellon. Se incorporó a la Universidad Carnegie Mellon en 1979 y se convirtió en un miembro clave del profesorado en el área de inteligencia artificial. Fue nombrado profesor titular en 1987, presidente de la cátedra Newell en 1995 y profesor universitario en 2012.
Realizó sus estudios de grado en el MIT, donde obtuvo una doble titulación en Matemáticas y Física. En 1979 se doctoró en Ciencias de la Computación en la Universidad de Yale.
En el momento de su nombramiento, Carbonell era el catedrático más joven de la Facultad de Informática de la CMU. Se le consideraba creativo, perspicaz y muy productivo como investigador. Su investigación abarcó varias áreas de la informática, principalmente en inteligencia artificial, entre ellas: aprendizaje automático, minería de datos y texto, procesamiento del lenguaje natural, bases de conocimiento a gran escala, recuperación de información translingüística y resumen automatizado. Escribió más de 300 artículos técnicos y realizó más de 500 presentaciones por invitación o arbitradas (coloquios, seminarios, paneles, conferencias, discursos de apertura, etc.). Murió tras una larga enfermedad el 28 de febrero de 2020. [2] Mona Talat Diab se convirtió en directora del Instituto de Tecnologías del Lenguaje de la CMU en el otoño de 2023. [3]
Entre los principales logros científicos de Carbonell se encuentran la creación de la tecnología MMR (relevancia marginal máxima) para el resumen de textos y la detección de novedades informativas en motores de búsqueda, la invención de la analogía transformacional, un método generalizado de razonamiento basado en casos (CBR) para reutilizar, modificar y componer planes anteriores exitosos para problemas cada vez más complejos y la traducción automática interlingüística basada en el conocimiento. Desempeñó un papel decisivo en la creación del Programa de Biolingüística Computacional, una iniciativa conjunta entre Carnegie Mellon y la Universidad de Pittsburgh, que combina tecnologías del lenguaje y aprendizaje automático para modelar y predecir estructuras 3D genómicas, proteómicas y glicómicas.
Carbonell era particularmente conocido en el campo del aprendizaje automático. Organizó las primeras cuatro conferencias sobre aprendizaje automático, comenzando con la CMU en 1981. El Language Technologies Institute (LTI), fundado y dirigido por Carbonell, obtuvo los máximos honores en múltiples áreas. Estas áreas incluyen la traducción automática, los motores de búsqueda (incluida la fundación de Lycos por Michael Mauldin , uno de los estudiantes de doctorado de Carbonell), la síntesis de voz y la educación. LTI sigue siendo el instituto original, más grande y más conocido en tecnologías del lenguaje, con más de $12 millones en financiación anual y 200 investigadores (profesores, personal, estudiantes de doctorado, estudiantes de maestría, académicos visitantes, etc.).
Carbonell realizó importantes contribuciones técnicas en varios campos, incluyendo (1) Creación de tecnología MMR (relevancia marginal máxima) para resumen de texto y detección de novedad informativa en motores de búsqueda, (2) Aprendizaje automático proactivo para aprendizaje activo sensible a costos de múltiples fuentes, (3) Campos aleatorios condicionales vinculados para predecir pliegues de proteínas terciarios y cuaternarios, (4) Método de alineación de frases óptima simétrica para traducción automática estadística y basada en ejemplos entrenables, (5) Modelado de anomalías de series para detección de fraude financiero y vigilancia sindrómica, (6) Traducción automática interlingüística basada en conocimiento, (7) Análisis robusto de marcos de casos, (8) Aprendizaje de espacio de versiones sembrado y (9) Invención de analogía transformacional y derivacional, métodos generalizados para razonamiento basado en casos (CBR) para reutilizar, modificar y componer planes exitosos pasados para problemas cada vez más complejos.
Los equipos dirigidos por Carbonell lograron los máximos honores en muchas áreas, como la primera traducción automática interlingüística escalable de alta precisión (1991), la primera traducción automática de voz a voz (1992), el primer motor de búsqueda y araña a gran escala (1994) y el primer predictor de topología de estructura de proteínas entrenable a gran escala (2005). El aprendizaje automático moderno, cofundado por Carbonell, Michalski y Mitchell, es una tecnología habilitadora fundamental en los motores de búsqueda, la minería de datos y las redes sociales. A partir de 1980, coeditó los tres primeros libros sobre aprendizaje automático, lanzó las conferencias de aprendizaje automático y fue cofundador y editor en jefe de ML Journal. Las innovaciones de Carbonell han dado lugar a varias empresas emergentes exitosas: Carnegie Group (sistemas expertos en inteligencia artificial), Lycos (búsqueda web), Wisdom (optimización financiera y aprendizaje automático), Carnegie Speech (tutoría de lenguaje hablado), Dynamix (minería de datos y descubrimiento de patrones) y Meaningful Machines (traducción automática basada en contexto). Carbonell fue el director fundador de The Language Technology Institute, la institución mundial preeminente en estudios de idiomas, sin paralelo en tamaño y alcance y que desde entonces ha sido adoptada/imitada en Alemania (DFKI), Japón (Universidad de Tokio) y los EE. UU. (Johns Hopkins).