Científico informático estadounidense (1927-1995)
Gerard A. "Gerry" Salton (8 de marzo de 1927 - 28 de agosto de 1995) fue profesor de Ciencias de la Computación en la Universidad de Cornell . Salton fue quizás el científico informático líder que trabajó en el campo de la recuperación de información durante su tiempo, y "el padre de la recuperación de información". [2] Su grupo en Cornell desarrolló el Sistema de Recuperación de Información SMART , que inició cuando estaba en Harvard . Fue el primer sistema en utilizar el ahora popular modelo de espacio vectorial para la recuperación de información.
Educación y carrera
Salton nació como Gerhard Anton Sahlmann en Núremberg, Alemania . Llegó a los Estados Unidos en 1947 y se naturalizó en 1952. Recibió una licenciatura (1950) y una maestría (1952) en matemáticas del Brooklyn College , y un doctorado de Harvard en matemáticas aplicadas en 1958, el último de los estudiantes de doctorado de Howard Aiken , y enseñó allí hasta 1965, cuando se unió a la Universidad de Cornell y cofundó su departamento de Ciencias de la Computación.
Salton fue quizás más conocido por desarrollar el modelo de espacio vectorial ahora ampliamente utilizado para la recuperación de información. [3] En este modelo, tanto los documentos como las consultas se representan como vectores de recuentos de términos, y la similitud entre un documento y una consulta está dada por el coseno entre el vector de término y el vector de documento. En este artículo, también presentó TF-IDF , o frecuencia de término-frecuencia-frecuencia inversa de documento, un modelo en el que la puntuación de un término en un documento es la relación entre el número de términos en ese documento dividido por la frecuencia del número de documentos en los que aparece ese término. (El concepto de frecuencia inversa de documento, una medida de especificidad, había sido introducido en 1972 por Karen Sparck-Jones . [4] ) Más tarde en la vida, se interesó en el resumen y análisis automático de texto, [5] así como en la generación automática de hipertexto. [6] Publicó más de 150 artículos de investigación y 5 libros durante su vida.
Honores y premios
Salton fue editor jefe de Communications of the ACM y Journal of the ACM , y presidió el Special Interest Group on Information Retrieval (SIGIR). Fue editor asociado de ACM Transactions on Information Systems . Fue miembro de la ACM (elegido en 1995), [7] recibió el Premio al Mérito de la Sociedad Estadounidense de Ciencias de la Información (1989) y fue el primer destinatario del Premio SIGIR por contribuciones destacadas al estudio de la Recuperación de Información (1983), ahora llamado Premio Gerard Salton .
Bibliografía
- Salton, Organización y recuperación automática de información , 1968.
- Gerard Salton (1975). Una teoría de la indexación . Sociedad de Matemáticas Industriales y Aplicadas. p. 56. ISBN 9780898710151.
- --- y Michael J. McGill, Introducción a la recuperación de información moderna , 1983. ISBN 0-07-054484-0
- Gerard Salton (1989). Procesamiento automático de textos. Addison-Wesley Publishing Company. pág. 530. ISBN 978-0-201-12227-5.
- Gerard Salton en el servidor de bibliografía DBLP
- G. Salton, A. Wong y CS Yang (1975), "A Vector Space Model for Automatic Indexing", Communications of the ACM , vol. 18, nr. 11, páginas 613–620. (Artículo en el que se presentó un modelo de espacio vectorial)
- G. Salton. (1980). 'Hacia una biblioteca dinámica'. En F. Wilfrid Lancaster, ed. El papel de la biblioteca en una sociedad electrónica: Clínica sobre aplicaciones bibliotecarias del procesamiento de datos. Urbana-Champaign: Facultad de Bibliotecología de la Universidad de Illinois.
Véase también
Referencias
- ^ Alla, James. Construcción automática de hipertexto. Universidad de Cornell . Consultado el 3 de diciembre de 2023 .
- ^ ab "El padre de la recuperación de información" (PDF) . cs.cornell.edu . Consultado el 10 de marzo de 2015 .
miembro fundador del departamento y el padre de la recuperación de información.
- ^ Salton, G.; Wong, A.; Yang, CS (1975). "Un modelo de espacio vectorial para indexación automática". Comunicaciones de la ACM . 18 (11): 613. doi :10.1145/361219.361220. hdl : 1813/6057 . S2CID 6473756.
- ^ Spärck Jones, K. (1972). "Una interpretación estadística de la especificidad de los términos y su aplicación en la recuperación". Revista de documentación . 28 : 11–21. CiteSeerX 10.1.1.115.8343 . doi :10.1108/eb026526. S2CID 2996187.
- ^ Salton, G.; Allan, J.; Buckley, C.; Singhal, A. (1994). "Análisis automático, generación de temas y resumen de textos legibles por máquina". Science . 264 (5164): 1421–1426. Bibcode :1994Sci...264.1421S. doi :10.1126/science.264.5164.1421. PMID 17838425. S2CID 32296317.
- ^ "Gerard Salton". Cs.cornell.edu . Consultado el 14 de septiembre de 2013 .
- ^ "Gerard Salton ACM Fellows 1995". acm.org . Consultado el 10 de marzo de 2015 .
contribuciones a lo largo de 30 años a la organización y recuperación de información
Enlaces externos
- En memoria
- Fractales del cambio: una búsqueda en el camino de la memoria
- "El artículo más influyente que Gerard Salton nunca escribió". Dubin D. Este artículo de 2004 de Library Trends (2004;52(4):748-764) de David Dubin sirve como una revisión histórica de la metamorfosis del modelo de valor de discriminación de términos (TDV) en el modelo de espacio vectorial como modelo de recuperación de información (VSM como modelo IR). Este artículo pone en tela de juicio lo que la comunidad de investigación de recuperación de información creía que el modelo de espacio vectorial de Salton originalmente pretendía modelar. Lo que mucho más tarde se convirtió en un modelo de recuperación de información fue originalmente un modelo matemático-computacional centrado en datos utilizado como un dispositivo explicativo. Además, el artículo de Dubin señala que no existe un artículo de Salton de 1975 que se cita a menudo, sino que probablemente sea una combinación de otros dos artículos, ninguno de los cuales se refiere realmente al VSM como un modelo IR.