Científico informático estadounidense (1927-1995)
Gerard A. "Gerry" Salton (8 de marzo de 1927 - 28 de agosto de 1995) fue profesor de Ciencias de la Computación en la Universidad de Cornell . Salton fue quizás el principal científico informático que trabajó en el campo de la recuperación de información durante su época y "el padre de la recuperación de información". [2] Su grupo en Cornell desarrolló el Sistema de Recuperación de Información SMART , que inició cuando estaba en Harvard. Fue el primer sistema en utilizar el ahora popular modelo de espacio vectorial para la recuperación de información.
Educación y carrera
Salton nació como Gerhard Anton Sahlmann en Nuremberg, Alemania . Llegó a los Estados Unidos en 1947 y se naturalizó en 1952. Recibió una licenciatura (1950) y una maestría (1952) en matemáticas del Brooklyn College , y un doctorado. Se licenció en matemáticas aplicadas en Harvard en 1958, el último de los estudiantes de doctorado de Howard Aiken , y enseñó allí hasta 1965, cuando se incorporó a la Universidad de Cornell y cofundó su departamento de Ciencias de la Computación.
Salton fue quizás más conocido por desarrollar el ahora ampliamente utilizado modelo de espacio vectorial para la recuperación de información. [3] En este modelo, tanto los documentos como las consultas se representan como vectores de recuentos de términos, y la similitud entre un documento y una consulta viene dada por el coseno entre el vector de términos y el vector de documento. En este artículo, también presentó TF-IDF , o término-frecuencia-frecuencia-documento inversa, un modelo en el que la puntuación de un término en un documento es la relación entre el número de términos en ese documento dividido por la frecuencia del número de documentos en los que aparece ese término. (El concepto de frecuencia inversa de documentos, una medida de especificidad, fue introducido en 1972 por Karen Sparck-Jones . [4] ) Más adelante en su vida, se interesó en el análisis y resumen automático de textos, [5] así como en el hipertexto automático. generación. [6] Publicó más de 150 artículos de investigación y 5 libros durante su vida.
Honores y premios
Salton fue editor en jefe de Comunicaciones de la ACM y de la Revista de la ACM , y presidió el Grupo de Interés Especial en Recuperación de Información (SIGIR). Fue editor asociado de ACM Transactions on Information Systems . Fue miembro de la ACM (elegido en 1995), [7] recibió el Premio al Mérito de la Sociedad Estadounidense de Ciencias de la Información (1989) y fue el primer ganador del Premio SIGIR por sus destacadas contribuciones al estudio de la recuperación de información (1983). - ahora llamado Premio Gerard Salton .
Bibliografía
- Salton, Organización y recuperación automática de información , 1968.
- Gerard Salton (1975). Una teoría de la indexación . Sociedad de Matemática Industrial y Aplicada. pag. 56.ISBN _ 9780898710151.
- --- y Michael J. McGill, Introducción a la recuperación de información moderna , 1983. ISBN 0-07-054484-0
- Gerard Salton (1989). Procesamiento automático de textos. Compañía editorial Addison-Wesley. pag. 530.ISBN _ 978-0-201-12227-5.
- Gerard Salton en el servidor de bibliografía DBLP
- G. Salton, A. Wong y CS Yang (1975), "Un modelo espacial vectorial para la indexación automática", Communications of the ACM , vol. 18, núm. 11, páginas 613–620. (Artículo en el que se presentó un modelo de espacio vectorial)
- G. Saltón. (1980). "Hacia una biblioteca dinámica". En F. Wilfrid Lancaster, ed. El papel de la biblioteca en una sociedad electrónica: clínica sobre aplicaciones bibliotecarias del procesamiento de datos. Urbana-Champaign: Escuela de Graduados en Biblioteconomía de la Universidad de Illinois.
Ver también
Referencias
- ^ Alla, James. Construcción automática de hipertexto. Universidad de Cornell . Consultado el 3 de diciembre de 2023 .
- ^ ab "El padre de la recuperación de información" (PDF) . cs.cornell.edu . Consultado el 10 de marzo de 2015 .
miembro fundador del departamento y padre de la recuperación de información.
- ^ Salton, G.; Wang, A.; Yang, CS (1975). "Un modelo de espacio vectorial para indexación automática". Comunicaciones de la ACM . 18 (11): 613.doi : 10.1145/361219.361220. hdl : 1813/6057 . S2CID 6473756.
- ^ Spärck Jones, K. (1972). "Una interpretación estadística de la especificidad del término y su aplicación en la recuperación". Revista de Documentación . 28 : 11–21. CiteSeerX 10.1.1.115.8343 . doi :10.1108/eb026526. S2CID 2996187.
- ^ Salton, G.; Allan, J.; Buckley, C.; Singhal, A. (1994). "Análisis automático, generación de temas y resumen de textos legibles por máquina". Ciencia . 264 (5164): 1421-1426. Código Bib : 1994 Ciencia... 264.1421S. doi : 10.1126/ciencia.264.5164.1421. PMID 17838425. S2CID 32296317.
- ^ "Gerard Salton". Cs.cornell.edu . Consultado el 14 de septiembre de 2013 .
- ^ "Becarios Gerard Salton ACM 1995". acm.org . Consultado el 10 de marzo de 2015 .
contribuciones durante 30 años a la organización y recuperación de información
enlaces externos
- En memoria
- Fractales de cambio: búsqueda en el carril de la memoria
- "El artículo más influyente que Gerard Salton nunca escribió". Dubin D. Este artículo de Library Trends de 2004 (2004;52(4):748-764) de David Dubin sirve como una revisión histórica de la metamorfosis del término modelo de valor de discriminación (TDV) en el modelo de espacio vectorial como modelo de recuperación de información. (VSM como modelo IR). Este artículo cuestiona lo que la comunidad de investigación de Recuperación de Información creía que el modelo de espacio vectorial de Salton originalmente pretendía modelar. Lo que mucho más tarde se convirtió en un modelo de recuperación de información fue originalmente un modelo matemático-computacional centrado en datos utilizado como dispositivo explicativo. Además, el artículo de Dubin señala que un artículo de Salton de 1975 citado con frecuencia no existe, pero es probablemente una combinación de otros dos artículos, ninguno de los cuales se refiere realmente al VSM como un modelo IR.