stringtranslate.com

Martín Porter

Martin F. Porter es el inventor del algoritmo Porter Stemmer , [1] uno de los algoritmos más comunes para la lematización del inglés, [2] [3] y el marco de programación Snowball . Su artículo de 1980 "Un algoritmo para la eliminación de sufijos", en el que propone el algoritmo de lematización, ha sido citado más de 8000 veces (Google Scholar). [4]

El motor de búsqueda Muscat es el resultado de una investigación realizada por Porter en la Universidad de Cambridge y fue comercializado en 1984 por Cambridge CD Publishing; posteriormente fue vendido a MAID, que se convirtió en Dialog Corporation . [5] Una parte de Dialog se escindió para convertirse en BrightStation en 2000, [6] [7] que hizo la transición de Open Muscat a un modelo de desarrollo de código cerrado en 2001. [8] Posteriormente, un grupo de desarrolladores liderado por Porter [9] inició un proyecto basado en Open Muscat llamado Xapian y lanzó la primera versión oficial el 30 de septiembre de 2002. [10]

En 2000 fue galardonado con el premio Tony Kent Strix . [11]

Porter estudió matemáticas en el St John's College de Cambridge (1963-1966) y se licenció en informática (1967) y doctorado en el Cambridge Computer Laboratory . Trabajó en la Universidad de Leeds durante un año antes de regresar al Literary and Linguistic Computing Centre de Cambridge (1971-1974) y al Museo Sedgwick como programador (1974-1976). En 1977 se convirtió en director de la Museum Documentation Advisory Unit (MDA). [12]

Martin Porter es cofundador, junto con John Snyder, de Grapeshot, una empresa de recomendaciones de contenido y segmentación contextual. [13] John Snyder figura como director ejecutivo y Martin Porter como científico jefe. Grapeshot recibió 250 000 libras esterlinas en subsidios del gobierno del Reino Unido y, posteriormente, recaudó 16 millones de libras esterlinas de inversores del Reino Unido. [14] El 15 de mayo de 2018, Oracle Corporation completó la adquisición de Grapeshot.

Referencias

  1. ^ Algoritmo de derivación de Porter
  2. ^ Christopher D. Manning, Prabhakar Raghavan y Hinrich Schütze (2008). Introducción a la recuperación de información. Cambridge University Press.
  3. ^ Daniel Jurafsky y James H. Martin (2009). Procesamiento del habla y del lenguaje . Pearson, pág. 102.
  4. ^ Artículos en Google Scholar, consultado el 9 de febrero de 2012.
  5. ^ Avi Rappoport, Search Tools Consulting. "Smartlogik Discover (APR) - Informe de SearchTools". Searchtools.com . Consultado el 9 de febrero de 2012 .
  6. ^ Rob Buckley (marzo de 2001). "La neblina bayesiana". infoconomy . Consultado el 10 de abril de 2022 .
  7. Paul Farrelly (23 de septiembre de 2000). «Brillante al final del túnel». The Guardian . Consultado el 10 de abril de 2022 .
  8. ^ "El Proyecto Xapian: Historia" . Consultado el 10 de abril de 2022 .
  9. ^ Porter, Martin (30 de marzo de 2006). "Lovins Revisited". En Tait, John (ed.). Trazando un nuevo rumbo: procesamiento del lenguaje natural y recuperación de información. Ensayos en honor a Karen Spärck Jones. Ámsterdam: Kluwer: Springer Science & Business Media. pág. 61. ISBN 9781402034671.
  10. ^ "NOTICIAS de Xapian Core" . Consultado el 10 de abril de 2022 .
  11. ^ Premio Tony Kent Strix de UKeiIG Archivado el 25 de septiembre de 2014 en Wayback Machine (consultado en febrero de 2012)
  12. ^ Museo , Vol XXX, n° 3/4, 1978, Museos y computadoras p.224
  13. ^ Grapeshot (Consultado en octubre de 2012)
  14. ^ [1] Revisión Parlamentaria 2018 - Grapeshot

Enlaces externos