stringtranslate.com

Christopher D. Paice

Christopher D Paice fue uno de los pioneros de la investigación sobre derivaciones . El despalillador de Paice-Husk se publicó en 1990 y su método de evaluación del rendimiento del despalillador mediante la tasa de error con respecto al truncamiento (ERRT) fue el primer método directo para comparar los errores de despalillado y de despalillado excesivo. Además de su trabajo pionero en algoritmos de derivación y métodos de evaluación, realizó otras contribuciones de investigación en el área de recuperación de información , resolución de anáforas y abstracción automática. [1] [2]

carrera docente

Christopher D Paice fue miembro de la Escuela de Computación y Comunicaciones (SCC) de la Universidad de Lancaster , Reino Unido , durante unos cuarenta años, incorporándose inicialmente al entonces Departamento de Estudios de Computación como investigador asociado en 1969-70; Luego pasó a una cátedra. Fue Jefe de Departamento interino en 1977-78, Jefe de Departamento 1979-82 y se jubiló en 2009. [3]

El algoritmo de derivación de Paice-Husk

El destilador Paice-Husk fue desarrollado por Chris D. Paice con la ayuda de Gareth Husk en el Departamento de Computación de la Universidad de Lancaster, a fines de la década de 1980. Cuenta con un conjunto de reglas de destilación almacenado externamente, y esta flexibilidad sobre el destilador Porter lo hizo de interés para varios investigadores. [4]

Implementado originalmente en el lenguaje de programación Pascal, se han realizado implementaciones adicionales utilizando ANSI C y Java. Mary Taffet implementó una versión de Perl en el Centro de Procesamiento del Lenguaje Natural de la Universidad de Syracuse, EE. UU. [5]

El lematizador consta de un algoritmo de lematización y un conjunto separado de reglas de lematización. El conjunto estándar de reglas proporciona un planteamiento "fuerte". La resistencia del tallo es una cualidad que es ventajosa para la compresión del índice; sin embargo, produce una mayor cantidad de errores de sobrerasillado en relación con la cantidad de errores de subtaladizado; los usuarios que necesiten una destiladora más ligera pueden desarrollar fácilmente su propio conjunto de reglas.

El Stemmer es iterativo (es decir, las terminaciones se eliminan poco a poco en un número indefinido de etapas) y las reglas pueden especificar la eliminación o el reemplazo de una terminación. La técnica de sustitución evita la necesidad de una etapa separada en el proceso para recodificar o proporcionar una coincidencia parcial; esto ayuda a mantener la eficiencia del algoritmo. Las reglas están indexadas por la última letra del final para permitir una búsqueda eficiente. [6]

Evaluación del tallo

Además del Stemmer en sí, Chris Paice desarrolló un método para medir directamente el rendimiento de los lematizadores utilizando listas agrupadas de palabras aplicadas al lematizador, contando el número de errores de sobre y subtalamización y luego comparando los resultados con lo que se habría obtenido usando un lematizador. conjunto de lematizadores de truncamiento. La medida final es la tasa de error relativa al truncamiento (ERRT). [7] [8]

Vida personal

Christopher D Paice nació en 1941 y se casó con Kathleen F Moss en 1965 en el distrito de registro de Manchester. En 2015 le diagnosticaron un tumor cerebral agresivo, poco después de que él y su esposa se mudaran de Cumbria a Stratford, falleció el 21 de abril de 2016.

Publicaciones

Referencias

  1. ^ [1], Universidad de Trier, Bibliografía de informática DBLP
  2. ^ [2], página del autor de ACM, CD Paice
  3. ^ [3], Universidad de Lancaster, en memoria de Chris Paice
  4. ^ [4], Mejoras en el algoritmo de derivación de Lancaster (Paice-Husk Stemmer), Antonio Zamora
  5. ^ [5], GitHub, Paice-Husk Stemmer en varios idiomas
  6. ^ "Paice/Husk Stemmer". Archivado desde el original el 22 de agosto de 2006 . Consultado el 22 de agosto de 2006 .
  7. ^ Paice, CD, (1994) Un método de evaluación para algoritmos de derivación, en Croft, WB y van Rijsbergen, CJ (eds.), Actas de la 17ª conferencia ACM SIGIR celebrada en Dublín, del 3 al 6 de julio de 1994; págs. 42-50.
  8. ^ Paice, CD (1996) Método para la evaluación de algoritmos de derivación basados ​​en el recuento de errores, JASIS, 47(8): 632-649