Christopher D. Paice

Christopher D Paice fue uno de los pioneros de la investigación sobre derivaciones . El despalillador de Paice-Husk se publicó en 1990 y su método de evaluación del rendimiento del despalillador mediante la tasa de error con respecto al truncamiento (ERRT) fue el primer método directo para comparar los errores de despalillado y de despalillado excesivo. Además de su trabajo pionero en algoritmos de derivación y métodos de evaluación, realizó otras contribuciones de investigación en el área de recuperación de información , resolución de anáforas y abstracción automática. ^[1] ^[2]

carrera docente

Christopher D Paice fue miembro de la Escuela de Computación y Comunicaciones (SCC) de la Universidad de Lancaster , Reino Unido , durante unos cuarenta años, incorporándose inicialmente al entonces Departamento de Estudios de Computación como investigador asociado en 1969-70; Luego pasó a una cátedra. Fue Jefe de Departamento interino en 1977-78, Jefe de Departamento 1979-82 y se jubiló en 2009. ^[3]

El algoritmo de derivación de Paice-Husk

El destilador Paice-Husk fue desarrollado por Chris D. Paice con la ayuda de Gareth Husk en el Departamento de Computación de la Universidad de Lancaster, a fines de la década de 1980. Cuenta con un conjunto de reglas de destilación almacenado externamente, y esta flexibilidad sobre el destilador Porter lo hizo de interés para varios investigadores. ^[4]

Implementado originalmente en el lenguaje de programación Pascal, se han realizado implementaciones adicionales utilizando ANSI C y Java. Mary Taffet implementó una versión de Perl en el Centro de Procesamiento del Lenguaje Natural de la Universidad de Syracuse, EE. UU. ^[5]

El lematizador consta de un algoritmo de lematización y un conjunto separado de reglas de lematización. El conjunto estándar de reglas proporciona un planteamiento "fuerte". La resistencia del tallo es una cualidad que es ventajosa para la compresión del índice; sin embargo, produce una mayor cantidad de errores de sobrerasillado en relación con la cantidad de errores de subtaladizado; los usuarios que necesiten una destiladora más ligera pueden desarrollar fácilmente su propio conjunto de reglas.

El Stemmer es iterativo (es decir, las terminaciones se eliminan poco a poco en un número indefinido de etapas) y las reglas pueden especificar la eliminación o el reemplazo de una terminación. La técnica de sustitución evita la necesidad de una etapa separada en el proceso para recodificar o proporcionar una coincidencia parcial; esto ayuda a mantener la eficiencia del algoritmo. Las reglas están indexadas por la última letra del final para permitir una búsqueda eficiente. ^[6]

Evaluación del tallo

Además del Stemmer en sí, Chris Paice desarrolló un método para medir directamente el rendimiento de los lematizadores utilizando listas agrupadas de palabras aplicadas al lematizador, contando el número de errores de sobre y subtalamización y luego comparando los resultados con lo que se habría obtenido usando un lematizador. conjunto de lematizadores de truncamiento. La medida final es la tasa de error relativa al truncamiento (ERRT). ^[7]^[8]

Vida personal

Christopher D Paice nació en 1941 y se casó con Kathleen F Moss en 1965 en el distrito de registro de Manchester. En 2015 le diagnosticaron un tumor cerebral agresivo, poco después de que él y su esposa se mudaran de Cumbria a Stratford, falleció el 21 de abril de 2016.

Publicaciones

CD Paice (1977). Recuperación de información y la computadora . Macdonald y Jane's, Londres.
CD Paice (1980). Actas SIGIR '80 La generación automática de resúmenes literarios: un enfoque basado en la identificación de frases autoindicadoras . Butterworth. ISBN 0-408-10775-8.
CD Paice (1984). Aplicaciones de desarrollo de investigación en tecnología de la información: Volumen 3 Número 1, Evaluación suave de consultas de búsqueda booleanas en sistemas de recuperación de información . Butterworth.
CD Paice; V. Aragón-Ramírez (1985). RIAO '85: Recherche d'Informations Assistée par Ordinateur, El cálculo de similitudes entre cadenas de varias palabras utilizando un diccionario de sinónimos . LE CENTRE DE HAUTES ETUDES INTERNATIONALES D'INFORMATIQUE DOCUMENTAIRE.
CD Paice (1986). Actas de ASLIB: Volumen 38 Número 10, ¿Sistemas expertos para la recuperación de información? . Aslib, Asociación para la Gestión de la Información.
CD Paice (1990). Procesamiento y gestión de la información: una revista internacional, volumen 26, número 1 Construcción de resúmenes de literatura por computadora: técnicas y perspectivas . Prensa de Pérgamo, Inc.
CD Paice (1990). Procesamiento y gestión de la información: una revista internacional, volumen 27, número 5. Un modelo tesaural de recuperación de información . Prensa de Pérgamo, Inc.
CD Paice (1991). Foro ACM SIGIR: Volumen 24 Número 3 Otro lema . ACM.
FC Johnson; CD Paice; WJ Negro; AP Neal (1997). Lecturas en recuperación de información: la aplicación del procesamiento lingüístico a la generación automática de resúmenes . Morgan Kaufmann Editores Inc.
Michael B. Twidale; David M. Nichols; Chris D. Paice (1997). Procesamiento y gestión de la información: una revista internacional: Volumen 33 Número 6, La navegación es un proceso colaborativo . Prensa de Pérgamo, Inc.
Michael P. Oakes; CD Paice (1999). IRSG'99: Actas de la 21ª conferencia anual BCS-IRSG sobre investigación de recuperación de información La generación automática de plantillas para resúmenes automáticos . BCS.
CD Paice (2009). Análisis léxico de datos textuales. Enciclopedia de sistemas de bases de datos . Springer, Estados Unidos. págs. 1606-1610. ISBN 978-0-387-35544-3.
CD Paice (2009). Derivado. Enciclopedia de sistemas de bases de datos . Springer, Estados Unidos. págs. 2790–2793. ISBN 978-0-387-35544-3.

Referencias

^ [1], Universidad de Trier, Bibliografía de informática DBLP
^ [2], página del autor de ACM, CD Paice
^ [3], Universidad de Lancaster, en memoria de Chris Paice
^ [4], Mejoras en el algoritmo de derivación de Lancaster (Paice-Husk Stemmer), Antonio Zamora
^ [5], GitHub, Paice-Husk Stemmer en varios idiomas
^ "Paice/Husk Stemmer". Archivado desde el original el 22 de agosto de 2006 . Consultado el 22 de agosto de 2006 .
^ Paice, CD, (1994) Un método de evaluación para algoritmos de derivación, en Croft, WB y van Rijsbergen, CJ (eds.), Actas de la 17ª conferencia ACM SIGIR celebrada en Dublín, del 3 al 6 de julio de 1994; págs. 42-50.
^ Paice, CD (1996) Método para la evaluación de algoritmos de derivación basados en el recuento de errores, JASIS, 47(8): 632-649