stringtranslate.com

Recuperación de información en varios idiomas

La recuperación de información en varios idiomas ( CLIR ) es un subcampo de la recuperación de información que se ocupa de recuperar información escrita en un idioma diferente al idioma de la consulta del usuario. [1] El término "recuperación de información en varios idiomas" tiene muchos sinónimos, de los cuales los siguientes son quizás los más frecuentes: recuperación de información en varios idiomas, recuperación de información translingüe, recuperación de información multilingüe. El término "recuperación de información multilingüe" se refiere de manera más general tanto a la tecnología para la recuperación de colecciones multilingües como a la tecnología que se ha trasladado para manejar material de un idioma a otro. El término Recuperación de información multilingüe (MLIR) implica el estudio de sistemas que aceptan consultas de información en varios idiomas y devuelven objetos (texto y otros medios) de varios idiomas, traducidos al idioma del usuario. La recuperación de información en varios idiomas se refiere más específicamente al caso de uso en el que los usuarios formulan su necesidad de información en un idioma y el sistema recupera documentos relevantes en otro. Para ello, la mayoría de los sistemas CLIR utilizan diversas técnicas de traducción. Las técnicas CLIR se pueden clasificar en diferentes categorías según los diferentes recursos de traducción: [2]

Los sistemas CLIR han mejorado tanto que los sistemas de recuperación de información ad hoc multilingües y multilingües más precisos de la actualidad son casi tan efectivos como los sistemas monolingües. [3] Otras tareas relacionadas de acceso a la información, como el monitoreo de medios , el filtrado y enrutamiento de información, el análisis de sentimientos y la extracción de información, requieren modelos más sofisticados y, por lo general, más procesamiento y análisis de los elementos de información de interés. Gran parte de ese procesamiento debe tener en cuenta las características específicas de los idiomas de destino en los que se implementa.

Principalmente, los diversos mecanismos de variación en el lenguaje humano plantean desafíos de cobertura para los sistemas de recuperación de información: los textos de una colección pueden tratar un tema de interés pero utilizan términos o expresiones que no coinciden con la expresión de la necesidad de información dada por el usuario. Esto puede ser cierto incluso en un caso monolingüe, pero es especialmente cierto en la recuperación de información multilingüe, donde los usuarios pueden conocer el idioma de destino sólo hasta cierto punto. Se ha descubierto que los beneficios de la tecnología CLIR para usuarios con competencia baja o moderada en el idioma de destino son mayores que para aquellos que lo dominan. [4] Las tecnologías específicas implementadas para los servicios CLIR incluyen análisis morfológico para manejar la inflexión , descomposición o división compuesta para manejar términos compuestos y mecanismos de traducción para traducir una consulta de un idioma a otro.

El primer taller sobre CLIR se celebró en Zúrich durante la conferencia SIGIR-96. [5] Se han celebrado talleres anualmente desde 2000 en las reuniones del Foro de Evaluación de Idiomas Cruzados (CLEF). Los investigadores también se reúnen en la Conferencia anual de recuperación de textos (TREC) para discutir sus hallazgos sobre diferentes sistemas y métodos de recuperación de información, y la conferencia ha servido como punto de referencia para el subcampo CLIR. [6] Los primeros experimentos CLIR se llevaron a cabo en TREC-6, celebrado en el Instituto Nacional de Estándares y Tecnología (NIST) del 19 al 21 de noviembre de 1997. [7]

La Búsqueda de Google tenía una función de búsqueda en varios idiomas que se eliminó en 2013. [8]

Ver también

Referencias

  1. ^ Wang, Jianqiang y Douglas W. Oard. "Coincidencia de significado para la recuperación de información en varios idiomas". Procesamiento y gestión de la información 48.4 (2012): 631-53.
  2. ^ Tsai, Peishan. "Una introducción a los enfoques de recuperación de información en varios idiomas". www.mikeandpeishan.com . Archivado desde el original el 4 de noviembre de 2022 . Consultado el 4 de noviembre de 2022 .
  3. ^ Oard, Douglas. "Acceso a la información multilingüe". Comprensión de los sistemas de recuperación de información (2011): 373-80. Web.
  4. ^ Airio, Eija (2008). "¿Quién se beneficia de CLIR en la recuperación web?". Revista de Documentación . 64 (5): 760–778. doi :10.1108/00220410810899754.
  5. ^ Las actas de este taller se pueden encontrar en el libro Recuperación de información en varios idiomas (Grefenstette, ed; Kluwer, 1998) ISBN 0-7923-8122-X
  6. ^ Olvera-Lobo, María-Dolores. "Recuperación de información en varios idiomas en la Web". Manual de investigación sobre dimensiones sociales de tecnologías semánticas y servicios web (sin fecha): 704-19. Web.
  7. ^ Vorhees, Ellen M.; Harman, Donna (1999). "Resumen de la Sexta Conferencia de Recuperación de Texto (TREC-6)". Procesamiento y Gestión de la Información .
  8. ^ "Google elimina la opción de búsqueda de" páginas extranjeras traducidas "por falta de uso". 20 de mayo de 2013.

enlaces externos