Recuperación de información entre humanos y computadoras

La recuperación de información entre humanos y computadoras ( HCIR , por sus siglas en inglés) es el estudio y la ingeniería de técnicas de recuperación de información que incorporan la inteligencia humana al proceso de búsqueda . Combina los campos de la interacción entre humanos y computadoras (HCI, por sus siglas en inglés) y la recuperación de información (IR, por sus siglas en inglés) y crea sistemas que mejoran la búsqueda al tener en cuenta el contexto humano o mediante un proceso de búsqueda de varios pasos que brinda la oportunidad de recibir retroalimentación humana.

Historia

El término " recuperación de información hombre-computadora" fue acuñado por Gary Marchionini en una serie de conferencias dictadas entre 2004 y 2006. ^[1] La tesis principal de Marchionini es que "la HCIR tiene como objetivo capacitar a las personas para explorar bases de información a gran escala, pero exige que las personas también asuman la responsabilidad de este control gastando energía cognitiva y física".

En 1996 y 1998, un par de talleres en la Universidad de Glasgow sobre recuperación de información e interacción entre humanos y computadoras buscaron abordar la superposición entre estos dos campos. Marchionini destaca el impacto de la World Wide Web y el aumento repentino de la alfabetización informacional , cambios que apenas eran embrionarios a fines de los años 1990.

Algunos talleres se han centrado en la intersección de la RI y la HCI. El Taller sobre búsqueda exploratoria, iniciado por el Laboratorio de Interacción Hombre-Ordenador de la Universidad de Maryland en 2005, se alterna entre las conferencias del Grupo de Interés Especial sobre Recuperación de Información (SIGIR) y el Grupo de Interés Especial sobre Interacción Hombre-Ordenador (CHI) de la Asociación de Maquinaria Informática . También en 2005, la Fundación Europea de la Ciencia celebró un Taller Exploratorio sobre Recuperación de Información en Contexto. Luego, en 2007, se celebró el primer Taller sobre Recuperación de Información Hombre-Ordenador en el Instituto Tecnológico de Massachusetts .

Descripción

La HCIR incluye varios aspectos de la IR y la HCI. Entre ellos se encuentran la búsqueda exploratoria , en la que los usuarios generalmente combinan estrategias de consulta y navegación para fomentar el aprendizaje y la investigación; la recuperación de información en contexto (es decir, teniendo en cuenta aspectos del usuario o del entorno que normalmente no se reflejan en una consulta); y la recuperación de información interactiva, que Peter Ingwersen define como "los procesos de comunicación interactiva que ocurren durante la recuperación de información al involucrar a todos los participantes principales en la recuperación de información (IR), es decir, el usuario, el intermediario y el sistema IR". ^[2]

Una preocupación clave de HCIR es que los sistemas IR destinados a usuarios humanos se implementen y evalúen de una manera que refleje las necesidades de esos usuarios. ^[3]

La mayoría de los sistemas IR modernos emplean un modelo de recuperación por orden de importancia , en el que los documentos se califican en función de la probabilidad de relevancia del documento para la consulta. ^[4] En este modelo, el sistema solo presenta al usuario los documentos mejor clasificados. Estos sistemas suelen evaluarse en función de su precisión media promedio en un conjunto de consultas de referencia de organizaciones como la Text Retrieval Conference (TREC).

Debido a su énfasis en el uso de la inteligencia humana en el proceso de recuperación de información, la HCIR requiere diferentes modelos de evaluación, uno que combine la evaluación de los componentes IR y HCI del sistema. Un área clave de investigación en HCIR involucra la evaluación de estos sistemas. Los primeros trabajos sobre recuperación de información interactiva, como el estudio de Juergen Koenemann y Nicholas J. Belkin de 1996 sobre diferentes niveles de interacción para la reformulación automática de consultas, aprovechan las medidas IR estándar de precisión y recuperación pero las aplican a los resultados de múltiples iteraciones de interacción del usuario, en lugar de a una única respuesta de consulta. ^[5] Otras investigaciones de HCIR, como el modelo de evaluación IIR de Pia Borlund, aplican una metodología más reminiscente de HCI, centrándose en las características de los usuarios, los detalles del diseño experimental, etc. ^[6]

Objetivos

Los investigadores del HCIR han propuesto los siguientes objetivos para lograr un sistema en el que el usuario tenga más control a la hora de determinar los resultados relevantes. ^[1]^[7]

Los sistemas deben

Ya no sólo debe entregar los documentos relevantes, sino que también debe proporcionar información semántica junto con esos documentos
Aumentar la responsabilidad y el control del usuario; es decir, los sistemas de información requieren esfuerzo intelectual humano.
Tienen arquitecturas flexibles para poder evolucionar y adaptarse a bases de usuarios cada vez más exigentes y conocedores.
Pretendemos ser parte de la ecología de información de memorias y herramientas personales y compartidas en lugar de servicios independientes discretos.
Apoyar todo el ciclo de vida de la información (desde la creación hasta la preservación) en lugar de solo la fase de difusión o uso
Apoyar el ajuste por parte de los usuarios finales y, especialmente, de los profesionales de la información que añaden valor a los recursos de información.
Sea atractivo y divertido de usar

En resumen, se espera que los sistemas de recuperación de información funcionen de la misma manera que lo hacen las buenas bibliotecas. Los sistemas deberían ayudar a los usuarios a salvar la brecha entre los datos o la información (en el sentido muy estrecho y granular de estos términos) y el conocimiento (datos o información procesada que proporciona el contexto necesario para informar la siguiente iteración de un proceso de búsqueda de información). Es decir, las buenas bibliotecas proporcionan tanto la información que necesita el usuario como un socio en el proceso de aprendizaje (el profesional de la información ) para navegar por esa información, darle sentido, preservarla y convertirla en conocimiento (lo que a su vez crea nuevas necesidades de información más fundamentadas).

Técnicas

Las técnicas asociadas con HCIR enfatizan las representaciones de información que utilizan la inteligencia humana para llevar al usuario a resultados relevantes. Estas técnicas también buscan permitir que los usuarios exploren y digieran el conjunto de datos sin penalizaciones, es decir, sin gastar costos innecesarios de tiempo, clics del mouse o cambios de contexto.

Muchos motores de búsqueda tienen funciones que incorporan técnicas de HCIR. Las sugerencias ortográficas y la reformulación automática de consultas proporcionan mecanismos para sugerir posibles rutas de búsqueda que pueden llevar al usuario a resultados relevantes. Estas sugerencias se presentan al usuario, lo que pone el control de la selección y la interpretación en sus manos.

La búsqueda por facetas permite a los usuarios navegar por la información de forma jerárquica , pasando de una categoría a sus subcategorías, pero eligiendo el orden en el que se presentan las categorías. Esto contrasta con las taxonomías tradicionales en las que la jerarquía de categorías es fija e inmutable. La navegación por facetas , al igual que la navegación taxonómica, guía a los usuarios mostrándoles las categorías (o facetas) disponibles, pero no les exige que naveguen por una jerarquía que puede no ajustarse precisamente a sus necesidades o forma de pensar. ^[8]

La búsqueda anticipada proporciona un enfoque general para la exploración sin penalizaciones. Por ejemplo, varias aplicaciones web emplean AJAX para completar automáticamente los términos de consulta y sugerir búsquedas populares. Otro ejemplo común de búsqueda anticipada es la forma en que los motores de búsqueda anotan los resultados con información resumida sobre esos resultados, incluida tanto información estática (por ejemplo, metadatos sobre los objetos) como "fragmentos" de texto del documento que son más pertinentes a las palabras de la consulta de búsqueda.

La retroalimentación de relevancia permite a los usuarios guiar un sistema IR indicando si determinados resultados son más o menos relevantes. ^[9]

El resumen y el análisis ayudan a los usuarios a digerir los resultados que se obtienen de la consulta. El resumen en este caso tiene como objetivo abarcar cualquier medio de agregación o compresión de los resultados de la consulta en un formato más fácil de entender para los humanos. La búsqueda por facetas, descrita anteriormente, es una de esas formas de resumen. Otra es la agrupación , que analiza un conjunto de documentos agrupando documentos o términos similares o que aparecen al mismo tiempo. La agrupación permite dividir los resultados en grupos de documentos relacionados. Por ejemplo, una búsqueda de "java" puede devolver grupos para Java (lenguaje de programación) , Java (isla) o Java (café) .

La representación visual de los datos también se considera un aspecto clave de la HCIR. La representación de los resúmenes o análisis puede mostrarse como tablas, gráficos o resúmenes de datos agregados. Otros tipos de visualización de información que permiten a los usuarios acceder a vistas resumidas de los resultados de búsqueda incluyen las nubes de etiquetas y los mapas de árbol .

Áreas relacionadas

Referencias

^ ab Marchionini, G. (2006). Toward Human-Computer Information Retrieval Bulletin, en junio/julio de 2006 Boletín de la Sociedad Americana de Ciencias de la Información
^ "Ingwersen, P. (1992). Information Retrieval Interaction. Londres: Taylor Graham". Archivado desde el original el 25 de noviembre de 2007. Consultado el 28 de noviembre de 2007 .
^ "Grupo de trabajo Mira (1996). Marcos de evaluación para aplicaciones de recuperación de información multimedia interactiva". Archivado desde el original el 1 de febrero de 2008.
^ Grossman, D. y Frieder, O. (2004). Algoritmos y heurísticas de recuperación de información.
^ Koenemann, J. y Belkin, NJ (1996). Un caso de interacción: un estudio del comportamiento y la eficacia de la recuperación de información interactiva. En Actas de la Conferencia SIGCHI sobre factores humanos en sistemas informáticos: Common Ground (Vancouver, Columbia Británica, Canadá, 13-18 de abril de 1996). MJ Tauber, Ed. CHI '96. ACM Press, Nueva York, NY, 205-212
^ Borlund, P. (2003). El modelo de evaluación IIR: un marco para la evaluación de sistemas interactivos de recuperación de información. Information Research, 8(3), Artículo 152
^ White, R., Capra, R., Golovchinsky, G., Kules, B., Smith, C. y Tunkelang, D. (2013). Introducción al número especial sobre recuperación de información entre humanos y computadoras. Journal of Information Processing and Management 49(5), 1053-1057
^ Hearst, M. (1999). Interfaces de usuario y visualización, Capítulo 10 de Baeza-Yates, R. y Ribeiro-Neto, B., Recuperación de información moderna.
^ Rocchio, J. (1971). Retroalimentación de relevancia en la recuperación de información. En: Salton, G (ed), The SMART Retrieval System.

Enlaces externos

"Talleres sobre recuperación de información humano-computadora".
"Conferencia ACM SIGIR sobre interacción y recuperación de información humana (CHIIR)".