La recuperación de información entre humanos y computadoras ( HCIR , por sus siglas en inglés) es el estudio y la ingeniería de técnicas de recuperación de información que incorporan la inteligencia humana al proceso de búsqueda . Combina los campos de la interacción entre humanos y computadoras (HCI, por sus siglas en inglés) y la recuperación de información (IR, por sus siglas en inglés) y crea sistemas que mejoran la búsqueda al tener en cuenta el contexto humano o mediante un proceso de búsqueda de varios pasos que brinda la oportunidad de recibir retroalimentación humana.
El término " recuperación de información hombre-computadora" fue acuñado por Gary Marchionini en una serie de conferencias dictadas entre 2004 y 2006. [1] La tesis principal de Marchionini es que "la HCIR tiene como objetivo capacitar a las personas para explorar bases de información a gran escala, pero exige que las personas también asuman la responsabilidad de este control gastando energía cognitiva y física".
En 1996 y 1998, un par de talleres en la Universidad de Glasgow sobre recuperación de información e interacción entre humanos y computadoras buscaron abordar la superposición entre estos dos campos. Marchionini destaca el impacto de la World Wide Web y el aumento repentino de la alfabetización informacional , cambios que apenas eran embrionarios a fines de los años 1990.
Algunos talleres se han centrado en la intersección de la RI y la HCI. El Taller sobre búsqueda exploratoria, iniciado por el Laboratorio de Interacción Hombre-Ordenador de la Universidad de Maryland en 2005, se alterna entre las conferencias del Grupo de Interés Especial sobre Recuperación de Información (SIGIR) y el Grupo de Interés Especial sobre Interacción Hombre-Ordenador (CHI) de la Asociación de Maquinaria Informática . También en 2005, la Fundación Europea de la Ciencia celebró un Taller Exploratorio sobre Recuperación de Información en Contexto. Luego, en 2007, se celebró el primer Taller sobre Recuperación de Información Hombre-Ordenador en el Instituto Tecnológico de Massachusetts .
La HCIR incluye varios aspectos de la IR y la HCI. Entre ellos se encuentran la búsqueda exploratoria , en la que los usuarios generalmente combinan estrategias de consulta y navegación para fomentar el aprendizaje y la investigación; la recuperación de información en contexto (es decir, teniendo en cuenta aspectos del usuario o del entorno que normalmente no se reflejan en una consulta); y la recuperación de información interactiva, que Peter Ingwersen define como "los procesos de comunicación interactiva que ocurren durante la recuperación de información al involucrar a todos los participantes principales en la recuperación de información (IR), es decir, el usuario, el intermediario y el sistema IR". [2]
Una preocupación clave de HCIR es que los sistemas IR destinados a usuarios humanos se implementen y evalúen de una manera que refleje las necesidades de esos usuarios. [3]
La mayoría de los sistemas IR modernos emplean un modelo de recuperación por orden de importancia , en el que los documentos se califican en función de la probabilidad de relevancia del documento para la consulta. [4] En este modelo, el sistema solo presenta al usuario los documentos mejor clasificados. Estos sistemas suelen evaluarse en función de su precisión media promedio en un conjunto de consultas de referencia de organizaciones como la Text Retrieval Conference (TREC).
Debido a su énfasis en el uso de la inteligencia humana en el proceso de recuperación de información, la HCIR requiere diferentes modelos de evaluación, uno que combine la evaluación de los componentes IR y HCI del sistema. Un área clave de investigación en HCIR involucra la evaluación de estos sistemas. Los primeros trabajos sobre recuperación de información interactiva, como el estudio de Juergen Koenemann y Nicholas J. Belkin de 1996 sobre diferentes niveles de interacción para la reformulación automática de consultas, aprovechan las medidas IR estándar de precisión y recuperación pero las aplican a los resultados de múltiples iteraciones de interacción del usuario, en lugar de a una única respuesta de consulta. [5] Otras investigaciones de HCIR, como el modelo de evaluación IIR de Pia Borlund, aplican una metodología más reminiscente de HCI, centrándose en las características de los usuarios, los detalles del diseño experimental, etc. [6]
Los investigadores del HCIR han propuesto los siguientes objetivos para lograr un sistema en el que el usuario tenga más control a la hora de determinar los resultados relevantes. [1] [7]
Los sistemas deben
En resumen, se espera que los sistemas de recuperación de información funcionen de la misma manera que lo hacen las buenas bibliotecas. Los sistemas deberían ayudar a los usuarios a salvar la brecha entre los datos o la información (en el sentido muy estrecho y granular de estos términos) y el conocimiento (datos o información procesada que proporciona el contexto necesario para informar la siguiente iteración de un proceso de búsqueda de información). Es decir, las buenas bibliotecas proporcionan tanto la información que necesita el usuario como un socio en el proceso de aprendizaje (el profesional de la información ) para navegar por esa información, darle sentido, preservarla y convertirla en conocimiento (lo que a su vez crea nuevas necesidades de información más fundamentadas).
Las técnicas asociadas con HCIR enfatizan las representaciones de información que utilizan la inteligencia humana para llevar al usuario a resultados relevantes. Estas técnicas también buscan permitir que los usuarios exploren y digieran el conjunto de datos sin penalizaciones, es decir, sin gastar costos innecesarios de tiempo, clics del mouse o cambios de contexto.
Muchos motores de búsqueda tienen funciones que incorporan técnicas de HCIR. Las sugerencias ortográficas y la reformulación automática de consultas proporcionan mecanismos para sugerir posibles rutas de búsqueda que pueden llevar al usuario a resultados relevantes. Estas sugerencias se presentan al usuario, lo que pone el control de la selección y la interpretación en sus manos.
La búsqueda por facetas permite a los usuarios navegar por la información de forma jerárquica , pasando de una categoría a sus subcategorías, pero eligiendo el orden en el que se presentan las categorías. Esto contrasta con las taxonomías tradicionales en las que la jerarquía de categorías es fija e inmutable. La navegación por facetas , al igual que la navegación taxonómica, guía a los usuarios mostrándoles las categorías (o facetas) disponibles, pero no les exige que naveguen por una jerarquía que puede no ajustarse precisamente a sus necesidades o forma de pensar. [8]
La búsqueda anticipada proporciona un enfoque general para la exploración sin penalizaciones. Por ejemplo, varias aplicaciones web emplean AJAX para completar automáticamente los términos de consulta y sugerir búsquedas populares. Otro ejemplo común de búsqueda anticipada es la forma en que los motores de búsqueda anotan los resultados con información resumida sobre esos resultados, incluida tanto información estática (por ejemplo, metadatos sobre los objetos) como "fragmentos" de texto del documento que son más pertinentes a las palabras de la consulta de búsqueda.
La retroalimentación de relevancia permite a los usuarios guiar un sistema IR indicando si determinados resultados son más o menos relevantes. [9]
El resumen y el análisis ayudan a los usuarios a digerir los resultados que se obtienen de la consulta. El resumen en este caso tiene como objetivo abarcar cualquier medio de agregación o compresión de los resultados de la consulta en un formato más fácil de entender para los humanos. La búsqueda por facetas, descrita anteriormente, es una de esas formas de resumen. Otra es la agrupación , que analiza un conjunto de documentos agrupando documentos o términos similares o que aparecen al mismo tiempo. La agrupación permite dividir los resultados en grupos de documentos relacionados. Por ejemplo, una búsqueda de "java" puede devolver grupos para Java (lenguaje de programación) , Java (isla) o Java (café) .
La representación visual de los datos también se considera un aspecto clave de la HCIR. La representación de los resúmenes o análisis puede mostrarse como tablas, gráficos o resúmenes de datos agregados. Otros tipos de visualización de información que permiten a los usuarios acceder a vistas resumidas de los resultados de búsqueda incluyen las nubes de etiquetas y los mapas de árbol .