La definición de "sesión" varía, particularmente cuando se aplica a los motores de búsqueda . [1] Generalmente, se entiende que una sesión consiste en "una secuencia de solicitudes realizadas por un solo usuario final durante una visita a un sitio en particular". [2] En el contexto de los motores de búsqueda , "sesiones" y "sesiones de consulta" tienen al menos dos definiciones. [1] Una sesión o sesión de consulta puede ser todas las consultas realizadas por un usuario en un período de tiempo particular [3] o también puede ser una serie de consultas o navegaciones con una necesidad subyacente consistente del usuario. [4] [5]
Usos
Las sesiones por usuario se pueden utilizar como una medida del uso del sitio web. [6] [7] Otras métricas utilizadas en la investigación y el análisis web aplicado incluyen la duración de la sesión, [8] y las acciones del usuario por sesión. [9] La duración de la sesión se considera una alternativa más precisa para medir las visitas a la página . [10]
Para utilizar sesiones en la analítica web es fundamental poder identificarlas. Esto se conoce como "reconstrucción de sesiones". Los enfoques de reconstrucción de sesiones se pueden dividir en dos categorías principales: orientados al tiempo y orientados a la navegación. [14]
Enfoques orientados al tiempo
Los enfoques orientados al tiempo para la reconstrucción de sesiones buscan un período determinado de inactividad del usuario, comúnmente llamado "umbral de inactividad". Una vez que se alcanza este período de inactividad, se supone que el usuario ha abandonado el sitio o ha dejado de usar el navegador por completo y la sesión finaliza. Las solicitudes posteriores del mismo usuario se consideran una segunda sesión. Un valor común para el umbral de inactividad es 30 minutos y, a veces, se describe como el estándar de la industria. [15] [16] Algunos han argumentado que un umbral de 30 minutos produce artefactos alrededor de sesiones naturalmente largas y han experimentado con otros umbrales. [17] [18] Otros simplemente afirman: "ningún umbral de tiempo es efectivo para identificar [sesiones]". [19]
Una alternativa que se ha propuesto es utilizar umbrales específicos del usuario en lugar de un único umbral global para todo el conjunto de datos. [20] [21] Esto tiene el problema de suponer que los umbrales siguen una distribución bimodal y no es adecuado para conjuntos de datos que cubren un largo período de tiempo. [17]
Enfoques orientados a la navegación
Los enfoques orientados a la navegación explotan la estructura de los sitios web, específicamente, la presencia de hipervínculos y la tendencia de los usuarios a navegar entre páginas del mismo sitio web haciendo clic en ellas, en lugar de escribir la URL completa en su navegador. [14] Una forma de identificar sesiones observando estos datos es construir un mapa del sitio web: si se puede identificar la primera página del usuario, la "sesión" de acciones dura hasta que aterriza en una página a la que no se puede acceder desde ninguna de las páginas a las que se accedió anteriormente. Esto tiene en cuenta el retroceso, donde un usuario volverá sobre sus pasos antes de abrir una nueva página. [22] Un enfoque más simple, que no tiene en cuenta el retroceso, es simplemente requerir que el referente HTTP de cada solicitud sea una página que ya esté en la sesión. Si no lo es, se crea una nueva sesión. [23] Esta clase de heurística "exhibe un rendimiento muy pobre" en sitios web que contienen conjuntos de marcos . [24]
Referencias
^ ab Gayo-Avello 2009, pag. 1824.
^ Arlitt 2000, pág. 2.
^ Donato, Bonchi y Chi 2010, pag. 324.
^ Gayo-Avello 2009, pág. 1825.
^ Lam, Russell y Tang 2007, pág. 147.
^ Weischdel y Huizingh 2006, pág. 464.
^ Catledge y Pitkow 1995, pág. 5.
^ Jansen y Spink 2006, pág. 10.
^ Jansen, Spink y Saracevic 2000, pág. 12.
^ Khoo y otros. 2008, pág. 377.
^ Geiger y Halfaker 2014, pág. 1.
^ Meiss y otros. 2009, pág. 177.
^ Arlitt 2000, pág. 8.
^ ab Spiliopoulou et al. 2003, pág. 176.
^ Ortega y Aguillo 2010, pag. 332.
^ Eickhoff y otros. 2014, pág. 3.
^ ab Mehrzadi y Feitelson 2012, pág. 3.
^ Él, Goker y Harper 2002, pág. 733.
^ Jones y Klinkner 2008, pág. 2.
^ Murray, Lin y Chowdhury 2006, pág. 3.
^ Mehrzadi y Feitelson 2012, pág. 1.
^ Cooley, Mobasher y Srivastava 1999, pág. 19.
^ Cooley, Mobasher y Srivastava 1999, pág. 23.
^ Berendt y col. 2003, pág. 179.
Bibliografía
Arlitt, Martin (2000). "Caracterización de sesiones de usuario web" (PDF) . SIGMETRICS Performance Evaluation Review . 28 (2): 50–63. doi :10.1145/362883.362920. S2CID 2946044.
Berendt, Bettina; Mobasher, Bamshad; Nakagawa, Miki; Spiliopoulou, Myra (2003). "El impacto de la estructura del sitio y el entorno del usuario en la reconstrucción de sesiones en el análisis del uso web" (PDF) . WEBKDD 2002 - Minería de datos web para descubrir patrones y perfiles de uso . Apuntes de clase en informática. Vol. 2703. Springer. págs. 159–179. doi :10.1007/978-3-540-39663-5_10. ISBN 978-3-540-39663-5.
Catledge, L.; Pitkow, J. (1995). "Caracterización de las estrategias de navegación en la World Wide Web" (PDF) . Redes informáticas y sistemas de RDSI . 27 (6): 1065–1073. doi :10.1016/0169-7552(95)00043-7. S2CID 14313721.
Cooley, Robert; Mobasher, Bamshad; Srivastava, Jaideep (1999). "Preparación de datos para la minería de patrones de navegación en la World Wide Web" (PDF) . Sistemas de información y conocimiento . 1 (1): 5–32. CiteSeerX 10.1.1.33.2792 . doi :10.1007/BF03325089. ISSN 0219-3116. S2CID 1165622.
Donato, Debora ; Bonchi, Francesco; Chi, Tom (2010). "¿Quieres tomar notas?: Identificación de misiones de investigación en Yahoo! Search pad" (PDF) . Actas de la 19.ª conferencia internacional sobre la World Wide Web . ACM. págs. 321–330. doi :10.1145/1772690.1772724. ISBN.9781605587998.S2CID6951065 .
Eickhoff, Carsten; Teevan, Jaime; White, Ryen; Dumais, Susan. (2014). "Lecciones del viaje". Actas de la 7.ª conferencia internacional de la ACM sobre búsqueda web y minería de datos (PDF) . ACM. págs. 223–232. doi :10.1145/2556195.2556217. ISBN .9781450323512.ID S2C 14666769.
Gayo-Avello, Daniel (2009). "Una encuesta sobre métodos de detección de sesiones en registros de consultas y una propuesta para una evaluación futura" (PDF) . Ciencias de la Información . 179 (12): 1822–1843. doi :10.1016/j.ins.2009.01.026. hdl : 10651/8686 . ISSN 0020-0255. Archivado desde el original (PDF) el 2016-03-04 . Consultado el 2015-02-18 .
Geiger, RS; Halfaker, A. (2014). "Uso de sesiones de edición para medir la participación en Wikipedia". Actas de la conferencia de 2013 sobre trabajo cooperativo con apoyo informático (PDF) . ACM. págs. 861–870. doi :10.1145/2441776.2441873. ISBN.9781450313315.S2CID 7166943 .
He, Daqing; Goker, Ayse; Harper, David J. (2002). "Combinación de evidencia para la identificación automática de sesiones web". Procesamiento y gestión de la información . 38 (5): 727–742. doi :10.1016/S0306-4573(01)00060-7. ISSN 0306-4573.
Heer, Jeffrey; Chi, Ed H. (2002). "Separación del enjambre: métodos de categorización para sesiones de usuario en la web" (PDF) . Actas de la Conferencia SIGCHI sobre factores humanos en sistemas informáticos . Vol. 4. ACM. págs. 243–250. doi :10.1145/503376.503420. ISBN .1581134533. Número de identificación S2C14018957.
Huang, Chien-Kang; Chien, Lee-Feng; Oyang, Yen-Jen (2003). "Sugerencia de términos relevantes en la búsqueda web interactiva basada en información contextual en registros de sesiones de consulta". Revista de la Sociedad Estadounidense de Ciencias de la Información y Tecnología . 54 (7): 638–649. CiteSeerX 10.1.1.105.5584 . doi :10.1002/asi.10256.
Jansen, Bernard J.; Spink, Amanda; Saracevic, Tefko (2000). "Vida real, usuarios reales y necesidades reales: un estudio y análisis de consultas de usuarios en la web" (PDF) . Procesamiento y gestión de la información . 36 (2): 207–227. CiteSeerX 10.1.1.155.1383 . doi :10.1016/S0306-4573(99)00056-4. ISSN 0306-4573.
Jansen, Bernard J.; Spink, Amanda (2006). "¿Cómo buscamos en la World Wide Web? Una comparación de nueve registros de transacciones de motores de búsqueda" (PDF) . Procesamiento y gestión de la información . 42 (1): 248–263. doi :10.1016/j.ipm.2004.10.007. ISSN 0306-4573.
Jones, Rosie; Klinkner, Kristina Lisa (2008). "Más allá del tiempo de espera de la sesión: segmentación jerárquica automática de temas de búsqueda en registros de consultas". Actas de la 17.ª conferencia de la ACM sobre gestión de la información y el conocimiento (PDF) . ACM. págs. 699–708. doi :10.1145/1458082.1458176. ISBN.9781595939913.S2CID6548724 .
Khoo, Michael; Pagano, Joe; Washington, Anne L.; Recker, Mimi; Palmer, Bart; Donahue, Robert A. (2008). "Uso de métricas web para analizar bibliotecas digitales" (PDF) . Actas de la 8.ª Conferencia conjunta ACM/IEEE-CS sobre bibliotecas digitales . ACM.
Lam, Heidi ; Russell, Daniel; Tang, Diane (2007). "Visualizador de sesiones: análisis exploratorio visual de registros de sesiones web". Simposio IEEE sobre ciencia y tecnología de análisis visual . IEEE.
Mehrzadi, David; Feitelson, Dror G. (2012). "Sobre la extracción de datos de sesión de registros de actividad" (PDF) . Actas de la 5.ª Conferencia anual internacional sobre sistemas y almacenamiento . SYSTOR '12. ACM. CiteSeerX 10.1.1.381.1956 . doi :10.1145/2367589.2367592. ISBN .978-1-4503-1448-0.S2CID8820623 .
Meiss, Mark; Duncan, John; Gonçalves, Bruno; Ramasco, José J.; Menczer, Filippo (2009). "What's in a session: Tracking individual behavior on the web" (PDF) . Actas de la 20.ª conferencia de la ACM sobre hipertexto e hipermedia . ACM. pp. 173–182. arXiv : 1003.5325 . doi :10.1145/1557914.1557946. ISBN 9781605584867.S2CID6564335 .
Menascé, Daniel A.; Almeida, V.; Fonseca, R.; Mendes, M. (1999). "Una metodología para la caracterización de la carga de trabajo de los sitios de comercio electrónico" (PDF) . Actas de la 1.ª conferencia de la ACM sobre comercio electrónico . ACM. págs. 119–128. doi :10.1145/336992.337024. ISBN 1581131763.S2CID7239612 .
Murray, G. Craig; Lin, Jimmy; Chowdhury, Abdur (2006). "Identificación de sesiones de usuario con agrupamiento aglomerativo jerárquico" (PDF) . Actas de la Sociedad Estadounidense de Ciencias de la Información y Tecnología . 43 (1): 1–9. doi : 10.1002/meet.14504301312 .
Ortega, JL; Aguillo, I. (2010). "Diferencias entre sesiones web según el origen de sus visitas" (PDF) . Journal of Informetrics . 4 (3): 331–337. doi :10.1016/j.joi.2010.02.001. ISSN 1751-1577.
Spiliopoulou, Myra; Mobasher, Bamshad; Berendt, Bettina; Nakagawa, Miki (2003). "Un marco para la evaluación de heurísticas de reconstrucción de sesiones en el análisis de uso web" (PDF) . Revista INFORMA de Informática . 15 (2): 171-190. CiteSeerX 10.1.1.621.3037 . doi :10.1287/ijoc.15.2.171.14445. ISSN 1526-5528.
Weischdel, Birgit; Huizingh, Eelko KRE (2006). "Optimización de sitios web con métricas web". Actas de la 8.ª conferencia internacional sobre comercio electrónico, el nuevo comercio electrónico: innovaciones para superar las barreras, obstáculos y limitaciones actuales para realizar negocios con éxito en Internet - ICEC '06 (PDF) . pág. 463. doi :10.1145/1151454.1151525. ISBN 978-1595933928.S2CID2965255 .