El historial de navegación web hace referencia a la lista de páginas web que ha visitado un usuario, así como a los metadatos asociados , como el título de la página y la hora de la visita. Normalmente, los navegadores web lo almacenan de forma local [1] [2] para proporcionar al usuario una lista de historial a la que volver a las páginas visitadas anteriormente. Puede reflejar los intereses, las necesidades y los hábitos de navegación del usuario. [3]
Todos los navegadores principales tienen un modo de navegación privada en el que no se registra el historial de navegación. Esto sirve para protegerse contra la recopilación del historial de navegación por parte de terceros con fines publicitarios específicos u otros.
El historial de navegación almacenado localmente puede facilitar el redescubrimiento de páginas web visitadas previamente y perdidas de las que solo se tiene un recuerdo vago en la mente, o páginas difíciles de encontrar debido a que se encuentran en la red profunda. Los navegadores también lo utilizan para habilitar el autocompletado en su barra de direcciones para una navegación más rápida y cómoda a las páginas visitadas con frecuencia. [4]
El tiempo de retención del historial de navegación varía según el navegador de Internet. Mozilla Firefox (versión de escritorio) registra el historial de forma indefinida de forma predeterminada dentro de un archivo llamado places.sqlite
, pero borra automáticamente el historial más antiguo cuando se agota el espacio en disco, [1] mientras que Google Chrome (versión de escritorio) almacena el historial durante diez semanas de forma predeterminada, eliminando automáticamente las entradas anteriores. Una vez se registró un archivo de historial indefinido llamado Archived History
, pero se eliminó y se eliminó automáticamente en la versión 37, lanzada en septiembre de 2014. [5] [6]
Las extensiones del navegador como History Trends Unlimited para Google Chrome (versión de escritorio) permiten el almacenamiento local indefinido del historial de navegación, la exportación a un archivo portable y el autoanálisis de los hábitos y estadísticas de navegación. [7]
El historial de navegación no se registra cuando se utiliza el modo de navegación privada que ofrecen la mayoría de los navegadores.
La publicidad dirigida consiste en presentar al usuario anuncios que sean más relevantes para él en función de su historial de navegación. [8] Un ejemplo típico es el de un usuario que recibe anuncios de zapatos cuando navega por otros sitios web después de buscar zapatos en sitios web de compras. Una investigación muestra que la publicidad dirigida duplica la tasa de conversión de la publicidad online clásica. [9]
La puja en tiempo real (RTB) es el método utilizado en la publicidad dirigida. Se trata de un sistema que automáticamente aumenta el precio de la presentación de anuncios en determinados sitios web. [10] Los anunciantes deciden cuánto están dispuestos a pagar en función de la audiencia objetivo de los sitios web. Por lo tanto, una mayor información sobre los usuarios podría animar a los anunciantes a pagar precios más altos. [10] La información de los usuarios, como el historial de navegación, se proporciona a todas las empresas que participan en la puja. [11] Dado que se trata de un proceso en tiempo real, la información suele recopilarse sin el consentimiento del usuario y se transfiere de forma no cifrada. [12] El usuario tiene un conocimiento muy limitado de cómo se recopila, almacena y utiliza su información. [13] [14]
La respuesta del usuario a la publicidad dirigida depende de si sabe que se está recopilando información. Si el usuario ya sabe de antemano que se está recopilando información, la publicidad dirigida podría crear un efecto positivo, lo que llevaría a una mayor intención de hacer clic en el enlace. [11] Sin embargo, si el usuario no está informado sobre la recopilación de información, podría preocuparse más por la privacidad. Esto reducirá su intención de hacer clic en el enlace. [11] Mientras tanto, cuando el usuario considera que el sitio web es confiable, es más probable que haga clic en el enlace y acepte el servicio de personalización. [11] [15]
Para resolver los conflictos entre privacidad y ganancias, un nuevo sistema propuesto es el pago por seguimiento. Existe un intermediario entre los usuarios y los anunciantes. Los usuarios podrían decidir si proporcionan su información personal al intermediario y luego el intermediario enviaría la información personal ofrecida por los usuarios a los anunciantes. Mientras tanto, los usuarios podrían recibir recompensas monetarias por compartir su información personal. Esto podría ayudar a proteger la privacidad y la eficiencia del seguimiento, pero generaría costos adicionales. [16]
La fijación de precios personalizada se basa en la idea de que si un usuario compra un determinado producto con frecuencia o paga un precio más alto por ese producto, se le podría cobrar un precio más alto por ese producto. El historial de navegación web podría brindar predicciones confiables sobre los comportamientos de compra de los usuarios. Al utilizar la fijación de precios personalizada, las ganancias de las empresas podrían aumentar en un 12,99 % en comparación con los casos en que no se utilizaban los mismos productos . [17]
El historial de navegación web se podría utilizar para facilitar la investigación, por ejemplo, para revelar el comportamiento de navegación de las personas. Cuando un usuario navega extensamente en un sitio, aumenta la probabilidad de solicitar una página adicional. Cuando un usuario visita más sitios, se reduce la probabilidad de solicitar páginas adicionales. [18]
El historial de navegación web también se puede utilizar para crear bibliotecas web personales. Una biblioteca web personal se crea recopilando y analizando el historial de navegación web del usuario. Podría ayudar al usuario a observar las tendencias de navegación, la distribución horaria y los sitios web utilizados con más frecuencia. Algunos usuarios consideran que esta función es útil. [3]
El historial de navegación web almacenado localmente no se publica en ningún lugar de forma pública de forma predeterminada. Sin embargo, casi todos los sitios web son rastreados por adwares y programas potencialmente no deseados (PUP) que recopilan información de los usuarios sin su consentimiento. [19] Estos métodos de seguimiento suelen estar permitidos por las plataformas de forma predeterminada. [12] El historial de navegación web también se recopila mediante cookies en los sitios web, que podrían dividirse en dos tipos, cookies de origen y cookies de terceros . Las cookies de terceros suelen estar integradas en sitios web de origen y recopilan información de ellos. [10] Las cookies de terceros tienen una mayor eficiencia y capacidad de agregación de datos que las cookies de origen. Si bien las cookies de origen solo tienen acceso a los datos de los usuarios en un sitio web, las cookies de terceros podrían combinar datos recopilados de diferentes sitios web para hacer que la imagen del usuario sea más completa. [10] Mientras tanto, podrían existir varias cookies de terceros en el mismo sitio web. [10]
Con suficiente información disponible, los usuarios podrían ser identificados sin iniciar sesión en sus cuentas. [20]
Cuando las cookies de terceros recopilan el historial de navegación web de los usuarios de varios sitios web, más información genera más preocupaciones sobre la privacidad. Por ejemplo, un usuario navega por las noticias en un sitio web y busca información médica en el otro sitio web. Cuando se combina el historial de navegación web de estos dos sitios web, se puede considerar que el usuario está interesado en noticias relacionadas con temas médicos. [10] Cuando se combina el historial de navegación de diferentes sitios web, podría reflejar una imagen más completa de la persona.
En 2006, AOL publicó una gran cantidad de datos de sus usuarios, incluido el historial de búsquedas. Aunque no se incluyeron los nombres ni los identificadores de los usuarios, se pudo identificar a los usuarios basándose en el historial de navegación publicado. [21] Por ejemplo, se identificó al usuario n.° 4417749 con su historial de búsquedas de tres meses. [22]
En 2020, Avast , un popular software antivirus, fue acusado de vender el historial de navegación a terceros. Las autoridades de la República Checa están investigando esta acusación de manera preliminar. El informe muestra que Avast vendió los datos de los usuarios a través de Jumpshot, una herramienta de análisis de marketing. Avast afirmó que la información personal de los usuarios no estaba incluida en la filtración. Sin embargo, el historial de navegación podría usarse para identificar a los usuarios. Avast cerró Jumpshot como respuesta a este problema. [23]
Cuando el usuario siente que hay un riesgo para la privacidad, la intención de revelar información personal será menor, pero las acciones no se ven afectadas. [24] Sin embargo, algunos estudios encuentran que no hay una diferencia significativa entre la intención y las acciones de revelar información privada, lo que significa que el usuario reducirá las acciones de compartir información personal y tomará más medidas de protección cuando se sienta preocupado por la privacidad. [25] Cuando los usuarios tienen preocupaciones sobre la privacidad, harían menos uso de los servicios en línea. [25] También tomarían más medidas de protección como negarse a ofrecer su información, ofrecer información falsa, eliminar su información en línea y quejarse a las personas que los rodean o a las organizaciones relevantes. [26]
Sin embargo, a los usuarios les resulta difícil proteger su privacidad por múltiples razones. En primer lugar, los usuarios no tienen suficiente conciencia de la privacidad. No les preocupa ser rastreados a menos que haya un impacto sustancial en ellos. Tampoco son conscientes de que sus datos contienen valores comerciales. [12] En general, a los usuarios les resulta difícil notar los enlaces a políticas de privacidad en todo tipo de sitios web, y las mujeres y los usuarios de mayor edad son más propensos a ignorar estos avisos. Incluso cuando los usuarios notan los enlaces de privacidad, la divulgación de su información puede no verse afectada. [27] Además, los usuarios tampoco están equipados con suficientes conocimientos técnicos para protegerse incluso cuando notan una fuga de privacidad. Se los coloca en el lado pasivo con poco margen para cambiar la situación. [12]
La mayoría de los usuarios utilizan bloqueadores de anuncios , eliminan las cookies y evitan los sitios web que recopilan información personal para intentar proteger su historial de navegación web. [13] [28] Sin embargo, la mayoría de los bloqueadores de anuncios no ofrecen suficiente orientación a los usuarios para ayudarlos a mejorar su conciencia de privacidad. Más importante aún, se basan en listas blancas y negras estándar . [29] Estas listas no suelen incluir los sitios web que rastrean a los usuarios. Los bloqueadores de anuncios solo podrían ser efectivos si se bloquean estos dominios de rastreo. [30]
Hay una serie de proyectos de código abierto que intentan proteger su privacidad mediante la recopilación de su historial de navegación en el disco duro en lugar del navegador. [31] Resuelve el problema de que los usuarios no pueden ver los datos del historial de navegación una vez que el usuario elimina los datos del navegador.