La caché del motor de búsqueda es una caché de páginas web que muestra la página tal como estaba cuando fue indexada por un rastreador web . Las versiones en caché de páginas web se pueden utilizar para ver el contenido de una página cuando no se puede acceder a la versión en vivo , se ha modificado o se ha eliminado . [1]
Un rastreador web recopila el contenido de una página web, que luego es indexado por un motor de búsqueda web . El motor de búsqueda puede hacer que la copia sea accesible para los usuarios. Los rastreadores web que obedecen restricciones en robots.txt [2] o metaetiquetas [3] por parte del webmaster del sitio no pueden poner una copia en caché a disposición de los usuarios de motores de búsqueda si se les indica que no lo hagan.
La caché del motor de búsqueda se puede utilizar para la investigación de delitos , [4] procedimientos judiciales [5] y periodismo . [6] [1] Ejemplos de motores de búsqueda que ofrecen a sus usuarios versiones en caché de páginas web son Bing , Yandex Search y Baidu .
Es posible que la memoria caché de los motores de búsqueda no esté completamente protegida por las leyes habituales que protegen a los proveedores de tecnología de reclamaciones por infracción de derechos de autor. [7]
Google retiró su servicio de almacenamiento en caché web en 2024. El servicio fue diseñado para sitios web que pueden aparecer en un resultado de búsqueda de Google, pero que están temporalmente fuera de línea. No fue diseñado para fines de archivo a largo o mediano plazo. Google dijo que Internet a partir de 2024 es mucho más confiable que "hace mucho tiempo" en días anteriores y, por lo tanto, su servicio de caché ya no es un servicio importante de mantener. Google señaló a Wayback Machine como una mejor alternativa y sugirió que Google podría trabajar con ellos en el futuro. [8]
Cuando una página se vuelve controvertida, los editores pueden eliminarla o modificarla sin previo aviso. Si sospecha que se está topando con el problema, el primer lugar al que debe recurrir es el caché de la página de Google tal como estaba cuando realizó su último rastreo.
noarchive: no muestra un enlace almacenado en caché en los resultados de búsqueda.
noarchive: no muestra un enlace en caché para una página en los resultados de búsqueda.
Para el investigador esto puede ser un dato valioso. Dependiendo de cuándo Google rastreó el sitio, la última página puede contener información diferente a la página actual. Por lo tanto, documentar y capturar la página almacenada en caché de Google de una página web puede ser un paso importante para garantizar que se conserve esta instantánea de tiempo.
La World Wide Web no es tan efímera como podría pensarse. Un número cada vez mayor de páginas web antiguas están disponibles en línea a través de servicios como Wayback Machine, Yahoo Cache o Bing Cache. Algunos abogados de los demandantes y tábanos corporativos utilizan estos servicios como una cuestión de rutina.
Los periodistas también pueden acceder al contenido eliminado de la lista a través del caché de Google.
Para la función de caché, el Tribunal rechazó la excepción de una "copia técnicamente necesaria".
Esta excepción exime la reproducción temporal que es parte necesaria de un proceso técnico aplicado por un intermediario para la transmisión en una red entre terceros.
Según el Tribunal, la copia caché que Google almacena en su servidor no es técnicamente necesaria para una transmisión eficaz.