Un caché de motor de búsqueda es un caché de páginas web que muestra la página tal como estaba cuando fue indexada por un rastreador web . Las versiones en caché de las páginas web se pueden utilizar para ver el contenido de una página cuando no se puede acceder a la versión activa , se ha modificado o se ha eliminado . [1]
Un rastreador web recopila el contenido de una página web, que luego es indexado por un motor de búsqueda web . El motor de búsqueda puede hacer que la copia sea accesible para los usuarios. Los rastreadores web que obedecen las restricciones en robots.txt [2] o metaetiquetas [3] por parte del webmaster del sitio pueden no poner una copia en caché a disposición de los usuarios del motor de búsqueda si se les indica que no lo hagan.
El caché de un motor de búsqueda se puede utilizar para la investigación de delitos , [4] procedimientos legales [5] y periodismo . [6] [1] Ejemplos de motores de búsqueda que ofrecen a sus usuarios versiones en caché de páginas web son Bing , Yandex Search y Baidu .
Es posible que la memoria caché de los motores de búsqueda no esté completamente protegida por las leyes habituales que protegen a los proveedores de tecnología de reclamos por violación de derechos de autor. [7]
Google retiró su servicio de almacenamiento en caché web en 2024. [8] El servicio fue diseñado para sitios web que podrían aparecer en un resultado de búsqueda de Google, pero que están temporalmente fuera de línea. No fue diseñado para fines de archivo a largo o mediano plazo. Google dijo que Internet a partir de 2024 es mucho más confiable de lo que era "en el pasado" y, por lo tanto, su servicio de caché ya no es un servicio importante para mantener. [8]
Google señaló a Wayback Machine como una mejor alternativa y sugirió que Google podría trabajar con ellos en el futuro. [8] En septiembre de 2024, Google e Internet Archive anunciaron una colaboración que proporcionaría enlaces a Wayback Machine desde Google Search . [9]
Cuando una página se vuelve controvertida, los editores pueden eliminarla o modificarla sin previo aviso. Si sospecha que se está encontrando con un problema, el primer lugar al que debe recurrir es el caché de Google de la página tal como estaba cuando se realizó el último rastreo.
noarchive: No mostrar un enlace almacenado en caché en los resultados de búsqueda.
noarchive - No mostrar un enlace en caché para una página en los resultados de búsqueda.
esto puede ser una pieza de información valiosa. Según el momento en que Google haya rastreado el sitio, la última página puede contener información distinta a la de la página actual. Por lo tanto, documentar y capturar la página almacenada en caché de Google de una página web puede ser un paso importante para garantizar que se conserve esta instantánea del tiempo.
alta dirección de las empresas utilizan estos servicios de forma habitual.
Los periodistas también pueden acceder a contenido eliminado de la lista a través del caché de Google.
Para la función de caché, el Tribunal rechazó la excepción de una "copia técnicamente necesaria". Esta excepción exime la reproducción temporal que es una parte necesaria de un proceso técnico aplicado por un intermediario para la transmisión en una red entre terceros. Según el Tribunal, la copia de caché que Google almacena en su servidor no es técnicamente necesaria para una transmisión eficiente.