stringtranslate.com

Caché del motor de búsqueda

El enlace a la versión en caché de una página web en los resultados de búsqueda de Google (arriba), Bing (en el medio) y Yandex (abajo).

La caché del motor de búsqueda es una caché de páginas web que muestra la página tal como estaba cuando fue indexada por un rastreador web . Las versiones en caché de páginas web se pueden utilizar para ver el contenido de una página cuando no se puede acceder a la versión en vivo , se ha modificado o se ha eliminado . [1]

Un rastreador web recopila el contenido de una página web, que luego es indexado por un motor de búsqueda web . El motor de búsqueda puede hacer que la copia sea accesible para los usuarios. Los rastreadores web que obedecen restricciones en robots.txt [2] o metaetiquetas [3] por parte del webmaster del sitio no pueden poner una copia en caché a disposición de los usuarios de motores de búsqueda si se les indica que no lo hagan.

La caché del motor de búsqueda se puede utilizar para la investigación de delitos , [4] procedimientos judiciales [5] y periodismo . [6] [1] Ejemplos de motores de búsqueda que ofrecen a sus usuarios versiones en caché de páginas web son Bing , Yandex Search y Baidu .

Es posible que la memoria caché de los motores de búsqueda no esté completamente protegida por las leyes habituales que protegen a los proveedores de tecnología de reclamaciones por infracción de derechos de autor. [7]

Google retiró su servicio de almacenamiento en caché web en 2024. El servicio fue diseñado para sitios web que pueden aparecer en un resultado de búsqueda de Google, pero que están temporalmente fuera de línea. No fue diseñado para fines de archivo a largo o mediano plazo. Google dijo que Internet a partir de 2024 es mucho más confiable que "hace mucho tiempo" en días anteriores y, por lo tanto, su servicio de caché ya no es un servicio importante de mantener. Google señaló a Wayback Machine como una mejor alternativa y sugirió que Google podría trabajar con ellos en el futuro. [8]


Referencias

  1. ^ ab Wilfried Ruetten (2012). El manual de periodismo de datos. O'Reilly Media, Inc. ISBN 9781449330064. Cuando una página se vuelve controvertida, los editores pueden eliminarla o modificarla sin previo aviso. Si sospecha que se está topando con el problema, el primer lugar al que debe recurrir es el caché de la página de Google tal como estaba cuando realizó su último rastreo.
  2. ^ "Especificaciones de metaetiqueta de robots, data-nosnippet y X-Robots-Tag". noarchive: no muestra un enlace almacenado en caché en los resultados de búsqueda.
  3. ^ "Etiquetas especiales que Google comprende: ayuda de Search Console". noarchive: no muestra un enlace en caché para una página en los resultados de búsqueda.
  4. ^ Todd G. Shipley, Art Bowker (2013). Investigación de delitos en Internet: una introducción a la resolución de delitos en el ciberespacio. Newnes. ISBN 9780124079298. Para el investigador esto puede ser un dato valioso. Dependiendo de cuándo Google rastreó el sitio, la última página puede contener información diferente a la página actual. Por lo tanto, documentar y capturar la página almacenada en caché de Google de una página web puede ser un paso importante para garantizar que se conserve esta instantánea de tiempo.
  5. ^ Steven Mark Levy (2011). Regulación de valores: Libro de respuestas de la SEC. Editores de Aspen en línea. ISBN 9781454805434. La World Wide Web no es tan efímera como podría pensarse. Un número cada vez mayor de páginas web antiguas están disponibles en línea a través de servicios como Wayback Machine, Yahoo Cache o Bing Cache. Algunos abogados de los demandantes y tábanos corporativos utilizan estos servicios como una cuestión de rutina.
  6. ^ Cleland Thom (23 de octubre de 2014). "Las cachés de Google y el motor de búsqueda .com ofrecen soluciones para el 'derecho al olvido'". Prensa Gaceta . Los periodistas también pueden acceder al contenido eliminado de la lista a través del caché de Google.
  7. ^ Herman De Bauw, Valerie Vandenweghe (junio de 2011). "El Tribunal de Apelación de Bruselas confirma la sentencia contra Google News y Google Cache". Archivado desde el original el 26 de abril de 2015. Para la función de caché, el Tribunal rechazó la excepción de una "copia técnicamente necesaria". Esta excepción exime la reproducción temporal que es parte necesaria de un proceso técnico aplicado por un intermediario para la transmisión en una red entre terceros. Según el Tribunal, la copia caché que Google almacena en su servidor no es técnicamente necesaria para una transmisión eficaz.
  8. ^ "Los enlaces de caché de la Búsqueda de Google se retirarán oficialmente". 2 de febrero de 2024.