stringtranslate.com

Caché del motor de búsqueda

Enlace a la versión en caché de una página web en los resultados de búsqueda de Google (arriba), Bing (centro) y Yandex (abajo)

Un caché de motor de búsqueda es un caché de páginas web que muestra la página tal como estaba cuando fue indexada por un rastreador web . Las versiones en caché de las páginas web se pueden utilizar para ver el contenido de una página cuando no se puede acceder a la versión activa , se ha modificado o se ha eliminado . [1]

Un rastreador web recopila el contenido de una página web, que luego es indexado por un motor de búsqueda web . El motor de búsqueda puede hacer que la copia sea accesible para los usuarios. Los rastreadores web que obedecen las restricciones en robots.txt [2] o metaetiquetas [3] por parte del webmaster del sitio pueden no poner una copia en caché a disposición de los usuarios del motor de búsqueda si se les indica que no lo hagan.

El caché de un motor de búsqueda se puede utilizar para la investigación de delitos , [4] procedimientos legales [5] y periodismo . [6] [1] Ejemplos de motores de búsqueda que ofrecen a sus usuarios versiones en caché de páginas web son Bing , Yandex Search y Baidu .

Es posible que la memoria caché de los motores de búsqueda no esté completamente protegida por las leyes habituales que protegen a los proveedores de tecnología de reclamos por violación de derechos de autor. [7]

Caché de Google

Google retiró su servicio de almacenamiento en caché web en 2024. [8] El servicio fue diseñado para sitios web que podrían aparecer en un resultado de búsqueda de Google, pero que están temporalmente fuera de línea. No fue diseñado para fines de archivo a largo o mediano plazo. Google dijo que Internet a partir de 2024 es mucho más confiable de lo que era "en el pasado" y, por lo tanto, su servicio de caché ya no es un servicio importante para mantener. [8]

Google señaló a Wayback Machine como una mejor alternativa y sugirió que Google podría trabajar con ellos en el futuro. [8] En septiembre de 2024, Google e Internet Archive anunciaron una colaboración que proporcionaría enlaces a Wayback Machine desde Google Search . [9]

Referencias

  1. ^ de Wilfried Ruetten (2012). Manual de periodismo de datos. O'Reilly Media, Inc. ISBN 9781449330064Cuando una página se vuelve controvertida, los editores pueden eliminarla o modificarla sin previo aviso. Si sospecha que se está encontrando con un problema, el primer lugar al que debe recurrir es el caché de Google de la página tal como estaba cuando se realizó el último rastreo .
  2. ^ "Especificaciones de metaetiquetas Robots, data-nosnippet y X-Robots-Tag". noarchive: No mostrar un enlace almacenado en caché en los resultados de búsqueda.
  3. ^ "Etiquetas especiales que Google entiende - Ayuda de Search Console". noarchive - No mostrar un enlace en caché para una página en los resultados de búsqueda.
  4. ^ Todd G. Shipley, Art Bowker (2013). Investigación de delitos en Internet: una introducción a la resolución de delitos en el ciberespacio. Newnes. ISBN 9780124079298Para el investigador , esto puede ser una pieza de información valiosa. Según el momento en que Google haya rastreado el sitio, la última página puede contener información distinta a la de la página actual. Por lo tanto, documentar y capturar la página almacenada en caché de Google de una página web puede ser un paso importante para garantizar que se conserve esta instantánea del tiempo.
  5. ^ Steven Mark Levy (2011). Regulación de valores: Libro de respuestas de la SEC. Aspen Publishers Online. ISBN 9781454805434La World Wide Web no es tan efímera como se podría pensar. Cada vez hay más páginas web antiguas disponibles en línea a través de servicios como Wayback Machine, Yahoo Cache o Bing Cache. Algunos abogados de los demandantes y personas de la alta dirección de las empresas utilizan estos servicios de forma habitual.
  6. ^ Cleland Thom (23 de octubre de 2014). "Los cachés de Google y el motor de búsqueda .com ofrecen soluciones de 'derecho al olvido'". Press Gazette . Los periodistas también pueden acceder a contenido eliminado de la lista a través del caché de Google.
  7. ^ Herman De Bauw, Valerie Vandenweghe (junio de 2011). "El Tribunal de Apelación de Bruselas confirma la sentencia contra Google News y Google Cache". Archivado desde el original el 26 de abril de 2015. Para la función de caché, el Tribunal rechazó la excepción de una "copia técnicamente necesaria". Esta excepción exime la reproducción temporal que es una parte necesaria de un proceso técnico aplicado por un intermediario para la transmisión en una red entre terceros. Según el Tribunal, la copia de caché que Google almacena en su servidor no es técnicamente necesaria para una transmisión eficiente.
  8. ^ abc "Los enlaces de caché de la Búsqueda de Google se están retirando oficialmente". 2 de febrero de 2024.
  9. ^ Freeland, Chris (11 de septiembre de 2024). «Alerta de nueva función: acceso a páginas web archivadas directamente a través de la búsqueda de Google». The Internet Archive . Consultado el 11 de septiembre de 2024 .