Un elemento de enlace canónico es un elemento HTML que ayuda a los webmasters a evitar problemas de contenido duplicado en la optimización de motores de búsqueda al especificar la versión " canónica " o "preferida" de una página web. Se describe en RFC 6596, que entró en funcionamiento en abril de 2012. [1] [2]
Un problema importante para los motores de búsqueda es determinar la fuente original de los documentos que están disponibles en múltiples URL . La duplicación de contenido puede ocurrir de muchas maneras, incluyendo: [3]
Los problemas de contenido duplicado ocurren cuando se puede acceder al mismo contenido desde múltiples URL . [4] Por ejemplo, los motores de búsqueda considerarían que http://www.example.com/page.html es una página completamente diferente de http://www.example.com/page.html?parameter=1 . aunque ambas URL puedan hacer referencia al mismo contenido. [5] [6]
En febrero de 2009, Google , Yahoo y Microsoft anunciaron soporte para el canonical
elemento de enlace, que puede insertarse en la <head>
sección de una página web, para permitir a los webmasters evitar estos problemas. [7] El elemento de enlace canónico ayuda a los webmasters a dejar claro a los motores de búsqueda qué página debe acreditarse como la original.
Los motores de búsqueda intentan utilizar definiciones de enlaces canónicos como filtro de salida para sus resultados de búsqueda. Si varias URL contienen el mismo contenido en el conjunto de resultados, es probable que se incorporen las definiciones de URL del enlace canónico para determinar la fuente original del contenido. "Por ejemplo, cuando Google encuentra instancias de contenido idénticas, decide mostrar una de ellas. La elección del recurso a mostrar en los resultados de búsqueda dependerá de la consulta de búsqueda". [8]
Según Google, el canonical
elemento de enlace no se considera una directiva, sino más bien un indicio de que el algoritmo de clasificación "respetará firmemente". [1] [9]
Si bien el elemento de enlace canónico tiene sus ventajas, Matt Cutts , entonces jefe del equipo de spam web de Google , ha dicho que el motor de búsqueda prefiere el uso de redireccionamientos 301 . Cutts dijo que la preferencia por las redirecciones se debe a que las arañas de Google pueden optar por ignorar un elemento de enlace canónico si lo consideran más beneficioso. [10]
El elemento de enlace canónico puede usarse en el HTML semántico<head>
o enviarse con el encabezado HTTP de un documento. Para documentos que no son HTML, el encabezado HTTP es una forma alternativa de establecer una URL canónica. [3] [11]
Según el estándar HTML 5, el elemento HTML debe estar dentro de la sección del documento. [12]<link rel="canonical" href="http://example.com/">
<head>
Algunos sitios como Stack Overflow [13] tienen hipervínculos en la página que conducen a una URL limpia de ellos mismos. Los beneficios de usabilidad facilitan la copia de la URL de destino o el título del hipervínculo si el navegador o una extensión del navegador ofrece una opción de menú contextual "Copiar texto del enlace" para los hipervínculos, la capacidad de recuperar la URL original de una página guardada si el navegador no la almacena. en un comentario dentro del archivo, así como la capacidad de duplicar la página abierta en una nueva pestaña justo al lado de la abierta actualmente si el navegador carece de dicha característica. [14] [13]
A continuación se muestra un ejemplo de código HTML que utiliza rel=canonical dentro de la etiqueta. El código podría usarse en una página, por ejemplo para indicarle a los motores de búsqueda que es la versión preferida de la página web.<head>
https://example.com/page.php?parameter=1
https://example.com/page.php
<!DOCTYPE html> < html > < encabezado > < enlace rel = "canonical" href = "https://www.example.com/page.php" > </ encabezado > < cuerpo >...</cuerpo> </html>
HTTP / 1.1 200 OK Tipo de contenido : aplicación/pdf Enlace : <https://www.newthink.life/page.php>; rel="canonical" Longitud del contenido : 4223 ...