stringtranslate.com

Wikipedia: Control de la indexación en motores de búsqueda

Wikipedia intenta controlar la indexación de los motores de búsqueda de diversas formas , lo que se denomina comúnmente "noindexing" en Wikipedia. El comportamiento predeterminado es indexar los artículos con más de 90 días de antigüedad. Todos los métodos se basan en el uso de la etiqueta meta HTML noindex , que indica a los motores de búsqueda que no indexen determinadas páginas. Respetar la etiqueta, especialmente en términos de eliminar contenido ya indexado, es una decisión de cada motor de búsqueda y, en teoría, la etiqueta puede ignorarse por completo.

Los métodos de control son:

  1. Controlar un espacio de nombres completo a través de la configuración del software MediaWiki
  2. Control de clases de páginas, a través de MediaWiki:Robots.txt ( archivo Robots.txt de Wikipedia )
  3. Controlar páginas individuales agregando la __NOINDEX__ palabra mágica en ellas, ya sea directamente o usando la plantilla {{ NOINDEX }} , sin embargo los artículos son un caso especial, consulte #Indexación de artículos ("espacio principal").
  4. Controlar varias páginas añadiendo la __NOINDEX__palabra mágica a las plantillas estándar utilizadas en determinadas situaciones (la misma advertencia que en el tercer punto).

Indexación de artículos ("espacio principal")

Los artículos con más de 90 días de antigüedad se indexan automáticamente. [1] La __NOINDEX__palabra mágica y la plantilla {{ NOINDEX }} no funcionan en ellos. Los artículos con menos de 90 días de antigüedad no se indexan, a menos que hayan sido revisados ​​y no tengan la __NOINDEX__palabra mágica o la plantilla {{ NOINDEX }} (o una plantilla que transcluya la plantilla {{ NOINDEX }} , como las plantillas de eliminación rápida). [2] [3] [4] Tenga en cuenta que &action=info indicará incorrectamente que están indexados. [5] Los artículos que incluyen la plantilla {{ NOINDEX }} se enumeran en Category:Noindexed articles .

Este patrullaje puede ser realizado automáticamente por el software, como en el caso de artículos creados por editores con el derecho de usuario de patrullaje automático , o por otro editor con el derecho de usuario de revisor de nueva página (que no debe confundirse con el derecho de usuario de revisor de cambios pendientes ).

Otros espacios de nombres y robots.txt

Control de espacio de nombres

En la Wikipedia en inglés, todo el espacio de nombres User:[6] , , y los espacios de nombres se indexan automáticamente mediante una configuración de software. [7]User talk:Draft:Draft talk:

Al mismo tiempo, __NOINDEX__y __INDEX__están deshabilitados, además del espacio de artículos , en el espacio de nombres Borrador y en el espacio de nombres Discusión Borrador; no tienen efecto allí. [8]

No indexación de robots.txt

MediaWiki:Robots.txt prohíbe a las herramientas analíticas visitar tipos de páginas sensibles o potencialmente sensibles, principalmente en el espacio de nombres Wikipedia, por ejemplo, debates sobre eliminación . Un efecto secundario de no visitarlas es que normalmente no se puede indexar una página. Siempre que sea posible, también debería utilizar la función __NOINDEX__para esas páginas.

Palabra mágica NOINDEX

Páginas individuales

Se puede hacer que las páginas individuales no sean indexadas agregando la __NOINDEX__ palabra mágica en esa página, ya sea directamente o usando la plantilla {{ NOINDEX }} . Como se explicó anteriormente, esta palabra mágica no funciona en el espacio principal (en los artículos).

Las páginas con la palabra clave se enumeran en Categoría:Páginas no indexadas . [9]

Plantilla estándar sin indexación

Algunas plantillas estándar incluyen la __NOINDEX__palabra clave, por lo que no se indexan las páginas a las que se aplican las plantillas. Dichas plantillas deberían aparecer en la Categoría:Plantillas de Wikipedia que aplican NOINDEX .

Biografías de personas vivas página de discusión noindexing

Las plantillas {{ BLP }} y {{ BLP otros }} incluyen el parámetro {{ NOINDEX }} . La plantilla {{ BLP }} se agrega automáticamente mediante la plantilla de página de discusión {{ WikiProject Biography }} , si se le proporciona el parámetro |living=yes; consulte la documentación de esa plantilla para obtener más detalles. Las páginas que utilizan estas plantillas se categorizan automáticamente en Categoría:Artículos biográficos de personas vivas .

Otras plantillas

Estas plantillas incluyen {{ NOINDEX }} :

Véase también Categoría:Plantillas de Wikipedia que aplican NOINDEX .

Palabra mágica ÍNDICE

Páginas individuales

Las páginas individuales pueden anular la noindexación del espacio de nombres agregando la __INDEX__ palabra mágica en esa página, ya sea directamente o usando la plantilla {{ INDEX }} . Dichas páginas aparecen en Category:Indexed pages . Sin embargo, INDEX no anula la noindexación a través de MediaWiki:Robots.txt . [10] Como se explicó anteriormente, esta palabra mágica no funciona en el espacio principal (en los artículos).

La capacidad de agregar la palabra mágica ÍNDICE a los espacios de usuario (Usuario:, Discusión del usuario:) ha sido restringida por un filtro de edición a usuarios confirmados extendidos luego de una discusión en la comunidad. [11]

Atributo HTML nofollow

Desde 2007, todos los enlaces a otros sitios web desde Wikipedia en inglés tienen establecido el atributo HTML nofollow . [12] Esto significa que en las páginas indexadas por motores de búsqueda, cualquier enlace que encuentre un motor de búsqueda en esas páginas no debería influir en la clasificación del destino del enlace en el índice del motor de búsqueda.

Discusiones pasadas

Discusiones sobre espacios de nombres

Discusiones sobre plantillas individuales

Véase también

Notas

  1. ^ 2017 cambio de 30 a 90 días
  2. ^ T147544
  3. ^ Código fuente de PageTriage
  4. ^ Valor de $wgRCMaxAge en las wikis de WMF
  5. ^ Véase T157747
  6. ^ Decidido en Wikipedia:Bomba de pueblo (propuestas)/Archivo 126#Borradores de páginas de usuario mostrados en motores de búsqueda , implementado en phab:T104797.
  7. ^ Esto es $wgNamespaceRobotPolicies. Consulte la configuración $wgNamespaceRobotPolicies de Wikimedia para enwiki
  8. ^ Esto se controla mediante la configuración del software MediaWiki $wgExemptFromUserRobotsControl. En otros proyectos, los espacios de nombres exentos son los mismos que $wgContentNamespaces, que está configurado como espacio principal en casi todos los proyectos Wikimedia (consulte aquí y aquí).
  9. ^ El listado lo realiza MediaWiki siguiendo la palabra clave. El nombre de la categoría lo determina MediaWiki:Noindex-category .
  10. ^ Anula mw:Manual:$wgArticleRobotPolicies, pero no se usa en la Wikipedia en inglés: configuración $wgArticleRobotPolicies de Wikimedia para enwiki
  11. ^ Especial:PermaLink/862856598#Evitar_que_los_nuevos_usuarios_permitan_la_indexación_de_páginas_de_usuario_por_motores_de_búsqueda
  12. ^ Controlado por $wgNoFollowLinks, establecido como verdadero en [en el archivo de configuración de Wikimedia para enwiki]