stringtranslate.com

Wikipedia: control de la indexación de los motores de búsqueda

Hay una variedad de formas en las que Wikipedia intenta controlar la indexación de los motores de búsqueda , comúnmente denominada "no indexación" en Wikipedia. El comportamiento predeterminado es que se indexen los artículos de más de 90 días. Todos los métodos se basan en el uso de la metaetiqueta HTML noindex , que indica a los motores de búsqueda que no indexen determinadas páginas. Respetar la etiqueta, especialmente en términos de eliminar contenido ya indexado, depende del motor de búsqueda individual y, en teoría, la etiqueta puede ignorarse por completo.

Los métodos de control son:

  1. Controlar un espacio de nombres completo , a través de la configuración del software MediaWiki
  2. Controlar clases de páginas, a través de MediaWiki:Robots.txt (archivo Robots.txt de Wikipedia )
  3. Controlar páginas individuales agregando la __NOINDEX__ palabra mágica en ellas, ya sea directamente o usando la plantilla {{ NOINDEX }}; sin embargo, los artículos son un caso especial, consulte #Indexación de artículos ("espacio principal").
  4. Controlar varias páginas agregando la __NOINDEX__palabra mágica en plantillas estándar utilizadas en determinadas situaciones (la misma advertencia que en el tercer punto).

Indexación de artículos ("espacio principal")

Los artículos con más de 90 días se indexan automáticamente. [1] La __NOINDEX__palabra mágica y la plantilla {{ NOINDEX }} no funcionan en ellos. Los artículos de menos de 90 días no se indexan, a menos que hayan sido patrullados y no tengan la __NOINDEX__palabra mágica o la plantilla {{ NOINDEX }} (o una plantilla que transcluya la plantilla {{ NOINDEX }}, como la eliminación rápida plantillas). [2] [3] [4] Tenga en cuenta que &action=info indicará incorrectamente que están indexados. [5] Los artículos que incluyen la plantilla {{ NOINDEX }} se enumeran en Categoría: artículos no indexados .

Este patrullaje puede ser realizado automáticamente por el software, como en el caso de los artículos creados por editores con el derecho de usuario de patrulla automática , o por otro editor con el derecho de usuario de revisor de nueva página (no debe confundirse con el derecho de usuario de revisor de cambios pendientes ).

Otros espacios de nombres y robots.txt

control de espacio de nombres

En Wikipedia en inglés, todo el espacio de nombres User:[6] , y los espacios de nombres no se indexan automáticamente mediante una configuración de software. [7]User talk:Draft:Draft talk:

Al mismo tiempo, __NOINDEX__y __INDEX__están deshabilitados, además del espacio del artículo , en el espacio de nombres Draft y en el espacio de nombres Draft talk; allí no tienen ningún efecto. [8]

Robots.txt sin indexación

MediaWiki:Robots.txt prohíbe que las herramientas analíticas visiten tipos de páginas sensibles o potencialmente sensibles, principalmente en el espacio de nombres de Wikipedia (por ejemplo, debates sobre eliminación) . Un efecto secundario de no visitarla normalmente es que una página no se puede indexar. Siempre que sea posible, debería utilizarlo además __NOINDEX__para esas páginas.

Palabra mágica NOINDEX

Páginas individuales

Las páginas individuales se pueden no indexar agregando la __NOINDEX__ palabra mágica en esa página, ya sea directamente o usando la plantilla {{ NOINDEX }}. Como se explicó anteriormente, esta palabra mágica no funciona en el espacio principal (en los artículos).

Las páginas con la palabra clave se enumeran en Categoría:Páginas no indexadas . [9]

Plantilla estándar sin indexación

Algunas plantillas estándar incluyen la __NOINDEX__palabra clave, por lo que no se indexan las páginas a las que se aplican las plantillas. Dichas plantillas deben incluirse en Categoría:Plantillas de Wikipedia que aplican NOINDEX .

Página de discusión de biografías de personas vivas no indexada

Las plantillas {{ BLP }} y {{ BLP others }} incluyen el parámetro {{ NOINDEX }}. La plantilla {{ BLP }} se agrega automáticamente mediante la plantilla de la página de conversación {{ WikiProject Biography }}, si se le proporciona el parámetro |living=yes; consulte la documentación de esa plantilla para obtener más detalles. Las páginas que utilizan estas plantillas se clasifican automáticamente en Categoría: artículos biográficos de personas vivas .

Otras plantillas

Estas plantillas incluyen {{ NOINDEX }}:

Consulte también Categoría: Plantillas de Wikipedia que aplican NOINDEX .

ÍNDICE palabra mágica

Páginas individuales

Las páginas individuales pueden anular la no indexación del espacio de nombres agregando la __INDEX__ palabra mágica en esa página, ya sea directamente o usando la plantilla {{ INDEX }}. Estas páginas aparecen en Categoría:Páginas indexadas . Sin embargo, INDEX no anula la no indexación a través de MediaWiki:Robots.txt . [10] Como se explicó anteriormente, esta palabra mágica no funciona en el espacio principal (en artículos).

La capacidad de agregar la palabra mágica ÍNDICE a los espacios de usuario (Usuario:, Charla de usuario:) ha sido restringida por un filtro de edición a usuarios extendidos confirmados después de una discusión comunitaria. [11]

Atributo HTML no seguir

Desde 2007, todos los enlaces a otros sitios web de Wikipedia en inglés tienen configurado el atributo HTML nofollow . [12] Esto significa que en las páginas indexadas por los motores de búsqueda, cualquier enlace encontrado por un motor de búsqueda en esas páginas no debe influir en la clasificación del enlace objetivo en el índice del motor de búsqueda.

Discusiones pasadas

Discusiones sobre espacios de nombres

Discusiones sobre plantillas individuales

Ver también

Notas

  1. ^ 2017 cambia de 30 a 90 días
  2. ^ T147544
  3. ^ Código fuente de PageTriage
  4. ^ Valor de $wgRCMaxAge en wikis de WMF
  5. ^ Ver T157747
  6. ^ Decidido en Wikipedia: Village pump (propuestas) / Archivo 126 # Borradores de página de usuario mostrados en motores de búsqueda , implementado en phab: T104797.
  7. ^ Esto es $wgNamespaceRobotPolicies. Consulte la configuración $wgNamespaceRobotPolicies de Wikimedia para enwiki
  8. ^ Esto está controlado por la configuración del software MediaWiki $wgExemptFromUserRobotsControl. En otros proyectos, los espacios de nombres exentos son los mismos que $wgContentNamespaces, que está configurado como espacio principal en casi todos los proyectos de Wikimedia; consulte aquí y aquí.
  9. ^ La lista se realiza mediante el seguimiento de la palabra clave por parte de MediaWiki . El nombre de la categoría lo determina MediaWiki:Noindex-category .
  10. ^ Anula mw:Manual:$wgArticleRobotPolicies, pero esto no se usa en la Wikipedia en inglés: configuración $wgArticleRobotPolicies de Wikimedia para enwiki
  11. ^ Especial: PermaLink/862856598#Prevent_new_users_from_allowing_search_engine_indexing_of_user_pages
  12. ^ Controlado por $wgNoFollowLinks, establecido en verdadero en [en el archivo de configuración de Wikimedia para enwiki]