Plantilla: enlace de búsqueda

Documentación de plantilla [ ver ] [ editar ] [ historial ] [ purgar ]

{{ sl }}

Esta plantilla crea un enlace que se puede utilizar para almacenar una consulta del cuadro de búsqueda de Wikipedia. Un enlace de búsqueda es útil para la búsqueda colaborativa en páginas de discusión y en la mayoría de las demás páginas, pero no debe usarse en artículos. Si se usa en artículos , genera la advertencia anterior.

Lo esencial

{{Search link|first|second|third}}

El primer parámetro es para la búsqueda o consulta.
El segundo parámetro es una etiqueta para el enlace .
El tercer parámetro es el dominio de búsqueda .

El nombre de la plantilla es Enlace de búsqueda o sl para abreviar.
El segundo y tercer parámetro son opcionales y tienen valores predeterminados, por lo que la forma abreviada es .{{sl|query}}

Tanto un enlace de búsqueda como un cuadro de búsqueda van al mismo motor de búsqueda. La misma consulta produce el mismo resultado.

La búsqueda básica cubre artículos. Encuentra palabras y frases compuestas de letras y números muy rápidamente, pero una búsqueda básica también puede consultar todos los artículos que contienen una cadena que incluye puntuación, matemáticas y otros símbolos como se ve en el contenido de la página o como se ve en el wikitexto de la página.

Esta plantilla se diferencia superficialmente del cuadro de búsqueda cuando se busca un signo igual. En el cuadro de búsqueda solo dices =, pero aquí debes usar la cadena de cinco letras {{=}}. ^[2]

En la búsqueda 5, observe la necesidad de utilizar comillas dobles alrededor del patrón de búsqueda: . Estos protegen los caracteres para que no sean interpretados como metacaracteres de expresiones regulares y garantizan que se interpreten literalmente. En las búsquedas básicas siempre se utilizan comillas para permitir búsquedas de cadenas exactas en el wikitexto. En las búsquedas avanzadas no se utilizan comillas dobles, de modo que los metacaracteres pueden actuar como operadores condicionales y de ramificación para crear patrones generalizados. insource:/"slash delimited regexp"/

La Búsqueda 2 ejemplifica el filtro más fácil de aplicar para acompañar cualquier búsqueda de expresiones regulares. Simplemente toma la misma frase y conviértela en un término separado. Dada cualquier expresión regular , simplemente acompáñela de un archivo . El último término siempre actuará como un filtro perfecto, haciendo coincidir cada alfanumérico e ignorando cada no alfanumérico, acelerando una búsqueda indexada para filtrar páginas que la expresión regular no podría coincidir. En cuanto a otros filtros, un espacio de nombres es débil, pero cada término adicional aumenta el poder de las expresiones regulares .insource/"exact string search"/insource:"exact string search"

La siguiente sección cubre los argumentos del enlace de búsqueda con más profundidad.

Avanzado

Estos son los parámetros de la plantilla para el enlace de búsqueda.

Sólo necesita utilizar los parámetros del 3 al 20 si desea un perfil de dos o más espacios de nombres para un dominio de búsqueda. De lo contrario, puede simplemente decir el nombre del espacio de nombres (o todos ) al comienzo de la consulta, o un parámetro de prefijo al final de la consulta.

Cuando la consulta pasa por esta plantilla, el dominio de búsqueda predeterminado es el espacio del artículo, tal como lo es para los usuarios básicos. El dominio de búsqueda predeterminado de un usuario, haya iniciado sesión o no, es el espacio del artículo, a menos que el usuario establezca su preferencia . ^[3] Pero no importa quién utilice un enlace de búsqueda, los resultados siempre serán los mismos. "Cortar y pegar" nunca puede garantizar los mismos resultados para una búsqueda, pero un enlace de búsqueda sí puede hacerlo porque el dominio de búsqueda es solo un espacio de artículo para todos, o el dominio de búsqueda es el conjunto de espacios de nombres que usted establece para todos.

Si conoce los números de su perfil de dominio de búsqueda, simplemente escríbalos ns=ns0&ns1&ns118. (Puede obtenerlos de la tabla de espacios de nombres a la derecha). De lo contrario, refina su consulta y dominio de búsqueda en la página de resultados de búsqueda, cuya interfaz avanzada está diseñada para seleccionar y ajustar espacios de nombres sin conocer los números de los espacios de nombres. Una vez que eso produce resultados satisfactorios, copia la cadena de espacios de nombres de la URL (en la barra de direcciones de su navegador) y la pega en |ns=, y puede obtener la consulta desde el cuadro de búsqueda de la página de resultados de búsqueda y pegarla como la consulta, y eso es su enlace de búsqueda.

Si tiene solo un espacio de nombres en su enlace de búsqueda y no es un espacio de artículo, puede especificarlo diciendo, por ejemplo ns=ns10, o |ns10"en la posición del parámetro 3 o mayor:

{{sl|"search link" namespace||ns10}}→ espacio de nombres "enlace de búsqueda"

Para un espacio de nombres se prefiere el nombre explícito:

{{sl|Template:"search link" namespace}}→ Plantilla: espacio de nombres "enlace de búsqueda"

Se prefiere el nombre explícito si va a publicar o guardar su enlace de búsqueda. De esa manera, cuando se ejecuta más tarde, el dominio de búsqueda aparece explícitamente al principio del cuadro de búsqueda de la página de resultados de búsqueda para informar al usuario. De lo contrario, solo la URL y solo el marco de diálogo del perfil del espacio de nombres aparecen en la página de resultados de búsqueda para informar al usuario. Cuando se trata de dos o más espacios de nombres, estas cosas siempre suceden, porque la consulta solo acepta un espacio de nombres (solo como primer término). Pero todo es también una consulta informativa, un pseudoespacio de nombres sólo para búsqueda. Si ve una consulta que comienza con all:, la URL se cargará con todos los parámetros del espacio de nombres.

Puede utilizar "todos" en {{Enlace de búsqueda}} para especificar todos los espacios de nombres:

{{sl|query|ns=all}}

{{sl|query|label|all}}

pero de nuevo, es mucho más preferible decir

{{sl|all:"search link" namespace}}→ todos: espacio de nombres "enlace de búsqueda"

de lo que es usar:

{{sl|"search link" namespace||all}}→ espacio de nombres "enlace de búsqueda"

por las razones expuestas justo arriba. Pero al especificar "todos", el tiempo de consulta es aproximadamente siete veces mayor porque hay muchas más páginas en la wiki que artículos. Si es posible realizar una búsqueda más específica, se ejecutará mucho más rápidamente que la búsqueda "todo".

Por ejemplo, si tiene una consulta para la cual sabe que el dominio de búsqueda es 10 y 11 y no desea ninguna etiqueta , entonces necesita un parámetro 3, pero no necesita el parámetro 2 , por lo que, según las reglas de parámetros de la plantilla, el enlace de búsqueda puede ser hecho de cuatro maneras generales:

{{sl|query||ns10|ns11}} Cuando el parámetro 1 no tiene nombre y el parámetro 2 no tiene nombre | | (definido como la "cadena vacía"), entonces el parámetro 3 se puede definir sin nombre ns10y el parámetro 4 se puede definir sin nombre ns11, y así sucesivamente. Nada se nombra porque todo está definido.
{{sl|query|3=ns10|4=ns11}}El parámetro 2 no está definido, pero está bien porque los parámetros 3 y superiores tienen todos nombres...
{{sl|query|ns=ns10&ns11}} o el parámetro posicional vacío | | no es necesario cuando |ns=se define nombrado.
{{sl|query=query|label=|ns=ns10&ns11}}Todo está nombrado explícitamente.

Para otro ejemplo, si selecciona los espacios de nombres "Wikipedia" y "Ayuda", luego ejecuta una consulta, la URL mostrará ns4=1&ns12=1. Cópialo y pégalo en |ns=ns4=1&ns12=1. (Nota: puede ignorar la parte "=1" de la URL).

Observe cómo la URL contiene ns0, ns1, ns2 y ns3, y cómo los obtuvo:

{{sl|systems operations|3=ns2|4=ns1|ns=ns3|20=ns0}} → operaciones de sistemas

{{sl|query = systems operations|||ns2|ns1|ns3|ns0}}→ operaciones de sistemas

{{sl|systems operations|3=ns2&ns1&ns3&ns0}}→ operaciones de sistemas

Si necesita desarrollar un dominio de búsqueda muy específico, uno muy elaborado a partir de un conjunto de treinta espacios de nombres, entonces lo habrá desarrollado en la página de resultados de búsqueda utilizando el selector de dominio de búsqueda avanzada allí. Luego simplemente corta y pega la cadena completa de la URL de los espacios de nombres de dominio de búsqueda encontrados y la pega en un parámetro con nombre |ns=.

Para escribir los espacios de nombres 0, 2, 4, 5, 7 y 9, sin etiqueta, las dos formas más sencillas son:

{{sl|query||ns0|ns2|ns4|ns5|ns7|ns9}}
{{sl|query|ns=ns0&ns2&ns4&ns5&ns7&ns9}}

El orden es irrelevante.

Ejemplos avanzados

Todo esto implica filtros . Cualquier enlace de búsqueda con una búsqueda siempre debe proporcionar los términos de consulta adicionales que filtrarían (reducirían) el dominio de búsqueda tanto como fuera posible. Esta plantilla tiene como valor predeterminado el espacio del artículo si no se proporciona ningún espacio de nombres, que es un filtro.insource:/slash delimited regex/ insource:/regex/

Citando

La necesidad de hacer coincidir un igual en un artículo no es sorprendente, y es básica. Tienes que usar {{ = }} o |query=o |1=simplemente para obtener el signo igual en tu consulta al motor de búsqueda, o {{ ! }} para llevar el carácter de barra vertical al motor de búsqueda. Tanto los caracteres de barra vertical como los signos igual son sensibles a la plantilla para todas las plantillas, por lo que siempre puedes citarlos con llaves como esa dentro de las plantillas. Aunque el cuadro de búsqueda puede tomar = y | directamente, es necesario citar en el enlace de búsqueda porque de lo contrario tienen el significado de sus parámetros.

Las expresiones regulares son sensibles a la puntuación, los corchetes, las matemáticas y otros caracteres simbólicos, conocidos colectivamente como " puntuación ", por lo que los cita, porque de lo contrario tienen su significado de metacarácter de expresiones regulares . Los "metacaracteres" de CirrusSearch han reclamado la mayoría de los caracteres de puntuación como funciones en su expresión regular, pero no es necesario conocer todas las funciones de los metacaracteres sólo para buscarlos como objetivos literalmente. Simplemente puedes citar todos los signos de puntuación para buscarlos como objetivos literales en wikitext. La manera de citar fácilmente cada carácter en una expresión regular completa es poner el término completo entre comillas:insource:/"regexp with literal characters"/

Para obtener un carácter de canalización a través de la plantilla y el motor de búsqueda para orientarlo como un carácter en wikitexto, debe citarlo dos veces, de ahí la necesidad frecuente de los seis caracteres en un enlace de búsqueda avanzada. El signo igual no es un metacarácter, por lo que no es necesario entrecomillarlo dos veces, como ocurre con el carácter de barra vertical. El carácter de barra vertical es un metacarácter que significa O.\{{!}}

Para generar búsquedas avanzadas de expresiones regulares, consulte cómo hacerlo en {{ regex }} .

Funciones del motor de búsqueda

El motor de búsqueda puede

ordenar por fecha
doblar familias de personajes. An ecoincide con an ëy Aeroskobingcoincide con Ærøskøbing.
entender cuando una página linkstoo hastemplate, o tiene algo intitle, o esincategory
entender ORy AND, y dos formas de no .
realizar búsquedas difusas sobre la ortografía de las palabras.
ubique las palabras tan cerca unas de otras como usted especifique.
buscar expresiones comodín y expresiones regulares .

Una búsqueda coincide con lo que ve en la pantalla y en una vista previa de impresión. El wikitexto "fuente" sin procesar se puede buscar empleando el insourceparámetro. Para estos dos tipos de búsquedas, una palabra es cualquier cadena de letras y números consecutivos que coinciden con una palabra o frase completa. Todos los demás caracteres del teclado, como signos de puntuación, corchetes y barras, símbolos matemáticos y otros, normalmente no se pueden buscar.

De forma predeterminada, la búsqueda también derivará las palabras y las relacionará. Ordena automáticamente los resultados por frecuencia y ubicación, pero también puede mejorar la clasificación de la página por tiempo, uso de plantilla o incluso similitud con otras páginas.

Search es un motor de búsqueda que realiza una búsqueda de texto completo consultando una base de datos de índice . Ofrece una sintaxis de búsqueda y parámetros que superan las capacidades y el control de otros motores de búsqueda públicos que podrían buscar en Wikipedia.

Puntuación de la página

Digamos que se proporciona el cuadro de búsqueda two words. La búsqueda comienza con dos búsquedas de índice y los dos resultados se combinan con un AND lógico. Pero antes de que se muestren como resultados de búsqueda, se les debe asignar a todos una puntuación final antes de que se puedan mostrar los veinte primeros (enumerados en la primera página), y se les debe dar formato con fragmentos y resaltado. La clasificación de páginas se ocupa rápidamente de un gran número de páginas, abordando las cosas estadísticamente y analizando varios datos.

La frecuencia y ubicación de cada palabra determina la primera clasificación. ^[4]
El orden de las palabras determina la segunda clasificación. Si las dos palabras se encuentran en el mismo orden en una página, esa página se promociona nuevamente.
El número de enlaces entrantes. ^[5]

Estos atributos para una palabra le otorgan a esa página una puntuación más alta:

posición en el título
posición en la sección principal
repetición
proximidad a otras palabras en la consulta

Puede haber varios otros mecanismos de puntuación. Los parámetros que puedes controlar son morelike, boost-templatey prefer-recent.

Descripción general

Ahora hay once parámetros para varios enfoques para buscar en los numerosos espacios de nombres. Cuatro de los siete nuevos parámetros ahora ofrecen apuntar a estas características de la página: hastemplatey linksto, insourcey insource:/regexp/. Los otros tres ahora ofrecen apuntar a la clasificación de la página: morelikefunciona solo, prefer-recentse puede agregar un término a cualquier consulta y ahora también hay un boost-templateparámetro. Los otros cuatro, conservados solo en el nombre, de la versión anterior de Búsqueda completamente reescrita, son intitle, incategory, prefixy namespace .

Cualquier búsqueda incluirá uno de estos enfoques.

Confíe en la clasificación de la página; ignorar la mayoría de los resultados; corre una vez.
Busque una cadena exacta usando una expresión regular simple ; Pruebe previamente un pequeño dominio de búsqueda.
Hackear un conjunto altamente refinado de características de página preocupándose únicamente por un recuento exacto de páginas; refinar en una zona de pruebas y en la página de resultados de búsqueda.

El concepto de dominio de búsqueda juega un papel importante en todo esto. Por defecto es sólo espacio de artículo, pero en general un dominio de búsqueda comienza como un conjunto de espacios de nombres y termina como todas las páginas del resultado de búsqueda.

Un término de una consulta establecerá el dominio de búsqueda para otro término en la misma consulta. El orden está optimizado por el motor de búsqueda. La consulta term1 term2transforma el dominio de búsqueda dos veces para obtener esos resultados de búsqueda. Por ejemplo, un espacio de nombres simple devuelve las páginas del espacio de nombres. La consulta se basa en gran medida en los dos primeros términos para reducir el tamaño del dominio de búsqueda. term1 term2 regexp

Todos los términos de una consulta son búsquedas indexadas a menos que sean una expresión regular. Los términos indexados se ejecutan instantáneamente por palabras y una expresión regular se ejecuta lentamente por caracteres . Incluso el uso más básico de una expresión regular, sólo para encontrar una cadena exacta, siempre debe limitar el tamaño de su dominio de búsqueda al mínimo posible. Esto puede ser tan simple como agregar algunos términos (como se explica a continuación), porque cada término en una consulta tiende a reducir el número de páginas. Nunca ejecute una expresión regular simple en la wiki, especialmente si su perfil de usuario está preestablecido en Todo . El motor de búsqueda limita la cantidad de búsquedas de expresiones regulares que se pueden ejecutar a la vez. Sin el filtro adecuado ejecutándose junto con una expresión regular, se ejecutará durante hasta veinte segundos y luego incurrirá en un tiempo de espera de HTML.

En la página de resultados de búsqueda, el dominio de búsqueda inicial en el que se ejecutó la consulta se indica con lo siguiente, con un poder creciente para anular los demás:

un cuadro de diálogo de espacio de nombres abierto si el usuario ha preestablecido un perfil de espacios de nombres
Páginas de contenido o Multimedia o Todo : si una de ellas era el dominio de búsqueda inicial, entonces el color de su texto habrá cambiado de azul (color del enlace) a negro (presentación).
un parámetro de espacio de nombres en la consulta
un prefixparámetro los anula a todos.

Por ejemplo, si el parámetro del espacio de nombres es all, el tamaño del dominio de búsqueda inicial será de 61.130.517 páginas en todos los espacios de nombres: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12. , 13, 14, 15, 100, 101, 118, 119, 710, 711, 828, 829 Un parámetro de prefijo especifica solo uno de esos espacios de nombres, en su totalidad o en parte. Si el dominio de búsqueda inicial es el predeterminado, las páginas de contenido su tamaño son 6.860.439 páginas en el espacio de nombres 0 (espacio del artículo).

Se puede configurar una búsqueda en un enlace para especializar y compartir búsquedas: . Dicha consulta siempre debe especificarse completamente especificando un dominio de búsqueda inicial para evitar discrepancias en el perfil del usuario. De esta manera da los mismos resultados. Por ejemplo, si se necesita más de un espacio de nombres, utilice {{ enlace de búsqueda }} . ^[6][[Special:Search/search]]

Otros enfoques útiles para las funciones del motor de búsqueda son

plantillas como {{ uso de plantilla }} que ofrecen búsquedas especializadas prediseñadas.
Configuraciones de cuadros de entrada, como la que se encuentra al final de esta página, que quizás puedan funcionar con dichas plantillas.
impulsar solicitudes de funciones nuevas o mejoradas en phabricator

Sintaxis

Los caracteres de espacio gris son caracteres no alfanuméricos: ~!@#$%^&*()_+{}|[]\:";'<>?,./. Cualquier cadena de caracteres de espacios grises y/o espacios en blanco es "espacio gris".

El espacio gris se ignora excepto cuando tiene significado como modificador en la sintaxis.

+termdesactiva las sugerencias "¿Quiso decir?"
_termdesactiva las sugerencias "¿Quiso decir" para ese término?
-termsignifica que no . Cambia el significado de incluir a excluir .
!termtambién significa no .
El :carácter de dos puntos puede especificar el "espacio del artículo" como dominio de búsqueda y, en algunos casos, puede actuar como una letra o un número dentro de una palabra (sin espacio). Estos se tratan a continuación.
El ~carácter de tilde se asocia generalmente con la búsqueda de más resultados de búsqueda:
- ~querygarantiza resultados de búsqueda en lugar de navegación.
- word~hace una "búsqueda difusa" de esa palabra.
- "exact phrase"~agrega derivación para cada palabra.
- "exact phrase"~nrealiza una "búsqueda de proximidad", permitiendo n palabras adicionales dentro del texto exacto.

Los parámetros también aceptan palabras y frases, pero cada uno puede buscar en su propio índice e interpretar sus propios argumentos, como por ejemplo para

requerir un espacio de nombres o no, o aceptar alias de espacios de nombres o no
informar redirecciones o no
para una entrada de nombre de página: distinguir entre mayúsculas y minúsculas o no, o aceptar el _carácter de subrayado en lugar de un carácter de espacio o no
delimitadores para sus argumentos
el significado de la sintaxis de sus propios caracteres modificadores

Los delimitadores:

El espacio de nombres no necesita delimitadores, pero acepta espacios en blanco a la izquierda y espacios en gris a la derecha.
El prefijo acepta solo espacios en blanco entre el espacio de nombres y el nombre de la página, y acepta espacios en grises a la izquierda.
insource:/arg/no requiere espacio, pero todos los demás parámetros toleran al menos espacios en blanco
Dos palabras separadas únicamente por espacios en gris forman una frase en espacio en gris, sujeta a la derivación
"Comillas dobles": crean una frase exacta y hacen posible la derivación y la proximidad con más modificadores agregados.
Se ignora el espacio gris:
- en cualquier lugar dentro de comillas dobles
- en los caracteres iniciales de la consulta del cuadro de búsqueda, pero no antes de un espacio de nombres
- entre palabras y frases, excepto frases en espacios grises
Los caracteres espaciales solo son importantes
- para nombres de páginas (enlaces a, prefijo, categoría, plantillas de refuerzo, más).
- entre dos parámetros (para delimitar el argumento)

Dos puntos: personaje:

como espacio de nombres, significa espacio de artículo
como prefijo, significa espacio de artículo
Insource o "frase exacta" significa dos puntos literales y actúa como una letra o un número si son dos puntos sin espacio.

Palabra y frase

Una búsqueda es una consulta con uno o más términos . En realidad, la consulta no busca en la base de datos de la página, sino que consulta una base de datos de índice de búsqueda preconstruida y mantenida constantemente. Al crear el índice de búsqueda de palabras en la wiki, o al ingresar una consulta, el límite de una palabra es un espacio gris. Los caracteres de espacio gris pueden crear una frase de varias palabras. Debemos decir tabulador y nueva línea aunque no podamos poner esos caracteres en nuestra consulta; esto se debe al hecho importante de que el mismo análisis que se realiza en el wikitexto también se realiza en la consulta. El límite de una palabra son caracteres de espacio en blanco (tabulación, espacio o nueva línea) o caracteres de espacio en gris. Los caracteres de espacios en gris y en blanco se combinan como uno solo, del mismo modo que los caracteres especiales como æ (ae) o á (a) se combinan en los caracteres del teclado estándar.

Una frase expresa un orden de palabras, ^[7] y hay tres formas de crear una, dependiendo de qué tan agresivamente quieras que coincida la frase.

"comillas"
unirse_con_no alfanuméricos (caracteres)
camelCaseNombre o letra222transiciones numéricas

Las frases "comillas" se denominan "frase exacta" porque son palabras exactas: la raíz , la búsqueda difusa y los comodines no se utilizan en una "frase exacta". Como el resto de la Búsqueda, una "frase exacta" tolera espacios grises entre palabras. Unirse únicamente con (caracteres) no alfanuméricos empleará derivaciones en las palabras. CamelCaseNaming o transiciones de números letter222, coincide con la frase en espacios grises, con la raíz y, además, coincide con la palabra misma. Los parámetros pueden requerir que las comillas incluyan espacios en blanco en su entrada.

El wikitexto se busca empleando el parámetro insource . El parámetro interno también ignora los espacios en gris.

Por ejemplo, para encontrar la frase http://en.wikipedia.org/wiki/Template:Search_link/Search_engine, uso http://en.wikipedia.org/wiki/Template:Search_link/Search_engineo uso insource: "http en wikipedia org wiki search engine".

Cuando busca una palabra, esa palabra simplemente se busca en un índice . Una búsqueda indexada concluye instantáneamente con todos los títulos de los resultados de la búsqueda , sin tener que buscar en el wiki.

Cada palabra que ves en el contenido de una página (el contenido de un título) ya está en un índice, donde apunta a todos los demás resultados preestablecidos . Una palabra está indexada en una lista de nombres de páginas, donde se ve en el texto o solo en el título.

Cada palabra indexada se ve como

una cadena de caracteres alfabéticos az, o
una cadena de dígitos del 0 al 9, o
una cadena de caracteres alfanuméricos az, 0-9.
un token dentro de una palabra camelCase.

Para transiciones de minúsculas a mayúsculas (o camelCase) y transiciones de letras a números:

estas son dos palabras
sólo la primera transición divide tales palabras en dos
un espacio nulo coincide con caracteres no alfanuméricos: game-folks coincide con gameFolks.

para o dígito-letra estos coinciden solos o juntos. En otras palabras, no necesita el espacio, pero eso también funciona para encontrar "palabra" de un caso de camello o una palabra alfanumérica mixta. No necesita un espacio y los caracteres no alfanuméricos se tratan como ese espacio nulo.

A veces podemos llamar a estos caracteres de "palabra" o caracteres "alfanuméricos" en lugar de los caracteres "que no son de palabra", que se ignoran excepto para funcionar como límite de palabra. Por lo general, el límite de una palabra es solo un carácter de espacio.

Estas palabras no distinguen entre mayúsculas y minúsculas: az es equivalente a AZ, por lo que el cuadro de búsqueda navegará al nombre de una página independientemente de las mayúsculas (aunque los wikilinks y las URL deben coincidir con las mayúsculas, aparte del carácter inicial).

Cada palabra tiene un alias para todas sus raíces de palabras, por lo que nube, nube, nubes, nube, nube apuntarán a la misma entrada de índice.

En Buscar los caracteres !@#$%^&*()_+-={}|[]\:;'<>,.?/se ignoran. Cualquier combinación de caracteres de espacios en blanco y estos caracteres que no son palabras, podemos denominarlos espacios grises . El espacio gris, entonces, son todos los caracteres que no son palabras, excepto el carácter de comilla doble, que no se ignora.

El espacio gris es una cadena de uno o más caracteres, como corchetes, símbolos matemáticos, puntuación y espacios. Ahora, se encontrará una palabra indexada de búsqueda entre el espacio gris , y el espacio gris es un AND implícito de dos palabras en una consulta de búsqueda, pero el AND no siempre está implícito: cuando existen dos frases una al lado de la otra, el AND se requiere.

Las excepciones a las "palabras" que se indexan son estas palabras divididas :

Un cambio de un carácter numérico a uno alfanumérico es un límite de palabra adicional en una palabra alfanumérica.
Un cambio de un carácter alfanumérico a uno numérico es un límite de palabra en una palabra alfanumérica.
Un cambio de mayúsculas a minúsculas es el límite de una palabra en una palabra alfabética.

El límite de palabras entre tales porciones numéricas y porciones alfabéticas puede incluir espacios grises o no, pero una búsqueda de frases desactiva la división en porciones , porque es una "búsqueda de frases exactas", las palabras de la frase que coinciden solo con palabras alfanuméricas delimitadas por espacios grises. espacio.

Las palabras unidas únicamente por caracteres no alfanuméricos se tratan como una frase. Entonces palabra1_palabra2 y palabra3 es lo mismo que "palabra1 palabra2 palabra 3". Sin embargo, también coincidirán con las transiciones camelCase y letra-número. Una búsqueda de frase exacta no coincidirá con las transiciones camelCase o letra-número. Por ejemplo, se pueden encontrar términos como wgCanonicalNamespace y !wgCanonicalSpecialPageName buscando canonical page name.

Por ejemplo:

Un numerónimo como C10k se considera una palabra para proximidad, pero dos palabras para coincidencia.
números pluralizados, como "2010s"

Lo siguiente coincide con el término único txt2regEx en una página: txt, 2, regex, reg, ex, txt2, 2reg, 2regex. Ninguna de esas partes coincidiría en una búsqueda de frases; sólo coincidiría "txt2regex". ^[8]

Lo siguiente coincide con los dos términos 2 + 2 : 2o "2", 2 2o "2 2", "2 2"o "2", "2+2"o 2+2, "2-2"o 2-2, "2.2"o 2.2Cada término es una consulta y el espacio gris es un AND.

Búsqueda difusa, comodines y derivaciones

La derivación es una forma de hacer coincidir el significado "ambiciosamente", para aumentar los números, para una posible coincidencia semántica, de modo que run_shoetambién coincida running shoes. La derivación es un algoritmo de ortografía que sólo depende remotamente de cualquier diccionario. ^[9] El algoritmo intenta encontrar la misma palabra , pero en todas sus terminaciones.

Una búsqueda difusa coincidirá con una palabra diferente . Las palabras (pero no las frases) aceptan coincidencias de cadenas aproximadas o "búsqueda difusa". ~Se añade un carácter de tilde para esta búsqueda que "suena como". La otra palabra no debe diferir en más de dos letras .

No las dos primeras letras. Las dos primeras letras deben coincidir.
Se intercambiaron dos letras.
Dos letras cambiaron.
Dos letras sumadas, dos letras restadas o una restada y otra suma.

Pero puede diferir en una letra de esta manera. Una búsqueda difusa coincide exactamente con la palabra más palabras similares.

esto~ ,→ así y ruido sordo, adelgaza y el , pero no el suyo o el cardo
charlie~ parker~ → Charlie Parker y Charles Palmer y Charley Parks

Con comodines puede especificar qué letras cambian, incluidas las dos primeras letras, y puede aumentar la cantidad de letras que pueden cambiar. Los comodines tienen sus propias reglas:

* cero o más letras o números
*\? una o más letras o números.
\? una letra o número
ni ni \? puede coincidir con la primera letra; pueden ir en el medio o al final.
\? y * se puede usar cualquier número de veces en una palabra
esto* → cardo y This1234 y This
g\?it\?r → polaina bocio guitarra g8it9r
tecla* → teclado y punzonadora

Mientras se crean y actualizan los índices de palabras, la derivación agrega automáticamente alias a la mayoría de las entradas. No se utiliza un diccionario real. En su lugar, ejecuta un algoritmo que aplica reglas de sintaxis genéricas en inglés para las terminaciones de palabras. Los resultados son imperfectos. ^[10] Incluso las palabras mal escritas, las que no son palabras y las palabras con números se indexan y derivan de esta manera. Al agregar diferentes formas de la misma palabra a la consulta de búsqueda indexada, la derivación es un método estándar que utilizan los motores de búsqueda para obtener de manera agresiva más resultados de búsqueda y luego ejecutar un conjunto de reglas de clasificación de páginas.

Por ejemplo, la derivación tendrá alias nube , nubes , nublado y nublado . No asignará un alias a la palabra cloudy , pero sí asignará un alias a las diversas formas de nube a la palabra que no es cloudion , porque -ion es una terminación de palabra común.

La derivación se desactiva automáticamente para búsquedas internas:

nubes
fuente interna: nube
"nubes"

Para desactivar la derivación, coloque la palabra entre comillas; esta es una búsqueda de "frase exacta". ^[11]

Por ejemplo: gameFolks, game!folks, game:folks coincide con FolksSoul

Proximidad

Las búsquedas de proximidad no buscan títulos.
La proximidad funciona al revés si le das un recuento más alto.
Las búsquedas de proximidad desactivan la derivación.

Un "Exact phrase"o a wordcoincidirá en un título. Y crear una frase "with tilde"~simplemente requiere derivar (lo que equivale a formar una frase uniendo las palabras with_greyspace). Pero "exact phrase"~1coincide con el texto en ese orden y además permite que cualquier palabra adicional quede entre las dos palabras.

Por ejemplo

"exact second phrase"~2permite que quepan dos palabras adicionales en cualquier lugar a cada lado del segundo término.
"exact phrase"~3 también encuentra "frase exacta" (las dos palabras en orden inverso)
¿Está buscando "Shift-Alt-P" o "Alt_Shift-P"? Que no es "Alt-shift-P"~3. Que no es "alt shift"~3-P. Úselo "alt shift p" OR "shift alt p"en su lugar.
"Vértebra dorsal" ~2 coincide con "Vértebra dorsal (o torácica)"
"Tres palabras extra"~5 coincide con " tres w-1 w2% extra w:3 w_4 $w5 palabras ".

"hitch4 hiker2"encuentra las dos "palabras" en ese orden (posiblemente separadas por puntuación o corchetes u otros símbolos del teclado como símbolos matemáticos) y sin las comillas las encuentra en el mismo artículo. En ambos casos, el artículo aparece listado cuando el espacio satisface el significado lógico AND.

hello_dollyhace lo mismo que "hello dolly"hace, pero la versión de comillas dobles ofrece un filtro de proximidad. Después de la cita de cierre agregas una tilde ~ y un número que indica el número total de palabras permitidas entre todos los términos.

"WordOne wordTwo"significa una frase (cero palabras intermedias)
"Palabra1 palabra2" → palabra1 <[!@#]> <[:$%^*()]> <[+-*/]> palabra2
"Palabra3 palabra4"~1 → palabra3 palabra extra1palabra4
"Palabra5 palabra6 palabra7"~2 → palabra5 palabra extra1 palabra6 palabra extra2 palabra7
"Palabra8 palabra9 palabra10"~2 → palabra8 palabra9 extra1palabra extra2palabra10

La proximidad hacia atrás también funciona, pero incluye las dos palabras finales entre cada segmento. La proximidad no puede acercar la última palabra a la primera. La proximidad puede ser un número grande, como 500 o 1000.

Digamos que una página tiene palabra1, palabra2, palabra3 en ese orden. ^[12]

"PalabraB palabraA"~4 → palabraA extra1palabra extra2palabraB
"PalabraC palabraB palabraA"~6 → PalabraA palabraB extra1palabra extra2palabrac

Dos términos de búsqueda sin comillas son dos filtros y un montón de reglas de clasificación de páginas.

Lógica de búsqueda

La lógica de la verdad es Y, O y no .

Las consultas no aceptan paréntesis. Por tanto, no se pueden agrupar varios términos en un solo término lógico.
Los parámetros no aceptan Y ni O, pero no aceptan
word word2 voluntad Y los dos términos.
word AND word2 voluntad Y los dos términos. (similar)
word OR word2 será O los dos
-wordno será el término, excluyendo las páginas que coincidan con la palabra.
!word¿No será el término (de manera similar)

El OR lógico aumenta los resultados, mientras que el AND lógico los disminuye. El no lógico es una buena manera de refinar una consulta eliminando cualquier tipo de término excepto el parámetro de prefijo .

Por ejemplo while -refining -unwanted search results. Por ejemplo, credit card -"credit card" busca todos los artículos con "tarjeta" y "crédito".

Prefijo y espacio de nombres

El prefijo y el espacio de nombres son los únicos parámetros posicionales y el espacio de nombres es un parámetro de búsqueda sin nombre. Uno u otro de ellos se utiliza en una consulta para anular el dominio de búsqueda inicial establecido por el perfil de usuario o por la barra de búsqueda. No se usan juntos: el prefijo anula el espacio de nombres.

El argumento del espacio de nombres debe estar al principio de una consulta y el prefix:parámetro debe estar al final de una consulta.

Espacio de nombres

Namespace:es un parámetro de búsqueda sin nombre que va al comienzo de una consulta. ^[13] El espacio de nombre va seguido de dos puntos, seguido de cero o más caracteres de espacio en blanco. y coincide con el nombre de un espacio de nombres . Los nombres de los espacios de nombres y "todos" funcionan como se esperaba, pero ver uno en el cuadro de búsqueda no garantiza que represente los resultados de la búsqueda, como se explica a continuación.

Además de los nombres habituales de los espacios de nombres y sus alias

allbusca todos los espacios de nombres en la wiki. ^[14]
filebusca en la wiki más en la wiki de Commons .
- Se buscan las palabras y frases en las páginas del archivo.
- se busca el contenido textual dentro de todos los archivos adjuntos cargados ^[15]
- Si la coincidencia se realiza dentro de un pdf (o similar), esto se indica en los resultados de la búsqueda entre paréntesis: "(coincide con el contenido del archivo)".
file:localdesactiva la búsqueda en Commons
allno busca en los comunes
Los nombres de los espacios de nombres no distinguen entre mayúsculas y minúsculas, pero "todos" y "local" deben estar en minúsculas.
All:no es un espacio de nombres de búsqueda y será tratado como una palabra.
local:no se tratará como una palabra, sino que se ignorará silenciosamente, a menos que esté involucrado el espacio de nombres del Archivo, como ocurre en la barra de búsqueda al activar Multimedia o Todo .
En una consulta, local:solo tiene efecto después del espacio de nombres del Archivo file:local.

Las páginas con espacios de nombres superan en número a las páginas sin ellos en una proporción de 7 a 1 .

En la barra de búsqueda en la página de resultados de búsqueda

Todo busca en todo, además de Commons y el espacio de nombres de Archivo.
Avanzado cuando está marcado Todo (espacios de nombres) es equivalente a Todo .
Multimedia busca los espacios de nombres de archivos y medios en la wiki local además de Commons.

Estos difieren del espacio de nombres "todos" al hacer coincidir sus términos de búsqueda dentro de un pdf en una página de ayuda: archivo , ese elemento en la página de resultados de búsqueda dice "(coincide con el contenido del archivo)".

Por ejemplo , el archivo: "885,7 segundos" coincide dentro de un pdf, pero todo: "885,7 segundos" no.

Prefijo

prefix:namespace: string filtra un espacio de nombres a una o más páginas donde la cadena coincide con los caracteres iniciales del nombre de la página. ^[16] Por ejemplo, prefix:help:t busca nombres de páginas de Ayuda que comienzan con "T".

Cuando la cadena tiene cero caracteres, se encuentran todas las páginas en el espacio de nombres dado.
Cuando la cadena tiene todos los caracteres de un nombre de página, se encuentra una sola página.
La cadena no distingue entre mayúsculas y minúsculas.
El espacio de nombres puede ser un alias de espacio de nombres, como WPfor Wikipedia.
Se permite un espacio entre el espacio de nombres y el nombre de la página.
El espacio de nombres para el prefijo por defecto es el espacio del artículo.
El prefijo no coincidirá con una redirección. (Pero vea Especial:PrefixIndex .)
El prefijo no se puede utilizar como filtro: -prefixse ignora el guión de. -prefix:WP: ab sólo establece el dominio de búsqueda en "Wikipedia:Ab".
No se ignora ningún carácter del nombre de la página. Incluso el carácter de espacio es parte del nombre de la página y es por eso que el prefijo debe ir al final.

Prefix puede realizar la función de filtro de espacio de nombres y, además, puede aislar un solo artículo, mientras que intitle no. El prefijo no puede aislar una sola página si tiene subpáginas.

Una alternativa a una consulta de prefijo es Special:PrefixIndex :

informe de varias columnas capaz de enumerar varios cientos de nombres de páginas en una sola página
Distingue mayúsculas y minúsculas
también enumera redireccionamientos

Comparado

Comparando el espacio de nombres y los parámetros de prefijo :

Tanto el prefijo como el espacio de nombres pueden servir para establecer el dominio de búsqueda inicial.
Para un espacio de nombres determinado, son equivalentes.
Ambos filtran títulos.
Ambos aceptan alias de espacios de nombres , pero el prefijo no reconoce "todos".
Ambos limitan el dominio de búsqueda inicial a un espacio de nombres.
Un espacio de nombres solo va al principio y un prefijo solo al final.

Los siguientes métodos establecen un dominio de búsqueda inicial por espacio de nombres:

a prefix:, que por defecto es el espacio del artículo
un argumento de espacio de nombres al comienzo de una consulta, que por defecto es el dominio de búsqueda predeterminado del usuario
los parámetros de URL&nsN=1
la GUI de "perfil avanzado" en la página de resultados de búsqueda

Estos están en orden de precedencia. Un prefijo anula un espacio de nombres anula la GUI. El argumento del parámetro de prefijo es un nombre de página completo, que transmite un espacio de nombres .

Al alternar dominios de búsqueda, con las diversas técnicas, y por sus prioridades, merece la pena repetir: comprobar la indicación de la barra de búsqueda; es de lo más sutil. ^[17] El panel de selección avanzada de espacio de nombres de la barra de búsqueda no es tan sutil. Permanecerá mientras esté vigente la selección anterior "recordar selección para futuras búsquedas". Puede "recordar" el espacio del artículo y luego 1) presionar Contenido, 2) elegir otro dominio de búsqueda en la barra de búsqueda o 3) eliminar todas las instancias de &profile=advancedde la URL.

Atributos de página

Estos cinco parámetros de búsqueda filtran un espacio de nombres según una palabra o frase de entrada.

Sin quirófano. Por ejemplo, no intitle:A OR intitle:B
No hay requisitos de posición y todos pueden ser independientes, por ejemplo.!hastemplate: Val
Solo incategoryacepta varias entradas (entre barras verticales | caracteres)
Sólo linkstoy insourceno acepto frases en espacios grises.
Sólo linkstodistingue entre mayúsculas y minúsculas.
Sólo insourcees sensible a dos puntos sin espacio: carácter.

Estos nombres de parámetros deben estar en letras minúsculas.

Título

Intitle busca una palabra o frase en el nombre de una página . Como una búsqueda de palabras o frases, se pueden aplicar búsquedas derivadas y difusas .

Una entrada de palabra se puede poner entre comillas dobles para desactivar la derivación .
Una entrada de frase puede utilizar espacios grises para activar la derivación .
La entrada de una sola palabra puede tener como sufijo el carácter ~ de tilde para una búsqueda difusa .
Una sola palabra ingresada puede tener como sufijo el carácter de estrella * para una búsqueda con comodines .
Intitle no busca redireccionamientos .
La búsqueda de proximidad no es una opción en la búsqueda de títulos.

Para encontrar una coincidencia en un título de redireccionamiento o aplicar una búsqueda de proximidad a un título, puede confiar en el software de clasificación de páginas para aumentar las coincidencias de títulos antes que las de contenido. Por lo tanto, una búsqueda básica de palabras o frases, o una búsqueda de proximidad, es una alternativa a intitle .

Por ejemplo

intitle: "forest ridge" encuentra uno, mientras que la búsqueda de proximidad

"forest ridge"~3 encuentra inmediatamente una docena de títulos relacionados.

intitle: image_label muestra la derivación, mientras que intitle: "image label" no.

intitle:juggle muestra derivación.

intitle:sun intitle:moon muestra cómo buscar dos palabras en un título.

Incategoría

La categoría tiene el formato general.

incategory: "category|category|...|category"

y selecciona de la sección de páginas de una categoría determinada , aquellas páginas que también están en el dominio de búsqueda.

Las entradas de categoría no distinguen entre mayúsculas y minúsculas.
Las entradas de categoría son sensibles al espacio. No hay espacios alrededor de la categoría. Para cualquier espacio dentro de cualquier entrada, utilice "comillas dobles" alrededor de toda la expresión.
Los resultados de la búsqueda no incluyen subcategorías. Para eso existe un parámetro de búsqueda de deepcat , disponible agregando una línea a sus archivos javaScript y CSS. ^[18]
Se pueden aplicar varias categorías hasta el límite de 300 caracteres de una consulta.

Debido a que muchas páginas fuera del espacio principal también están categorizadas, los recuentos a menudo no coincidirán con la categoría a menos que el dominio de búsqueda sea todo el wiki:

todo: encategoría: Historia (las 70 páginas)
encategoría: Historia (espacio del artículo, 36 páginas)
portal: encategoría: Historia (espacio del portal, 2 páginas)

La entrada de múltiples categorías cuenta una página solo una vez. Las siguientes dos categorías tienen 209 páginas en el espacio del artículo, con seis páginas en ambas categorías:

incategory:"Técnicas de recuperación de información" incategory:"Procesamiento del lenguaje natural" (6)

incategoría: "Procesamiento del lenguaje natural" (159)

encategoría: "Técnicas de recuperación de información" (50)

incategoría: "Técnicas de recuperación de información|Procesamiento del lenguaje natural" (203:= 209−6)

Por otro lado se trata de categorías dispares:

todos: encategoría: Kames (23 páginas sobre montañas)
todo: encategoría: Balandras (18 páginas sobre barcos)
todos: encategoría: Kames|Sloops (41:=23+18)

Debido a la naturaleza de Wikipedia: categorización, estas categorías no comparten páginas:

todo: encategoría: historia encategoría: matemáticas encategoría: física (cero páginas que coinciden con todos/y )
todos: encategoría: Historia (70 páginas)
todos: encategoría: Física (57 páginas)
todos: incategoría: Matemáticas (30 páginas)
todos: encategoría: Historia|Física (127 páginas)
todos: encategoría: Historia|Matemáticas (100 páginas)
todos: encategoría: Física|Matemáticas (87 páginas)
todos: encategoría: Historia|Matemáticas|Física (157 páginas)

Las categorías y la búsqueda son sinérgicas.

Para buscar títulos de categorías y enlaces y texto en una página de categorías, busque en el espacio de nombres de la categoría (o utilice CategoryTree o Categorías para búsquedas de títulos).
Si dos categorías están estrechamente relacionadas pero no están en una relación de subconjunto, entonces se pueden incluir enlaces entre ellas en el texto de las páginas de categorías.
Una búsqueda de palabra o frase a menudo puede coincidir con precisión en una categoría : puede coincidir dentro del cuadro de categorías en la parte inferior de cada página. Cuando esto ocurre, el resultado de la búsqueda incluirá un indicador entre paréntesis " ( Nombre de página de categoría ) ".

En los siguientes ejemplos, observe cómo la descripción de la página en el espacio de nombres de la categoría muestra los tamaños de las categorías en lugar de los tamaños de las páginas.

categoría: intitle: desambiguación (busca en el espacio de nombres de la categoría títulos con esa palabra).
categoría: historia texana (busca en el espacio de nombres de la categoría esas dos palabras en el título o cuerpo de una página de categoría)
anaxyrus (es fácil detectar las páginas que necesitan categorización, porque tampoco tienen una redirección con ese término).

plantilla has

Hastemplatebusca páginas que transcluyen una plantilla determinada. Encuentra el uso de la plantilla , no solo un patrón de nombre, porque encontrará todas las páginas donde se utilizó el contenido de la plantilla de alguna manera. Los resultados difieren ligeramente según el alias que proporcione.

plantilla has

dado el nombre de la página canónica (en la línea de título), también encontrará el uso de todos los alias (redirecciones) y también encontrará los enlaces de subpágina desde una plantilla principal.
dado un alias (en el nombre de la página de la redirección) encuentra el patrón de nombre de la redirección
no distingue entre mayúsculas y minúsculas
acepta un nombre de página completo para encontrar el uso de plantillas (homed) en un espacio de nombres de plantilla distinto del predeterminado (al igual que dentro de la llamada {{ template }})

Si no encuentra el nombre de la plantilla buscada en el wikitexto de la página, puede significar que le dio el nombre de la página canónica pero encontró un alias, o que fue llamada como plantilla secundaria a través de una plantilla que se muestra. en el wikitexto. Para buscar solo llamadas visibles (principales), utilice insource.

Fuente interna

Insource: term encuentra una palabra o frase en wikitext.

Sin frases_espacio_grises.
Sin derivación.
Sin proximidad.
Sí, comodines, pero sólo para palabras, no cuando el término es una "frase exacta".
trata los dos puntos sin espacio: carácter como una letra normal
Insource no busca en archivos .js o .css excepto en comentarios o etiquetas nowiki.

A diferencia de una búsqueda normal, la fuente interna no encuentra elementos "obtenidos" mediante una transclusión .

Insource apunta al wikitexto de dos maneras. Se ven similares, pero la forma de expresión regular emplea la barra diagonal/carácter para delimitar la expresión regular. ^[19]

insource: term encuentra una palabra o frase indexada.
insource:/regexp/ apunta a todo el wikitexto de cada página en el dominio de búsqueda como una larga cadena de caracteres por página, ya sea que tenga un patrón o no. Esta es la "expresión regular" (o regexp, o regex). Sus metacaracteres pueden representar múltiples posibilidades para una posición de carácter o un rango de posiciones de caracteres dentro de una página, utilizando metacaracteres para lógica de verdad, agrupando, contando y modificando los caracteres que se encuentran.

Una expresión regular básica es una manera fácil de encontrar una expresión específica, /"exact strings"/como se muestra a continuación. Las comillas dobles son delimitadores de campos. Son caracteres de escape que citan todo el conjunto de caracteres entre ellos y mantienen su interpretación literal (evitan que se produzca cualquier interpretación de metacaracteres).

Una expresión regular avanzada utiliza los metacaracteres para programar patrones de cadenas generales. Encuentra todo, incluso fragmentos y partes de palabras, sin transmitir ninguna noción de "palabras", sino sólo la de una cadena de caracteres en una secuencia. Los metacaracteres se interpretan a menos que estén entre comillas, comillas dobles o corchetes. Consulte la sección sobre expresiones regulares. El ejemplo obvio es que debe citar cualquier barra en su patrón para que no se interprete como el delimitador de la barra de cierre, y use \/en lugar de /para hacer coincidir una barra literal. Una expresión regular interpreta todos los metacaracteres. Probar un patrón de expresión regular de manera responsable requiere limitar el dominio de búsqueda

convirtiéndola en una sola página usando un filtro de nombre de páginaprefix:page name
un parámetro de prefijo u otro filtro que limita el dominio de búsqueda a tantas páginas como sea necesario
la wiki de prueba.

Abusar de las expresiones regulares no dañará el rendimiento de Wikipedia, pero limita que la información de búsqueda de expresiones regulares fluya hacia otros lugares.

Sólo las expresiones regulares interpretan caracteres de espacios grises. La fuente interna normal, como en cualquier otro lugar, ignora los caracteres de espacio gris. Entonces insource:"M S"coincide m/s, al igual que insource:"M-S"y insource:"m=s". Pero insource:/M\/S/lo coincidirá, y la versión filtrada también lo hará: insource:"M/S" insource:/M\/S/. El insource:"word1 word2"filtro es el filtro más obvio para insource:/word1 word2/, donde las dos palabras de wikitexto solo están separadas por puntuación y espacio. Digamos que la cadena de destino es {{Val|9999|ul=m/s|fmt=commas}}:

insource:"val 9999 ul m s fmt commas"→ coincidir
hastemplate: val insource:"9999 ul"→ coincidir
hastemplate: val insource:"999"→ no hay coincidencia
hastemplate: val insource:"fmt commas"→ coincidir
hastemplate: val insource:"ul m"→ coincidir
hastemplate: val insource:"ul M S"→ coincidir
hastemplate: val insource:fmt→ coincidir

Insource busca palabras secuencialmente, pero la coincidencia podría ocurrir en cualquier parte de la página, no necesariamente dentro de {{template markup}}. Para esto existe {{ uso de plantilla }} y coincide con cualquier expresión regular dentro de la plantilla.

Para una precisión completa, utilice /regex/. Por ejemplo, para encontrar cualquier URL simple dentro de , con , es posible que no puedas usar el . Adoptando un enfoque cauteloso, antes de probar la expresión regular completa, cree un dominio de búsqueda de menos de 10 000 páginas. Comenzando con dos filtros, prefijo e interno:<ref name=name>...</ref>[external link brackets label]ref name=nameinsource:"ref http server com"

insource: "ref http" prefix:A 98.000 son demasiados para empezar.
insource: "ref http" prefix:AA 1000 es bueno.
Así que intenta agregar un término de expresión regular insource:/\<ref[^>]\> *\[?https?:\/\/[^][<> "]+\]? */cero para el prefijo: AA, uno para el prefijo: AB
Así que intenta simplemente insource:/\<ref[^>]\>y luego prueba con prefix:AA zero; prueba AB, uno.
Observa que olvidó el modificador para [^>]*.
insource: "ref http" insource:/\<ref[^>]*\> prefix:AB. Hay3700 y eso está bien.
Experimente más. Luego decide hacer el proyecto en los segmentos AA, AB, AC,... ZZ.
insource:/\<ref[^>]*\> *\[?https?:\/\/[^][<> "]+\]? */ insource: ref prefix:AA

Tenemos el único filtro posible insource: ref prefix:AA. Ese filtro produce un dominio de búsqueda de expresiones regulares de solo 2300. El filtro insource: ref prefix:Aproduce un dominio de búsqueda de264 000 . Es posible ejecutar la expresión regular en tantas páginas y produce64 000 resultados.

Para encontrar una URL más específica, diga yahoo.brand.edgar.com, use insource: "http yahoo brand edgar com" (o corte y pegue la URL completa, barras, puntos y todo; no importa). Haga otra búsqueda con la versión https. Estas búsquedas tienen más flexibilidad que Special:LinkSearch . No es necesario ningún filtro, pero cada búsqueda siempre se beneficia de información adicional: cualquier palabra, cualquier frase y la mayoría de los parámetros.

Enlaces a

LinkstoInforma enlaces wiki a un nombre de página.

Linksto sólo acepta un nombre de página completo canónico. Utilice la línea del título. Si el título no comienza con una letra mayúscula, o si no está seguro de la línea del título por algún motivo, puede obtener una vista previa {{FULLPAGENAME}}al editar la página.
Linksto distingue entre mayúsculas y minúsculas.
Se encuentran alias de espacios de nombres, pero no se aceptan como entrada.
Linksto no encuentra redirecciones. Si desea todos los enlaces al contenido , deberá buscar el nombre de cada página de redireccionamiento .
Linksto no informa la página dada como un enlace a sí misma, incluso cuando hay enlaces internos de sección a sección.
Linksto no encuentra enlaces wiki de estilo URL a una página.
Los enlaces de navegación colapsados no son informados por linksto, pero sí por WhatLinksHere.

Linksto informa enlaces wiki a un nombre de página, incluso si el enlace wiki es

a una sección.
desde un enlace de subpágina .
oculto en una transclusión ("detrás" de una plantilla que forma un wikilink).

Linksto puede diferir de la herramienta " Qué enlaces aquí ", porque el dominio de búsqueda de " Qué enlaces aquí " es todo . Los enlaces a los resultados de búsqueda se encuentran en su dominio de búsqueda predeterminado. (También linkstoinforma el recuento, al igual que todas las búsquedas).

Además del wikitexto, busca dentro de una página el contenido transcluido.

primero y luego escanee el contenido. ^[20] Por ejemplo

linksto:"Mozart and scatology"

informará una lista de 300 artículos que enlazan con él, al igual que " Qué enlaces aquí ". Pero Mozart y la escatología en realidad sólo están vinculados 15 veces por los autores de contenidos . El resto se debe a Mozart y la escatología en Plantilla: Wolfgang Amadeus Mozart en las páginas no deseadas. Se desea la plantilla, pero la referencia a "enlaces a" probablemente no. ^[21]

El truco para solucionar esto y encontrar todos los enlaces de autoría a un artículo es una búsqueda con expresiones regulares:

: insource:"pagename" insource:/\[\[ *[Pp]agename *[]|]/

Esa búsqueda encontrará artículos solo porque el inicial : limita el dominio de búsqueda inicial al espacio del artículo, sin importar cómo esté configurado su dominio de búsqueda predeterminado. Encontrará todos los enlaces muchas veces más rápido que una simple expresión regular, porque el primer insourcetérmino crea instantáneamente el dominio de búsqueda refinado que establece los límites adecuados para la búsqueda de expresiones regulares. Una expresión regular puede adaptarse a las variaciones encontradas en el wikitexto permitidas por los permisos de los wikilinks: 1) el metacarácter *permite "cero o más" caracteres de espacio antes y después del título, y 2) la [clase de carácter] al principio permite la utilización de mayúsculas relajada en el primer carácter de cualquier nombre de página, y 3) la clase de carácter al final encuentra el enlace, ya sea que esté etiquetado mediante el carácter de barra vertical | o cerrado mediante el corchete ] del wikilink.

Los enlaces a transclusiones son manejados por hastemplate .

Ordenar resultados

La puntuación general de una página determina su lugar en los resultados de búsqueda.

Un mejor partido aumentará el marcador.

Una coincidencia de sección cero (sección principal) es mejor que una sección numerada.
Una coincidencia de título o encabezados es mejor que una coincidencia de sección principal.
Una mayor frecuencia de un término de búsqueda es mejor.
Una coincidencia directa es mejor que una coincidencia derivada.
Cuando se encuentran varias palabras en muchos documentos, es mejor un orden coincidente .
Una malla más alta (más enlaces hacia y desde una página) es mejor.

La "importancia" de Wikiproject y las evaluaciones de la calidad de los artículos pueden tener en cuenta. La búsqueda desde una página, sus categorías, wikidata y ubicación geográfica pueden tener en cuenta.

Sabiendo esto es posible que puedas encontrar mejor, por ejemplo, un título que recuerdas a medias. El uso de intitle puede distorsionar demasiado los resultados debido al orden de las palabras. Úselos en una búsqueda de palabras y dependa de la clasificación de la página. Las palabras titulares aparecerán en la parte superior.

Para tener una idea de cómo podría funcionar CirrusSearch, consulte mw:Search/Old#Search_Weighting_Ideas.

Para ordenar los resultados de la búsqueda por fecha, utilice prefer-recent . Para ordenar los resultados de la búsqueda por uso de plantilla, utilice boost-template .

Más como

El morelikeparámetro de búsqueda enumera todos los artículos que se comparan en frecuencia y longitud de palabras con uno o más artículos determinados.

morelike: pagename | pagename2 | ... | pagename50

No se necesitan comillas y el espacio no es importante.
Se aplican mayúsculas y los nombres de páginas mal escritos fallan silenciosamente.
Se aceptan redirecciones; Se utiliza el título del artículo de destino.
un nombre de página con un espacio de nombres falla silenciosamente.
wp:los atajos fallan silenciosamente. (Un acceso directo redirige desde el espacio del artículo al espacio del proyecto).
No se permiten otros parámetros de búsqueda ni otros términos junto con morelike .

Morelike calcula una búsqueda de varias palabras.

: word1 word2 ... wordN

Véalos resaltados en el fragmento.

Morelike busca los nombres de las páginas dadas en el índice de búsqueda, crea un agregado de frecuencia de palabras y un agregado de longitud de palabras a partir de todas las palabras, y calcula una búsqueda de varias palabras basada en esas configuraciones variables internas. Es una búsqueda costosa.

Por ejemplo, digamos que busca

morelike:William H. Stewart

luego elija un nombre de esa lista y agréguelo

morelike:William H. Stewart|Leroy Edgar Burney

luego agregue más nombres, hasta que tenga cinco nombres de páginas de entrada. Luego podría comenzar a ajustar ciegamente esta consulta más parecida a la calculada automáticamente , diciendo el siguiente tipo de cosas: Hacer la consulta calculada

al menos cinco palabras
una longitud mínima de siete palabras
una frecuencia mínima de palabras de tres
Como máximo cuatro de los cinco nombres de páginas deben tener el término.
Al menos tres de ellos deben tener el plazo.

Luego, digamos, ajusta el número de nombres de páginas de entrada que tienen una palabra a dos (de cinco). https://en.wikipedia.org/w/index.php?title=Special:Search&profile=default&search=morelike:ant%7Cbee%7Cwasp%7CEusociality%7Ctermite&fulltext=Search&cirrusMtlUseFields=yes&cirrusMltFields=opening_text&limit=1150

También puede encontrar artículos similares basándose solo en el título, o solo en los encabezados, o solo en la sección principal.

&cirrusMtlUseFields=sí&cirrusMltFields= título
&cirrusMtlUseFields=si&cirrusMltFields= encabezados
&cirrusMtlUseFields=si&cirrusMltFields= texto
&cirrusMtlUseFields=si&cirrusMltFields= texto_auxiliar
&cirrusMtlUseFields=sí&cirrusMltFields= texto_apertura
&cirrusMtlUseFields=si&cirrusMltFields= todos

Los resultados de la búsqueda dependen de Mltvariables internas ( , más como esto), configurables a través de la URL, sobre qué palabras buscar:

Por ejemplo, aquí se muestra cómo se ve la barra de direcciones (barra de búsqueda convertida) para una búsqueda más parecida a las secciones principales de dos artículos, en comparación con otras secciones principales: https://en.wikipedia.org/w/index.php?title =Special:Search&profile=default&search=morelike:William+H.+Stewart%7CLeroy+Edgar+Burney&fulltext=Search&cirrusMtlUseFields=yes&cirrusMltFields=opening_text Observe el final que contiene los dos parámetros de URL agregados que activaron una capacidad más similar .

Preferiblemente reciente

Puede ordenar los resultados de la búsqueda por fecha.

prefer-recent:
prefer-recent:recent,boost

Va a cualquier parte de la consulta. El valor predeterminado es 160 días como "reciente" y aplica su fórmula de impulso al 60% de la puntuación. La fórmula no es el multiplicador habitual, es un multiplicador exponencial, potencialmente mucho más potente. Esto le permite funcionar donde el valor predeterminado para "reciente", en lugar de ser 160 días, puede ser tan solo 9 segundos. Si su "reciente" significa 9 segundos, useprefer-recent:0.0001

Por ejemplo, si solo está interesado en los relativamente pocos artículos que han cambiado en la última semana, utilice 7 en su lugar. La forma en que funciona esto es que todos los artículos de más de siete días solo se potencian la mitad, y todos los artículos de más de 14 días se potencian la mitad nuevamente, y así sucesivamente.

El impulso es más que el multiplicador habitual, es exponencial. El factor utilizado en el exponente es el tiempo desde la última edición. Cuanto mayor sea el tiempo transcurrido desde la última edición, menor será el impulso. La fórmula es e ^−t , donde t es el intervalo en días o el intervalo de interés.

Agregar prefer-recent al comienzo de una búsqueda. Le dará un impulso a los artículos editados más recientemente en los resultados de búsqueda. La forma general es

prefer-recent:proportion_of_score_to_scale,half_life_in_days

Este parámetro acepta dos argumentos separados por comas para permitir ajustar la configuración predeterminada. De forma predeterminada, esto escalará el 60 % de la puntuación de manera exponencial con el tiempo transcurrido desde la última edición, con una vida media de 160 días. Entonces el valor predeterminado es prefer-recent:0.6,160.

Esto se puede cambiar para aumentar el peso:

prefer-recent:0.8,360

o disminuirlo:

prefer-recent:0.4,10

La proporción_de_puntuación_a_escala debe ser un número entre 0 y 1 inclusive. Half_life_in_days debe ser mayor que 0 pero permite puntos decimales, por lo que funciona bastante bien para ordenar tiempos de edición cercanos si son muy pequeños.

Por ejemplo prefer-recent:0.6,0.0001funciona con una vida media de 8,64 segundos.

Eventualmente esto estará activado de forma predeterminada para Wikinews.

Plantillas de impulso

Boost-templates :" " agrega peso a las páginas con la plantilla o plantillas proporcionadas (plural). El uso de este parámetro de búsqueda anula la función normal de mejora de plantilla de la Búsqueda. No utilice este parámetro de búsqueda sin proporcionar el argumento de aumento de peso a menos que desee deshabilitar la función de ponderación de plantilla para la búsqueda.

El formato general es

boost-templates:"Template:pagename|parameter Template:pagename|parameter"

Verá, normalmente el mensaje del sistema ^[22] titulado MediaWiki:cirrussearch-boost-templates aumenta la puntuación de los siguientes nombres de páginas completas: Plantilla:Artículo destacado|200% Plantilla:Imagen destacada|200% Plantilla:Sonido destacado|200% Plantilla:Destacado lista|175% Plantilla:Buen artículo|150% Plantilla:Categoría Sockpuppet|5% Plantilla:Categoría de mantenimiento|5% Plantilla:Categoría oculta|5% Plantilla:Categoría de seguimiento|5% Plantilla:Clase de categoría|5% Plantilla:Importancia de la categoría |5% Plantilla:CatTrack|5% Plantilla:Categoría de plantilla|5%. Estos son los nombres reales de las plantillas y su impulso real. Estos se reemplazan durante el uso de las plantillas de refuerzo .

Por ejemplo, una búsqueda de "fenómeno" Y "conferencia", con las plantillas Enlace de búsqueda y expresión regular teniendo la puntuación de ponderación de las páginas en las que se encuentran multiplicada por 1,5 y 2,25 respectivamente, ignorando todas las demás plantillas (deteniendo la suma de cualquier puntuación para cualquier otra plantilla):

phenom lecture boost-templates:"Template:search link|150% tlusage|225%"

Boost-templates se diferencia de hastemplate en

el espacio de nombres predeterminado
gramática. Boost-templates tiene una forma plural y utiliza un guión entre las palabras.
sintaxis. Las plantillas de impulso requieren comillas.
función. Hastemplate es un filtro, pero boost-templates no lo es; solo cambia una puntuación.
Boost-template tiene un parámetro para controlar el impulso .

Si solo desea que los resultados de su búsqueda incluyan solo páginas con ciertas plantillas, use hastemplate una o más veces para filtrar las páginas que no las tienen. De lo contrario, elija un multiplicador similar al mensaje del sistema que se muestra arriba. Multiplicar la puntuación de una página por 10 se realiza con 1000% y probablemente enmascarará todas las demás funciones de ponderación, como "cuando las palabras de búsqueda coinciden en el título", tendrá poco efecto en la presentación de los resultados de la búsqueda y no se recomienda porque afecta el orden de toda la lista.

Ya sea hastemplate o boost-templates, uno puede ir a cualquier parte de la consulta, cada uno con otros términos a cada lado. es un término en una consulta que puede ir a cualquier parte de la consulta y tener otros términos a ambos lados.

Insectos

Problemas relevantes en CirrusSearch :

T73123: el nombre de la página no puede tener comillas dobles "marca: incategoría o título
El carácter de tilde ~ no debería afectar al allparámetro, por ejemplo ~all:hephalump. ~ al principio no solo no navega , sino que tampoco crea una página, y todo esto sin interferir con ningún argumento del espacio de nombres, sino que sí interfiere con el pseudo-espacio de nombres "todos".
T124272 El uso de AND y OR en la misma consulta no funciona como se esperaba
Una búsqueda de frase puede abarcar un signo numérico #, pero no un carácter de asterisco *. Esto es inconsistente.
T119806 cm2no encuentra , no encuentra , donde el superíndice son caracteres Unicode.cm²m3m³
El cuadro de diálogo del perfil de búsqueda es difícil de eliminar. Incluso después de que el perfil de búsqueda vuelva al valor predeterminado, continúa mostrándose.

Soluciones alternativas

Utilice AND entre dos frases, por ejemplo "one two" AND "three four", para evitar seis artículos no deseados relacionados con la comilla doble ".

Solución de problemas

https://test.wikipedia.org/
Cambie el backend añadiendo el sufijo URL: &srbackend=LuceneSearcho&srbackend=CirrusSearch
Notas de lanzamiento

Búsqueda indexada

Todas las páginas de Wikipedia son escaneadas e indexadas por el propio motor de búsqueda de Wikipedia . Todo el wiki se trata como un "texto completo" guardado en una base de datos separada (un "índice") creada sólo para realizar búsquedas. Es como el índice de un libro, pero prácticamente cada palabra y cada número está indexado en cada página. ^[23]

Dado que cada palabra en el índice de búsqueda prediseñado ya apunta a las páginas que la contienen, una búsqueda de palabras clave generalmente corresponde a una búsqueda de un único registro en el índice. (Esto también es cierto para las frases, hasta cierto punto). Las "búsquedas de índice" básicamente no tardan en ejecutarse. Son baratos y abundantes.

Hay índices separados que se mantienen actualizados para:

títulos
contenido visual
wikitexto
plantillas

Cualquier texto transcluido de una plantilla se indexa como si realmente estuviera presente en su página de destino . (En otras palabras, de forma predeterminada, una búsqueda de palabras clave se realiza en el texto de la página de Wikipedia representada , no en la fuente de la página en sí. Sin embargo, puede cambiar esto usando para buscar el marcado de origen en lugar de la página representada).insource:keyword

La preparación y el mantenimiento de los índices de búsqueda se realizan mediante los servidores de Wikipedia, en segundo plano, casi en tiempo real. Tan pronto como guardes la página, unos segundos después podrás buscar los cambios que acabas de realizar. Para las plantillas que se incluyen en muchas páginas, la propagación de esos cambios a todas las páginas del índice puede tardar un tiempo.

El índice se basa en caracteres alfanuméricos; no almacena información sobre caracteres no alfanuméricos. Si escribe puntuación o corchetes en el cuadro de búsqueda al realizar una búsqueda indexada, esos caracteres se descartarán silenciosamente.

Una búsqueda indexada básica

busca sólo el espacio del artículo de forma predeterminada.
coincide sólo con letras y números . Generalmente esto no es un problema.
obtiene muchos resultados de búsqueda. Depende en gran medida de las reglas de clasificación de páginas. Luego, puede refinar los resultados de la búsqueda según las páginas principales. Esto se hace con el filtro no , indicado por un signo menos adjunto al frente de la palabra no deseada para filtrar el ruido de las visitas a la página que no podría haber predicho.
es un "comparador agresivo" que incluye tantas páginas como sea posible al hacer coincidir todas las formas de cada palabra que ingresa.

Búsqueda de expresiones regulares

En lugar de realizar una búsqueda indexada básica de palabras clave, puede realizar una búsqueda de expresiones regulares , que omite el índice. Una búsqueda de expresiones regulares escanea el texto de cada página de Wikipedia en tiempo real, carácter por carácter, para encontrar páginas que coincidan con una secuencia o patrón de caracteres específico. A diferencia de la búsqueda de palabras clave, la búsqueda de expresiones regulares distingue entre mayúsculas y minúsculas de forma predeterminada, no ignora la puntuación y opera directamente en la fuente de la página (marcado MediaWiki) en lugar de en el contenido representado de la página.

Para realizar una búsqueda de expresiones regulares, utilice el cuadro de búsqueda normal con la sintaxis o . La expresión denota una expresión regular en la sintaxis de expresión regular con sabor a MediaWiki.insource:/regex/intitle:/regex/regex

Utilice expresiones regulares de forma responsable

Debido a que la búsqueda de expresiones regulares escanea cada página carácter por carácter, generalmente es mucho más lenta que una búsqueda de índice. Puede (y debe) agregar términos de búsqueda adicionales cuando los utilice para reducir la cantidad de texto que se procesa. Por ejemplo:insource:/regex/

polish insource:/polish/busca páginas que coincidan con una búsqueda de palabras clave derivadas que no distinguen entre mayúsculas y minúsculas para "polaco" (incluido "pulido" o "pulido"); luego realiza una búsqueda de expresiones regulares que distingue entre mayúsculas y minúsculas dentro de esas páginas. Sólo se devuelven las páginas que coinciden con ambos filtros.

insource:polish insource:/polish/es similar, pero comienza con una búsqueda que no distingue entre mayúsculas y minúsculas del marcado de origen en lugar de la página representada (por lo que encontrará usos como Polesy no transclusiones).

intitle:, incategory:, y linksto:son excelentes filtros. ^{[ se necesita aclaración ]}

hastemplate:es un buen filtro. ^{[ se necesita aclaración ]}

Agregar un término de búsqueda basado en índice para reducir la cantidad de texto que se escanea es importante simplemente para que su propia búsqueda de expresiones regulares finalice en un período de tiempo razonable. Las búsquedas de expresiones regulares que toman demasiado tiempo "caducarán" y devolverán solo resultados parciales. El uso excesivo de búsquedas lentas de expresiones regulares puede provocar una limitación temporal de la función para usted y/o para todos los usuarios de Wikipedia. (Sin embargo, no se puede afectar el rendimiento del sitio de Wikipedia en su conjunto simplemente abusando de la búsqueda de expresiones regulares). Recuerde que una sola búsqueda de expresiones regulares puede tardar varios segundos y actualmente hay 47.752.020 usuarios registrados en Wikipedia. Utilice la búsqueda de expresiones regulares de manera responsable.

Metacaracteres

La sintaxis de expresiones regulares de MediaWiki funciona así:

La mayoría de los personajes se representan a sí mismos. Por ejemplo, insource:/C-3p0/buscará páginas que contengan la cadena literal "C-3p0" (distingue entre mayúsculas y minúsculas).
Los siguientes metacaracteres reciben un tratamiento especial: . + * ? | { [ ] ( ) " \ # @ < ~. Se puede omitir cualquier metacarácter precediéndolo con una barra invertida \. Preceder cualquier otro carácter con una barra invertida es inofensivo. Por ejemplo, insource:/yes\.\no/buscará páginas que contengan la cadena literal "yes.no" (distingue entre mayúsculas y minúsculas). Los expertos en expresiones regulares deben tener en cuenta que \nno significa "nueva línea", \dno significa "dígito", etc.: en la sintaxis de MediaWiki, el único uso de \es escapar de los metacaracteres.
/es especial porque indica el final de la expresión regular. Por ejemplo, insource:/yes/no/se trata de la misma manera que insource:/yes/ no(porque la búsqueda de palabras clave no/ignora la puntuación). El /carácter debe tener una barra invertida en todos los lugares donde aparece dentro de una expresión regular, incluso dentro de corchetes o comillas.
.coincide con cualquier carácter individual. Por ejemplo, insource:/yes.no/coincide con yes/no, yes no, yesuno, etc.
( )agrupar una secuencia de caracteres en una unidad atómica.
|va entre dos secuencias y coincide con cualquiera de ellas. Por ejemplo, insource:/a(g|ch)e/coincide con ageo ache.
+coincide con el carácter o grupo anterior una o más veces. Por ejemplo, insource:/ab+(cd)+/coincide con abcd, abbbcd, abbcdcd, etc. insource:/a(g|ch)+e/coincide con agge, achgchchggche, etc.
*coincide con el carácter o grupo anterior cualquier número de veces (incluido cero). Por ejemplo, insource:/ab*(cd)*/coincide con a, abbb, acdcd, etc.
?coincide con el carácter o grupo anterior exactamente cero o una vez.
{ }coincide con el carácter o grupo anterior un número fijo de veces. Por ejemplo, insource:/[a-z]{2}/coincide exactamente con 2 letras minúsculas seguidas. insource:/[a-z]{2,4}/coincide con cualquier cadena de 2, 3 o 4 letras minúsculas. insource:/[a-z]{2,}/coincide con cualquier cadena de 2 o más letras minúsculas.
[ ]introduzca una clase de carácter , que coincida con una única instancia de cualquiera de los caracteres de la clase. Por ejemplo, insource:/[Pp]olish/coincide con Polishy polish. Por lo general, no es necesario escapar de los caracteres entre corchetes, aunque escapar de ellos sigue siendo inofensivo y /aún así es necesario escapar de ellos en todas partes. Por ejemplo, insource:/[.\/\]\n]/coincide con una única instancia de ., /, ]o n.
Dentro de una clase de carácter, el carácter ^(si aparece primero) representa la negación y el carácter -(a menos que aparezca primero o último) representa un rango. Por ejemplo, insource:/[A-Za-z0-9_]/coincide con cualquier carácter alfanumérico o guión bajo y insource:/[^A-Za-z]/coincide con cualquier carácter no alfabético.
< >representan números tratados como números, no como caracteres. Por ejemplo, insource:/AD <476-1453>/coincide con AD 476, AD 477, ... AD 1452, AD 1453pero no AD 1474. (Pero también coincidirá con los primeros seis caracteres de AD 4760.)
~"mira hacia adelante" y niega el siguiente personaje o grupo. Por ejemplo, insource:/crab~(cake)c/debe coincidir con los primeros cinco caracteres de, crabclawpero no con los primeros cinco caracteres de crabcake. ^{[ se necesita aclaración ]}

Hay algunas peculiaridades adicionales de la sintaxis:

El metacarácter @es sinónimo de .*(coincide con cualquier secuencia de caracteres).
Aunque una búsqueda insource:/0/fracasa insource:/1/y insource:/\0/ambos tienen éxito.
" "son un mecanismo de escape, como los corchetes o la barra invertida. Por ejemplo, insource:/".*"/significa lo mismo que insource:/\.\*/.
El personaje #también es un metacarácter y se debe escapar. ^{[ se necesita aclaración ]}
Los expertos en expresiones regulares deben tener en cuenta que \neso no significa "nueva línea", \dno significa "dígito", etc.
Los expertos en expresiones regulares deben tener en cuenta que eso ^no significa "principio del texto" ni $"fin del texto". Por lo general, buscar desde el principio o el final de una página de Wikipedia no es útil.

Soluciones alternativas para algunas clases de personajes

Aunque las clases de caracteres \n, \s, \Sno son compatibles, puedes utilizar estas soluciones:

^ Para excluir también el carácter de tabulación, cópielo y agréguelo al conjunto de caracteres.

En estos rangos, " " (espacio) es el carácter que sigue inmediatamente a los caracteres de control , "!" es el carácter que sigue inmediatamente al espacio y "̏" es U+10FFFF, el último carácter en Unicode . Por lo tanto, el rango de " " a "̏" incluye todos los caracteres excepto los caracteres de control (de los cuales los artículos pueden contener nuevas líneas y tabulación), mientras que el rango de "!" a "̏" incluye todos los caracteres excepto los caracteres de control y el espacio.

Notas

^ El dominio de búsqueda predeterminado de algunos usuarios son todos espacios de nombres. En casos como la búsqueda de expresiones regulares, el motor de búsqueda se protege limitando todas las búsquedas de expresiones regulares. Una expresión regular simple que recorre millones de páginas puede tardar más de veinte segundos e incluso puede costarle un tiempo de espera de HTML. Durante ese tiempo se permiten muy pocas búsquedas de expresiones regulares. Utilice siempre un filtro con expresiones regulares.
^ La búsqueda de un signo igual requiere el uso de una expresión regular. Como con cualquier plantilla, use {{ = }} o |1=para pasar un signo igual a cualquier parámetro, incluso la etiqueta del enlace.
^ Los editores avanzados que comienzan a buscar otras páginas de Wikipedia pueden en ocasiones establecer su dominio de búsqueda predeterminado (en Especial: Búsqueda avanzada ) en todos . Configurar la búsqueda en todos es el escenario más probable para "configurar y olvidar". Dado que eso incluye el espacio del artículo, los resultados habituales son comparables.
^ A diferencia de otros datos que califican la clasificación de una página, los datos de ubicación y frecuencia de palabras se pueden mantener actualizados en el índice en todo momento. Para cada palabra de la wiki, el índice almacena una lista de nombres de páginas donde se puede encontrar esa palabra. Junto con el nombre de la página, también se almacenan las ubicaciones y el recuento de las palabras. Apache Lucene es el indexador y mantiene los datos; utiliza el término algoritmo de frecuencia. Para saber cómo hace esto, consulte Similitud TFIDF.
^ A diferencia de los índices de búsqueda, los datos de clasificación de páginas no se actualizan inmediatamente. Cuando la cantidad de enlaces entrantes ha cambiado más del 20%, se actualiza.
^ {{enlace de búsqueda}} siempre genera consultas completamente especificadas, incluso si no se proporciona ningún espacio de nombres, porque de forma predeterminada es el espacio del artículo.
^ Una frase se extenderá sobre espacios en blanco a menos que contenga una viñeta. Una frase puede extenderse a un elemento de una lista ordenada, pero no a un elemento de una lista desordenada. En otras palabras, puede extenderse sobre un signo numérico #, pero no sobre un carácter de asterisco *. El asterisco tiene un significado especial para el analizador. Se utiliza para crear un elemento en una lista desordenada y además se utiliza como modificador en la búsqueda.
^ Consulte el "tokenizador" de ElasticSearch que desarrolló CirrusSearch.
^ La derivación, al igual que la clasificación de páginas, es solo un algoritmo informático y tiende a necesitar ajustes ocasionales.
^ CirrusSearch usa kstem para el paquete lematizador, según T56022.
^ También puedes utilizar el parámetro insource para desactivar la derivación. Además, tenga en cuenta que T113838 detalla este error relacionado: cuando la derivación está desactivada para una palabra, las páginas enumeradas en los resultados de búsqueda son correctas (no tienen variantes solo con derivación, todas tienen la palabra tal como se indica), pero cualquier Los tallos cortados se resaltan incorrectamente.
^ Esto no se puede probar en una búsqueda de ejemplo de esta página, pero funcionará en otra página que no contenga este ejemplo. Esto se debe a que la coincidencia, que aquí se muestra en negrita como prueba, prefiere el orden correcto. Se puede probar colocando el texto de destino en otra página y luego cambiando la consulta (en la página de resultados de búsqueda) iniciando aquí a esa página.
^ El espacio de nombres de búsqueda coincide con el primer parámetro de una consulta. Esto es consistente con su uso en navegación, wikilinking, transclusión y denominación de páginas, donde siempre es la primera palabra en el campo.
^ Para ver todos los espacios de nombres, vaya a la página de resultados de búsqueda y haga clic en Avanzado. El espacio de nombres predeterminado se muestra entre paréntesis.
^ El texto completo de cada palabra en la wiki más cada palabra en cada archivo adjunto cargado se indexa en conjunto en una base de datos de búsqueda. CirrusSearch puede analizar e indexar miles de formatos.
^ Los caracteres no permitidos en los nombres de las páginas son # < > [ ] | { }.
^ Siempre consulte la barra de búsqueda para ver su indicación. Activar el panel Avanzado puede mostrar el dominio de búsqueda predeterminado, y el cuadro de búsqueda es muy obvio con un espacio de nombres o un término de prefijo. Una forma de hacerlo es hacer clic en la barra de búsqueda de dominio de búsqueda en lugar de hacer clic en el botón de búsqueda. La única vez que esto no funciona es cuando se cambian los dominios de búsqueda en la pestaña Avanzado: después de cambiarlos, debe presionar Buscar, no Avanzado.
^ Para obtener deepcat como parámetro de búsqueda, instale un gadget que genere automáticamente incategory:pagename1|pagename2|...|pagename70. Para ver el número de subcategorías y ver si había más o menos de 69, vaya hacia adelante y hacia atrás en el historial del navegador, o vea el HTML fuente de la página de resultados de búsqueda, el atributo <título>
^ En informática es común delimitar una /expresión regular/ con barras.
^ En realidad, la búsqueda no se realiza página por página, pero el índice de la wiki se construye página por página de esta manera.
^ Haciendo cosas como agregar una plantilla de navegación de Mozart a cada página sobre Mozart [[wp:wikignomes|]] apuntala la infraestructura wiki. La autoría, por otra parte, escribe la prosa de una página, una página a la vez. (No puedes eliminar los enlaces no deseados con -hastemplate:"Wolfgang Amadeus Mozart".
^ Un mensaje del sistema es el valor de una variable de operaciones de MediaWiki. Puede consistir en un fragmento de texto sin formato, texto wiki, CSS o Javascript. Un mensaje se utiliza para personalizar el comportamiento de MediaWiki, especialmente en lo que respecta a la interfaz de usuario tal como la ven los lectores, pero también incluye la forma en que aparece como un mensaje simple, y esto para cada idioma y ubicación.
^ Cuando realiza una búsqueda básica de palabras clave en Wikipedia, no está escaneando páginas en tiempo real; simplemente estás buscando una entrada en el índice. Todo el contenido es en todo momento "conocido" y reside en índices. Entonces, cuando lees algo como "buscar páginas que contengan...", puedes reemplazar mentalmente "buscar..." por "buscar en el índice ..."

Desarrollar expresiones regulares enun anunciocaja de arena específica

Las expresiones regulares son pequeños programas de computadora, por lo que es característico de las búsquedas de expresiones regulares que deben escribirse mientras se estudian los datos de destino y probarse para lograr su precisión y minuciosidad potenciales. Sin embargo, técnicamente sólo algunas de estas búsquedas intensivas pueden ejecutarse a la vez en la base de datos. ^[1] Un sandbox minimiza su huella y garantiza que nunca ejecutará una expresión regular no probada en cada espacio de nombres en la wiki, incluso si su búsqueda predeterminada le permitiría hacerlo.

Aunque una búsqueda normal dirigida a todo el wiki se ejecutará rápidamente, una búsqueda con expresiones regulares debe apuntar al menor número posible de páginas mediante el uso de filtros para poder ejecutarse rápidamente. Un filtro es parte o la totalidad de una consulta de base de datos . Los filtros incluyen:

palabra(s) o frase
título:
categoría:
plantilla has:
prefijo: (siempre al final)
enlaces a:
espacio de nombres: (siempre al principio)
fuente interna: "palabra1 palabra2"
fuente interna: palabra

El orden no es importante porque el software optimiza la búsqueda antes de ejecutarla.

Para apuntar solo a una página mientras experimenta o desarrolla una búsqueda de expresiones regulares, oriente un nombre de página completo. Desde el cuadro de búsqueda utiliza el filtro . Desde el cuadro de edición (de cualquier sección de la página con los datos de destino), siempre puede simplemente escribir y se "expandirá" al nombre completo de la página. Aunque puede editar una página de historial, técnicamente una "página de historial" no es una página (en la base de datos), por lo que {{FULLPAGENAME}} apuntará a la versión de la base de datos (no a su propia representación). Por la misma razón, no puedes buscar el wikitexto en una página que aún no esté guardada (en la base de datos), aunque ciertamente puedes cambiar los parámetros de búsqueda una y otra vez sin necesidad de guardarlos .prefix:fullpagenameprefix:{{FULLPAGENAME}}

El nombre de página completo es espacio de nombres: nombre de página . Sabiendo esto puedes ajustar tu parámetro Prefijo. Aunque el prefijo puede filtrar hasta una página, puede filtrar hasta un espacio de nombres y también acepta las letras iniciales de un conjunto de nombres de páginas si desea reducir el dominio de búsqueda del espacio de nombres.

El sandboxing de expresiones regulares utiliza un sandbox ad hoc creado editando cualquier página que contenga los datos de destino y usándola como un "sandbox" (sin editarla para guardarla). Luego se desarrolla agregando un enlace de búsqueda que incluye insource:/ regexp /, con el prefijo de filtro:{{FULLPAGENAME}} al lado.

El uso de una zona de pruebas permite la huella más pequeña posible mediante el uso de filtros para limitar el dominio de búsqueda. Una vez que se perfecciona su patrón de expresión regular, aumenta el dominio de búsqueda. Una búsqueda de expresiones regulares se ejecuta mejor con filtros, no sola, incluso si es una rexexp pulida.

Procedimiento de zona de pruebas

En lugar de usar el cuadro de búsqueda, donde ingresar un signo igual y un carácter de barra vertical y "comillas entre frases" es una cuestión sencilla, sigue siendo más fácil usar una plantilla de vínculo de búsqueda basada en expresiones regulares: {{ regex }} o { { tlusage }} : en la página con datos de muestra, porque luego puede concentrarse en los datos de destino allí y en escribir el patrón de expresión regular. Es más fácil, claro está, si ya entiendes cómo las plantillas "escapan" del carácter de barra vertical y del signo igual. Consulte Ayuda: Plantilla#Parámetros para obtener otros detalles importantes.

El procedimiento aquí es un ciclo iterativo de lectura, evaluación y modificación. El desarrollo de expresiones regulares requiere que estudie los datos de destino mientras escribe y reescribe su patrón.

Navegue a una página con las instancias de wikitexto que le interesa extraer. O cree uno usted mismo y guárdelo en la base de datos para que la consulta lo encuentre.
Abra el wikitexto e ingrese una {{ regex }} o {{ tlusage }} .
Mostrar vista previa y activar el enlace de búsqueda. En la página de resultados de búsqueda, observe el texto en negrita en cada coincidencia.
Vuelve a tu navegador. Modifique la expresión regular y realice el ciclo hasta terminar. (O no regrese, es posible que desee modificar la consulta en el cuadro de búsqueda).
Amplíe el dominio de búsqueda y pruebe la precisión de esos resultados. Puede recortar o ampliar el número de resultados utilizando el prefijo: .

Advertencia : si cambia el objetivo para una nueva prueba inmediata , tendrá que guardar y purgar , pero no si simplemente cambia la expresión regular.

Ejemplos

Como entorno de pruebas ad hoc , puede mostrar el wikitexto de una sección como esta (ya guardada en la base de datos), modificar algunos de los patrones en las llamadas a la plantilla de enlace de búsqueda de expresiones regulares en esta página, hacer una vista previa y ver qué coincide cuando haces clic en el enlace de búsqueda de expresiones regulares recién formado, todo de forma bastante segura y sin cambiar nada en la base de datos.

Las llamadas de plantilla que producen "1 pie/s ,2 pies cuadrados ,3m/s ,4m*s-2 ,5 pies s-2 ,6 °C/J , y7 J/C " aparecen en el wikitexto de esta sección así:

{{val|1|ul=ft/s|fmt = commas}}
{{val|2|u=ft2}}
{{val|3|u=m/s| fmt =commas }}
{{val|4|u=m*s-2}}
{{val|5|u=ft.s-2}}
{{val|6|u=C/J}}
{{val|7|ul=J/C}}

Observe cómo los objetivos anteriores están |numerados|, luego haga clic en los enlaces a continuación.

En el segundo trimestre , observe cómo el software MediaWiki ignora los espacios alrededor de los parámetros, pero cómo en el cuarto trimestre el mismo software MediaWiki procesa los espacios dentro de los parámetros. La pregunta 2 podría haberse resuelto con una insource:val fmtbúsqueda simple porque "fmt" y "val" son palabras completas, y fmt rara vez se ve fuera del interior de Val. Qué tal si hastemplate:val insource:fmt?

Referencias

^ Vea cómo las búsquedas pueden acabar con el motor CirrusSearch/ElasticSearch de Wikipedia.

Ver también

Plantillas para buscar en Wikipedia

Enlaces de búsqueda

Un enlace de búsqueda almacena una consulta en un enlace que lo lleva a resultados de búsqueda en vivo para esa búsqueda almacenada. Se encuentran en páginas de usuarios y páginas de discusión. Utilice uno para ofrecer el conjunto completo de funciones de MediaWiki Search, o funciones de motores de búsqueda externos, para usuarios que no estén familiarizados con sus parámetros de búsqueda.

Un tipo de enlace de búsqueda es un wikilink con todas las capacidades de Búsqueda (cuadro de búsqueda) y con sintaxis estándar de wikilink: . Por lo tanto, este enlace de búsqueda (1) navegará : [[Special:search/Wales]] → Special:search/Wales o (2) buscará: → search/~Wales si antepone un carácter ~ tilde. [[Special:Search/query| label]] [[Special:search/~Wales | search/~Wales]]

Todos los demás enlaces de búsqueda se crean a partir de una plantilla que creará una URL en lugar de un wikilink. Una URL puede, por ejemplo, llamar a motores de búsqueda externos para buscar en Wikipedia.

{{ Enlace de búsqueda }} ofrece todas las capacidades de búsqueda (cuadro de búsqueda), además de parámetros adicionales (URL) para combinaciones de espacios de nombres, y donde puede escapar de la limitación de 20 resultados por página, compartible: {{search link | et al | ''label'' | ns4 | ns5 | limit = 123}}→ etiqueta .
{{ Regex }} : desarrolla una búsqueda avanzada de expresiones regulares. {{regex | \<--.*--> | label = Articles with comments missing the ! bang character | prefix=0}}→ Artículos con comentarios a los que les falta el ! personaje de explosión
{{ Uso de plantilla }} : desarrolle una búsqueda de expresiones regulares de plantilla e identifique detalles específicos de llamadas de plantilla. {{Template usage | Convert | \{{!}}C\{{!}}F | 0 | Articles that convert Celsius to Fahrenheit}}→ Artículos que convierten Celsius a Fahrenheit
{{ ShortSearch }} – crea tres enlaces de búsqueda: {{ShortSearch | system operations research}}→ WP GWP G (busca en Wikipedia, Wikipedia "Google" y búsqueda en Google)
{{ wpsearch }} – crea cinco enlaces de búsqueda: {{wpsearch|collaborative search}}→ búsqueda colaborativa – búsqueda en Wikipedia | Búsqueda de Google | Búsqueda de Bing | DuckDuckGo buscar | búsqueda de yahoo
{{ Enlace de búsqueda de Wikidata }} : crea un enlace de búsqueda de Wikidata para descripciones, entidades, elementos, propiedades, etc. → https://www.wikidata.org/w/index.php?search=Universe&title=Special:Search&fulltext=1

Cuadros de búsqueda

{{ Cuadro de búsqueda }} : cuadro de búsqueda simple con opción de botón debajo o a la derecha
{{ Prefijos de búsqueda }}: se buscan subpáginas de varias páginas a la vez.
{{ Banner de archivo }} –Para buscar archivos. Es de estilo banner, como muchas otras plantillas de archivo .
{{ Buscar listas }} : para buscar en listas de listas.
Plantilla: cuadros de búsqueda del editor : enumera diferentes cuadros de búsqueda de parámetros

Los cuadros de búsqueda están formados por <inputbox>etiquetas. Consulte mw:Extensión:InputBox.

Búsquedas de títulos de página

{{ Búsqueda almacenada }} : enlace a resultados de búsqueda automatizados para un término determinado
{{ En el título }} : busca páginas cuyo nombre contenga palabras determinadas
{{ Buscar desde }} : busca páginas cuyo nombre comience con una palabra determinada

Para búsquedas con coincidencias exactas, exactas en mayúsculas y minúsculas, o en signos de puntuación, consulte Ayuda: Búsqueda § grep .

Otra ayuda del editor de Wikipedia

{{ Linksearch }} : busca enlaces externos que coincidan con una URL
{{ búsqueda | término }}: herramienta externa para buscar títulos de páginas que contengan a entre paréntesis; útil para Wikipedia: estudio de desambiguación(term)
{{ Búsquedas en la mesa de ayuda }} – Navbox con lista de enlaces a páginas de Google, especializado para buscar, por ejemplo, páginas de usuarios, bombas de aldea , etc.; útil para Wikipedia: tareas de la mesa de ayuda
{{ Spamsearch }} : busca páginas de usuario en busca de spam común, por ejemplo, "damos servicio", "fabricante líder", etc.

Ver también

Ayuda:Buscando
Categoría:Plantillas de búsqueda
MediaWiki:Extensión:InputBox § Sintaxis general: cómo crear su propio cuadro de búsqueda usando<inputbox>...</inputbox>

La documentación anterior está transcluida de Plantilla:Enlace de búsqueda/doc . ( editar | historial )
Los editores pueden experimentar en las páginas sandbox ( editar | diff ) y casos de prueba ( editar ) de esta plantilla .
Agregue categorías a la subpágina /doc . Subpáginas de esta plantilla .