stringtranslate.com

consulta web

Una consulta web o consulta de búsqueda web es una consulta que un usuario ingresa en un motor de búsqueda web para satisfacer sus necesidades de información . Las consultas de búsqueda web se distinguen porque a menudo son texto sin formato y rara vez se utilizan directivas de búsqueda booleanas . Varían mucho de los lenguajes de consulta estándar , que se rigen por estrictas reglas de sintaxis como los lenguajes de comandos con palabras clave o parámetros posicionales .

Tipos

Hay tres categorías amplias que cubren la mayoría de las consultas de búsqueda web: informativas, de navegación y transaccionales. [1] Estos también se llaman "hacer, saber, ir". [2] Aunque este modelo de búsqueda no se derivó teóricamente, la clasificación se ha validado empíricamente con consultas reales en motores de búsqueda. [3]

Los motores de búsqueda suelen admitir un cuarto tipo de consulta que se utiliza con mucha menos frecuencia:

Características

Una lista de sugerencias de búsqueda para una consulta de búsqueda.

La mayoría de los motores de búsqueda web comerciales no divulgan sus registros de búsqueda, por lo que es difícil obtener información sobre lo que los usuarios buscan en la Web. [5] Sin embargo, los estudios de investigación comenzaron a aparecer en 1998. [6] [7] Un estudio de 2001, [8] que analizó las consultas del motor de búsqueda Excite , mostró algunas características interesantes de las búsquedas web:

Un estudio de los mismos registros de consultas de Excite reveló que el 19% de las consultas contenían un término geográfico (por ejemplo, nombres de lugares, códigos postales, características geográficas, etc.). [9]

Los estudios también muestran que, además de las consultas breves (consultas con pocos términos), existen patrones predecibles de cómo los usuarios cambian sus consultas. [10]

Un estudio de 2005 sobre los registros de consultas de Yahoo reveló que el 33% de las consultas de los mismos usuarios eran consultas repetidas y que en el 87% de los casos el usuario hacía clic en el mismo resultado. [11] Esto sugiere que muchos usuarios utilizan consultas repetidas para volver a visitar o volver a encontrar información. Este análisis lo confirma una publicación de blog del motor de búsqueda Bing que afirma que alrededor del 30% de las consultas son consultas de navegación. [12]

Además, las investigaciones han demostrado que las distribuciones de frecuencia de los términos de consulta se ajustan a la ley de potencia o curvas de distribución de cola larga . Es decir, una pequeña porción de los términos observados en un registro de consultas grande (por ejemplo, > 100 millones de consultas) se usan con mayor frecuencia, mientras que los términos restantes se usan con menos frecuencia individualmente. [13] Este ejemplo del principio de Pareto (o regla 80-20 ) permite a los motores de búsqueda emplear técnicas de optimización como índice o partición de bases de datos , almacenamiento en caché y búsqueda previa. Además, se han realizado estudios sobre atributos orientados lingüísticamente que pueden reconocer si una consulta web es de navegación, informativa o transaccional. [14]

Un estudio de 2011 encontró que la duración promedio de las consultas había aumentado de manera constante con el tiempo y la duración promedio de las consultas en idiomas distintos del inglés había aumentado más que las de inglés. [15] Google implementó la actualización Hummingbird en agosto de 2013 para manejar consultas de búsqueda más largas, ya que la mayoría de las búsquedas son conversacionales (por ejemplo, "¿dónde está la cafetería más cercana?"). [dieciséis]

Consultas estructuradas

Con motores de búsqueda que admitan operadores booleanos y paréntesis, se puede aplicar una técnica tradicionalmente utilizada por los bibliotecarios. Un usuario que busca documentos que cubran varios temas o facetas puede querer describir cada uno de ellos mediante una disyunción de palabras características, como vehicles OR cars OR automobiles. Una consulta facetada es una conjunción de dichas facetas; por ejemplo, una consulta como ésta (electronic OR computerized OR DRE) AND (voting OR elections OR election OR balloting OR electoral)probablemente encuentre documentos sobre votación electrónica incluso si omiten una de las palabras "electrónica" o "votación", o incluso ambas. [17]

Ver también

Referencias

  1. ^ Broder, A. (2002). Una taxonomía de búsqueda web. Foro SIGIR, 36(2), 3–10.
  2. ^ Gibbons, Kevin (11 de enero de 2013). "Hacer, saber, seguir: cómo crear contenido en cada etapa del ciclo de compra". Vigilancia del motor de búsqueda . Consultado el 24 de mayo de 2014 .
  3. ^ Jansen, BJ, Booth, D. y Spink, A. (2008) Determinación de la intención informativa, de navegación y transaccional de las consultas web, procesamiento y gestión de la información. 44(3), 1251-1266.
  4. ^ Moore, Ross. "Servidores de conectividad". Prensa de la Universidad de Cambridge . Consultado el 24 de mayo de 2014 .
  5. ^ Dawn Kawamoto y Elinor Mills (2006), AOL se disculpa por la divulgación de datos de búsqueda de usuarios
  6. ^ Jansen, BJ, Spink, A., Bateman, J. y Saracevic, T. 1998. Recuperación de información de la vida real: un estudio de las consultas de los usuarios en la web. Foro SIGIR, 32(1), 5 -17.
  7. ^ Silverstein, C., Henzinger, M., Marais, H. y Moricz, M. (1999). Análisis de un gran registro de consultas de un motor de búsqueda web. Foro SIGIR, 33(1), 6–12.
  8. ^ Amanda Spink; Dietmar Wolfram; el mayor BJ Jansen; Tefko Saračević (2001). «Búsqueda en la web: El público y sus consultas» (PDF) . Revista de la Sociedad Estadounidense de Ciencia y Tecnología de la Información . 52 (3): 226–234. CiteSeerX 10.1.1.23.9800 . doi :10.1002/1097-4571(2000)9999:9999<::AID-ASI1591>3.3.CO;2-I. 
  9. ^ Mark Sanderson y Janet Kohler (2004). "Análisis de consultas geográficas". Actas del Taller sobre Información Geográfica (SIGIR '04) .
  10. ^ Jansen, BJ, Booth, DL y Spink, A. (2009). Patrones de modificación de consultas durante la búsqueda web. Revista de la Sociedad Estadounidense de Ciencia y Tecnología de la Información. 60(3), 557-570. 60(7), 1358-1371.
  11. ^ Jaime Teevan; Eytan Adar; Rosie Jones; Michael Potts (2005). "La historia se repite: consultas repetidas en los registros de consultas de Yahoo" (PDF) . Actas de la 29ª Conferencia Anual de ACM sobre Investigación y Desarrollo en Recuperación de Información (SIGIR '06) . págs. 703–704. doi :10.1145/1148170.1148326.[ enlace muerto permanente ]
  12. ^ "Bing haciendo suya la búsqueda - Blog de búsqueda - Blogs del sitio - Comunidad Bing". Archivado desde el original el 14 de marzo de 2011 . Consultado el 1 de marzo de 2011 .
  13. ^ Ricardo Baeza-Yates (2005). "Aplicaciones de la minería de consultas web". Avances en la recuperación de información . Apuntes de conferencias sobre informática. vol. 3408. Springer Berlín / Heidelberg. págs. 7–22. doi :10.1007/978-3-540-31865-1_2. ISBN 978-3-540-25295-5.
  14. Alejandro Figueroa (2015). "Explorando funciones efectivas para reconocer la intención del usuario detrás de las consultas web". Computadoras en la Industria . 68 . Elsevier: 162-169. doi :10.1016/j.compind.2015.01.005.
  15. ^ Mona Taghavi; Ahmed Patel; Nikita Schmidt; Christopher Wills; Yiqi Tew (2011). "Un análisis de registros de proxy web con un enfoque de patrón de distribución de consultas para motores de búsqueda". Revista de interfaces y estándares informáticos . 34 (1): 162-170. doi :10.1016/j.csi.2011.07.001.
  16. ^ Sullivan, Danny (26 de septiembre de 2013). "Preguntas frecuentes: Todo sobre el nuevo algoritmo" Hummingbird "de Google". Tierra de motores de búsqueda . Consultado el 24 de mayo de 2014 .
  17. ^ Vojkan Mihajlović; Djoerd Hiemstra; Henk Ernst Blok; Peter MG Apers (octubre de 2006). "Explotación de la estructura de consultas y la estructura de documentos para mejorar la eficacia de la recuperación de documentos" (PDF) . {{cite journal}}: Citar diario requiere |journal=( ayuda )