Existen tres grandes categorías que abarcan la mayoría de las consultas de búsqueda web: informativas, de navegación y transaccionales. [1] Estas también se denominan "hacer, saber, ir". [2] Aunque este modelo de búsqueda no se derivó teóricamente, la clasificación se ha validado empíricamente con consultas reales en motores de búsqueda. [3]
Consultas informativas : consultas que cubren un tema amplio (por ejemplo, Colorado o camiones ) para las que puede haber miles de resultados relevantes.
Consultas de navegación : consultas que buscan un solo sitio web o página web de una sola entidad (por ejemplo, YouTube o Delta Airlines ).
Consultas transaccionales : consultas que reflejan la intención del usuario de realizar una acción particular, como comprar un automóvil o descargar un protector de pantalla.
Los motores de búsqueda suelen admitir un cuarto tipo de consulta que se utiliza con mucha menos frecuencia:
Consultas de conectividad : consultas que informan sobre la conectividad del gráfico web indexado (por ejemplo, ¿Qué enlaces apuntan a esta URL ? y ¿Cuántas páginas están indexadas desde este nombre de dominio ?). [4]
Características
La mayoría de los motores de búsqueda comerciales no revelan sus registros de búsqueda, por lo que resulta difícil obtener información sobre lo que buscan los usuarios en la Web. [5] Sin embargo, los estudios de investigación comenzaron a aparecer en 1998. [6] [7] Un estudio de 2001, [8] que analizó las consultas del motor de búsqueda Excite , mostró algunas características interesantes de las búsquedas web:
La longitud media de una consulta fue de 2,4 términos.
Aproximadamente la mitad de los usuarios ingresó una sola consulta, mientras que un poco menos de un tercio de los usuarios ingresó tres o más consultas únicas.
Casi la mitad de los usuarios examinaron sólo la primera o las dos primeras páginas de resultados (10 resultados por página).
Menos del 5% de los usuarios utilizaron funciones de búsqueda avanzadas (por ejemplo, operadores booleanos como AND, OR y NOT).
Los cuatro términos más utilizados fueron (búsqueda vacía), y, de y sexo.
Un estudio de los mismos registros de consultas de Excite reveló que el 19% de las consultas contenían un término geográfico (por ejemplo, nombres de lugares, códigos postales, características geográficas, etc.). [9]
Los estudios también muestran que, además de las consultas cortas (consultas con pocos términos), existen patrones predecibles de cómo los usuarios cambian sus consultas. [10]
Un estudio de 2005 sobre los registros de consultas de Yahoo reveló que el 33% de las consultas de los mismos usuarios eran consultas repetidas y que en el 87% de los casos el usuario hacía clic en el mismo resultado. [11] Esto sugiere que muchos usuarios utilizan consultas repetidas para volver a visitar o encontrar información. Este análisis se confirma en una publicación del blog del motor de búsqueda Bing que afirma que aproximadamente el 30% de las consultas son consultas de navegación. [12]
Además, las investigaciones han demostrado que las distribuciones de frecuencia de los términos de consulta se ajustan a la ley de potencia o curvas de distribución de cola larga . Es decir, una pequeña parte de los términos observados en un gran registro de consultas (por ejemplo, > 100 millones de consultas) se utilizan con mayor frecuencia, mientras que los términos restantes se utilizan con menos frecuencia de forma individual. [13] Este ejemplo del principio de Pareto (o regla 80-20 ) permite a los motores de búsqueda emplear técnicas de optimización como la partición de índices o bases de datos , el almacenamiento en caché y la obtención previa de datos. Además, se han realizado estudios sobre atributos orientados lingüísticamente que pueden reconocer si una consulta web es navegacional, informativa o transaccional. [14]
Un estudio de 2011 descubrió que la longitud promedio de las consultas había crecido de manera constante con el tiempo y que la longitud promedio de las consultas en idiomas distintos del inglés había aumentado más que las consultas en inglés. [15] Google implementó la actualización Hummingbird en agosto de 2013 para manejar consultas de búsqueda más largas, ya que más búsquedas son conversacionales (por ejemplo, "¿dónde está la cafetería más cercana?"). [16]
Consultas estructuradas
Con los motores de búsqueda que admiten operadores booleanos y paréntesis, se puede aplicar una técnica utilizada tradicionalmente por los bibliotecarios. Un usuario que busca documentos que cubran varios temas o facetas puede querer describir cada uno de ellos mediante una disyunción de palabras características, como vehicles OR cars OR automobiles. Una consulta facetada es una conjunción de tales facetas; por ejemplo, una consulta como (electronic OR computerized OR DRE) AND (voting OR elections OR election OR balloting OR electoral)es probable que encuentre documentos sobre votación electrónica incluso si omite una de las palabras "electrónico" o "votación", o incluso ambas. [17]
^ Broder, A. (2002). Una taxonomía de búsqueda web. SIGIR Forum, 36(2), 3–10.
^ Gibbons, Kevin (11 de enero de 2013). "Hacer, saber, ir: cómo crear contenido en cada etapa del ciclo de compra". Search Engine Watch . Consultado el 24 de mayo de 2014 .
^ Jansen, BJ, Booth, D. y Spink, A. (2008) Determinación de la intención informativa, de navegación y transaccional de las consultas web, Procesamiento y gestión de la información. 44(3), 1251-1266.
^ Moore, Ross. "Servidores de conectividad". Cambridge University Press . Consultado el 24 de mayo de 2014 .
^ Dawn Kawamoto y Elinor Mills (2006), AOL se disculpa por la publicación de datos de búsqueda de usuarios
^ Jansen, BJ, Spink, A., Bateman, J. y Saracevic, T. 1998. Recuperación de información en la vida real: un estudio de consultas de usuarios en la web. SIGIR Forum, 32(1), 5 -17.
^ Silverstein, C., Henzinger, M., Marais, H. y Moricz, M. (1999). Análisis de un registro de consultas de un motor de búsqueda web muy grande. SIGIR Forum, 33(1), 6–12.
^ Amanda Spink; Dietmar Wolfram; Major BJ Jansen; Tefko Saracevic (2001). "Buscando en la web: El público y sus consultas" (PDF) . Revista de la Sociedad Americana de Ciencias de la Información y Tecnología . 52 (3): 226–234. CiteSeerX 10.1.1.23.9800 . doi :10.1002/1097-4571(2000)9999:9999<::AID-ASI1591>3.3.CO;2-I.
^ Mark Sanderson y Janet Kohler (2004). "Análisis de consultas geográficas". Actas del Taller sobre Información Geográfica (SIGIR '04) .
^ Jansen, BJ, Booth, DL y Spink, A. (2009). Patrones de modificación de consultas durante la búsqueda web. Revista de la Sociedad Estadounidense de Ciencias de la Información y Tecnología. 60(3), 557-570. 60(7), 1358-1371.
^ Jaime Teevan; Eytan Adar; Rosie Jones; Michael Potts (2005). "La historia se repite: consultas repetidas en los registros de consultas de Yahoo" (PDF) . Actas de la 29.ª Conferencia Anual de la ACM sobre Investigación y Desarrollo en Recuperación de Información (SIGIR '06) . págs. 703–704. doi :10.1145/1148170.1148326.[ enlace muerto permanente ]
^ "Bing convierte la búsqueda en tu actividad - Blog de búsqueda - Blogs del sitio - Comunidad de Bing". Archivado desde el original el 14 de marzo de 2011. Consultado el 1 de marzo de 2011 .
^ Ricardo Baeza-Yates (2005). "Aplicaciones de la minería de consultas web". Avances en la recuperación de información . Apuntes de clase en informática. Vol. 3408. Springer Berlin / Heidelberg. págs. 7–22. doi :10.1007/978-3-540-31865-1_2. ISBN .978-3-540-25295-5.
^ Alejandro Figueroa (2015). "Explorando características efectivas para reconocer la intención del usuario detrás de consultas web". Computers in Industry . 68 . Elsevier: 162–169. doi :10.1016/j.compind.2015.01.005.
^ Mona Taghavi; Ahmed Patel; Nikita Schmidt; Christopher Wills; Yiqi Tew (2011). "Análisis de registros de proxy web con un enfoque de patrón de distribución de consultas para motores de búsqueda". Journal of Computer Standards & Interfaces . 34 (1): 162–170. doi :10.1016/j.csi.2011.07.001.
^ Sullivan, Danny (26 de septiembre de 2013). "Preguntas frecuentes: todo sobre el nuevo algoritmo "Hummingbird" de Google". Search Engine Land . Consultado el 24 de mayo de 2014 .
^ Vojkan Mihajlović; Djoerd Hiemstra; Henk Ernst Blok; Peter MG Apers (octubre de 2006). "Explotación de la estructura de consultas y la estructura de documentos para mejorar la eficacia de la recuperación de documentos" (PDF) .{{cite journal}}: Requiere citar revista |journal=( ayuda )