stringtranslate.com

Búsqueda vertical

Un motor de búsqueda vertical se diferencia de un motor de búsqueda web general en que se centra en un segmento específico de contenido en línea. También se denominan motores de búsqueda especializados o temáticos. El área de contenido vertical puede basarse en la actualidad, el tipo de medio o el género del contenido. Los verticales más comunes incluyen compras, la industria automotriz, información legal, información médica, literatura académica, búsqueda de empleo y viajes. Algunos ejemplos de motores de búsqueda verticales incluyen la Biblioteca del Congreso , Mocavo , Nuroa , Trulia y Yelp .

A diferencia de los motores de búsqueda web generales, que intentan indexar grandes porciones de la World Wide Web mediante un rastreador web , los motores de búsqueda verticales suelen utilizar un rastreador específico que intenta indexar solo las páginas web relevantes para un tema o un conjunto de temas predefinidos. Algunos sitios de búsqueda vertical se centran en verticales individuales, mientras que otros incluyen múltiples búsquedas verticales dentro de un motor de búsqueda.

Beneficios

La búsqueda vertical ofrece varios beneficios potenciales sobre los motores de búsqueda generales:

La búsqueda vertical puede considerarse similar a la búsqueda empresarial , en la que el ámbito de interés es la empresa, como una compañía, un gobierno u otra organización. En 2013, los sitios web de comparación de precios al consumidor con motores de búsqueda verticales integrados, como FindTheBest, atrajeron grandes rondas de financiación de capital de riesgo, lo que indica una tendencia de crecimiento para estas aplicaciones de la tecnología de búsqueda vertical. [1] [2]

Búsqueda específica de dominio

Los mercados verticales específicos de un dominio se centran en un tema específico. John Battelle lo describe en su libro The Search (2005):

Las soluciones de búsqueda específicas de dominio se centran en un área de conocimiento, creando experiencias de búsqueda personalizadas que, debido al corpus limitado del dominio y las relaciones claras entre los conceptos, brindan resultados extremadamente relevantes para los buscadores. [3]

Cualquier motor de búsqueda general indexaría todas las páginas y buscaría en amplitud para recopilar documentos. El rastreo en motores de búsqueda específicos de un dominio busca de manera más eficiente un pequeño subconjunto de documentos al centrarse en un conjunto particular. Se ha descubierto que el rastreo realizado con un marco de aprendizaje de refuerzo es tres veces más eficiente que la búsqueda en amplitud . [4]

Programa Memex de DARPA

A principios de 2014, la Agencia de Proyectos de Investigación Avanzada de Defensa ( DARPA ) publicó una declaración en su sitio web que describe los detalles preliminares del "programa Memex", que tiene como objetivo desarrollar nuevas tecnologías de búsqueda que superen algunas limitaciones de la búsqueda basada en texto. [5] DARPA quiere que la tecnología Memex desarrollada en esta investigación sea utilizable para motores de búsqueda que puedan buscar información en la Deep Web , la parte de Internet a la que los motores de búsqueda comerciales como Google o Yahoo pueden acceder en gran medida . El sitio web de DARPA describe que "el objetivo es inventar mejores métodos para interactuar y compartir información, de modo que los usuarios puedan organizar y buscar de forma rápida y completa subconjuntos de información relevantes para sus intereses individuales". [6] Como se informó en un artículo de Wired de 2015 , la tecnología de búsqueda que se está desarrollando en el programa Memex "tiene como objetivo arrojar luz sobre la dark web y descubrir patrones y relaciones en los datos en línea para ayudar a las fuerzas del orden y otros a rastrear la actividad ilegal". [7] La ​​DARPA pretende que el programa sustituya los procedimientos centralizados utilizados por los motores de búsqueda comerciales, afirmando que la "creación de un nuevo paradigma de indexación y búsqueda específico de dominio proporcionará mecanismos para mejorar el descubrimiento de contenido, la extracción de información, la recuperación de información, la colaboración del usuario y la extensión de las capacidades de búsqueda actuales a la web profunda, la web oscura y el contenido no tradicional (por ejemplo, multimedia)". [8] En su descripción del programa, la DARPA explica el nombre del programa como un homenaje a la invención original de Bush, Memex, que sirvió de inspiración. [5]

En abril de 2015, se anunció que algunas partes de Memex serían de código abierto. [9] Algunos módulos estaban disponibles para su descarga. [8]

Referencias

  1. ^ Rao, Leena (5 de marzo de 2013). "La plataforma de comparación de precios basada en datos FindTheBest recauda 11 millones de dólares de New World, Kleiner Perkins y otros". TechCrunch. Archivado desde el original el 1 de junio de 2013. Consultado el 27 de mayo de 2013 .
  2. ^ HO, VICTORIA (11 de mayo de 2013). «El sitio de comparación de precios asiático Save 22 obtiene una ronda de Angel de "seis cifras medias"». Archivado desde el original el 7 de junio de 2013. Consultado el 27 de mayo de 2013 .
  3. ^ Battelle, John (2005). La búsqueda: cómo Google y sus rivales reescribieron las reglas de los negocios y transformaron nuestra cultura . Nueva York: Portfolio.
  4. ^ McCallum, Andrew (1999). "Un enfoque de aprendizaje automático para la creación de motores de búsqueda específicos de dominio". IJCAI . 99 : 662–667. CiteSeerX 10.1.1.88.3818 . 
  5. ^ ab "Memex pretende crear un nuevo paradigma para la búsqueda específica de dominios" (Nota de prensa). DARPA . 9 de febrero de 2014. Archivado desde el original el 11 de febrero de 2015 . Consultado el 11 de febrero de 2015 .
  6. ^ "Memex (Búsqueda específica de dominio)". www.darpa.mil . Archivado desde el original el 16 de septiembre de 2016 . Consultado el 21 de septiembre de 2016 .
  7. ^ Kim Zetter (2 de febrero de 2015). «Darpa está desarrollando un motor de búsqueda para la Dark Web». Wired . Archivado desde el original el 29 de junio de 2023. Consultado el 19 de noviembre de 2020 .
  8. ^ ab «Memex (Domain-Specific Search)». DARPA. Archivado desde el original el 10 de junio de 2015. Consultado el 20 de abril de 2015 .
  9. ^ Forbes (17 de abril de 2015). «Cuidado Google, DARPA acaba de publicar en código abierto toda esta elegante tecnología de búsqueda de la Dark Web». Forbes . Archivado desde el original el 20 de abril de 2015 . Consultado el 20 de abril de 2015 .