Yandex Search ( en ruso : Яндекс ) es un motor de búsqueda propiedad de la empresa Yandex , con sede en Rusia . En enero de 2015, Yandex Search generó el 51,2 % de todo el tráfico de búsqueda en Rusia según LiveInternet . [1]
En febrero de 2024, Yandex NV anunció la venta de la mayoría de sus activos con sede en Rusia a un consorcio de inversores con sede en Rusia. [2] [3] En julio de 2024, se completó la venta, lo que le dio al Kremlin más control sobre el negocio. [4] [5]
La tecnología de búsqueda ofrece resultados de búsqueda locales en más de 1.400 ciudades. Yandex Search también cuenta con una búsqueda "paralela" que presenta resultados tanto del índice web principal como de recursos de información especializados, incluidas noticias, compras, blogs, imágenes y videos en una sola página.
Yandex Search responde a consultas en tiempo real y reconoce cuándo una consulta requiere la información más actualizada, como noticias de último momento o la publicación más reciente en Twitter sobre un tema en particular. También contiene algunas funciones adicionales: Asistente de respuesta, que proporciona información adicional (por ejemplo, resultados deportivos), corrector ortográfico , autocompletado que sugiere consultas a medida que escribe, antivirus que detecta malware en páginas web, etc. [6]
En mayo de 2010, Yandex lanzó Yandex.com, una plataforma para realizar pruebas beta y mejorar la búsqueda en idiomas distintos del ruso. [7]
Se puede acceder al producto de búsqueda desde computadoras personales, teléfonos móviles, tabletas y otros dispositivos digitales. Además de la búsqueda web, Yandex ofrece una amplia gama de servicios de búsqueda especializados.
En 2009, Yandex lanzó MatrixNet, un nuevo método de aprendizaje automático que mejora significativamente la relevancia de los resultados de búsqueda. Permite que el motor de búsqueda de Yandex tenga en cuenta una gran cantidad de factores al tomar decisiones sobre la relevancia de los resultados de búsqueda. [8]
En 2010 se lanzó otra tecnología, Spectrum, que permite inferir consultas implícitas y devolver resultados de búsqueda coincidentes. El sistema analiza automáticamente las búsquedas de los usuarios e identifica objetos como nombres personales, películas o automóviles. Las proporciones de los resultados de búsqueda que responden a diferentes intenciones de los usuarios se basan en la demanda de estos resultados por parte de los usuarios. [9]
Con su primer lanzamiento el 21 de julio de 2017, el navegador web Brave presenta a Yandex como uno de sus motores de búsqueda predeterminados. [10]
En marzo de 2022, durante la invasión rusa de Ucrania , Yandex y Mail.ru fueron eliminados como proveedores de búsqueda opcionales del navegador Mozilla Firefox . [11]
El motor de búsqueda consta de tres componentes principales: [12]
En general, Yandex indexa los siguientes tipos de archivos: [15] html , pdf , rtf , doc , xls , ppt , docx , odt , odp, ods, odg, xlsx , pptx .
El motor de búsqueda también es capaz de indexar texto dentro de objetos Shockwave Flash (si el texto no está colocado en la imagen misma), si estos elementos se transfieren como una página separada, que tiene el tipo MIME application/x-shockwave-flash
, y archivos con la extensión .swf [16]
Yandex tiene dos robots de escaneo: el “principal” y el “rápido”. El primero es responsable de todo Internet, el segundo indexa los sitios con información que cambia y se actualiza con frecuencia (sitios de noticias y agencias de noticias). En 2010, el robot “rápido” recibió una nueva tecnología llamada “Orange”, desarrollada conjuntamente por las divisiones de Yandex en California y Moscú. [16]
Desde 2009, Yandex admite la tecnología Sitemaps . [16]
En los registros del servidor, los robots de Yandex se representan de la siguiente manera: [17]
Mozilla/5.0 (compatible; YandexBot/3.0)
es el robot de indexación principal.Mozilla/5.0 (compatible; YandexBot/3.0; MirrorDetector)
- un bot que detecta sitios espejo. Si hay varios sitios con el mismo contenido, solo uno se mostrará en los resultados de búsqueda.Mozilla/5.0 (compatible; YandexImages/3.0)
- Indexador de imágenes de YandexMozilla/5.0 (compatible; YandexVideo/3.0)
- Indexador de videos de YandexMozilla/5.0 (compatible; YandexMedia/3.0)
- indexador de datos multimediaMozilla/5.0 (compatible; YandexBlogs/0.99; robot)
es un robot de búsqueda que indexa los comentarios de las publicaciones.Mozilla/5.0 (compatible; YandexAddurl/2.0)
- es un robot de búsqueda que indexa páginas a través del formulario "Agregar URL ".Mozilla/5.0 (compatible; YandexDirect/2.0; Dyatel)
- comprueba Yandex DirectMozilla/5.0 (compatible; YandexMetrika/2.0)
- Indexador de métricas de YandexMozilla/5.0 (compatible; YandexCatalog/3.0; Dyatel)
- Consulta el catálogo de YandexMozilla/5.0 (compatible; YandexNews/3.0)
- Indexador de noticias de YandexMozilla/5.0 (compatible; YandexAntivirus/2.0)
- Bot antivirus YandexLos siguientes operadores se utilizan para la configuración:
""
- cita exacta|
- Introduce entre palabras, si necesitas encontrar alguna de ellas.*
- introducir entre palabras, si falta alguna palabrasite:
- buscar en un sitio específicodate:
- buscar documentos por fecha, por ejemplo, fecha: 2007+
- introducir antes de la palabra que debe estar en el documentoYandex, automáticamente, junto con la “forma exacta” original de la consulta, busca sus diversas variaciones y formulaciones. [18]
La búsqueda de Yandex tiene en cuenta la morfología del idioma ruso, por lo tanto, independientemente de la forma de la palabra en la consulta de búsqueda, la búsqueda se realizará para todas las formas de la palabra. Si el análisis morfológico no es deseable, puede colocar un signo de exclamación (!) Antes de la palabra: la búsqueda en este caso mostrará solo la forma específica de la palabra. Además, la consulta de búsqueda prácticamente no tiene en cuenta las llamadas palabras vacías , es decir, preposiciones , puntuación , pronombres, etc., debido a su amplia distribución [12]
Por regla general, las abreviaturas se revelan automáticamente, se corrige la ortografía y también se buscan sinónimos (móvil - celular). La extensión de la consulta original del usuario depende del contexto. La extensión no se produce cuando se utiliza un conjunto de términos altamente especializados, nombres de empresas (por ejemplo, OJSC “Hippo” - OJSC “Hippopotamus”), añadiendo la palabra “precio”, entre comillas exactas (estas consultas se resaltan con comillas de máquina de escribir). [18]
Los resultados de búsqueda para cada usuario se forman individualmente en función de su ubicación, idioma de la consulta, intereses y preferencias según los resultados de las sesiones de búsqueda anteriores y actuales. Sin embargo, el factor clave para clasificar los resultados de búsqueda es su relevancia para la consulta de búsqueda. [19] La relevancia se determina en función de una fórmula de clasificación, que se actualiza constantemente según algoritmos de aprendizaje automático.
La búsqueda se realiza en ruso , inglés , francés , alemán , ucraniano , bielorruso , tártaro y kazajo .
Los resultados de la búsqueda se pueden ordenar por relevancia y por fecha (botones debajo de los resultados de la búsqueda).
La página de resultados de búsqueda consta de 10 enlaces con breves anotaciones: “snippets”. Los snippets incluyen un comentario de texto, un enlace, una dirección, secciones populares del sitio, páginas en redes sociales, etc. [20] Como alternativa a los snippets, Yandex introdujo en 2014 una nueva interfaz llamada “Islands”. [21]
Yandex implementa el mecanismo de “búsquedas paralelas”, cuando junto con una búsqueda web, se realiza una búsqueda en los servicios de Yandex, como Catálogo, Noticias, Mercado, Enciclopedias, Imágenes, etc. Como resultado, en respuesta a la solicitud de un usuario, el sistema muestra no solo información textual, sino también enlaces a archivos de video, imágenes, entradas de diccionario, etc. [22]
Una característica distintiva del motor de búsqueda es también la tecnología de "búsqueda intencional", es decir, la búsqueda para resolver un problema. [23] Los elementos de la búsqueda intencional son: mensajes de diálogo en caso de una solicitud ambigua, traducción automática de texto, información sobre las características del vehículo solicitado, etc. Por ejemplo, cuando se solicita " Boris Grebenshchikov - Golden City", el sistema mostrará un formulario para escuchar música en línea del servicio Yandex Music , y si se solicita "st. Koroleva 12", se mostrará un fragmento del mapa con el objeto marcado.
Los resultados de búsqueda del motor de búsqueda Yandex tienden a favorecer a las fuentes de medios rusos, incluidos los medios estatales, y los anuncios distribuidos por Yandex tienden a promover desinformación y propaganda producida por más de media docena de sitios de noticias en idioma ruso. [24] [25]
Un estudio descubrió que los anuncios distribuidos por Yandex se publicaban junto a historias falsas sobre laboratorios estadounidenses de armas biológicas en Ucrania, afirmaciones de que el presidente ucraniano Volodymyr Zelenskiy es un consumidor de drogas e informes que repetían las afirmaciones del Kremlin de que la guerra contra Ucrania se desarrollaba según lo planeado. Otras noticias falsas promovidas por los anuncios de Yandex se referían a la invasión rusa utilizando puntos de conversación del Kremlin, calificando la guerra de “operación para desnazificar y desmilitarizar Ucrania”. [26] Otro análisis descubrió que Yandex dirige a los hablantes de ruso de todo el mundo a información manipulada y, a menudo, a desinformación absoluta. [27]
En 2013, algunos consideraban que Yandex era el motor de búsqueda más seguro del momento y el tercero más seguro entre todos los recursos web. [28] En 2016, Yandex había descendido al tercer lugar, mientras que Google ocupaba el primer lugar. [29]
La comprobación de páginas web y la advertencia a los usuarios aparecieron en Yandex en 2009: desde entonces, en la página de resultados de búsqueda, junto a un sitio peligroso hay una nota "Este sitio puede amenazar la seguridad de su computadora". [30] Se utilizan dos tecnologías a la vez para detectar amenazas. La primera fue comprada al antivirus estadounidense Sophos y se basa en un enfoque de firmas: es decir, al acceder a una página web, el sistema antivirus también accede a una base de datos de virus y malware ya conocidos . Este enfoque es rápido, pero prácticamente impotente contra nuevos virus que aún no han ingresado a la base de datos. Por lo tanto, Yandex junto con la firma también utiliza su propio complejo antivirus, basado en un análisis del factor de comportamiento. El programa Yandex, al acceder al sitio, verifica si este último solicitó archivos adicionales del navegador, lo redirigió a un recurso extraño, etc. Por lo tanto, si se recibe información de que el sitio comienza a realizar ciertas acciones (hojas de estilo en cascada, se lanzan módulos JavaScript y programas completos) sin el permiso del usuario, se coloca en la "lista negra" y en la base de datos de firmas de virus. [31] La información sobre la infección del sitio aparece en los resultados de búsqueda y, a través del servicio Yandex.Webmaster, el propietario del sitio recibe una notificación. Después de la primera verificación, Yandex realiza la segunda y, si la información de la infección se confirma una segunda vez, las verificaciones se realizarán con mayor frecuencia hasta que se elimine la amenaza. El número total de sitios infectados en la base de datos de Yandex no supera el 1%. [30]
Cada día en 2013, Yandex revisa 23 millones de páginas web (detectando 4.300 sitios peligrosos) y muestra a los usuarios 8 millones de advertencias. [32] Aproximadamente mil millones de sitios son revisados mensualmente. [30]
Durante mucho tiempo, el factor clave de clasificación para Yandex fue la cantidad de enlaces de terceros a un sitio en particular. A cada página de Internet se le asignó un índice de citas único, similar al índice de autores de artículos científicos: cuantos más enlaces, mejor. Un mecanismo similar se implementó en Yandex y en el PageRank de Google . Para evitar trampas , Yandex utiliza un análisis multivariado, en el que solo 70 de los 800 factores se ven afectados por la cantidad de enlaces de terceros. Hoy en día, el contenido del sitio y la presencia o ausencia de palabras clave en él, la facilidad de lectura del texto, el nombre del dominio, su historial y la presencia de contenido multimedia juegan un papel mucho más importante.
El 5 de diciembre de 2013, Yandex anunció su negativa total a tener en cuenta el factor enlace en el futuro. [33]
A medida que el usuario escribe la consulta en la barra de búsqueda, el motor de búsqueda ofrece sugerencias en forma de lista desplegable. Las sugerencias aparecen incluso antes de que aparezcan los resultados de la búsqueda y permiten refinar la consulta, corregir el diseño o los errores tipográficos o ir directamente al sitio que se está buscando. Para cada usuario, se generan sugerencias basadas en el historial de sus consultas de búsqueda utilizando el servicio My Finds. En 2012, aparecieron las llamadas "Sugerencias de búsqueda inteligente", que brindan información instantánea sobre las principales constantes (longitud del ecuador, velocidad de la luz, etc.), los atascos de tráfico y tienen una calculadora incorporada. Además, se integró un traductor en las "Sugerencias" (la consulta "amor en francés" brinda instantáneamente amour, afecto ), el calendario y los resultados de los partidos de fútbol, los tipos de cambio, las previsiones meteorológicas y más. Puede averiguar la hora exacta preguntando "qué hora es". En 2011, las Sugerencias en la búsqueda de Yandex se volvieron completamente locales para 83 regiones de Rusia. [34]
Además de la búsqueda propiamente dicha, los buscadores de Yandex incorporan sugerencias como, por ejemplo, Diccionarios, Yandex. Market , Yandex. Maps y otros servicios de Yandex.
La función de sugerencias es una consecuencia del desarrollo de la tecnología de búsqueda por intención y apareció por primera vez en Yandex.Bar en agosto de 2007, y en octubre de 2008 se introdujo en la página principal del motor de búsqueda. [35] Disponible tanto en la versión de escritorio como en la versión móvil del sitio, Yandex muestra a sus usuarios más de mil millones de sugerencias de búsqueda por día [36].
Los cambios en el motor de búsqueda no fueron ampliamente difundidos durante mucho tiempo y permanecieron anónimos. Y recién a principios de 2008, cuando se anunció el lanzamiento del algoritmo 8 SP1 , Yandex anunció que en adelante los nuevos algoritmos de clasificación llevarían los nombres de las ciudades. [37]
El nombre del sistema, Yandex, fue inventado conjuntamente por Arkady Volozh e Ilya Segalovich . [38] La palabra significa y et y otro en dex er (o como “ yo soy ( “ ya ” en idioma ruso) e index )”. Según la interpretación de Artemy Lebedev , el nombre del motor de búsqueda está en consonancia con Yandeks, donde yang significa el comienzo masculino, [39]
El motor de búsqueda yandex.ru fue presentado por CompTek el 23 de septiembre de 1997 [40] en la feria Softool, aunque algunos desarrollos en el campo de la búsqueda ( indexación de la Biblia , búsqueda de documentos en CD-ROM , búsqueda de sitios web) fueron realizados por la empresa incluso antes. El primer índice contenía información sobre 5 mil servidores y ocupaba 4,5 GB. [41]
En el mismo año 1997, la búsqueda de Yandex comenzó a utilizarse en la versión rusa de Internet Explorer 4.0. [42] [43] Se hizo posible realizar consultas en lenguaje natural. [44]
En 1998, apareció la función “encontrar documentos similares” para cada resultado de búsqueda. [45]
“Yandex. Search” en 1998 funcionaba en tres máquinas que ejecutaban FreeBSD bajo Apache : una máquina rastreaba Internet e indexaba documentos, una máquina buscaba y la otra máquina duplicaba el buscador. [46]
En 1999, en las categorías apareció una búsqueda: búsqueda, una combinación de motor de búsqueda y catálogo. [47] La versión del motor de búsqueda fue actualizada. [48]
El 6 de junio de 2000 se presentó la segunda versión del buscador . [49] Se introdujo un mecanismo de búsqueda paralelo y, junto con la emisión, se ofreció información de grandes fuentes. Los usuarios podían limitar los resultados de la búsqueda al tema seleccionado. Apareció el encabezado “Hallazgos populares”, palabras que refinan la búsqueda. [50]
En diciembre de 2000, el volumen de información indexada alcanzó los 355,22 GB. [51]
En 2001, Yandex superó a otro motor de búsqueda ruso, Rambler , en términos de asistencia y se convirtió en el motor de búsqueda líder de Runet . [52] [53] Yandex comenzó a comprender las solicitudes en lenguaje natural que se formulaban en forma interrogativa. El sistema ha aprendido a reconocer errores tipográficos y a sugerir correcciones. El diseño ha cambiado. [54]
El número de consultas diarias al motor de búsqueda Yandex superó los 2 millones [55]
Se inició la indexación de documentos .rtf y .pdf . [56] Los resultados de búsqueda comenzaron a emitirse incluso en formato XML. [57]
El algoritmo de clasificación ha cambiado. [58]
Yandex comenzó a indexar documentos en formatos . swf ( Flash ), [59] xls y . ppt . [60]
A finales de año se publicó el estudio “Algunos aspectos de la búsqueda de texto completo y el ranking en Yandex Archivado el 9 de abril de 2022 en Wayback Machine ” (autores Ilya Segalovich , Mikhail Maslov), que reveló ciertos detalles de ranking en un motor de búsqueda. [61]
En verano se puso en marcha el llamado robot de búsqueda “rápido”, que funciona en paralelo a las propias páginas destinadas a la indexación. La base del “robot rápido” se actualiza cada 1,5–2 horas. [62]
Se ha mejorado el algoritmo de clasificación para aumentar la precisión de la búsqueda. [63]
Las posibilidades de búsqueda se han ampliado con la ayuda de Yandex.Dictionaries” y “Yandex.Lingvo”. El motor de búsqueda ha aprendido a comprender consultas como “ Qué es [algo] en español ” y traducirlas automáticamente.
Se hizo posible limitar los resultados de búsqueda por región. [64]
Desde mayo de 2006, se muestran iconos de sitios en los resultados de búsqueda. [65]
A principios de diciembre, junto a cada enlace en los resultados de búsqueda apareció el elemento “Copia guardada”, al hacer clic en el cual, el usuario iba a una copia completa de la página en una base de datos de archivo especial (“Yandex cache”). [66]
El algoritmo de clasificación cambió nuevamente. [67]
En 2008, Yandex comenzó a anunciar abiertamente por primera vez cambios en el algoritmo de búsqueda y comenzó a nombrar los cambios con los nombres de ciudades rusas. [68] El nombre de la “ciudad” de cada algoritmo posterior comienza con la letra con la que terminaba el nombre del anterior. [69]
En abril de 2020, el motor de búsqueda comenzó a colocar artificialmente comentarios negativos sobre Navalny en las primeras posiciones de sus resultados de búsqueda de su nombre. [70] Yandex declaró que esto era parte de un "experimento" y volvió a presentar resultados de búsqueda orgánicos. [71] [72] [73]
Según el experto en medios de comunicación Mijail Gurevich, Yandex es un “tesoro nacional”, un “producto estratégico”. [74]
Este hecho también fue reconocido en la Duma Estatal de la Federación Rusa , donde en mayo de 2012 apareció un proyecto de ley en el que Yandex y VKontakte son reconocidos por empresas estratégicas como traductores de información nacional. [75] En 2009, el presidente de Rusia, Dmitry Medvedev, inició la compra de una “ acción de oro ” de Yandex por parte de Sberbank para evitar que una importante empresa nacional cayera en manos extranjeras. [76] En noviembre de 2019, Sberbank anunció que renunciaría a su acción de oro, [77] y al mes siguiente los accionistas de Yandex votaron para aprobar una reestructuración corporativa respaldada por el gobierno ruso que invertiría el control de la acción de oro en una nueva fundación de interés público, que se implementaría a fines del primer trimestre de 2020, después de que Sberbank había acordado previamente vender la acción de oro por un euro. [78]
En 2012, Yandex superó a Channel One en términos de audiencia diaria, lo que convirtió a Yandex en un líder en el mercado de medios domésticos. [75] En 2013, Yandex confirmó este estatus, superando a First en términos de ingresos. [79]
En 2008, Yandex fue el noveno motor de búsqueda del mundo, [80] en 2009 el séptimo, [81] y en 2013 el cuarto. [82]
Uno de los componentes de esta situación es la presencia en Rusia de un número suficiente de especialistas con conocimientos matemáticos y un instinto científico. [83]
En 2002, la palabra Yandex se volvió tan común que cuando la compañía de Arkady Volozh exigió devolver el dominio yandex.com, comprado por terceros, el acusado afirmó que la palabra "Yandex" ya era sinónimo de búsqueda y se convirtió en una palabra familiar en Rusia. [84]
Desde finales de 2012, el motor de búsqueda Yandex ha superado el número de usuarios de Google en el navegador Google Chrome en Rusia . [85] [86]
El logotipo de Yandex aparece en numerosos entornos para identificar a la empresa de motores de búsqueda. Yandex ha recurrido a varios logotipos desde su cambio de nombre, siendo el primero creado por Arkady Volozh y debutó en 1997 [87] en los productos Яndex.Site y Яndex.CD, incluso antes del anuncio del motor de búsqueda Yandex. El logotipo fue diseñado de forma análoga al logotipo de CompTek.
Desde 1997, los logotipos son diseñados por Art. Lebedev Studios , que diseñó cuatro versiones. El logotipo actual utiliza palabras en cirílico. [88]
Sitio web oficial