stringtranslate.com

Búsqueda inversa de imágenes

Búsqueda inversa de imágenes usando Google Imágenes .

La búsqueda inversa de imágenes es una técnica de consulta de recuperación de imágenes basada en contenido (CBIR) que implica proporcionar al sistema CBIR una imagen de muestra en la que luego basará su búsqueda; en términos de recuperación de información , la imagen de muestra es muy útil. En particular, la búsqueda inversa de imágenes se caracteriza por la falta de términos de búsqueda. Esto elimina de manera efectiva la necesidad de que un usuario adivine palabras clave o términos que pueden o no devolver un resultado correcto. La búsqueda inversa de imágenes también permite a los usuarios descubrir contenido relacionado con una imagen de muestra específica [1] o la popularidad de una imagen, y descubrir versiones manipuladas y trabajos derivados. [2]

Un motor de búsqueda visual es un motor de búsqueda diseñado para buscar información en la World Wide Web a través de una búsqueda inversa de imágenes. La información puede consistir en páginas web , ubicaciones, otras imágenes y otros tipos de documentos. Este tipo de motores de búsqueda se utilizan principalmente para buscar en Internet móvil a través de una imagen de un objeto desconocido (consulta de búsqueda desconocida). Algunos ejemplos son los edificios de una ciudad extranjera. Estos motores de búsqueda suelen utilizar técnicas de recuperación de imágenes basada en contenido .

Un motor de búsqueda visual busca imágenes, patrones basados ​​en un algoritmo que puede reconocer y brinda información relativa basada en la técnica de coincidencia de patrones selectiva o aplicada.

Usos

La búsqueda inversa de imágenes se puede utilizar para: [3]

Algoritmos

Los algoritmos de búsqueda inversa de imágenes más utilizados incluyen: [4]

Buscadores de información visual

Captura de pantalla de los resultados que muestra el buscador de imágenes a través del ejemplo GOS

Búsqueda de imágenes

Un motor de búsqueda de imágenes es un motor de búsqueda diseñado para encontrar una imagen. La búsqueda puede basarse en palabras clave, una imagen o un enlace web a una imagen. Los resultados dependen del criterio de búsqueda, como metadatos , distribución de color, forma, etc., y de la técnica de búsqueda que utilice el navegador.

Diagrama de una búsqueda realizada a través de un ejemplo basado en regiones detectables de una imagen

Técnicas de búsqueda de imágenes

Dos técnicas utilizadas actualmente en la búsqueda de imágenes:

Búsqueda por metadatos: La búsqueda de imágenes se basa en la comparación de metadatos asociados a la imagen como palabras clave, texto, etc. y se obtiene empleando un conjunto de imágenes ordenadas por relevancia. Los metadatos asociados a cada imagen pueden hacer referencia al título de la imagen, formato, color, etc. y pueden generarse de forma manual o automática. Este proceso de generación de metadatos se denomina indexación audiovisual.

Búsqueda por ejemplo: En esta técnica, también llamada búsqueda inversa de imágenes, los resultados de la búsqueda se obtienen a través de la comparación entre imágenes utilizando técnicas de visión artificial de recuperación de imágenes basadas en contenido . Durante la búsqueda se examina el contenido de la imagen, como el color, la forma, la textura o cualquier información visual que se pueda extraer de la imagen. Este sistema requiere una mayor complejidad computacional , pero es más eficiente y confiable que la búsqueda por metadatos.

Existen buscadores de imágenes que combinan ambas técnicas de búsqueda. Por ejemplo, la primera búsqueda se realiza introduciendo un texto. A continuación, se utilizan las imágenes obtenidas para afinar la búsqueda.

Búsqueda de vídeos

Un buscador de vídeos es un motor de búsqueda diseñado para buscar vídeos en la red. Algunos buscadores de vídeos procesan la búsqueda directamente en Internet, mientras que otros almacenan los vídeos a partir de los cuales se realiza la búsqueda. Algunos buscadores también permiten utilizar como parámetros de búsqueda el formato o la duración del vídeo. Normalmente los resultados vienen acompañados de una captura en miniatura del vídeo.

Técnicas de búsqueda de vídeos

Actualmente, casi todos los buscadores de vídeos se basan en palabras clave (búsqueda por metadatos) para realizar las búsquedas. Estas palabras clave pueden encontrarse en el título del vídeo, texto que acompaña al vídeo o pueden estar definidas por el autor. Un ejemplo de este tipo de búsqueda es YouTube .

Buscador de modelos 3D

Un buscador de modelos 3D tiene como objetivo encontrar el archivo de un objeto de modelado 3D desde una base de datos o red. A primera vista la implementación de este tipo de buscadores puede parecer innecesaria, pero debido a la continua inflación documental de Internet, cada día se hace más necesaria la indexación de información.

Técnicas de búsqueda de modelos 3D

Técnicas de búsqueda de modelos 3D

Estos se han utilizado con buscadores tradicionales basados ​​en texto (palabras clave/etiquetas), donde los autores del material indexado , o los usuarios de Internet, han aportado estas etiquetas o palabras clave. Debido a que no siempre es eficaz, recientemente se ha investigado en la implementación de buscadores que combinan la búsqueda mediante texto con la búsqueda comparada de dibujos 2D, dibujos 3D y modelos 3D.

La Universidad de Princeton ha desarrollado un motor de búsqueda que combina todos estos parámetros para realizar la búsqueda, aumentando así la eficiencia de la búsqueda. [6] Además, el portal 3DfindIT.com ofrece un motor de búsqueda de modelos 3D basado en bocetos, dibujos, texto, etc. https://www.3dfindit.com/

Búsqueda visual móvil

Un buscador de imágenes móvil es un tipo de buscador diseñado exclusivamente para teléfonos móviles, a través del cual se puede encontrar cualquier información en Internet , a través de una imagen realizada con el propio teléfono móvil o utilizando determinadas palabras clave ( keywords ). Las soluciones de Mobile Visual Search permiten integrar capacidades de software de reconocimiento de imágenes en las aplicaciones móviles de marca propia. Mobile Visual Search (MVS) cierra la brecha entre los medios online y offline , permitiéndole vincular a sus clientes con el contenido digital .

Introducción

Los teléfonos móviles han evolucionado hasta convertirse en potentes dispositivos de procesamiento de imágenes y vídeo equipados con cámaras de alta resolución, pantallas a color y gráficos acelerados por hardware. También están cada vez más equipados con un sistema de posicionamiento global y conectados a redes inalámbricas de banda ancha. Todo esto permite una nueva clase de aplicaciones que utilizan la cámara del teléfono para iniciar consultas de búsqueda sobre objetos que se encuentran en proximidad visual al usuario (Figura 1). Dichas aplicaciones se pueden utilizar, por ejemplo, para identificar productos, comparar precios, encontrar información sobre películas, discos compactos (CD), bienes raíces, medios impresos u obras de arte.

Proceso

Normalmente, este tipo de buscadores utilizan técnicas de consulta por ejemplo o consulta de imagen por ejemplo , que utilizan el contenido, la forma, la textura y el color de la imagen para compararlos en una base de datos y luego entregar los resultados aproximados de la consulta.

El proceso utilizado en estas búsquedas en los teléfonos móviles es el siguiente:

En primer lugar, la imagen se envía a la aplicación servidor. Ya en el servidor, la imagen será analizada por diferentes equipos analíticos, ya que cada uno está especializado en diferentes campos que componen una imagen. Luego, cada equipo decidirá si la imagen enviada contiene los campos de su especialidad o no.

Una vez realizado todo este procedimiento, un ordenador central analizará los datos y creará una página con los resultados ordenados según la eficiencia de cada equipo, para finalmente ser enviada al teléfono móvil .

Aplicación en sistemas de búsqueda populares

Yandex

Yandex Images ofrece una búsqueda global inversa de imágenes y fotografías. El sitio utiliza la tecnología estándar de recuperación de imágenes basada en contenido (CBIR) que utilizan muchos otros sitios, pero además utiliza tecnología basada en inteligencia artificial para localizar más resultados en función de la consulta. [7] Los usuarios pueden arrastrar y soltar imágenes en la barra de herramientas del sitio para completar una búsqueda en Internet de imágenes similares. Yandex Images busca en algunos sitios de redes sociales poco conocidos, además de en otros más comunes, lo que ofrece a los propietarios de contenido medios para rastrear el plagio de la propiedad intelectual de imágenes o fotografías.

Imágenes de Google

La función de búsqueda por imagen de Google utiliza la búsqueda inversa de imágenes y permite a los usuarios buscar imágenes relacionadas subiendo una imagen o copiando la URL de la misma. Google logra esto analizando la imagen enviada y construyendo un modelo matemático de la misma. Luego, se compara con otras imágenes en las bases de datos de Google antes de devolver resultados coincidentes y similares. Cuando están disponibles, Google también utiliza metadatos sobre la imagen, como la descripción. En 2022, la función fue reemplazada por Google Lens como el método de búsqueda visual predeterminado en Google, y la antigua función de búsqueda por imagen sigue estando disponible en Google Lens. [8]

Ojo de hojalata

TinEye es un motor de búsqueda especializado en búsquedas inversas de imágenes. Al enviar una imagen, TinEye crea una "firma o huella digital única y compacta" de dicha imagen y la compara con otras imágenes indexadas. [9] Este procedimiento puede comparar incluso versiones muy editadas de la imagen enviada, pero por lo general no arrojará imágenes similares en los resultados. [10]

Pixy

La tecnología de búsqueda inversa de imágenes de Pixsy detecta coincidencias de imágenes [11] en la red pública de Internet para las imágenes cargadas en la plataforma Pixsy. [12] Las nuevas coincidencias se detectan automáticamente y se envían alertas al usuario. En caso de uso no autorizado, Pixsy ofrece un servicio de recuperación de compensación [13] [14] por el uso comercial del trabajo de los propietarios de las imágenes. Pixsy colabora con más de 25 bufetes de abogados y abogados de todo el mundo para resolver las infracciones de derechos de autor. Pixsy es el servicio de monitoreo estratégico de imágenes para la plataforma Flickr y sus usuarios. [15]

eBay

eBay ShopBot utiliza la búsqueda inversa de imágenes para encontrar productos a partir de una foto cargada por el usuario. eBay utiliza una red ResNet-50 para el reconocimiento de categorías, los hashes de imágenes se almacenan en Google Bigtable ; los trabajos de Apache Spark son operados por Google Cloud Dataproc para la extracción de hashes de imágenes; y el servicio de clasificación de imágenes es implementado por Kubernetes . [16]

Planeta SK

SK Planet utiliza la búsqueda inversa de imágenes para encontrar artículos de moda relacionados en su sitio web de comercio electrónico. Desarrolló la red de codificador de visión basada en TensorFlow inception-v3 , con velocidad de convergencia y generalización para uso en producción. Se utiliza una red neuronal recurrente para la clasificación de múltiples clases, y la detección de la región de interés de los productos de moda se basa en Faster R-CNN . El sistema de búsqueda inversa de imágenes de SK Planet se construye en menos de 100 meses-hombre. [17]

Alibaba

Alibaba lanzó la aplicación Pailitao en 2014. Pailitao ( en chino :拍立淘, que literalmente significa comprar a través de una cámara) permite a los usuarios buscar artículos en la plataforma de comercio electrónico de Alibaba tomando una foto del objeto de consulta. La aplicación Pailitao utiliza un modelo CNN profundo con ramas para la detección conjunta y el aprendizaje de características para descubrir la máscara de detección y la característica discriminatoria exacta sin perturbaciones de fondo. GoogLeNet V1 se utiliza como modelo base para la predicción de categorías y el aprendizaje de características. [18] [19]

Interés

Pinterest adquirió la empresa emergente VisualGraph en 2014 e introdujo la búsqueda visual en su plataforma. [20] En 2015, Pinterest publicó un artículo en la conferencia ACM Conference on Knowledge Discovery and Data Mining y reveló la arquitectura del sistema. El pipeline utiliza Apache Hadoop , el marco de red neuronal convolucional de código abierto Caffe , Cascading para procesamiento por lotes, PinLater para mensajería y Apache HBase para almacenamiento. Las características de la imagen, incluidas las características locales, las características profundas, las firmas de color salientes y los píxeles salientes se extraen de las cargas de los usuarios. El sistema es operado por Amazon EC2 y solo requiere un clúster de 5 instancias de GPU para manejar las cargas diarias de imágenes en Pinterest. Al utilizar la búsqueda inversa de imágenes, Pinterest puede extraer características visuales de objetos de moda (por ejemplo, zapatos, vestido, anteojos, bolso, reloj, pantalones, pantalones cortos, bikini, aretes) y ofrecer recomendaciones de productos que se ven similares. [21] [22]

JD.com

JD.com reveló el diseño y la implementación de su sistema de búsqueda visual en tiempo real en la conferencia Middleware '18 . El artículo revisado por pares se centra en los algoritmos utilizados por el sistema distribuido de extracción, indexación y recuperación de características de imágenes jerárquicas de JD, que tiene 300 millones de usuarios activos diarios. El sistema pudo soportar 80 millones de actualizaciones de su base de datos por hora cuando se implementó en producción en 2018. [23]

Bing

Microsoft Bing publicó la arquitectura de su sistema de búsqueda inversa de imágenes en la conferencia KDD'18. El documento afirma que se utilizan diversas características de una imagen consultada enviada por un usuario para describir su contenido, incluido el uso de codificadores de redes neuronales profundas , funciones de reconocimiento de categorías, funciones de reconocimiento facial , funciones de color y funciones de detección de duplicados. [24]

Amazonas

Amazon.com reveló la arquitectura de un motor de búsqueda visual para productos de moda y hogar llamado Amazon Shop the Look en un artículo publicado en la conferencia KDD'22. El artículo describe las lecciones aprendidas por Amazon cuando se implementó en un entorno de producción, incluido el aumento de datos basado en síntesis de imágenes para optimizar el rendimiento de la recuperación y mejorar la precisión. [25]

Sistemas de investigación

El laboratorio de Beijing de Microsoft Research Asia publicó un artículo en las Actas del IEEE sobre los sistemas Arista-SS (Búsqueda similar) y Arista-DS (Búsqueda de duplicados). Arista-DS solo realiza algoritmos de búsqueda de duplicados, como el análisis de componentes principales sobre características de imágenes globales, para reducir los costos computacionales y de memoria. Arista-DS puede realizar búsquedas de duplicados en 2 mil millones de imágenes con 10 servidores, pero con la desventaja de no detectar duplicados cercanos. [26]

Implementaciones de código abierto

En 2007, se lanza la biblioteca Puzzle bajo la licencia ISC . Puzzle está diseñada para ofrecer búsqueda inversa de imágenes visualmente similares, incluso después de que las imágenes hayan sido redimensionadas, recomprimidas, recoloreadas y/o ligeramente modificadas. [27]

El proyecto de código abierto image-match se lanzó en 2016. El proyecto, licenciado bajo la Licencia Apache , implementa un motor de búsqueda de imágenes inversa escrito en Python . [28]

Tanto la biblioteca Puzzle como los proyectos de coincidencia de imágenes utilizan algoritmos publicados en una conferencia IEEE ICIP. [29]

En 2019, O'Reilly publicó un libro que documenta cómo se puede construir un sistema simple de búsqueda inversa de imágenes en unas pocas horas. El libro cubre la extracción de características de imágenes y la búsqueda de similitudes, junto con temas más avanzados que incluyen la escalabilidad mediante GPU y el ajuste de la mejora de la precisión de la búsqueda. [30] El código del sistema se puso a disposición de forma gratuita en GitHub . [31]

Búsqueda inversa de vídeo

Las demandas de procesamiento para realizar una búsqueda inversa de video serían asombrosamente altas. No existe una herramienta sencilla que simplemente cargue el video para encontrar los resultados coincidentes. En la actualidad, no existe ninguna tecnología que pueda realizar con éxito una búsqueda inversa de video. [32] [33]

Sistemas de búsqueda inversa de imágenes de producción

Véase también

Referencias

  1. ^ "Cómo buscar por imagen" . Consultado el 2 de noviembre de 2013 .
  2. ^ "Búsqueda de vídeos con Frompo". Frompo.com . Consultado el 2 de noviembre de 2013 .
  3. ^ "Preguntas frecuentes - TinEye - ¿Por qué utilizar TinEye?". Ojo de hojalata .
  4. ^ Agrupamiento de funciones para la búsqueda de imágenes web parcialmente duplicadas a gran escala Microsoft .
  5. ^ Un nuevo motor de búsqueda de imágenes en la Web que utiliza el algoritmo SIFT computer.org
  6. ^ Funkhouser, Thomas; Min, Patrick; Kazhdan, Michael; Chen, Joyce; Halderman, Alex; Dobkin, David; Jacobs, David (2002). "Un motor de búsqueda para modelos 3D" (PDF) . ACM Transactions on Graphics . 22 (1): 83–105. doi :10.1145/588272.588279. S2CID  1178691.
  7. ^ Raj, Abhishek, ed. (27 de febrero de 2022). "¿Cómo funciona la búsqueda inversa de imágenes de Yandex? Guía detallada". www.buddinggeek.com . Budding Geek . Consultado el 5 de mayo de 2022 .
  8. ^ Li, Abner (10 de agosto de 2022). «Google Images en la web ahora usa Google Lens». 9to5Google . Consultado el 2 de diciembre de 2022 .
  9. ^ "Preguntas frecuentes - TinEye - ¿Cómo funciona TinEye?". Ojo de hojalata .
  10. ^ "Preguntas frecuentes - TinEye - ¿Puede TinEye encontrar imágenes similares?". Ojo de hojalata .
  11. ^ "Encuentra imágenes robadas - Pixsy". Pixsy . Consultado el 20 de octubre de 2017 .
  12. ^ "Reseña de Pixsy.com: Cómo encontrar y combatir el robo de imágenes - Marketing online para artistas -". Marketing online para artistas . 2015-07-02 . Consultado el 2017-10-20 .
  13. ^ "Pixsy: encuentra y recibe dinero por el robo de imágenes". artlawjournal.com . 2014-10-18 . Consultado el 2017-10-20 .
  14. ^ "Resolver el robo de imágenes - Pixsy". Pixsy . Consultado el 20 de octubre de 2017 .
  15. ^ "Flickr se asocia con Pixsy para que puedas cobrar cuando te roben fotos". petapixel.com . 9 de abril de 2019 . Consultado el 12 de diciembre de 2019 .
  16. ^ Yang, Fan; Kale, Ajinkya; Bubnov, Yury; Stein, Leon; Wang, Qiaosong; Kiapour, Hadi; Piramuthu, Robinson (2017). "Búsqueda visual en eBay". Actas de la 23.ª Conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos. págs. 2101–2110. arXiv : 1706.03154 . doi :10.1145/3097983.3098162. ISBN 9781450348874. Número de identificación del sujeto  22367645. {{cite book}}: |work=ignorado ( ayuda )
  17. ^ Búsqueda visual de productos de moda en SK Planet
  18. ^ Zhang, Yanhao; Pan, Pan; Zheng, Yun; Zhao, Kang; Zhang, Yingya; Ren, Xiaofeng; Jin, Rong (2018). "Búsqueda visual en Alibaba". Actas de la 24ª Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos. págs. 993–1001. arXiv : 2102.04674 . doi :10.1145/3219819.3219820. ISBN 9781450355520.S2CID50776405  .​ {{cite book}}: |work=ignorado ( ayuda )
  19. ^ "Comprar con la cámara: la búsqueda visual de imágenes se fusiona con el comercio electrónico en Alibaba". Alibaba Tech . Septiembre de 2020.
  20. ^ Josh Constine (6 de enero de 2014). "Pinterest adquiere VisualGraph, una startup de reconocimiento de imágenes y búsqueda visual". TechCrunch . AOL.
  21. ^ Jing, Yushi; Liu, David; Kislyuk, Dmitry; Zhai, Andrew; Xu, Jiajing; Donahue, Jeff; Tavel, Sarah (2015). "Búsqueda visual en Pinterest". Actas de la 21.ª Conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos. págs. 1889–1898. doi :10.1145/2783258.2788621. ISBN 9781450336642. Número de identificación del sujeto  1153609. {{cite book}}: |work=ignorado ( ayuda )
  22. ^ "Construcción de un flujo de trabajo escalable para visión artificial". Pinterest Ingeniería . Archivado desde el original el 6 de septiembre de 2015.
  23. ^ Li, Jie; Liu, Haifeng; Gui, Chuanghua; Chen, Jianyu; Ni, Zhenyuan; Wang, Ning; Chen, Yuan (2018). "El diseño y la implementación de un sistema de búsqueda visual en tiempo real en la plataforma de comercio electrónico JD". Actas de la 19.ª Conferencia Internacional de Middleware Industry. págs. 9–16. arXiv : 1908.07389 . doi :10.1145/3284028.3284030. ISBN 9781450360166. Número de identificación del sujeto  53713854. {{cite book}}: |website=ignorado ( ayuda )
  24. ^ Hu, Houdong; Wang, Yan; Yang, Linjun; Komlev, Pavel; Huang, Li; Chen, Xi (Stephen); Huang, Jiapei; Wu, Ye; Merchant, Meenaz; Sacheti, Arun (2018). "Búsqueda visual responsiva a escala web en Bing". Actas de la 24.ª Conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos. págs. 359–367. doi :10.1145/3219819.3219843. ISBN 9781450355520. Número de identificación del sujeto  3427399. {{cite book}}: |website=ignorado ( ayuda )
  25. ^ Amazon Shop the Look: un sistema de búsqueda visual para moda y hogar
  26. ^ Anotación de imágenes basada en búsqueda duplicada utilizando datos a escala web Microsoft.
  27. ^ La biblioteca de rompecabezas
  28. ^ ProvenanceLabs / comparación de imágenes
  29. ^ Una firma de imagen para cualquier tipo de imagen
  30. ^ Koul, Anirudh (octubre de 2019). "Capítulo 4. Creación de un motor de búsqueda de imágenes inversas: comprensión de las incrustaciones". Aprendizaje profundo práctico para la nube, los dispositivos móviles y el borde. O'Reilly Media . ISBN 9781492034865.
  31. ^ Repositorio de fuentes de libros de aprendizaje profundo práctico
  32. ^ Cómo utilizar la búsqueda inversa de vídeos (y por qué es útil). Septiembre de 2022. {{cite book}}: |work=ignorado ( ayuda )
  33. ^ "¿Cómo encontrar la fuente de un vídeo con la búsqueda inversa de imágenes?". Alibaba DigitBin . Octubre de 2020.
  34. ^ Cómo hacer una búsqueda inversa de imágenes desde tu teléfono