stringtranslate.com

Esquema del reconocimiento de objetos

Reconocimiento de objetos : tecnología en el campo de la visión artificial para encontrar e identificar objetos en una imagen o secuencia de vídeo. Los seres humanos reconocen una multitud de objetos en imágenes con poco esfuerzo, a pesar de que la imagen de los objetos puede variar un poco en diferentes puntos de vista, en muchos tamaños y escalas diferentes o incluso cuando se trasladan o giran. Los objetos pueden reconocerse incluso cuando están parcialmente obstruidos a la vista. Esta tarea sigue siendo un desafío para los sistemas de visión artificial. A lo largo de varias décadas se han implementado muchos enfoques para la tarea.

Enfoques basados ​​en modelos de objetos tipo CAD

Reconocimiento por partes

Métodos basados ​​en la apariencia

Coincidencia de bordes

Búsqueda de divide y vencerás

Coincidencia de escala de grises

Coincidencia de gradientes

Histogramas de las respuestas del campo receptivo

Bases de modelos grandes

Métodos basados ​​en características

Árboles de interpretación

Formular hipótesis y probar

Consistencia de pose

Agrupamiento de poses

Invariancia

Hashing geométrico

Transformación de características invariantes de escala(TAMIZAR A)

Funciones robustas y aceleradas(NAVEGAR)

Representaciones de bolsas de palabras

Algoritmo genético

Los algoritmos genéticos pueden funcionar sin conocimiento previo de un conjunto de datos determinado y pueden desarrollar procedimientos de reconocimiento sin intervención humana. Un proyecto reciente logró una precisión del 100 por ciento en los conjuntos de datos de referencia de imágenes de motocicletas, rostros, aviones y automóviles de Caltech y una precisión del 99,4 por ciento en los conjuntos de datos de imágenes de especies de peces. [9] [10]

Otros enfoques

Aplicaciones

Los métodos de reconocimiento de objetos tienen las siguientes aplicaciones:

Encuestas

Véase también

Liza

Notas

  1. ^ Rahesh Mohan y Rakamant Nevatia (1992). "Organización perceptual para la segmentación y descripción de escenas" (PDF) . IEEE Trans Pattern Anal Mach Intell .
  2. ^ Swain, Michael J.; Ballard, Dana H. (1 de noviembre de 1991). "Indexación de color". Revista internacional de visión por computadora . 7 (1): 11–32. doi :10.1007/BF00130487. ISSN  1573-1405. S2CID  8167136.
  3. ^ Schiele, Bernt; Crowley, James L. (1 de enero de 2000). "Reconocimiento sin correspondencia mediante histogramas de campos receptivos multidimensionales". Revista internacional de visión artificial . 36 (1): 31–50. doi :10.1023/A:1008120406972. ISSN  1573-1405. S2CID  2551159.
  4. ^ O. Linde y T. Lindeberg "Reconocimiento de objetos utilizando histogramas de campos receptivos compuestos de mayor dimensionalidad", Proc. Conferencia internacional sobre reconocimiento de patrones (ICPR'04), Cambridge, Reino Unido II:1-6, 2004.
  5. ^ O. Linde; T. Lindeberg (2012). "Histogramas compuestos de señales complejas: una investigación del contenido de información en descriptores de imágenes basados ​​en campos receptivos para el reconocimiento de objetos". Visión artificial y comprensión de imágenes . 116 (4): 538–560. doi :10.1016/j.cviu.2011.12.003.
  6. ^ Lowe, DG, "Características distintivas de la imagen a partir de puntos clave invariantes en escala", International Journal of Computer Vision, 60, 2, págs. 91-110, 2004.
  7. ^ Lindeberg, Tony (2012). "Transformación de características invariantes de escala". Scholarpedia . 7 (5): 10491. Bibcode :2012SchpJ...710491L. doi : 10.4249/scholarpedia.10491 .
  8. ^ Bay, Herbert; Ess, Andreas; Tuytelaars, Tinne; Van Gool, Luc (2008). "Características robustas aceleradas (SURF)". Visión artificial y comprensión de imágenes . 110 (3): 346–359. CiteSeerX 10.1.1.205.738 . doi :10.1016/j.cviu.2007.09.014. S2CID  14777911. 
  9. ^ "Nuevo algoritmo de reconocimiento de objetos aprende sobre la marcha". Gizmag.com. 20 de enero de 2014. Consultado el 21 de enero de 2014 .
  10. ^ Lillywhite, K.; Lee, DJ; Tippetts, B.; Archibald, J. (2013). "Un método de construcción de características para el reconocimiento general de objetos". Reconocimiento de patrones . 46 (12): 3300. Bibcode :2013PatRe..46.3300L. doi :10.1016/j.patcog.2013.06.002.
  11. ^ Brown, Matthew y David G. Lowe. "Reconocimiento y reconstrucción de objetos 3D no supervisados ​​en conjuntos de datos desordenados". Imágenes y modelado digital 3D, 2005. 3DIM 2005. Quinta conferencia internacional sobre. IEEE, 2005.
  12. ^ ab Oliva, Aude y Antonio Torralba. "El papel del contexto en el reconocimiento de objetos". Tendencias en ciencias cognitivas 11.12 (2007): 520-527.
  13. ^ ab Niu, Zhenxing, et al. "Modelo de tema sensible al contexto para reconocimiento de escenas". Conferencia IEEE de 2012 sobre visión artificial y reconocimiento de patrones. IEEE, 2012.
  14. ^ Stein, Fridtjof y Gérard Medioni. "Indexación estructural: reconocimiento eficiente de objetos en 3D". IEEE Transactions on Pattern Analysis & Machine Intelligence 2 (1992): 125-145.
  15. ^ Zhu, Song-Chun y David Mumford. "Una gramática estocástica de imágenes". Fundamentos y tendencias en gráficos y visión por computadora 2.4 (2007): 259-362.
  16. ^ Nayar, Shree K. y Ruud M. Bolle. "Reconocimiento de objetos basado en reflectancia". Revista internacional de visión artificial 17.3 (1996): 219-240.
  17. ^ Worthington, Philip L. y Edwin R. Hancock. "Reconocimiento de objetos mediante el uso de la forma a partir del sombreado". IEEE Transactions on Pattern Analysis and Machine Intelligence 23.5 (2001): 535-542.
  18. ^ Shotton, Jamie, et al. "Textonboost para la comprensión de imágenes: reconocimiento y segmentación de objetos multiclase mediante el modelado conjunto de textura, diseño y contexto". Revista internacional de visión artificial 81.1 (2009): 2-23.
  19. ^ "Mejor visión del robot". KurzweilAI . Consultado el 9 de octubre de 2013 .
  20. ^ Donahue, Jeffrey, et al. "Redes convolucionales recurrentes a largo plazo para el reconocimiento y descripción visual". Actas de la conferencia IEEE sobre visión artificial y reconocimiento de patrones. 2015.
  21. ^ Karpathy, Andrej y Li Fei-Fei. "Alineaciones visuales y semánticas profundas para generar descripciones de imágenes". Actas de la conferencia IEEE sobre visión artificial y reconocimiento de patrones. 2015.
  22. ^ P Duygulu; K Barnard; N de Fretias y D Forsyth (2002). "Reconocimiento de objetos como traducción automática: aprendizaje de un léxico para un vocabulario de imágenes fijas". Actas de la Conferencia Europea sobre Visión por Computador . pp. 97–112. Archivado desde el original el 5 de marzo de 2005.
  23. ^ "Android Eyes Visión por Computadora".Martha J. Farah "Visual Agnosia", Computer Vision Computing Cognitive Neuroscience, MIT Press, 2011-05-01, Páginas 760-781, ISSN 1468-4233 [1] [ enlace roto ]
  24. ^ Esteva, Andre, et al. "Clasificación del cáncer de piel a nivel de dermatólogo con redes neuronales profundas". Nature 542.7639 (2017): 115.
  25. ^ Brown, M., y Lowe, DG, "Reconocimiento de panoramas Archivado el 25 de diciembre de 2014 en Wayback Machine ", ICCV, pág. 1218, Novena Conferencia Internacional IEEE sobre Visión por Computador (ICCV'03) - Volumen 2, Niza, Francia, 2003
  26. ^ Li, L., Guo, B. y Shao, K., "Marca de agua de imagen geométricamente robusta utilizando transformaciones de características invariantes de escala y momentos Zernike", Chinese Optics Letters, Volumen 5, Número 6, págs. 332-335, 2007.
  27. ^ Se,S., Lowe, DG y Little, JJ,"Localización y mapeo global basado en visión para robots móviles", IEEE Transactions on Robotics, 21, 3 (2005), págs. 364-375.
  28. ^ Thomas Serre, Maximillian Riesenhuber, Jennifer Louie, Tomaso Poggio, "Sobre el papel de las características específicas de los objetos para el reconocimiento de objetos del mundo real en la visión biológica". Laboratorio de Inteligencia Artificial y Departamento de Ciencias Cognitivas y Cerebrales, Instituto Tecnológico de Massachusetts, Centro de Aprendizaje Biológico y Computacional, Instituto McGovern para la Investigación Cerebral, Cambridge, MA, EE. UU.
  29. ^ Permaloff, Anne; Grafton, Carl (1992). "Reconocimiento óptico de caracteres". PS: Ciencia política y política . 25 (3): 523–531. doi :10.2307/419444. ISSN  1049-0965. JSTOR  419444. S2CID  64806776.
  30. ^ Christian Demant, Bernd Streicher-Abel, Peter Waszkewitz, "Procesamiento de imágenes industriales: control de calidad visual en la fabricación" Esquema del reconocimiento de objetos en Google Books
  31. ^ Nuno Vasconcelos "Indexación de imágenes con jerarquías de mezclas" Archivado el 18 de enero de 2011 en Wayback Machine Compaq Computer Corporation, Proc. Conferencia IEEE sobre visión artificial y reconocimiento de patrones, Kauai, Hawái, 2001
  32. ^ Heikkilä, Janne; Silvén, Olli (2004). "Un sistema en tiempo real para el seguimiento de ciclistas y peatones". Image and Vision Computing . 22 (7): 563–570. doi :10.1016/j.imavis.2003.09.010.
  33. ^ Jung, Ho Gi; Kim, Dong Suk; Yoon, Pal Joo; Kim, Jaihie (2006). "Reconocimiento de marcas de plazas de aparcamiento basado en análisis de estructura para sistemas de aparcamiento semiautomáticos". En Yeung, Dit-Yan; Kwok, James T.; Fred, Ana; Roli, Fabio; de Ridder, Dick (eds.). Reconocimiento de patrones estructurales, sintácticos y estadísticos . Notas de clase en informática. Vol. 4109. Berlín, Heidelberg: Springer. págs. 384–393. doi : 10.1007/11815921_42 . ISBN . 978-3-540-37241-7.
  34. ^ SK Nayar, H. Murase y SA Nene, "Aprendizaje, posicionamiento y seguimiento de la apariencia visual", Actas de la Conferencia Internacional IEEE sobre Robótica y Automatización, San Diego, mayo de 1994
  35. ^ Liu, F.; Gleicher, M.; Jin, H.; Agarwala, A. (2009). "Deformaciones que preservan el contenido para la estabilización de vídeo 3D". ACM Transactions on Graphics . 28 (3): 1. CiteSeerX 10.1.1.678.3088 . doi :10.1145/1531326.1531350. 

Referencias

Enlaces externos