stringtranslate.com

Esquema del reconocimiento de objetos

Reconocimiento de objetos : tecnología en el campo de la visión por computadora para encontrar e identificar objetos en una secuencia de imágenes o videos. Los seres humanos reconocen multitud de objetos en imágenes con poco esfuerzo, a pesar de que la imagen de los objetos puede variar algo en diferentes puntos de vista, en muchos tamaños y escalas diferentes o incluso cuando se trasladan o giran. Los objetos pueden reconocerse incluso cuando están parcialmente ocultos a la vista. Esta tarea sigue siendo un desafío para los sistemas de visión por computadora. Se han implementado muchos enfoques para esta tarea a lo largo de varias décadas.

Enfoques basados ​​en modelos de objetos tipo CAD

Reconocimiento por partes

Métodos basados ​​en la apariencia

Coincidencia de bordes

Búsqueda de divide y vencerás

Coincidencia de escala de grises

Coincidencia de gradiente

Histogramas de respuestas de campo receptivo.

Grandes bases de modelos

Métodos basados ​​en características

Árboles de interpretación

Plantear hipótesis y probar

Pose consistencia

Pose de agrupamiento

Invariancia

hash geométrico

Transformación de características invariantes de escala (SIFT)

Funciones robustas aceleradas (SURF)

Representaciones de bolsa de palabras.

Algoritmo genético

Los algoritmos genéticos pueden funcionar sin conocimiento previo de un conjunto de datos determinado y pueden desarrollar procedimientos de reconocimiento sin intervención humana. Un proyecto reciente logró una precisión del 100 por ciento en los conjuntos de datos de imágenes de referencia de motocicletas, rostros, aviones y automóviles de Caltech y una precisión del 99,4 por ciento en conjuntos de datos de imágenes de especies de peces. [9] [10]

Otros enfoques

Aplicaciones

Los métodos de reconocimiento de objetos tienen las siguientes aplicaciones:

Encuestas

Ver también

Liza

Notas

  1. ^ Rahesh Mohan y Rakamant Nevatia (1992). "Organización perceptual para segmentación y descripción de escenas" (PDF) . IEEE Trans Pattern Anal Mach Intell .
  2. ^ Swain, Michael J.; Ballard, Dana H. (1 de noviembre de 1991). "Indexación de colores". Revista Internacional de Visión por Computadora . 7 (1): 11–32. doi :10.1007/BF00130487. ISSN  1573-1405. S2CID  8167136.
  3. ^ Schiele, Bernt; Crowley, James L. (1 de enero de 2000). "Reconocimiento sin correspondencia mediante histogramas de campo receptivo multidimensional". Revista Internacional de Visión por Computadora . 36 (1): 31–50. doi :10.1023/A:1008120406972. ISSN  1573-1405. S2CID  2551159.
  4. ^ O. Linde y T. Lindeberg "Reconocimiento de objetos utilizando histogramas de campo receptivo compuestos de mayor dimensionalidad", Proc. Conferencia internacional sobre reconocimiento de patrones (ICPR'04), Cambridge, Reino Unido II:1-6, 2004.
  5. ^ O. Linde; T. Lindeberg (2012). "Histogramas de señales complejas compuestas: una investigación del contenido de la información en descriptores de imágenes basados ​​en campos receptivos para el reconocimiento de objetos". Visión por computadora y comprensión de imágenes . 116 (4): 538–560. doi :10.1016/j.cviu.2011.12.003.
  6. ^ Lowe, DG, "Características distintivas de la imagen a partir de puntos clave invariantes de escala", Revista internacional de visión por computadora, 60, 2, págs. 91-110, 2004.
  7. ^ Lindeberg, Tony (2012). "Transformación de características invariantes de escala". Scholarpedia . 7 (5): 10491. Código bibliográfico : 2012SchpJ...710491L. doi : 10.4249/scholarpedia.10491 .
  8. ^ Bahía, Herbert; Ess, Andrés; Tuytelaars, Tinne; Van Gool, Luc (2008). "Funciones robustas aceleradas (SURF)". Visión por computadora y comprensión de imágenes . 110 (3): 346–359. CiteSeerX 10.1.1.205.738 . doi :10.1016/j.cviu.2007.09.014. S2CID  14777911. 
  9. ^ "El nuevo algoritmo de reconocimiento de objetos aprende sobre la marcha". Gizmag.com. 20 de enero de 2014 . Consultado el 21 de enero de 2014 .
  10. ^ Lillywhite, K.; Lee, DJ; Tippetts, B.; Archibald, J. (2013). "Un método de construcción de características para el reconocimiento general de objetos". Reconocimiento de patrones . 46 (12): 3300. Código bibliográfico : 2013PatRe..46.3300L. doi :10.1016/j.patcog.2013.06.002.
  11. ^ Brown, Matthew y David G. Lowe. "Reconocimiento y reconstrucción de objetos 3D sin supervisión en conjuntos de datos desordenados". Modelado e imágenes digitales 3-D, 2005. 3DIM 2005. Quinta Conferencia Internacional sobre. IEEE, 2005.
  12. ^ ab Oliva, Aude y Antonio Torralba. "El papel del contexto en el reconocimiento de objetos". Tendencias en ciencias cognitivas 11.12 (2007): 520-527.
  13. ^ ab Niu, Zhenxing y col. "Modelo de tema consciente del contexto para el reconocimiento de escenas". Conferencia IEEE 2012 sobre visión por computadora y reconocimiento de patrones. IEEE, 2012.
  14. ^ Stein, Fridtjof y Gérard Medioni. "Indexación estructural: reconocimiento eficiente de objetos 3D". Transacciones IEEE sobre análisis de patrones e inteligencia artificial 2 (1992): 125-145.
  15. ^ Zhu, Song-Chun y David Mumford. "Una gramática estocástica de imágenes". Fundamentos y tendencias en visión y gráficos por computadora 2.4 (2007): 259-362.
  16. ^ Nayar, Shree K. y Ruud M. Bolle. "Reconocimiento de objetos basado en reflectancia". Revista internacional de visión por computadora 17.3 (1996): 219-240.
  17. ^ Worthington, Philip L. y Edwin R. Hancock. "Reconocimiento de objetos mediante forma a partir de sombreado". Transacciones IEEE sobre análisis de patrones e inteligencia artificial 23.5 (2001): 535-542.
  18. ^ Shotton, Jamie y col. "Textonboost para la comprensión de imágenes: reconocimiento y segmentación de objetos de múltiples clases mediante el modelado conjunto de textura, diseño y contexto". Revista internacional de visión por computadora 81.1 (2009): 2-23.
  19. ^ "Mejor visión del robot". KurzweilAI . Consultado el 9 de octubre de 2013 .
  20. ^ Donahue, Jeffrey y col. "Redes convolucionales recurrentes a largo plazo para reconocimiento y descripción visual". Actas de la conferencia IEEE sobre visión por computadora y reconocimiento de patrones. 2015.
  21. ^ Karpathy, Andrej y Li Fei-Fei. "Alineaciones visual-semánticas profundas para generar descripciones de imágenes". Actas de la conferencia IEEE sobre visión por computadora y reconocimiento de patrones. 2015.
  22. ^ P Duygulu; K Barnard; N de Fretias y D Forsyth (2002). "Reconocimiento de objetos como traducción automática: aprendizaje de un léxico para un vocabulario de imágenes fijas". Actas de la Conferencia europea sobre visión por computadora . págs. 97-112. Archivado desde el original el 5 de marzo de 2005.
  23. ^ "Android mira la visión por computadora".Martha J. Farah "Visual Agnosia", Computación, visión por computadora, neurociencia cognitiva, MIT Press, 2011-05-01, páginas 760-781, ISSN 1468-4233 [1] [ enlace muerto ]
  24. ^ Esteva, André y col. "Clasificación del cáncer de piel a nivel dermatólogo con redes neuronales profundas". Naturaleza 542.7639 (2017): 115.
  25. ^ Brown, M. y Lowe, DG, "Reconocimiento de panoramas", ICCV, p. 1218, Novena Conferencia Internacional IEEE sobre Visión por Computadora (ICCV'03) - Volumen 2, Niza, Francia, 2003
  26. ^ Li, L., Guo, B. y Shao, K., "Marca de agua de imagen geométricamente robusta mediante transformación de características invariantes de escala y momentos de Zernike", Chinese Optics Letters, volumen 5, número 6, págs. 332-335, 2007 .
  27. ^ Se, S., Lowe, DG y Little, JJ, "Localización y mapeo global basados ​​en visión para robots móviles", IEEE Transactions on Robotics, 21, 3 (2005), págs.
  28. ^ Thomas Serre, Maximillian Riesenhuber, Jennifer Louie, Tomaso Poggio, "Sobre el papel de las características específicas de los objetos para el reconocimiento de objetos del mundo real en la visión biológica". Laboratorio de Inteligencia Artificial y Departamento de Ciencias Cognitivas y del Cerebro, Instituto de Tecnología de Massachusetts, Centro de Aprendizaje Biológico y Computacional, Instituto McGovern para la Investigación del Cerebro, Cambridge, MA, EE. UU.
  29. ^ Permaloff, Anne; Grafton, Carl (1992). "Reconocimiento óptico de caracteres". PD: Ciencia Política y Política . 25 (3): 523–531. doi :10.2307/419444. ISSN  1049-0965. JSTOR  419444. S2CID  64806776.
  30. ^ Christian Demant, Bernd Streicher-Abel, Peter Waszkewitz, "Procesamiento de imágenes industriales: control de calidad visual en la fabricación" Esquema del reconocimiento de objetos en Google Books
  31. ^ Nuno Vasconcelos "Indexación de imágenes con jerarquías de mezclas" Archivado el 18 de enero de 2011 en Wayback Machine Compaq Computer Corporation, Proc. Conferencia IEEE sobre visión por computadora y reconocimiento de patrones, Kauai, Hawaii, 2001
  32. ^ Heikkilä, Janne; Silvén, Olli (2004). "Un sistema en tiempo real para el seguimiento de ciclistas y peatones". Computación de Imagen y Visión . 22 (7): 563–570. doi :10.1016/j.imavis.2003.09.010.
  33. ^ Jung, Ho Gi; Kim, Dong Suk; Yoon, Pal Joo; Kim, Jaihie (2006). Yeung, Dit-Yan; Kwok, James T.; Fred, Ana; Roli, Fabio; de Ridder, Dick (eds.). Reconocimiento de marcas de espacios de estacionamiento basado en análisis de estructura para sistema de estacionamiento semiautomático . Apuntes de conferencias sobre informática. vol. 4109. Berlín, Heidelberg: Springer. págs. 384–393. doi : 10.1007/11815921_42 . ISBN 978-3-540-37241-7. {{cite book}}: |journal=ignorado ( ayuda )
  34. ^ SK Nayar, H. Murase y SA Nene, "Aprendizaje, posicionamiento y seguimiento de la apariencia visual" Proc. De IEEE Internacional. Conf. sobre Robótica y Automatización, San Diego, mayo de 1994
  35. ^ Liu, F.; Gleicher, M.; Jin, H.; Agarwala, A. (2009). "Deformaciones que preservan el contenido para la estabilización de video 3D". Transacciones ACM sobre gráficos . 28 (3): 1. CiteSeerX 10.1.1.678.3088 . doi :10.1145/1531326.1531350. 

Referencias

enlaces externos