stringtranslate.com

Extracción de objetos interactiva simple

La extracción de objetos interactivos simples ( SIOX ) es un algoritmo para extraer objetos en primer plano de imágenes y vídeos en color con muy poca interacción del usuario. [1] Se ha implementado como herramienta de "selección de primer plano" en GIMP (desde la versión 2.3.3), como parte de la herramienta de seguimiento en Inkscape (desde 0.44pre3) y como función en ImageJ y Fiji (complemento) . También se informaron implementaciones experimentales para Blender y Krita . Aunque el algoritmo se diseñó originalmente para vídeos, prácticamente todas las implementaciones utilizan SIOX principalmente para la segmentación de imágenes fijas. De hecho, a menudo se dice que es el estándar de facto actual para esta tarea en el mundo del código abierto .

Inicialmente, se utiliza una herramienta de selección manual para especificar la región de interés. Debe contener todos los objetos de primer plano para extraer y la menor cantidad de objetos de fondo posible. Los píxeles fuera de la región de interés forman el fondo seguro, mientras que la región interior define un superconjunto del primer plano, es decir, la región desconocida. A continuación se utiliza el llamado pincel de primer plano para marcar regiones representativas del primer plano. El algoritmo genera una máscara de selección. La selección se puede refinar agregando más marcas de primer plano o agregando marcas de fondo usando el pincel de fondo.

Técnicamente, el algoritmo realiza los siguientes pasos:

Para la segmentación de video, las regiones seguras de fondo y de primer plano se aprenden de las estadísticas de movimiento. SIOX también cuenta con herramientas que permiten un refinamiento preciso de bordes y áreas de alta textura a subpíxeles, los llamados "pinceles de refinamiento de detalles".

Como ocurre con todos los algoritmos de segmentación , siempre hay imágenes en las que el algoritmo no produce resultados perfectos. El inconveniente más crítico de SIOX es la dependencia del color. Aunque muchas fotografías se pueden separar fácilmente por color, el algoritmo no puede lidiar con el camuflaje. Si el primer plano y el fondo comparten muchos tonos idénticos de colores similares, el algoritmo podría dar como resultado partes faltantes o un primer plano clasificado incorrectamente. SIOX funciona igual de bien en diferentes puntos de referencia en comparación con los métodos de segmentación basados ​​en gráficos, como Grabcut . Sin embargo, SIOX es más resistente al ruido y, por tanto, también puede utilizarse para la segmentación de vídeos. Los métodos de segmentación basados ​​en gráficos buscan un corte mínimo y, por lo tanto, tienden a no funcionar de manera óptima con estructuras complejas.

El algoritmo se desarrolló inicialmente en el departamento de informática de la Freie Universitaet Berlin . El desarrollador principal, Gerald Friedland , es ahora profesor del departamento EECS de la Universidad de California en Berkeley y también científico de datos principal en el Laboratorio Nacional Lawrence Livermore . Continúa apoyando el desarrollo a través de tutorías, por ejemplo en Google Summer of Code .

Notas

  1. ^ Friedland, G., Jantz, K., Lenz, T., Wiesel, F. y Rojas, R. (2006). "Un enfoque práctico para la extracción de múltiples objetos con precisión de límites a partir de imágenes fijas y vídeos". Octavo Simposio Internacional IEEE sobre Multimedia (ISM'06) . págs. 307–316. doi :10.1109/ISM.2006.9. ISBN 978-0-7695-2746-8. S2CID  13938666.{{cite book}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )

Referencias

enlaces externos