Extracción de objetos interactiva simple

La extracción de objetos interactivos simples ( SIOX ) es un algoritmo para extraer objetos en primer plano de imágenes y vídeos en color con muy poca interacción del usuario. ^[1] Se ha implementado como herramienta de "selección de primer plano" en GIMP (desde la versión 2.3.3), como parte de la herramienta de seguimiento en Inkscape (desde 0.44pre3) y como función en ImageJ y Fiji (complemento) . También se informaron implementaciones experimentales para Blender y Krita . Aunque el algoritmo se diseñó originalmente para vídeos, prácticamente todas las implementaciones utilizan SIOX principalmente para la segmentación de imágenes fijas. De hecho, a menudo se dice que es el estándar de facto actual para esta tarea en el mundo del código abierto .

Inicialmente, se utiliza una herramienta de selección manual para especificar la región de interés. Debe contener todos los objetos de primer plano para extraer y la menor cantidad de objetos de fondo posible. Los píxeles fuera de la región de interés forman el fondo seguro, mientras que la región interior define un superconjunto del primer plano, es decir, la región desconocida. A continuación se utiliza el llamado pincel de primer plano para marcar regiones representativas del primer plano. El algoritmo genera una máscara de selección. La selección se puede refinar agregando más marcas de primer plano o agregando marcas de fondo usando el pincel de fondo.

Técnicamente, el algoritmo realiza los siguientes pasos:

Cree un conjunto de colores representativos para un primer plano y un fondo determinados, las llamadas firmas de color.
Asigne todos los puntos de la imagen al primer plano o al fondo mediante una búsqueda ponderada del vecino más cercano en las firmas de color.
Aplique algunas operaciones de procesamiento de imágenes estándar como erosionar, dilatar y desenfocar para eliminar artefactos.
Encuentre los componentes de primer plano conectados que sean lo suficientemente grandes o estén marcados por el usuario.

Para la segmentación de video, las regiones seguras de fondo y de primer plano se aprenden de las estadísticas de movimiento. SIOX también cuenta con herramientas que permiten un refinamiento preciso de bordes y áreas de alta textura a subpíxeles, los llamados "pinceles de refinamiento de detalles".

Como ocurre con todos los algoritmos de segmentación , siempre hay imágenes en las que el algoritmo no produce resultados perfectos. El inconveniente más crítico de SIOX es la dependencia del color. Aunque muchas fotografías se pueden separar fácilmente por color, el algoritmo no puede lidiar con el camuflaje. Si el primer plano y el fondo comparten muchos tonos idénticos de colores similares, el algoritmo podría dar como resultado partes faltantes o un primer plano clasificado incorrectamente. SIOX funciona igual de bien en diferentes puntos de referencia en comparación con los métodos de segmentación basados en gráficos, como Grabcut . Sin embargo, SIOX es más resistente al ruido y, por tanto, también puede utilizarse para la segmentación de vídeos. Los métodos de segmentación basados en gráficos buscan un corte mínimo y, por lo tanto, tienden a no funcionar de manera óptima con estructuras complejas.

El algoritmo se desarrolló inicialmente en el departamento de informática de la Freie Universitaet Berlin . El desarrollador principal, Gerald Friedland , es ahora profesor del departamento EECS de la Universidad de California en Berkeley y también científico de datos principal en el Laboratorio Nacional Lawrence Livermore . Continúa apoyando el desarrollo a través de tutorías, por ejemplo en Google Summer of Code .

Notas

^ Friedland, G., Jantz, K., Lenz, T., Wiesel, F. y Rojas, R. (2006). "Un enfoque práctico para la extracción de múltiples objetos con precisión de límites a partir de imágenes fijas y vídeos". Octavo Simposio Internacional IEEE sobre Multimedia (ISM'06) . págs. 307–316. doi :10.1109/ISM.2006.9. ISBN 978-0-7695-2746-8. S2CID 13938666.{{cite book}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )

Referencias

G. Friedland, K. Jantz, R. Rojas: SIOX: Simple Interactive Object Extraction in Still Images, Actas del Simposio Internacional IEEE sobre Multimedia (ISM2005), págs. 253–259, Irvine (California), diciembre de 2005. artículo en línea
G. Friedland, K. Jantz, T. Lenz, F. Wiesel, R. Rojas: Cortar y pegar objetos en imágenes y vídeos, Revista Internacional de Computación Semántica Vol 1, No 2, págs. 221–247, World Scientific, EE. UU. , junio de 2007. artículo en línea

enlaces externos

www.siox.org
Vídeo de demostración de SIOX en GIMP
SIOX en Fiji e ImageJ
www.gimp.org
www.inkscape.org
www.echalk.de