Segmentación del espacio de escala

El *dendrograma* correspondiente a las segmentaciones de la figura anterior. Cada "×" identifica la posición de un extremo de la primera derivada de una de las 15 versiones suavizadas de la señal (rojo para los máximos, azul para los mínimos). Cada "+" identifica la posición a la que se remonta el extremo en la escala más fina. Las características de la señal que persisten hasta la escala más alta (versión más suavizada) son evidentes como las estructuras altas que corresponden a los límites de los segmentos principales en la figura anterior.

La segmentación en espacio de escala o segmentación multiescala es un marco general para la segmentación de señales e imágenes, basado en el cálculo de descriptores de imágenes en múltiples escalas de suavizado.

Segmentación de señales jerárquica unidimensional

El trabajo seminal de Witkin en el espacio de escala ^[1] incluyó la noción de que una señal unidimensional podría segmentarse de manera inequívoca en regiones, con un parámetro de escala que controla la escala de segmentación.

Una observación clave es que los cruces por cero de las derivadas segundas (que son los mínimos y máximos de la derivada primera o pendiente) de versiones suavizadas en múltiples escalas de una señal forman un árbol de anidamiento, que define relaciones jerárquicas entre segmentos a diferentes escalas. Específicamente, los extremos de pendiente a escalas gruesas se pueden rastrear hasta las características correspondientes a escalas finas. Cuando un máximo de pendiente y un mínimo de pendiente se aniquilan entre sí a una escala mayor, los tres segmentos que separaron se fusionan en un solo segmento, definiendo así la jerarquía de segmentos.

Segmentación de imágenes y boceto primario

Se han realizado numerosos trabajos de investigación en este campo, de los cuales algunos han llegado a un punto en el que se pueden aplicar ya sea con intervención manual interactiva (normalmente en aplicaciones de imágenes médicas ) o de forma totalmente automática. A continuación se presenta una breve descripción de algunas de las principales ideas de investigación en las que se basan los enfoques actuales.

Sin embargo, la estructura de anidamiento que describió Witkin es específica para señales unidimensionales y no se transfiere fácilmente a imágenes de dimensiones superiores. No obstante, esta idea general ha inspirado a varios otros autores a investigar esquemas de segmentación de imágenes de grueso a fino. Koenderink ^[2] propuso estudiar cómo evolucionan los contornos de isointensidad a lo largo de las escalas y este enfoque fue investigado con más detalle por Lifshitz y Pizer ^[3] . Desafortunadamente, sin embargo, la intensidad de las características de la imagen cambia a lo largo de las escalas, lo que implica que es difícil rastrear características de imágenes de escala gruesa a escalas más finas utilizando información de isointensidad.

Lindeberg ^[4] estudió el problema de vincular los extremos locales y los puntos de silla sobre escalas, y propuso una representación de imagen llamada boceto primario del espacio de escala que hace explícitas las relaciones entre las estructuras a diferentes escalas, y también hace explícitas qué características de la imagen son estables en grandes rangos de escala, incluidas las escalas localmente apropiadas para ellas. Bergholm ^[5] propuso detectar bordes en escalas gruesas en el espacio de escala y luego rastrearlos hasta escalas más finas con la elección manual tanto de la escala de detección gruesa como de la escala de localización fina.

Gauch y Pizer ^[6] estudiaron el problema complementario de crestas y valles en múltiples escalas y desarrollaron una herramienta para la segmentación de imágenes interactiva basada en cuencas hidrográficas multiescala . Olsen y Nielsen ^[7] también investigaron el uso de cuencas hidrográficas multiescala con aplicación al mapa de gradiente y Dam et al. ^[8] Vincken et al. ^{[9] propusieron una hiperpila para definir relaciones probabilísticas entre estructuras de imágenes a diferentes escalas. Ahuja y sus colaboradores}^[10]^[11] promovieron el uso de estructuras de imágenes estables en diferentes escalas en un sistema completamente automatizado. Undeman y Lindeberg ^[12] presentaron un algoritmo de segmentación cerebral completamente automático basado en ideas estrechamente relacionadas de cuencas hidrográficas multiescala y lo probaron ampliamente en bases de datos cerebrales.

Florack y Kuijper también han retomado estas ideas para la segmentación de imágenes en múltiples escalas mediante la vinculación de estructuras de imágenes a lo largo de las escalas. ^[13] Bijaoui y Rué ^[14] asocian las estructuras detectadas en el espacio de escala por encima de un umbral de ruido mínimo en un árbol de objetos que abarca múltiples escalas y corresponde a un tipo de característica en la señal original. Las características extraídas se reconstruyen con precisión utilizando un método iterativo de matriz de gradiente conjugado.

Segmentación de funciones vectoriales del tiempo

^{Lyon [15]} amplió la segmentación en el espacio de escala en otra dirección a funciones de tiempo con valores vectoriales, donde la derivada vectorial no tiene máximos ni mínimos y la segunda derivada no tiene cruces por cero, colocando los límites de los segmentos en los máximos de la magnitud euclidiana de la derivada vectorial de las señales vectoriales suavizadas. Esta técnica se ha aplicado a la segmentación del habla y del texto. ^[16]

Referencias

^ Witkin, A. (1984). "Filtrado en el espacio de escala: un nuevo enfoque para la descripción en múltiples escalas" (PDF) . ICASSP '84. IEEE International Conference on Acoustics, Speech, and Signal Processing . Vol. 9. págs. 150–153. doi :10.1109/ICASSP.1984.1172729. S2CID 11755124. Archivado desde el original (PDF) el 2019-08-01 . Consultado el 2019-08-01 .
^ Koenderink, Jan "La estructura de las imágenes", Biological Cybernetics, 50:363--370, 1984
^ Lifshitz, LM; Pizer, SM (1990). "Un enfoque jerárquico multiresolución para la segmentación de imágenes basado en extremos de intensidad". IEEE Transactions on Pattern Analysis and Machine Intelligence . 12 (6): 529–540. doi :10.1109/34.56189.
^ Lindeberg, Tony (1993). "Detección de estructuras de imágenes salientes similares a manchas y sus escalas con un boceto primario en el espacio de escala: un método para el foco de atención". Revista internacional de visión por computadora . 11 (3): 283–318. doi :10.1007/BF01469346. S2CID 11998035.
^ Bergholm, F. (1987). "Enfoque de bordes". IEEE Transactions on Pattern Analysis and Machine Intelligence . 9 (6): 726–741. doi :10.1109/tpami.1987.4767980. PMID 21869435. S2CID 18352198.
^ Gauch, JM; Pizer, SM (1993). "Análisis multirresolución de crestas y valles en imágenes en escala de grises". IEEE Transactions on Pattern Analysis and Machine Intelligence . 15 (6): 635–646. doi :10.1109/34.216734.
^ Olsen, Ole Fogh; Nielsen, Mads (1997). "Segmentación de cuencas hidrográficas por magnitud de gradiente multiescala" (PDF) . Análisis y procesamiento de imágenes . Apuntes de clase en informática. Vol. 1310. págs. 6-13. doi :10.1007/3-540-63507-6_178. ISBN . 978-3-540-63507-9.
^ Dam, E., Johansen, P., Olsen, O. Thomsen,, A. Darvann, T., Dobrzenieck, A., Hermann, N., Kitai, N., Kreiborg, S., Larsen, P., Nielsen, M.: "Segmentación multiescala interactiva en uso clínico" en Congreso Europeo de Radiología 2000.
^ Vincken, KL; Koster, ASE; Viergever, MA (1997). "Segmentación probabilística de imágenes multiescala". IEEE Transactions on Pattern Analysis and Machine Intelligence . 19 (2): 109–120. doi :10.1109/34.574787.
^ Tabb, M.; Ahuja, N. (1997). "Segmentación de imágenes multiescala mediante detección integrada de bordes y regiones". IEEE Transactions on Image Processing . 6 (5): 642–655. Bibcode :1997ITIP....6..642T. doi :10.1109/83.568922. PMID 18282958.
^ Akbas, Emre; Ahuja, Narendra (2010). "De las discontinuidades de rampa al árbol de segmentación". Visión artificial – ACCV 2009. Apuntes de clase en informática. Vol. 5994. págs. 123–134. doi :10.1007/978-3-642-12307-8_12. ISBN 978-3-642-12306-1.
^ Undeman, Carl; Lindeberg, Tony (2003). "Segmentación completamente automática de imágenes cerebrales obtenidas por resonancia magnética mediante difusión anisotrópica probabilística y cuencas hidrográficas multiescala". Métodos de espacio de escala en visión artificial. Apuntes de clase en informática. Vol. 2695. págs. 641–656. doi :10.1007/3-540-44935-3_45. ISBN 978-3-540-40368-5.
^ Florack, LMJ; Kuijper, A. (2000). "La estructura topológica de imágenes en el espacio de escala" (PDF) . Revista de imágenes matemáticas y visión . 12 (1): 65–79. doi :10.1023/A:1008304909717. hdl : 1874/18929 . S2CID 7515494.
^ Bijaoui, Alberto; Rue, Frédéric (1995). "Un modelo de visión multiescala adaptado a las imágenes astronómicas". Procesamiento de señales . 46 (3): 345–362. doi :10.1016/0165-1684(95)00093-4.
^ Richard F. Lyon. "Reconocimiento de voz en el espacio de escala", Proc. de 1987 ICASSP. San Diego, marzo, págs. 29.3.14, 1987.
^ "Slaney, M. Ponceleon, D., "Segmentación jerárquica utilizando indexación semántica latente en el espacio de escala", Proc. Intl. Conf. on Acoustics, Speech, and Signal Processing (ICASSP '01) 2001" (PDF) . Archivado desde el original (PDF) el 2006-09-19 . Consultado el 2006-11-01 .

Segmentación del espacio de escala

Segmentación de señales jerárquica unidimensional

Segmentación de imágenes y boceto primario

Segmentación de funciones vectoriales del tiempo

Referencias

Véase también