stringtranslate.com

Segmentación del espacio de escala

Un ejemplo unidimensional de segmentación del espacio de escala. Una señal (negra), versiones suavizadas de múltiples escalas (roja) y promedios de segmentos (azul) basados ​​en la segmentación del espacio de escala
El dendrograma correspondiente a las segmentaciones en la figura anterior. Cada "×" identifica la posición de un extremo de la primera derivada de una de las 15 versiones suavizadas de la señal (rojo para máximos, azul para mínimos). Cada "+" identifica la posición a la que el extremo rastrea en la escala más fina. Las características de la señal que persisten en la escala más alta (versión más suave) son evidentes como las estructuras altas que corresponden a los límites de los segmentos principales en la figura anterior.

La segmentación del espacio de escala o segmentación de múltiples escalas es un marco general para la segmentación de señales e imágenes, basado en el cálculo de descriptores de imágenes en múltiples escalas de suavizado.

Segmentación de señal jerárquica unidimensional.

El trabajo fundamental de Witkin en el espacio de escala [1] incluía la noción de que una señal unidimensional podría segmentarse sin ambigüedades en regiones, con un parámetro de escala controlando la escala de segmentación.

Una observación clave es que los cruces por cero de las segundas derivadas (que son mínimos y máximos de la primera derivada o pendiente) de versiones suavizadas de múltiples escalas de una señal forman un árbol de anidamiento, que define relaciones jerárquicas entre segmentos en diferentes escalas. . Específicamente, los extremos de pendiente en escalas gruesas se pueden rastrear hasta las características correspondientes en escalas finas. Cuando una pendiente máxima y una pendiente mínima se aniquilan entre sí a mayor escala, los tres segmentos que separaron se fusionan en un solo segmento, definiendo así la jerarquía de segmentos.

Segmentación de imágenes y boceto primario.

Se han realizado numerosos trabajos de investigación en esta área, de los cuales algunos han alcanzado un estado en el que se pueden aplicar con intervención manual interactiva (normalmente con aplicación a imágenes médicas ) o de forma totalmente automática. A continuación se ofrece una breve descripción de algunas de las principales ideas de investigación en las que se basan los enfoques actuales.

Sin embargo, la estructura de anidamiento que describió Witkin es específica para señales unidimensionales y no se transfiere trivialmente a imágenes de dimensiones superiores. Sin embargo, esta idea general ha inspirado a varios otros autores a investigar esquemas de segmentación de imágenes de grueso a fino. Koenderink [2] propuso estudiar cómo evolucionan los contornos de isointensidad a lo largo de las escalas y este enfoque fue investigado con más detalle por Lifshitz y Pizer. [3] Desafortunadamente, sin embargo, la intensidad de las características de la imagen cambia según las escalas, lo que implica que es difícil rastrear características de la imagen de escala gruesa a escalas más finas utilizando información de isointensidad.

Lindeberg [4] estudió el problema de vincular extremos locales y puntos de silla sobre escalas, y propuso una representación de imagen llamada bosquejo primario de espacio-escala que hace explícitas las relaciones entre estructuras a diferentes escalas, y también hace explícito qué características de la imagen son estables en diferentes escalas. amplios rangos de escala, incluidas escalas localmente apropiadas para ellos. Bergholm [5] propuso detectar bordes en escalas gruesas en el espacio de escala y luego rastrearlos hasta escalas más finas con la elección manual tanto de la escala de detección gruesa como de la escala de localización fina.

Gauch y Pizer [6] estudiaron el problema complementario de crestas y valles en múltiples escalas y desarrollaron una herramienta para la segmentación de imágenes interactiva basada en cuencas hidrográficas de múltiples escalas . Olsen y Nielsen también han investigado el uso de cuencas hidrográficas de múltiples escalas con aplicación al mapa de gradiente [7] y Dam et al. [8] Vincken et al. [9] propusieron una hiperpila para definir relaciones probabilísticas entre estructuras de imágenes en diferentes escalas. Ahuja y sus compañeros de trabajo [10] [11] han impulsado el uso de estructuras de imágenes estables a escalas en un sistema totalmente automatizado. Undeman y Lindeberg [12] han presentado un algoritmo de segmentación cerebral totalmente automático basado en ideas estrechamente relacionadas de cuencas hidrográficas de múltiples escalas, que ha sido probado exhaustivamente en bases de datos cerebrales.

Florack y Kuijper también han retomado estas ideas para la segmentación de imágenes a múltiples escalas mediante la vinculación de estructuras de imágenes a través de escalas. [13] Bijaoui y Rué [14] asocian estructuras detectadas en el espacio de escala por encima de un umbral de ruido mínimo en un árbol de objetos que abarca múltiples escalas y corresponde a un tipo de característica en la señal original. Las características extraídas se reconstruyen con precisión utilizando un método iterativo de matriz de gradiente conjugado.

Segmentación de funciones vectoriales del tiempo.

Lyon [15] extendió la segmentación del espacio de escala en otra dirección a funciones de tiempo con valores vectoriales, donde la derivada del vector no tiene máximos y mínimos, y la segunda derivada no tiene cruces por cero, al colocar los límites del segmento en los máximos. de la magnitud euclidiana de la derivada vectorial de las señales vectoriales suavizadas. Esta técnica se ha aplicado a la segmentación del habla y del texto. [dieciséis]

Referencias

  1. ^ Witkin, A. (1984). "Filtrado de espacio de escala: un nuevo enfoque para la descripción de múltiples escalas" (PDF) . ICASP '84. Conferencia internacional IEEE sobre acústica, voz y procesamiento de señales . vol. 9. págs. 150-153. doi :10.1109/ICASSP.1984.1172729. S2CID  11755124. Archivado desde el original (PDF) el 1 de agosto de 2019 . Consultado el 1 de agosto de 2019 .
  2. ^ Koenderink, Jan "La estructura de las imágenes", Biological Cybernetics, 50:363--370, 1984
  3. ^ Lifshitz, LM; Pizer, SM (1990). "Un enfoque jerárquico multiresolución para la segmentación de imágenes basado en extremos de intensidad". Transacciones IEEE sobre análisis de patrones e inteligencia artificial . 12 (6): 529–540. doi : 10.1109/34.56189.
  4. ^ Lindeberg, Tony (1993). "Detección de estructuras de imágenes destacadas en forma de manchas y sus escalas con un boceto primario de espacio de escala: un método para centrar la atención". Revista Internacional de Visión por Computadora . 11 (3): 283–318. doi :10.1007/BF01469346. S2CID  11998035.
  5. ^ Bergholm, F. (1987). "Enfoque de borde". Transacciones IEEE sobre análisis de patrones e inteligencia artificial . 9 (6): 726–741. doi :10.1109/tpami.1987.4767980. PMID  21869435. S2CID  18352198.
  6. ^ Gauch, JM; Pizer, SM (1993). "Análisis multiresolución de crestas y valles en imágenes en escala de grises". Transacciones IEEE sobre análisis de patrones e inteligencia artificial . 15 (6): 635–646. doi :10.1109/34.216734.
  7. ^ Olsen, Ole Fogh; Nielsen, Mads (1997). "Segmentación de cuencas hidrográficas de magnitud de gradiente multiescala" (PDF) . Análisis y procesamiento de imágenes . Apuntes de conferencias sobre informática. vol. 1310, págs. 6-13. doi :10.1007/3-540-63507-6_178. ISBN 978-3-540-63507-9.
  8. ^ Dam, E., Johansen, P., Olsen, O. Thomsen, A. Darvann, T., Dobrzenieck, A., Hermann, N., Kitai, N., Kreiborg, S., Larsen, P., Nielsen, M.: "Segmentación interactiva multiescala en uso clínico" en Congreso Europeo de Radiología 2000.
  9. ^ Vincken, KL; Koster, ASE; Viergever, MA (1997). "Segmentación probabilística de imágenes multiescala". Transacciones IEEE sobre análisis de patrones e inteligencia artificial . 19 (2): 109–120. doi : 10.1109/34.574787.
  10. ^ Tabb, M.; Ahuja, N. (1997). "Segmentación de imágenes multiescala mediante detección integrada de bordes y regiones". Transacciones IEEE sobre procesamiento de imágenes . 6 (5): 642–655. Código Bib : 1997ITIP....6..642T. doi : 10.1109/83.568922. PMID  18282958.
  11. ^ Akbas, Emre; Ahuja, Narendra (2010). "De las discontinuidades de la rampa al árbol de segmentación". Visión por Computador – ACCV 2009 . Apuntes de conferencias sobre informática. vol. 5994. págs. 123-134. doi :10.1007/978-3-642-12307-8_12. ISBN 978-3-642-12306-1.
  12. ^ Undeman, Carl; Lindeberg, Tony (2003). "Segmentación completamente automática de imágenes cerebrales de resonancia magnética mediante difusión anisotrópica probabilística y cuencas hidrográficas de múltiples escalas". Métodos de escala espacial en visión por computadora. Apuntes de conferencias sobre informática. vol. 2695, págs. 641–656. doi :10.1007/3-540-44935-3_45. ISBN 978-3-540-40368-5.
  13. ^ Florack, LMJ; Kuijper, A. (2000). "La estructura topológica de las imágenes del espacio de escala" (PDF) . Revista de visión y imágenes matemáticas . 12 (1): 65–79. doi :10.1023/A:1008304909717. hdl : 1874/18929 . S2CID  7515494.
  14. ^ Bijaoui, Alberto; Rue, Frédéric (1995). "Un modelo de visión multiescala adaptado a las imágenes astronómicas". Procesamiento de la señal . 46 (3): 345–362. doi :10.1016/0165-1684(95)00093-4.
  15. ^ Richard F. Lyon. "Reconocimiento de voz en el espacio de escala", Proc. de 1987 ICASSP. San Diego, marzo, págs. 29.3.14, 1987.
  16. ^ "Slaney, M. Ponceleon, D.," Segmentación jerárquica utilizando indexación semántica latente en espacio de escala ", Proc. Intl. Conf. sobre acústica, habla y procesamiento de señales (ICASSP '01) 2001" (PDF) . Archivado desde el original (PDF) el 19 de septiembre de 2006 . Consultado el 1 de noviembre de 2006 .

Ver también