stringtranslate.com

Registro de imagen

El registro y la suma de múltiples exposiciones de la misma escena mejoran la relación señal-ruido, lo que permite ver cosas que antes eran imposibles de ver. En esta imagen se ven los lejanos Alpes, aunque se encuentran a decenas de kilómetros en la bruma.

El registro de imágenes es el proceso de transformar diferentes conjuntos de datos en un sistema de coordenadas. Los datos pueden ser múltiples fotografías, datos de diferentes sensores, tiempos, profundidades o puntos de vista. [1] Se utiliza en visión por computadora , imágenes médicas , [2] reconocimiento automático de objetivos militares y compilación y análisis de imágenes y datos de satélites. El registro es necesario para poder comparar o integrar los datos obtenidos de estas diferentes mediciones.

Clasificación de algoritmos

Basado en intensidad versus basado en características

Los algoritmos de registro o alineación de imágenes se pueden clasificar en basados ​​en intensidad y basados ​​en características. [3] Una de las imágenes se denomina imagen en movimiento o fuente y las otras se denominan imágenes objetivo , fijas o detectadas . El registro de imágenes implica transformar espacialmente las imágenes fuente/en movimiento para alinearlas con la imagen de destino. El marco de referencia en la imagen de destino es estacionario, mientras que los otros conjuntos de datos se transforman para coincidir con el objetivo. [3] Los métodos basados ​​en intensidad comparan patrones de intensidad en imágenes mediante métricas de correlación, mientras que los métodos basados ​​en características encuentran correspondencia entre características de la imagen como puntos, líneas y contornos. [3] Los métodos basados ​​en la intensidad registran imágenes completas o subimágenes. Si se registran subimágenes, los centros de las subimágenes correspondientes se tratan como puntos característicos correspondientes. Los métodos basados ​​en características establecen una correspondencia entre una serie de puntos especialmente distintos en las imágenes. Conociendo la correspondencia entre varios puntos en las imágenes, se determina luego una transformación geométrica para asignar la imagen objetivo a las imágenes de referencia, estableciendo así una correspondencia punto por punto entre las imágenes de referencia y objetivo. [3] También se han desarrollado métodos que combinan información basada en la intensidad y basada en características. [4]

Modelos de transformación

Los algoritmos de registro de imágenes también se pueden clasificar según los modelos de transformación que utilizan para relacionar el espacio de la imagen de destino con el espacio de la imagen de referencia. La primera categoría amplia de modelos de transformación incluye transformaciones lineales , que incluyen rotación, escalado, traslación y otras transformaciones afines. [5] Las transformaciones lineales son de naturaleza global, por lo tanto, no pueden modelar diferencias geométricas locales entre imágenes. [3]

La segunda categoría de transformaciones permite transformaciones "elásticas" o "no rígidas". Estas transformaciones son capaces de deformar localmente la imagen de destino para alinearla con la imagen de referencia. Las transformaciones no rígidas incluyen funciones de base radial ( placas delgadas o splines de superficie, multicuadrículas y transformaciones con soporte compacto [3] ), modelos físicos continuos (fluidos viscosos) y modelos de grandes deformaciones ( diffeomorfismos ).

Las transformaciones se describen comúnmente mediante una parametrización, donde el modelo dicta la cantidad de parámetros. Por ejemplo, la traducción de una imagen completa se puede describir mediante un único parámetro, un vector de traducción. Estos modelos se denominan modelos paramétricos. Los modelos no paramétricos, por otro lado, no siguen ninguna parametrización, lo que permite que cada elemento de la imagen se desplace arbitrariamente. [6]

Hay varios programas que implementan tanto la estimación como la aplicación de un campo warp. Es parte de los programas SPM y AIR .

Transformaciones de coordenadas mediante la ley de composición de funciones en lugar de la suma

Alternativamente, muchos métodos avanzados para la normalización espacial se basan en homeomorfismos y difeomorfismos de transformaciones que preservan la estructura , ya que transportan subvariedades suaves sin problemas durante la transformación. Los difeomorfismos se generan en el campo moderno de la Anatomía Computacional a partir de flujos ya que los difeomorfismos no son aditivos aunque forman un grupo, sino un grupo bajo la ley de composición de funciones. Por esta razón, los flujos que generalizan las ideas de grupos aditivos permiten generar grandes deformaciones que preservan la topología, proporcionando transformaciones 1-1 y sobre. Los métodos computacionales para generar dicha transformación a menudo se denominan LDDMM [7] [8] [9] [10] y proporcionan flujos de difeomorfismos como la principal herramienta computacional para conectar sistemas de coordenadas correspondientes a los flujos geodésicos de la Anatomía Computacional .

Hay una serie de programas que generan transformaciones difeomorfas de coordenadas mediante mapeo difeomorfo, incluidos MRI Studio [11] y MRI Cloud.org [12].

Métodos de dominio espacial versus frecuencia

Los métodos espaciales operan en el dominio de la imagen, haciendo coincidir patrones de intensidad o características en las imágenes. Algunos de los algoritmos de coincidencia de características son consecuencia de técnicas tradicionales para realizar el registro manual de imágenes, en las que un operador elige los puntos de control (CP) correspondientes en las imágenes. Cuando el número de puntos de control excede el mínimo requerido para definir el modelo de transformación apropiado, se pueden usar algoritmos iterativos como RANSAC para estimar de manera sólida los parámetros de un tipo de transformación particular (por ejemplo, afín) para el registro de las imágenes.

Los métodos en el dominio de la frecuencia encuentran los parámetros de transformación para el registro de las imágenes mientras trabajan en el dominio de transformación. Estos métodos funcionan para transformaciones simples, como traslación, rotación y escalado. La aplicación del método de correlación de fases a un par de imágenes produce una tercera imagen que contiene un único pico. La ubicación de este pico corresponde a la traducción relativa entre las imágenes. A diferencia de muchos algoritmos de dominio espacial, el método de correlación de fases es resistente al ruido, oclusiones y otros defectos típicos de las imágenes médicas o satelitales. Además, la correlación de fase utiliza la transformada rápida de Fourier para calcular la correlación cruzada entre las dos imágenes, lo que generalmente genera grandes ganancias de rendimiento. El método se puede ampliar para determinar las diferencias de rotación y escala entre dos imágenes convirtiendo primero las imágenes a coordenadas log-polares . [13] [14] Debido a las propiedades de la transformada de Fourier , los parámetros de rotación y escala se pueden determinar de una manera invariante a la traslación.

Métodos monomodales o multimodales

Se puede hacer otra clasificación entre métodos monomodales y multimodales. Los métodos de modalidad única tienden a registrar imágenes en la misma modalidad adquiridas por el mismo tipo de escáner/sensor, mientras que los métodos de registro de modalidad múltiple tendieron a registrar imágenes adquiridas por diferentes tipos de escáner/sensor.

Los métodos de registro multimodal se utilizan a menudo en imágenes médicas , ya que las imágenes de un sujeto frecuentemente se obtienen de diferentes escáneres. Los ejemplos incluyen el registro de imágenes de TC / MRI del cerebro o imágenes de PET / CT de cuerpo entero para la localización de tumores, el registro de imágenes de TC con contraste frente a imágenes de TC sin contraste [15] para la segmentación de partes específicas de la anatomía y el registro de Imágenes de ultrasonido y TC para localización de próstata en radioterapia .

Métodos automáticos versus interactivos

Los métodos de registro pueden clasificarse según el nivel de automatización que proporcionan. Se han desarrollado métodos manuales, interactivos, semiautomáticos y automáticos. Los métodos manuales proporcionan herramientas para alinear las imágenes manualmente. Los métodos interactivos reducen el sesgo del usuario al realizar ciertas operaciones clave automáticamente y al mismo tiempo confiar en que el usuario guíe el registro. Los métodos semiautomáticos realizan más pasos de registro automáticamente, pero dependen del usuario para verificar la exactitud de un registro. Los métodos automáticos no permiten ninguna interacción del usuario y realizan todos los pasos de registro automáticamente.

Medidas de similitud para el registro de imágenes.

Las similitudes de imágenes se utilizan ampliamente en imágenes médicas . Una medida de similitud de imágenes cuantifica el grado de similitud entre patrones de intensidad en dos imágenes. [3] La elección de una medida de similitud de imágenes depende de la modalidad de las imágenes a registrar. Los ejemplos comunes de medidas de similitud de imágenes incluyen correlación cruzada , información mutua , suma de diferencias de intensidad al cuadrado y proporción de uniformidad de imagen. La información mutua y la información mutua normalizada son las medidas de similitud de imágenes más populares para el registro de imágenes multimodales. La correlación cruzada, la suma de diferencias de intensidad al cuadrado y la uniformidad de la imagen se utilizan comúnmente para el registro de imágenes en la misma modalidad.

Se han derivado muchas características nuevas para funciones de costos basadas en métodos de coincidencia a través de grandes deformaciones que han surgido en el campo de la Anatomía Computacional, incluida la coincidencia de medidas , que son conjuntos de puntos o puntos de referencia sin correspondencia, la coincidencia de curvas y la coincidencia de superficies mediante corrientes y variantes matemáticas.

Incertidumbre

Existe un nivel de incertidumbre asociado con el registro de imágenes que tienen diferencias espacio-temporales. Un registro seguro con cierta incertidumbre es fundamental para muchas aplicaciones de detección de cambios , como los diagnósticos médicos.

En aplicaciones de teledetección donde un píxel de una imagen digital puede representar varios kilómetros de distancia espacial (como las imágenes LANDSAT de la NASA ), un registro de imagen incierto puede significar que una solución podría estar a varios kilómetros de la realidad terrestre. Varios artículos destacados han intentado cuantificar la incertidumbre en el registro de imágenes para comparar resultados. [16] [17] Sin embargo, muchos enfoques para cuantificar la incertidumbre o estimar las deformaciones son computacionalmente intensivos o solo son aplicables a conjuntos limitados de transformaciones espaciales.

Aplicaciones

Registro de dos imágenes de resonancia magnética del cerebro.

El registro de imágenes tiene aplicaciones en teledetección (actualización de cartografía) y visión por computadora. Debido a la amplia gama de aplicaciones a las que se puede aplicar el registro de imágenes, es imposible desarrollar un método general que esté optimizado para todos los usos.

El registro de imágenes médicas (para datos del mismo paciente tomados en diferentes momentos, como la detección de cambios o el seguimiento de tumores) a menudo implica además un registro elástico (también conocido como no rígido ) para hacer frente a la deformación del sujeto (debido a la respiración, cambios anatómicos, Etcétera). [18] [19] [20] El registro no rígido de imágenes médicas también se puede utilizar para registrar los datos de un paciente en un atlas anatómico, como el atlas de Talairach para neuroimagen.

En astrofotografía, la alineación y el apilamiento de imágenes se utilizan a menudo para aumentar la relación señal-ruido de objetos débiles. Sin apilamiento, se puede utilizar para producir un lapso de tiempo de eventos como la rotación de un planeta en tránsito a través del Sol. Usando puntos de control (ingresados ​​automática o manualmente), la computadora realiza transformaciones en una imagen para alinear las características principales con una segunda o varias imágenes. Esta técnica también se puede utilizar para imágenes de diferentes tamaños, para permitir combinar imágenes tomadas a través de diferentes telescopios o lentes.

En crio-TEM, la inestabilidad provoca la deriva de la muestra y se requieren muchas adquisiciones rápidas con un registro de imagen preciso para preservar la alta resolución y obtener imágenes de alta señal a ruido. Para datos SNR bajos, el mejor registro de imágenes se logra correlacionando todas las permutaciones de imágenes en una pila de imágenes. [21]

El registro de imágenes es una parte esencial de la creación de imágenes panorámicas. Existen muchas técnicas diferentes que pueden implementarse en tiempo real y ejecutarse en dispositivos integrados como cámaras y teléfonos con cámara.

Ver también

Referencias

  1. ^ Lisa Gottesfeld Brown, Un estudio sobre técnicas de registro de imágenes (resumen), archivo ACM Computing Surveys, volumen 24, número 4, diciembre de 1992), páginas 325 - 376
  2. ^ imágenes biológicas y mapeo cerebral
  3. ^ abcdefg A. Ardeshir Goshtasby: Registro de imágenes 2D y 3D para aplicaciones médicas, de teledetección e industriales, Wiley Press, 2005.
  4. ^ Papademetris, Jenofonte; Jackowski, Andrea P.; Schultz, Robert T.; Staib, Lawrence H.; Duncan, James S. (2004). "Registro no rígido integrado de intensidad y característica puntual". Computación de imágenes médicas e intervención asistida por computadora - MICCAI 2004 . Apuntes de conferencias sobre informática. vol. 3216. págs. 763–770. doi :10.1007/978-3-540-30135-6_93. ISBN 978-3-540-22976-6. ISSN  0302-9743.
  5. ^ http://www.comp.nus.edu.sg/~cs4243/lecture/register.pdf [ URL básica PDF ]
  6. ^ Sotiras, A.; Davatzikos, C.; Paragios, N. (julio de 2013). "Registro de imágenes médicas deformables: una encuesta". Transacciones IEEE sobre imágenes médicas . 32 (7): 1153-1190. doi :10.1109/TMI.2013.2265603. PMC 3745275 . PMID  23739795. 
  7. ^ Toga, Arthur W. (17 de noviembre de 1998). Deformación cerebral. Prensa académica. ISBN 9780080525549.
  8. ^ "Coincidencia de puntos de referencia en las superficies del cerebro mediante grandes difeomorfismos de deformación en la esfera - Universidad de Utah". utah.pure.elsevier.com . Archivado desde el original el 29 de junio de 2018 . Consultado el 21 de marzo de 2016 .
  9. ^ Suplicar, M. Faisal; Molinero, Michael I.; Trouvé, Alain; Younes, Laurent (2005). "Cálculo de asignaciones métricas de grandes deformaciones mediante flujos geodésicos de difeomorfismos". Revista Internacional de Visión por Computadora . 61 (2): 139-157. doi :10.1023/B:VISI.0000043755.93987.aa. S2CID  17772076 . Consultado el 21 de marzo de 2016 .
  10. ^ Joshi, Carolina del Sur; Miller, MI (1 de enero de 2000). "Coincidencia de hitos mediante grandes difeomorfismos de deformación". Transacciones IEEE sobre procesamiento de imágenes . 9 (8): 1357-1370. Código Bib : 2000ITIP....9.1357J. doi : 10.1109/83.855431. ISSN  1057-7149. PMID  18262973.
  11. ^ "Estudio de resonancia magnética".
  12. ^ "Mapeo cerebral de MRICloud".
  13. ^ B. Srinivasa Reddy; BN Chatterji (agosto de 1996). "Una técnica basada en FFT para traducción, rotación y registro de imágenes invariantes de escala". Transacciones IEEE sobre procesamiento de imágenes . 5 (8): 1266-1271. Código Bib : 1996ITIP....5.1266R. doi : 10.1109/83.506761. PMID  18285214. S2CID  6562358.
  14. ^ Zokai, S., Wolberg, G., "Registro de imágenes mediante mapeos log-polares para la recuperación de similitudes a gran escala y transformaciones proyectivas". Transacciones IEEE sobre procesamiento de imágenes , vol. 14, N° 10, octubre de 2005.
  15. ^ Ristea, Nicolae-Catalin; Miron, Andreea-Iuliana; Savencu, Olivian; Georgescu, Mariana-Iuliana; Verga, Nicolae; Khan, Fahad Shahbaz; Ionescu, Radu Tudor (2023). "Cy Tran : un transformador de ciclo consistente con consistencia de múltiples niveles para traducción CT sin contraste a contraste". Neurocomputación . 538 : 126211. arXiv : 2110.06400 . doi :10.1016/j.neucom.2023.03.072. S2CID  257952429.
  16. ^ Simonson, K., Drescher, S., Tanner, F., Un enfoque basado en estadísticas para el registro de imágenes binarias con análisis de incertidumbre. Transacciones IEEE sobre análisis de patrones e inteligencia artificial, vol. 29, núm. 1, enero de 2007
  17. ^ Domokos, C., Kato, Z., Francos, J., Estimación paramétrica de deformaciones afines de imágenes binarias. Actas de la Conferencia Internacional IEEE sobre Acústica, Habla y Procesamiento de Señales , 2008
  18. ^ Zhao, Shengyu; Lau, Tingfung; Luo, Ji; Chang, Eric I-Chao; Xu, Yan (2020). "Registro de imágenes médicas de extremo a extremo en 3D sin supervisión con red de interpolación de volumen". Revista IEEE de Informática Biomédica y de Salud . 24 (5): 1394-1404. arXiv : 1902.05020 . doi :10.1109/JBHI.2019.2951024. ISSN  2168-2208. PMID  31689224. S2CID  61153704.
  19. ^ Chen, Junyu; Él, Yufan; Frey, Eric C.; Li, Ye; Du, Yong (13 de abril de 2021). "ViT-V-Net: Transformador de visión para registro de imágenes médicas volumétricas no supervisadas". arXiv : 2104.06468 [eess.IV].
  20. ^ Burduja, Mihail; Ionescu, Radu Tudor (2021). "Alineación de imágenes médicas sin supervisión con el aprendizaje curricular". Conferencia internacional IEEE 2021 sobre procesamiento de imágenes (ICIP) . págs. 3787–3791. arXiv : 2102.10438 . doi :10.1109/ICIP42928.2021.9506067. ISBN 978-1-6654-4115-5. S2CID  231986287.
  21. ^ Savitsky; El Baggari; Clemente; Hovden; Kourkoutis (2018). "Registro de imágenes de datos crio-STEM de baja relación señal-ruido". Ultramicroscopía . 191 : 56–65. arXiv : 1710.09281 . doi :10.1016/j.ultramic.2018.04.008. PMID  29843097. S2CID  26983019.

enlaces externos