stringtranslate.com

Registro de imagen

El registro y la suma de varias exposiciones de la misma escena mejoran la relación señal/ruido, lo que permite ver cosas que antes eran imposibles de ver. En esta imagen, se ven los Alpes distantes, aunque se encuentran a decenas de kilómetros dentro de la neblina.

El registro de imágenes es el proceso de transformar diferentes conjuntos de datos en un sistema de coordenadas. Los datos pueden ser múltiples fotografías, datos de diferentes sensores, tiempos, profundidades o puntos de vista. [1] Se utiliza en visión artificial , imágenes médicas , [2] reconocimiento automático de objetivos militares y recopilación y análisis de imágenes y datos de satélites. El registro es necesario para poder comparar o integrar los datos obtenidos a partir de estas diferentes mediciones.

Clasificación de algoritmos

Basado en intensidad vs. basado en características

Los algoritmos de registro o alineación de imágenes se pueden clasificar en basados ​​en intensidad y basados ​​en características. [3] Una de las imágenes se denomina en movimiento o fuente y las otras se denominan imágenes objetivo , fijas o detectadas . El registro de imágenes implica la transformación espacial de la(s) imagen(es) de origen/en movimiento para alinearlas con la imagen objetivo. El marco de referencia en la imagen objetivo es estacionario, mientras que los otros conjuntos de datos se transforman para que coincidan con el objetivo. [3] Los métodos basados ​​en intensidad comparan patrones de intensidad en imágenes a través de métricas de correlación, mientras que los métodos basados ​​en características encuentran correspondencia entre características de la imagen, como puntos, líneas y contornos. [3] Los métodos basados ​​en intensidad registran imágenes completas o subimágenes. Si se registran subimágenes, los centros de las subimágenes correspondientes se tratan como puntos de características correspondientes. Los métodos basados ​​en características establecen una correspondencia entre una serie de puntos especialmente distintos en las imágenes. Conociendo la correspondencia entre una serie de puntos en las imágenes, se determina una transformación geométrica para mapear la imagen objetivo a las imágenes de referencia, estableciendo así una correspondencia punto por punto entre las imágenes de referencia y objetivo. [3] También se han desarrollado métodos que combinan información basada en la intensidad y en las características. [4]

Modelos de transformación

Los algoritmos de registro de imágenes también se pueden clasificar según los modelos de transformación que utilizan para relacionar el espacio de la imagen de destino con el espacio de la imagen de referencia. La primera categoría amplia de modelos de transformación incluye las transformaciones lineales , que incluyen rotación, escalado, traslación y otras transformaciones afines. [5] Las transformaciones lineales son de naturaleza global, por lo tanto, no pueden modelar diferencias geométricas locales entre imágenes. [3]

La segunda categoría de transformaciones permite transformaciones "elásticas" o "no rígidas". Estas transformaciones son capaces de deformar localmente la imagen de destino para alinearla con la imagen de referencia. Las transformaciones no rígidas incluyen funciones de base radial ( splines de superficie o de placa delgada , multiquadricas y transformaciones con soporte compacto [3] ), modelos físicos continuos (fluidos viscosos) y modelos de deformación grande ( difeomorfismos ).

Las transformaciones se describen comúnmente mediante una parametrización, donde el modelo dicta el número de parámetros. Por ejemplo, la traducción de una imagen completa se puede describir mediante un único parámetro, un vector de traducción. Estos modelos se denominan modelos paramétricos. Los modelos no paramétricos, por otro lado, no siguen ninguna parametrización, lo que permite que cada elemento de la imagen se desplace arbitrariamente. [6]

Existen varios programas que implementan tanto la estimación como la aplicación de un campo de deformación. Es parte de los programas SPM y AIR .

Transformaciones de coordenadas a través de la ley de composición de funciones en lugar de la ley de adición

Alternativamente, muchos métodos avanzados para la normalización espacial se basan en transformaciones que preservan la estructura, homeomorfismos y difeomorfismos, ya que llevan subvariedades suaves sin problemas durante la transformación. Los difeomorfismos se generan en el campo moderno de la Anatomía Computacional con base en flujos, ya que los difeomorfismos no son aditivos aunque forman un grupo, sino un grupo bajo la ley de composición de funciones. Por esta razón, los flujos que generalizan las ideas de los grupos aditivos permiten generar grandes deformaciones que preservan la topología, proporcionando transformaciones 1-1 y sobre. Los métodos computacionales para generar dicha transformación a menudo se denominan LDDMM [7] [8] [9] [10] que proporcionan flujos de difeomorfismos como la principal herramienta computacional para conectar sistemas de coordenadas correspondientes a los flujos geodésicos de la Anatomía Computacional .

Hay varios programas que generan transformaciones difeomórficas de coordenadas a través del mapeo difeomórfico, incluidos MRI Studio [11] y MRI Cloud.org [12].

Métodos de dominio espacial y de dominio de frecuencia

Los métodos espaciales operan en el dominio de las imágenes, haciendo coincidir patrones de intensidad o características en las imágenes. Algunos de los algoritmos de coincidencia de características son el resultado de técnicas tradicionales para realizar el registro manual de imágenes, en el que un operador elige los puntos de control (CP) correspondientes en las imágenes. Cuando el número de puntos de control excede el mínimo requerido para definir el modelo de transformación apropiado, se pueden utilizar algoritmos iterativos como RANSAC para estimar de manera robusta los parámetros de un tipo de transformación particular (por ejemplo, afín) para el registro de las imágenes.

Los métodos de dominio de frecuencia encuentran los parámetros de transformación para el registro de las imágenes mientras trabajan en el dominio de transformación. Dichos métodos funcionan para transformaciones simples, como la traslación, la rotación y el escalado. La aplicación del método de correlación de fase a un par de imágenes produce una tercera imagen que contiene un solo pico. La ubicación de este pico corresponde a la traslación relativa entre las imágenes. A diferencia de muchos algoritmos de dominio espacial, el método de correlación de fase es resistente al ruido, las oclusiones y otros defectos típicos de las imágenes médicas o satelitales. Además, la correlación de fase utiliza la transformada rápida de Fourier para calcular la correlación cruzada entre las dos imágenes, lo que generalmente da como resultado grandes ganancias de rendimiento. El método se puede ampliar para determinar las diferencias de rotación y escalado entre dos imágenes convirtiendo primero las imágenes a coordenadas log-polares . [13] [14] Debido a las propiedades de la transformada de Fourier , los parámetros de rotación y escalado se pueden determinar de una manera invariante a la traslación.

Métodos monomodales versus multimodales

Se puede hacer otra clasificación entre métodos monomodales y multimodales. Los métodos monomodales tienden a registrar imágenes en la misma modalidad adquiridas por el mismo tipo de escáner/sensor, mientras que los métodos de registro multimodal tienden a registrar imágenes adquiridas por diferentes tipos de escáner/sensor.

Los métodos de registro multimodal se utilizan a menudo en el diagnóstico por imágenes médicas, ya que las imágenes de un sujeto se obtienen con frecuencia de diferentes escáneres. Algunos ejemplos incluyen el registro de imágenes de TC / RM cerebral o imágenes de PET / TC de cuerpo entero para la localización de tumores, el registro de imágenes de TC con contraste frente a imágenes de TC sin contraste [15] para la segmentación de partes específicas de la anatomía, y el registro de imágenes de ultrasonido y TC para la localización de la próstata en radioterapia .

Métodos automáticos vs interactivos

Los métodos de registro se pueden clasificar según el nivel de automatización que proporcionan. Se han desarrollado métodos manuales, interactivos, semiautomáticos y automáticos. Los métodos manuales proporcionan herramientas para alinear las imágenes manualmente. Los métodos interactivos reducen el sesgo del usuario al realizar ciertas operaciones clave automáticamente, aunque siguen dependiendo de que el usuario guíe el registro. Los métodos semiautomáticos realizan más pasos de registro automáticamente, pero dependen del usuario para verificar la exactitud de un registro. Los métodos automáticos no permiten ninguna interacción del usuario y realizan todos los pasos de registro automáticamente.

Medidas de similitud para el registro de imágenes

Las similitudes de imágenes se utilizan ampliamente en imágenes médicas . Una medida de similitud de imágenes cuantifica el grado de similitud entre patrones de intensidad en dos imágenes. [3] La elección de una medida de similitud de imágenes depende de la modalidad de las imágenes que se van a registrar. Los ejemplos comunes de medidas de similitud de imágenes incluyen correlación cruzada , información mutua , suma de diferencias de intensidad al cuadrado y uniformidad de imagen de relación. La información mutua y la información mutua normalizada son las medidas de similitud de imágenes más populares para el registro de imágenes multimodales. La correlación cruzada, la suma de las diferencias de intensidad al cuadrado y la uniformidad de imagen de relación se utilizan comúnmente para el registro de imágenes en la misma modalidad.

Se han derivado muchas características nuevas para funciones de costo basadas en métodos de correspondencia a través de grandes deformaciones que han surgido en el campo de la anatomía computacional, incluida la correspondencia de medidas , que son conjuntos de puntos o puntos de referencia sin correspondencia, la correspondencia de curvas y la correspondencia de superficies a través de corrientes matemáticas y varifolds.

Incertidumbre

Existe un nivel de incertidumbre asociado con el registro de imágenes que tienen diferencias espacio-temporales. Un registro confiable con un cierto grado de incertidumbre es fundamental para muchas aplicaciones de detección de cambios , como los diagnósticos médicos.

En aplicaciones de teledetección donde un píxel de imagen digital puede representar varios kilómetros de distancia espacial (como las imágenes LANDSAT de la NASA ), un registro de imagen incierto puede significar que una solución podría estar a varios kilómetros de la realidad del terreno. Varios artículos notables han intentado cuantificar la incertidumbre en el registro de imágenes para comparar resultados. [16] [17] Sin embargo, muchos enfoques para cuantificar la incertidumbre o estimar deformaciones requieren un uso intensivo de recursos computacionales o solo son aplicables a conjuntos limitados de transformaciones espaciales.

Aplicaciones

Registro de dos imágenes de resonancia magnética del cerebro

El registro de imágenes tiene aplicaciones en teledetección (actualización de cartografía) y visión artificial. Debido a la amplia gama de aplicaciones a las que se puede aplicar el registro de imágenes, es imposible desarrollar un método general que esté optimizado para todos los usos.

El registro de imágenes médicas (para datos del mismo paciente tomados en diferentes puntos en el tiempo, como la detección de cambios o el monitoreo de tumores) a menudo implica además un registro elástico (también conocido como no rígido ) para hacer frente a la deformación del sujeto (debido a la respiración, cambios anatómicos, etc.). [18] [19] [20] El registro no rígido de imágenes médicas también se puede utilizar para registrar los datos de un paciente en un atlas anatómico, como el atlas de Talairach para neuroimágenes.

En astrofotografía, la alineación y el apilamiento de imágenes se utilizan a menudo para aumentar la relación señal/ruido de los objetos débiles. Sin apilamiento, se puede utilizar para producir una secuencia de eventos como la rotación de un planeta o un tránsito frente al Sol. Mediante el uso de puntos de control (ingresados ​​de forma automática o manual), la computadora realiza transformaciones en una imagen para hacer que las características principales se alineen con una segunda imagen o con varias imágenes. Esta técnica también se puede utilizar para imágenes de diferentes tamaños, para permitir que se combinen imágenes tomadas a través de diferentes telescopios o lentes.

En la crio-TEM, la inestabilidad provoca la deriva de la muestra y se requieren muchas adquisiciones rápidas con un registro de imagen preciso para preservar la alta resolución y obtener imágenes con una alta relación señal/ruido. Para datos de baja relación señal/ruido, el mejor registro de imagen se logra mediante la correlación cruzada de todas las permutaciones de imágenes en una pila de imágenes. [21]

El registro de imágenes es una parte esencial de la creación de imágenes panorámicas. Existen muchas técnicas diferentes que se pueden implementar en tiempo real y ejecutar en dispositivos integrados, como cámaras y teléfonos con cámara.

Véase también

Referencias

  1. ^ Lisa Gottesfeld Brown, Un estudio de las técnicas de registro de imágenes (resumen), archivo de encuestas de computación de ACM, volumen 24, número 4, diciembre de 1992), páginas 325-376
  2. ^ Imágenes biológicas y mapeo cerebral
  3. ^ abcdefg A. Ardeshir Goshtasby: Registro de imágenes 2D y 3D para aplicaciones médicas, de teledetección e industriales, Wiley Press, 2005.
  4. ^ Papademetris, Xenophon; Jackowski, Andrea P.; Schultz, Robert T.; Staib, Lawrence H.; Duncan, James S. (2004). "Intensidad integrada y registro no rígido de características puntuales". Computación de imágenes médicas e intervención asistida por computadora – MICCAI 2004 . Apuntes de clase en informática. Vol. 3216. págs. 763–770. doi :10.1007/978-3-540-30135-6_93. ISBN 978-3-540-22976-6. ISSN  0302-9743.
  5. ^ http://www.comp.nus.edu.sg/~cs4243/lecture/register.pdf [ URL básica PDF ]
  6. ^ Sotiras, A.; Davatzikos, C.; Paragios, N. (julio de 2013). "Registro de imágenes médicas deformables: una encuesta". IEEE Transactions on Medical Imaging . 32 (7): 1153–1190. doi :10.1109/TMI.2013.2265603. PMC 3745275 . PMID  23739795. 
  7. ^ Toga, Arthur W. (17 de noviembre de 1998). Brain Warping. Academic Press. ISBN 9780080525549.
  8. ^ "Coincidencia de puntos de referencia en superficies cerebrales mediante difeomorfismos de deformación de gran tamaño en la esfera — Universidad de Utah". utah.pure.elsevier.com . Archivado desde el original el 2018-06-29 . Consultado el 2016-03-21 .
  9. ^ Beg, M. Faisal; Miller, Michael I.; Trouvé, Alain; Younes, Laurent (2005). "Computing Large Deformation Metric Mappings via Geodesic Flows of Diffeomorphisms" (Cálculo de asignaciones métricas de deformación a gran escala mediante flujos geodésicos de difeomorfismos). International Journal of Computer Vision (Revista internacional de visión por computadora ). 61 (2): 139–157. doi :10.1023/B:VISI.0000043755.93987.aa. S2CID :  17772076. Consultado el 21 de marzo de 2016 .
  10. ^ Joshi, SC; Miller, MI (1 de enero de 2000). "Coincidencia de puntos de referencia mediante difeomorfismos de deformación de gran tamaño". IEEE Transactions on Image Processing . 9 (8): 1357–1370. Bibcode :2000ITIP....9.1357J. doi :10.1109/83.855431. ISSN  1057-7149. PMID  18262973.
  11. ^ "Estudio de resonancia magnética".
  12. ^ "Mapeo cerebral mediante MRICloud".
  13. ^ B. Srinivasa Reddy; BN Chatterji (agosto de 1996). "Una técnica basada en FFT para la traducción, rotación y registro de imágenes invariante en escala". IEEE Transactions on Image Processing . 5 (8): 1266–1271. Bibcode :1996ITIP....5.1266R. doi :10.1109/83.506761. PMID  18285214. S2CID  6562358.
  14. ^ Zokai, S., Wolberg, G., "Registro de imágenes mediante mapeos log-polares para la recuperación de similitudes a gran escala y transformaciones proyectivas". IEEE Transactions on Image Processing , vol. 14, n.º 10, octubre de 2005.
  15. ^ Ristea, Nicolae-Catalin; Miron, Andreea-Iuliana; Savencu, Olivian; Georgescu, Mariana-Iuliana; Verga, Nicolae; Khan, Fahad Shahbaz; Ionescu, Radu Tudor (2023). "Cy Tran : un transformador de ciclo consistente con consistencia de múltiples niveles para traducción CT sin contraste a contraste". Neurocomputación . 538 : 126211. arXiv : 2110.06400 . doi :10.1016/j.neucom.2023.03.072. S2CID  257952429.
  16. ^ Simonson, K., Drescher, S., Tanner, F., Un enfoque basado en estadísticas para el registro de imágenes binarias con análisis de incertidumbre. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 29, n.º 1, enero de 2007
  17. ^ Domokos, C., Kato, Z., Francos, J., Estimación paramétrica de deformaciones afines de imágenes binarias. Actas de la Conferencia internacional IEEE sobre acústica, habla y procesamiento de señales , 2008
  18. ^ Zhao, Shengyu; Lau, Tingfung; Luo, Ji; Chang, Eric I-Chao; Xu, Yan (2020). "Registro de imágenes médicas de extremo a extremo en 3D no supervisado con red de interpolación de volumen". Revista IEEE de informática biomédica y sanitaria . 24 (5): 1394–1404. arXiv : 1902.05020 . doi :10.1109/JBHI.2019.2951024. ISSN  2168-2208. PMID  31689224. S2CID  61153704.
  19. ^ Chen, Junyu; He, Yufan; Frey, Eric C.; Li, Ye; Du, Yong (13 de abril de 2021). "ViT-V-Net: Transformador de visión para registro de imágenes médicas volumétricas no supervisadas". arXiv : 2104.06468 [eess.IV].
  20. ^ Burduja, Mihail; Ionescu, Radu Tudor (2021). "Alineación de imágenes médicas no supervisadas con el aprendizaje curricular". Conferencia internacional IEEE sobre procesamiento de imágenes (ICIP) de 2021. págs. 3787–3791. arXiv : 2102.10438 . doi :10.1109/ICIP42928.2021.9506067. ISBN 978-1-6654-4115-5. Número de identificación del sujeto  231986287.
  21. ^ Savitsky; El Baggari; Clement; Hovden; Kourkoutis (2018). "Registro de imágenes de datos crio-STEM de baja relación señal-ruido". Ultramicroscopía . 191 : 56–65. arXiv : 1710.09281 . doi :10.1016/j.ultramic.2018.04.008. PMID  29843097. S2CID  26983019.

Enlaces externos