stringtranslate.com

Informática de bioimágenes

La informática de bioimágenes es un subcampo de la bioinformática y la biología computacional . [1] Se centra en el uso de técnicas computacionales para analizar bioimágenes, especialmente imágenes celulares y moleculares, a gran escala y con un alto rendimiento. El objetivo es obtener conocimiento útil a partir de imágenes complejas y heterogéneas y metadatos relacionados .

Los microscopios automatizados pueden recopilar grandes cantidades de imágenes con una intervención mínima, lo que ha dado lugar a una explosión de datos que requiere un procesamiento automático. Además, y sorprendentemente, para varias de estas tareas, hay pruebas de que los sistemas automatizados pueden realizarlas mejor que los humanos. [2] [3] Además, los sistemas automatizados son imparciales, a diferencia del análisis basado en humanos cuya evaluación puede (incluso inconscientemente) verse influida por el resultado deseado.

Se ha prestado cada vez más atención al desarrollo de nuevas técnicas de procesamiento de imágenes , visión artificial , minería de datos , bases de datos y visualización para extraer, comparar, buscar y gestionar el conocimiento biológico en estos problemas de uso intensivo de datos. [4] [5]

Modalidades de datos

Se utilizan varios sistemas y plataformas de recopilación de datos, que requieren diferentes métodos para ser manejados de forma óptima.

Microscopía de fluorescencia

Imagen fluorescente de una célula en telofase . Se obtuvieron imágenes con múltiples colorantes y se muestran en diferentes colores.

La microscopía de fluorescencia permite la visualización directa de moléculas a nivel subcelular, tanto en células vivas como fijas . Las moléculas de interés se marcan con proteína fluorescente verde (GFP), otra proteína fluorescente o un anticuerpo marcado con fluorescencia . Se utilizan habitualmente varios tipos de microscopios: de campo amplio, confocal o de dos fotones . La mayoría de los sistemas de microscopía también admiten la recopilación de series temporales (películas).

En general, se utilizan filtros para que cada colorante se obtenga por separado (por ejemplo, se utiliza un filtro azul para obtener una imagen de Hoechst y luego se cambia rápidamente a un filtro verde para obtener una imagen de GFP). Para el consumo, las imágenes se muestran a menudo en falso color mostrando cada canal en un color diferente, pero estos pueden incluso no estar relacionados con las longitudes de onda originales utilizadas. En algunos casos, la imagen original podría incluso haberse adquirido en longitudes de onda no visibles (el infrarrojo es común).

Las decisiones que se toman en la etapa de adquisición de imágenes influirán en el análisis y, a menudo, requerirán un procesamiento especial. Las pilas confocales requerirán un procesamiento 3D y las pseudopilas de campo amplio a menudo se beneficiarán de la deconvolución digital para eliminar la luz desenfocada.

La aparición de microscopios automatizados que pueden adquirir muchas imágenes automáticamente es una de las razones por las que el análisis no se puede realizar a simple vista (de lo contrario, la anotación se convertiría rápidamente en un cuello de botella para la investigación). El uso de microscopios automatizados significa que algunas imágenes pueden estar desenfocadas (los sistemas automáticos de búsqueda de foco a veces pueden ser incorrectos), contener una pequeña cantidad de células o estar llenas de residuos. Por lo tanto, las imágenes generadas serán más difíciles de analizar que las imágenes adquiridas por un operador, ya que este habría elegido otras ubicaciones para obtener imágenes y enfocar correctamente. Por otro lado, el operador podría introducir un sesgo inconsciente en su selección al elegir solo las células cuyo fenotipo sea más parecido al esperado antes del experimento.

Histología

Imagen histológica de la microlitiasis alveolar.

La histología es una aplicación de la microscopía en la que se tiñen cortes de tejido y se observan bajo el microscopio (normalmente un microscopio óptico, pero también se utiliza microscopía electrónica).

Cuando se utiliza un microscopio óptico, a diferencia de lo que ocurre con las imágenes fluorescentes, las imágenes se adquieren normalmente utilizando sistemas de cámara a color estándar. Esto refleja en parte la historia de este campo, en el que los seres humanos solían interpretar las imágenes, pero también el hecho de que la muestra se puede iluminar con luz blanca y recoger toda la luz en lugar de tener que excitar los fluoróforos. Cuando se utiliza más de un colorante, un paso de preprocesamiento necesario es desmezclar los canales y recuperar una estimación de las intensidades específicas del colorante puro.

Se ha demostrado que la ubicación subcelular de las proteínas teñidas se puede identificar a partir de imágenes histológicas.

Si el objetivo es un diagnóstico médico, las aplicaciones de la histología suelen caer en el ámbito de la patología digital o el análisis automatizado de imágenes de tejidos , que son campos hermanos de la informática de bioimágenes. A menudo se aplican las mismas técnicas computacionales, pero los objetivos están orientados a la medicina, no a la investigación.

Problemas importantes

Análisis de la localización subcelular

Ejemplo de ubicación subcelular. Se asignan ejemplos de diferentes patrones a un espacio bidimensional calculando diferentes características de imagen . Las imágenes de proteínas desconocidas se asignan de manera similar a este espacio y se puede utilizar una búsqueda del vecino más cercano u otro clasificador para asignar una ubicación a esta proteína no clasificada.

El análisis de la localización subcelular fue uno de los problemas iniciales en este campo. En su modalidad supervisada, el problema consiste en aprender un clasificador que pueda reconocer imágenes de los principales orgánulos celulares a partir de imágenes.

Los métodos utilizados se basan en el aprendizaje automático , que construye un clasificador discriminativo basado en características numéricas calculadas a partir de la imagen. Las características son características genéricas de la visión artificial , como las características de textura de Haralick , o características especialmente diseñadas para capturar factores biológicos (por ejemplo, la colocalización con un marcador nuclear es un ejemplo típico).

Para el problema básico de identificación de orgánulos, se pueden obtener valores de precisión muy altos, incluso mejores que ? [2] Estos métodos son útiles en la investigación de biología celular básica, pero también se han aplicado al descubrimiento de proteínas cuya ubicación cambia en las células cancerosas. [6]

Sin embargo, la clasificación en orgánulos es una forma limitada del problema, ya que muchas proteínas se localizarán en múltiples ubicaciones simultáneamente (patrones mixtos) y se pueden distinguir muchos patrones aunque no sean componentes diferentes unidos a la membrana. Hay varios problemas sin resolver en esta área y la investigación está en curso.

Proyección de alto contenido

Un lector de imágenes confocal automatizado

Los análisis de alto rendimiento que utilizan tecnología de imágenes automatizadas (a veces denominada análisis de alto contenido ) se han convertido en un método estándar tanto para el descubrimiento de fármacos como para la investigación biológica básica. Mediante el uso de placas multipocillo, robótica y microscopía automatizada, el mismo ensayo se puede aplicar a una gran biblioteca de posibles reactivos (normalmente, moléculas pequeñas o ARNi ) muy rápidamente, obteniendo miles de imágenes en un corto período de tiempo. Debido al alto volumen de datos generados, el análisis automático de imágenes es una necesidad. [7]

Cuando se dispone de controles positivos y negativos, el problema puede abordarse como un problema de clasificación y pueden aplicarse las mismas técnicas de cálculo de características y clasificación que se utilizan para el análisis de ubicación subcelular.

Segmentación

Imagen de ejemplo para el problema de segmentación. Se muestran los núcleos de NIH 3T3 de ratón , teñidos con Hoechst y una segmentación en rojo. [8]

La segmentación de células es un subproblema importante en muchos de los campos que se describen a continuación (y, a veces, es útil por sí sola si el objetivo es solo obtener un recuento de células en un ensayo de viabilidad ). El objetivo es identificar los límites de las células en una imagen de múltiples células. Esto permite procesar cada célula individualmente para medir parámetros. En los datos 3D, la segmentación debe realizarse en el espacio 3D.

Como la obtención de imágenes de un marcador nuclear es algo habitual en muchas imágenes, un protocolo muy utilizado es la segmentación de los núcleos. Esto puede resultar útil por sí solo si se necesitan mediciones nucleares o puede servir para marcar una línea divisoria que extienda la segmentación a toda la imagen.

Se han descrito todos los métodos de segmentación más importantes en imágenes de células, desde el umbral simple hasta los métodos de conjunto de niveles. Dado que existen múltiples modalidades de imagen y diferentes tipos de células, cada uno de los cuales implica diferentes compensaciones, no existe una única solución aceptada para este problema.

La segmentación de imágenes celulares es un procedimiento importante que se utiliza a menudo para estudiar la expresión génica y la relación de colocalización, etc., de células individuales. En estos casos de análisis de células individuales, a menudo es necesario determinar de forma única las identidades de las células mientras se segmentan las células. Esta tarea de reconocimiento a menudo no es trivial desde el punto de vista computacional. Para organismos modelo como C. elegans que tienen linajes celulares bien definidos, es posible reconocer explícitamente las identidades celulares mediante el análisis de imágenes, combinando tanto la segmentación de imágenes como los métodos de reconocimiento de patrones. [9] La segmentación y el reconocimiento simultáneos de células [10] también se han propuesto como una solución más precisa para este problema cuando se dispone de un "atlas" u otra información previa de las células. Dado que la expresión génica con resolución de célula individual se puede obtener utilizando este tipo de enfoques basados ​​en imágenes, es posible combinar estos métodos con otros métodos de cuantificación de la expresión génica de células individuales, como RNAseq.

Seguimiento

El seguimiento es otro problema tradicional de procesamiento de imágenes que aparece en la informática de bioimágenes. El problema consiste en relacionar objetos que aparecen en fotogramas sucesivos de una película. Al igual que con la segmentación, el problema puede plantearse tanto en forma bidimensional como tridimensional. [11]

En el caso de las imágenes fluorescentes, el seguimiento a menudo debe realizarse en imágenes de muy bajo contraste. Como la obtención de un alto contraste se realiza mediante la emisión de más luz, lo que daña la muestra y destruye el tinte , la iluminación se mantiene al mínimo. A menudo es útil pensar en un presupuesto de fotones: la cantidad de fotones que se pueden utilizar para la obtención de imágenes antes de que el daño a la muestra sea tan grande que los datos ya no sean fiables. Por lo tanto, si se deben obtener imágenes de alto contraste, solo se pueden utilizar unos pocos fotogramas; mientras que para películas largas, cada fotograma tendrá un contraste muy bajo.

Registro

Cuando se consideran muestras de datos de imágenes de diferente naturaleza, como las correspondientes a diferentes métodos de etiquetado, diferentes individuos, muestras en diferentes puntos de tiempo, etc., a menudo es necesario registrar las imágenes para una mejor comparación. Un ejemplo es que a medida que se recopilan datos del curso temporal, a menudo es necesario registrar las imágenes en fotogramas posteriores para poder corregir pequeños cambios en la posición de la cámara. Otro ejemplo es que cuando se recopilan muchas imágenes de un animal modelo (por ejemplo, el cerebro de C. elegans o Drosophila o un cerebro de ratón ), a menudo existe una necesidad sustancial de registrar estas imágenes para comparar sus patrones (por ejemplo, las que corresponden a la misma o diferente población de neuronas, las que comparten o difieren en la expresión genética, etc.).

Los paquetes de software de registro de imágenes médicas fueron los primeros intentos de utilizarlos para las aplicaciones de registro de imágenes microscópicas. Sin embargo, debido al tamaño de archivo de imagen, que suele ser mucho mayor, y a una cantidad mucho mayor de especímenes en los experimentos, en muchos casos es necesario desarrollar un nuevo software de registro de imágenes 3D. BrainAligner [12] es un software que se ha utilizado para automatizar el proceso de registro no lineal y deformable en 3D mediante una estrategia de coincidencia de puntos de referencia confiable. Se ha utilizado principalmente para generar más de 50 000 imágenes estandarizadas en 3D del cerebro de la mosca de la fruta en Janelia Farm del HHMI, con otras aplicaciones que incluyen libélulas y ratones.

Lugares importantes

Un consorcio de científicos de universidades e institutos de investigación ha organizado reuniones anuales sobre informática de bioimágenes [13] desde 2005. La conferencia ISMB ha tenido una pista de Bioimágenes y Visualización de Datos desde 2010. La revista Bioinformatics también introdujo una pista de Informática de Bioimágenes en 2012. La revista OpenAccess BMC Bioinformatics tiene una sección dedicada al análisis de bioimágenes, visualización y aplicaciones relacionadas. Otras revistas de biología computacional y bioinformática también publican regularmente trabajos de informática de bioimágenes. Una acción de la Unión Europea llamada NEUBIAS (red de analistas de bioimágenes europeos) ha estado organizando conferencias anuales, así como escuelas de capacitación de analistas de bioimágenes y taggathons desde 2017.

Software

Existen varios paquetes que permiten disponer de métodos informáticos de bioimagen a través de una interfaz gráfica de usuario, como ImageJ , FIJI , CellProfiler , chunkflow o Icy. En los últimos años han aparecido plataformas de visualización y análisis como Vaa3D, que se han utilizado tanto en proyectos a gran escala, especialmente para neurociencias, como en aplicaciones de escritorio.

Ejemplo de cerebro de mosca renderizado con modelos de superficie de sus compartimentos utilizando Vaa3D

Otros investigadores desarrollan sus propios métodos, generalmente basados ​​en un lenguaje de programación con un buen soporte de visión por computadora, como Python , C++ o MATLAB . La biblioteca Mahotas para Python es un ejemplo popular. Sin embargo, existen ejemplos de métodos desarrollados por investigadores en lenguajes de programación con menos soporte de visión por computadora que R (por ejemplo, trackdem [14] ).

Véase también

Enlaces externos

Referencias

  1. ^ Peng, H; Bateman A; Valencia A; Wren JD (2012). "Informática de bioimágenes: una nueva categoría en bioinformática". Bioinformática . 28 (8): 1057. doi :10.1093/bioinformatics/bts111. PMC  3324521 . PMID  22399678.
  2. ^ ab Murphy, Robert; Velliste, M.; Porreca, G. (2003). "Características numéricas robustas para la descripción y clasificación de patrones de localización subcelular en imágenes de microscopio de fluorescencia". The Journal of VLSI Signal Processing . 35 (3): 311–321. CiteSeerX 10.1.1.186.9521 . doi :10.1023/b:vlsi.0000003028.71666.44. S2CID  8134907. 
  3. ^ Nattkemper, Tim; Thorsten Twellmann; Helge Ritter; Walter Schubert (2003). "Humano vs. máquina: evaluación de micrografías de fluorescencia". Computadoras en biología y medicina . 33 (1): 31–43. CiteSeerX 10.1.1.324.4664 . doi :10.1016/S0010-4825(02)00060-4. PMID  12485628. 
  4. ^ Peng H (septiembre de 2008). "Informática de bioimágenes: una nueva área de la biología de la ingeniería". Bioinformática . 24 (17): 1827–36. doi :10.1093/bioinformatics/btn346. PMC 2519164 . PMID  18603566. 
  5. ^ "La búsqueda de la microscopía cuantitativa". Nature Methods . 9 (7): 627. 2012. doi : 10.1038/nmeth.2102 . PMID  22930824.
  6. ^ Glory, Estelle; Justin Newberg; Robert F. Murphy (2008). "Comparación automatizada de patrones de localización subcelular de proteínas entre imágenes de tejidos normales y cancerosos". Imágenes biomédicas: de nano a macro, 2008. ISBI 2008. 5.º Simposio internacional IEEE sobre .
  7. ^ Shariff, Aabid; Joshua Kangas; Luis Pedro Coelho; Shannon Quinn; Robert F Murphy (2010). "Análisis automatizado de imágenes para análisis y detección de alto contenido". Journal of Biomolecular Screening . 15 (7): 726–734. doi : 10.1177/1087057110370894 . PMID  20488979.
  8. ^ Coelho, Luis Pedro; Aabid Shariff; Robert F. Murphy (2009). "Segmentación nuclear en imágenes de células obtenidas mediante microscopio: un conjunto de datos segmentados manualmente y comparación de algoritmos". Imágenes biomédicas: de nano a macro, 2009. ISBI'09. Simposio internacional IEEE sobre. IEEE . doi :10.1109/ISBI.2009.5193098. PMC 2901896 . 
  9. ^ Long, Fuhui; Peng, H.; Liu, X.; Kim, S.; Myers, EW (septiembre de 2009). "Un atlas digital 3D de C. elegans y su aplicación a los análisis de células individuales". Nature Methods . 6 (9): 667–672. doi :10.1038/nmeth.1366. PMC 2882208 . PMID  19684595. 
  10. ^ Qu, Lei; Long, F.; Liu, X.; Kim, S.; Myers, EW; Peng, H. (2011). "Reconocimiento y segmentación simultáneos de células: aplicación en C. elegans". Bioinformática . 27 (20): 2895–2902. doi :10.1093/bioinformatics/btr480. PMC 3187651 . PMID  21849395. 
  11. ^ Dufour, Alexandre; Vasily Shinin; Shahragim Tajbakhsh; Nancy Guillén-Aghion; JC. Olivo-Marin; Christophe Zimmer (2005). "Segmentación y seguimiento de células fluorescentes en microscopía tridimensional dinámica con superficies activas acopladas" (PDF) . Procesamiento de imágenes, IEEE Transactions on 14, n.º 9 . págs. 1396–1410. doi :10.1109/TIP.2005.852790. Archivado desde el original (PDF) el 2 de marzo de 2014..
  12. ^ Peng, Hanchuan; Chung, P.; Long, F.; Qu, L.; Jenett, A.; Seeds, A.; Myers, EW; Simpson, J. H (2011). "BrainAligner: atlas de registro 3D de cerebros de Drosophila". Nature Methods . 8 (6): 493–498. doi :10.1038/nmeth.1602. PMC 3104101 . PMID  21532582. 
  13. ^ "Reunión anual de informática de bioimágenes".
  14. ^ Bruijning, Marjolein; Visser, Marco D.; Hallmann, Caspar A.; Jongejans, Eelke; Golding, Nick (2018). "trackdem: Seguimiento automatizado de partículas para obtener recuentos de población y distribuciones de tamaño a partir de videos en r". Métodos en ecología y evolución . 9 (4): 965–973. doi : 10.1111/2041-210X.12975 . hdl : 2066/184075 . ISSN  2041-210X.