El mapeo óptico [1] es una técnica para construir mapas de restricción ordenados, de alta resolución y de todo el genomaa partir de moléculas individuales de ADN teñidas, llamadas "mapas ópticos". Al mapear la ubicación de los sitios de las enzimas de restricción a lo largo del ADN desconocido de un organismo, el espectro de fragmentos de ADN resultantes sirve colectivamente como una "huella digital" o "código de barras" único para esa secuencia. Originalmente desarrollado por el Dr. David C. Schwartz y su laboratorio en la Universidad de Nueva York en la década de 1990 [2], este método ha sido desde entonces parte integral del proceso de ensamblaje de muchos proyectos de secuenciación a gran escala para genomas microbianos y eucariotas. Las tecnologías posteriores utilizan la fusión del ADN, [3] la unión competitiva del ADN [4] o el etiquetado enzimático [5] [6] para crear los mapeos ópticos.
La plataforma de mapeo óptico moderna funciona de la siguiente manera: [7]
Las moléculas de ADN se fijaron en agarosa fundida, que se desarrolló entre un cubreobjetos y un portaobjetos de microscopio. La enzima de restricción se mezcló previamente con la agarosa fundida antes de la colocación del ADN y la escisión se desencadenó mediante la adición de magnesio.
En lugar de inmovilizarse dentro de una matriz de gel, las moléculas de ADN se mantuvieron en su lugar mediante interacciones electrostáticas sobre una superficie con carga positiva. La resolución mejoró de tal manera que se pudieron medir fragmentos desde ~30 kb hasta tan pequeños como 800 pb.
Esto implicó el desarrollo e integración de un sistema de detección automatizado para detectar múltiples moléculas individuales en un portaobjetos (como un microarreglo) para procesamiento enzimático paralelo, microscopía de fluorescencia automatizada para adquisición de imágenes, visión de procesamiento de imágenes para manejar imágenes, algoritmos para construcción de mapas ópticos, computación en clúster para procesar grandes cantidades de datos.
Al observar que los microarrays con moléculas individuales no funcionaban bien para moléculas grandes de ADN genómico, se desarrollaron dispositivos microfluídicos que utilizan litografía blanda que posee una serie de microcanales paralelos.
Una mejora en el mapeo óptico, llamada "nanocodificación", [8] tiene el potencial de aumentar el rendimiento al atrapar moléculas de ADN alargadas en nanoconfinamientos.
La ventaja de la OM sobre las técnicas de mapeo tradicionales es que preserva el orden del fragmento de ADN, mientras que el orden necesita ser reconstruido usando el mapeo de restricción . Además, dado que los mapas se construyen directamente a partir de moléculas de ADN genómico, se evitan los artefactos de clonación o PCR. Sin embargo, cada proceso de OM aún se ve afectado por sitios falsos positivos y negativos porque no todos los sitios de restricción se cortan en cada molécula y algunos sitios pueden cortarse incorrectamente. En la práctica, se crean múltiples mapas ópticos a partir de moléculas de la misma región genómica y se utiliza un algoritmo para determinar el mejor mapa de consenso. [9]
Existen diversos enfoques para identificar variaciones genómicas a gran escala (como indeles, duplicaciones, inversiones, translocaciones) entre genomas. Otras categorías de métodos incluyen el uso de microarrays , electroforesis en gel de campo pulsado , citogenética y etiquetas de extremos emparejados .
Inicialmente, el sistema de mapeo óptico se ha utilizado para construir mapas de restricción de todo el genoma de bacterias, parásitos y hongos. [10] [11] [12] También se ha utilizado para andamiar y validar genomas bacterianos. [13] Para servir como andamiaje para el ensamblaje, los contigs de secuencia ensamblados se pueden escanear en busca de sitios de restricción in silico utilizando datos de secuencia conocidos y alineándolos con el mapa óptico genómico ensamblado. La empresa comercial Opgen ha proporcionado mapeos ópticos para genomas microbianos. Para genomas eucariotas más grandes, solo el laboratorio David C. Schwartz (ahora en Madison-Wisconsin) ha producido mapas ópticos para ratón, [14] humano, [15] arroz, [16] y maíz. [17]
La secuenciación óptica es una técnica de secuenciación de ADN de una sola molécula que sigue la secuencia por síntesis y utiliza tecnología de mapeo óptico. [18] [19] De manera similar a otros enfoques de secuenciación molecular única como la secuenciación SMRT , esta técnica analiza una sola molécula de ADN, en lugar de amplificar la muestra inicial y secuenciar múltiples copias del ADN. Durante la síntesis, los nucleótidos marcados con fluorocromo se incorporan mediante el uso de ADN polimerasas y se rastrean mediante microscopía de fluorescencia . Esta técnica fue propuesta originalmente por David C. Schwartz y Arvind Ramanathan en 2003.
A continuación se presenta una descripción general de cada ciclo del proceso de secuenciación óptica. [20]
Paso 1: codificación de ADN
Las células se lisan para liberar el ADN genómico. Estas moléculas de ADN se desenredan, se colocan sobre una superficie de mapeo óptico que contiene canales microfluídicos y se permite que el ADN fluya a través de los canales. A continuación, las enzimas de restricción codifican estas moléculas para permitir la localización genómica mediante la técnica de mapeo óptico. Consulte la sección anterior sobre "Tecnología" para conocer esos pasos.
Paso 2: corte de la plantilla
Se añade la DNasa I para cortar aleatoriamente las moléculas de ADN montadas. A continuación, se realiza un lavado para eliminar la DNasa I. La cantidad media de cortes que se producen por plantilla depende de la concentración de DNasa I y del tiempo de incubación.
Paso 3: Formación de espacios
Se añade la exonucleasa T7, que utiliza las muescas en las moléculas de ADN para expandir los espacios en una dirección de 5' a 3'. La cantidad de exonucleasa T7 debe controlarse cuidadosamente para evitar niveles demasiado altos de roturas de doble cadena.
Paso 4: Incorporación de fluorocromos
La ADN polimerasa se utiliza para incorporar nucleótidos marcados con fluorocromos (FdNTP) en los múltiples sitios con huecos a lo largo de cada molécula de ADN. Durante cada ciclo, la mezcla de reacción contiene un solo tipo de FdNTP y permite múltiples adiciones de ese tipo de nucleótido. Luego se realizan varios lavados para eliminar los fdNTP no incorporados en preparación para la obtención de imágenes y el siguiente ciclo de adición de FdNTP.
Paso 5: Imágenes
Este paso cuenta la cantidad de nucleótidos marcados con fluorocromo incorporados en las regiones de espacio utilizando microscopía de fluorescencia.
Paso 6: Fotoblanqueo
La iluminación láser que se utiliza para excitar el fluorocromo también se utiliza aquí para destruir la señal del fluorocromo. Esto básicamente reinicia el contador de fluorocromo y lo prepara para el siguiente ciclo. Este paso es un aspecto único de la secuenciación óptica, ya que en realidad no elimina la etiqueta de fluorocromo del nucleótido después de su incorporación. No eliminar la etiqueta de fluorocromo hace que la secuenciación sea más económica, pero da como resultado la necesidad de incorporar etiquetas de fluorocromo consecutivamente, lo que puede generar problemas debido al volumen de las etiquetas.
Paso 7: Repita los pasos 4 a 6
Los pasos 4 a 6 se repiten con el paso 4 utilizando una mezcla de reacción que contiene un nucleótido marcado con fluorocromo (FdNTP) diferente cada vez. Esto se repite hasta que se secuencia la región deseada.
La selección de una ADN polimerasa adecuada es fundamental para la eficiencia del paso de adición de base y debe cumplir varios criterios:
Además, las diferentes preferencias de la polimerasa por diferentes fluorocromos, la longitud del conector en los fluorocromos-nucleótidos y las composiciones del tampón también son factores importantes a tener en cuenta para optimizar el proceso de adición de bases y maximizar el número de incorporaciones consecutivas de FdNTP.
Análisis de moléculas individuales
Dado que se requiere una muestra mínima de ADN, se evita el costoso y lento paso de amplificación para agilizar el proceso de preparación de la muestra.
Plantillas de moléculas de ADN grandes (~500 kb) vs. plantillas de moléculas de ADN cortas (<1 kb) Si bien la mayoría de las tecnologías de secuenciación de próxima generación apuntan a cantidades masivas de lecturas de secuencias pequeñas, estas lecturas de secuencias pequeñas dificultan la comprensión de las secuencias de novo y las regiones de repetición del genoma. La secuenciación óptica utiliza plantillas de moléculas de ADN grandes (~500 kb) para la secuenciación y estas ofrecen varias ventajas sobre las plantillas pequeñas: