stringtranslate.com

Biblioteca de saltos

Esta figura ilustra el principio básico detrás de las bibliotecas de salto. Las flechas representan dos secuencias físicamente distantes que se acercan utilizando este método.

Las bibliotecas de saltos o bibliotecas de fragmentos de unión son colecciones de fragmentos de ADN genómico generados por saltos cromosómicos . Estas bibliotecas permiten el análisis de grandes áreas del genoma y superan las limitaciones de distancia en las técnicas de clonación habituales. Un clon de biblioteca de saltos está compuesto por dos tramos de ADN que suelen estar situados a muchas kilobases de distancia uno del otro. El tramo de ADN situado entre estos dos "extremos" se elimina mediante una serie de manipulaciones bioquímicas realizadas al inicio de esta técnica de clonación.

Invención y primeras mejoras

Origen

El salto de cromosomas (o salto de cromosomas) fue descrito por primera vez en 1984 por Collins y Weissman. [1] En ese momento, las técnicas de clonación permitían la generación de clones de tamaño limitado (hasta 240 kb), y las técnicas citogenéticas permitían mapear dichos clones en una pequeña región de un cromosoma particular con una resolución de alrededor de 5-10 Mb. Por lo tanto, seguía existiendo una brecha importante en la resolución entre las tecnologías disponibles, y no había métodos disponibles para mapear áreas más grandes del genoma. [1]

Principio básico y método original

Esta figura es una representación esquemática del método utilizado para crear bibliotecas de salto cuando se desarrolló originalmente en los años 80.

Esta técnica es una extensión del "recorrido cromosómico" que permite "pasos" más grandes a lo largo del cromosoma. Si se desean pasos de longitud de N kb, se necesita ADN de peso molecular muy alto. Una vez aislado, se digiere parcialmente con una enzima de restricción de corte frecuente (como MboI o BamHI ). A continuación, se seleccionan los fragmentos obtenidos por tamaño, que debe rondar los N kb de longitud. A continuación, el ADN debe ligarse a baja concentración para favorecer la ligación en círculos en lugar de la formación de multímeros. En este punto temporal se puede incluir un marcador de ADN (como el gen supresor de ARNt ámbar supF) dentro del círculo unido covalentemente para permitir la selección de fragmentos de unión. Posteriormente, los círculos se digieren completamente con una segunda enzima de restricción (como EcoRI ) para generar una gran cantidad de fragmentos. Dichos fragmentos se ligan en vectores (como un vector λ) que deben seleccionarse para utilizar el marcador de ADN introducido anteriormente. Los fragmentos restantes representan así la biblioteca de fragmentos de unión, o "biblioteca de saltos". [1] El siguiente paso es examinar esta biblioteca con una sonda que represente un "punto de partida" del "salto cromosómico" deseado, es decir, determinar la ubicación del genoma que se está interrogando. Los clones obtenidos a partir de este paso de selección final consistirán en ADN homólogo a nuestra sonda, separado por nuestro marcador de ADN de otra secuencia de ADN que originalmente se encontraba a N kb de distancia (por lo que se denomina "salto"). [1] Al generar varias bibliotecas de diferentes valores de N, eventualmente se puede mapear todo el genoma, lo que permite el movimiento de una ubicación a otra, mientras se controla la dirección, mediante cualquier valor de N deseado. [1]

Primeros desafíos y mejoras

La técnica original de salto de cromosomas fue desarrollada en los laboratorios de Collins y Weissman en la Universidad de Yale en New Haven, EE. UU. [1] y en los laboratorios de Poustka y Lehrach en el Laboratorio Europeo de Biología Molecular en Heidelberg, Alemania. [2]

El método de Collins y Weissman [1] descrito anteriormente encontró algunas limitaciones iniciales. La principal preocupación era evitar fragmentos no circularizados. Se sugirieron dos soluciones: o bien examinar los fragmentos de unión con una sonda determinada o añadir un segundo paso de selección de tamaño después de la ligadura para separar los clones circulares individuales (monómeros) de los clones ligados entre sí (multímeros). Los autores también sugirieron que se deberían considerar otros marcadores como el sitio λ cos o los genes de resistencia a antibióticos (en lugar del gen de ARNt supresor ámbar) para facilitar la selección de clones de unión.

Poustka y Lehrach [2] sugirieron que se debería utilizar una digestión completa con enzimas de restricción de cortes raros (como NotI) para el primer paso de la construcción de la biblioteca en lugar de una digestión parcial con una enzima de restricción de cortes frecuentes. Esto reduciría significativamente el número de clones de millones a miles. Sin embargo, esto podría crear problemas con la circularización de los fragmentos de ADN, ya que estos fragmentos serían muy largos y también perderían la flexibilidad en la elección de los puntos finales que se obtiene en las digestiones parciales. Una sugerencia para superar estos problemas sería combinar los dos métodos, es decir, construir una biblioteca de saltos a partir de fragmentos de ADN digeridos parcialmente con una enzima de restricción de corte común y completamente con una enzima de restricción de cortes raros y circularizarlos en plásmidos escindidos con ambas enzimas. Varias de estas bibliotecas "combinadas" se completaron en 1986. [2] [3]

En 1991, Zabarovsky et al. [4] propusieron un nuevo enfoque para la construcción de bibliotecas de saltos. Este enfoque incluía el uso de dos vectores λ separados para la construcción de la biblioteca y una reacción de llenado parcial que elimina la necesidad de un marcador seleccionable. Esta reacción de llenado funcionaba destruyendo los extremos cohesivos específicos (resultantes de las digestiones de restricción) de los fragmentos de ADN que no estaban ligados ni circularizados, impidiendo así que se clonaran en los vectores, de una manera más precisa y eficiente en términos de energía. Además, esta técnica mejorada requería menos ADN para empezar y también producía una biblioteca que podía transferirse a una forma de plásmido, lo que facilitaba su almacenamiento y replicación. Utilizando este nuevo enfoque, construyeron con éxito una biblioteca de saltos NotI humana a partir de una línea celular linfoblastoide y una biblioteca de saltos NotI específica del cromosoma 3 humano a partir de una línea celular híbrida de cromosoma 3 humano y ratón. [4]

Método actual

Las técnicas de segunda generación o "Next-Gen" (NGS) han evolucionado radicalmente: la capacidad de secuenciación se ha multiplicado por más de diez mil y el coste se ha reducido en más de un millón desde 2007 (Instituto Nacional de Investigación del Genoma Humano). La NGS ha revolucionado el campo de la genética en muchos sentidos.

Construcción de biblioteca

Una biblioteca se prepara a menudo mediante la fragmentación aleatoria de ADN y la ligación de secuencias adaptadoras comunes. [5] [6] Sin embargo, las lecturas cortas generadas desafían la identificación de variantes estructurales, como indels, translocaciones y duplicación. Grandes regiones de repeticiones simples pueden complicar aún más la alineación. [7] Alternativamente, una biblioteca de saltos se puede utilizar con NGS para el mapeo de la variación estructural y el andamiaje de ensamblajes de novo. [8]

Esta figura es una representación esquemática de uno de los métodos más recientemente utilizados para crear bibliotecas de salto.

Las bibliotecas de salto se pueden clasificar según la longitud de los fragmentos de ADN incorporados.

Biblioteca de saltos cortos

En una biblioteca de saltos cortos, fragmentos de ADN genómico de 3 kb se ligan con extremos biotinilados y se circularizan. Luego, los segmentos circulares se cortan en fragmentos pequeños y los fragmentos biotinilados se seleccionan mediante un ensayo de afinidad para la secuenciación de extremos emparejados.

Existen dos problemas relacionados con las bibliotecas de saltos cortos. En primer lugar, una lectura puede pasar a través de la unión de circularización biotinilada y reducir la longitud de lectura efectiva. En segundo lugar, las lecturas de fragmentos no saltados (es decir, fragmentos sin la unión de circularización) se secuencian y reducen la cobertura genómica. Se ha informado que los fragmentos no saltados varían entre el 4% y el 13%, según el tamaño de la selección. El primer problema se puede resolver cortando círculos en un tamaño mayor y seleccionando esos fragmentos más grandes. El segundo problema se puede abordar utilizando una biblioteca de saltos con código de barras personalizada. [9] [10]

Biblioteca de saltos con código de barras personalizado

Esta biblioteca de saltos utiliza adaptadores que contienen marcadores para la selección de fragmentos en combinación con códigos de barras para la multiplexación. El protocolo fue desarrollado por Talkowski et al. [9] y se basa en la preparación de bibliotecas de pares de apareamiento para la secuenciación SOLiD. El tamaño del fragmento de ADN seleccionado es de 3,5 a 4,5 kb. Se utilizaron dos adaptadores: uno que contiene un sitio de reconocimiento de EcoP15I y un saliente de AC; el otro que contiene un saliente de GT, una timina biotinilada y un código de barras de oligo. El ADN circularizado se digirió y se seleccionaron los fragmentos con adaptadores biotinilados (consulte la Figura 3). El sitio de reconocimiento de EcoP15I y el código de barras ayudan a distinguir los fragmentos de unión de los fragmentos sin salto. Estos fragmentos seleccionados deben contener de 25 a 27 pb de ADN genómico, el sitio de reconocimiento de EcoP15I, el saliente y el código de barras. [9]

Biblioteca de salto de longitud

Este proceso de construcción de biblioteca es similar al de la biblioteca de salto corto, excepto que la condición está optimizada para fragmentos más largos (5 kb). [10]

Biblioteca de saltos de fosmidos

Este proceso de construcción de bibliotecas también es similar al de las bibliotecas de salto corto, excepto que se requiere la transfección con el vector de E. coli para la amplificación de fragmentos de ADN grandes (40 kb). Además, los fósmidos se pueden modificar para facilitar la conversión en bibliotecas de salto compatibles con ciertos secuenciadores de próxima generación. [8] [10]

Secuenciación de extremos emparejados

Los segmentos resultantes de la circularización durante la construcción de la biblioteca de saltos se escinden y los fragmentos de ADN con marcadores se enriquecen y se someten a una secuenciación de extremos emparejados. Estos fragmentos de ADN se secuencian desde ambos extremos y generan pares de lecturas. La distancia genómica entre las lecturas de cada par se conoce aproximadamente y se utiliza para el proceso de ensamblaje. Por ejemplo, un clon de ADN generado por fragmentación aleatoria tiene alrededor de 200 pb y una lectura de cada extremo tiene alrededor de 180 pb, superponiéndose entre sí. Esto debe distinguirse de la secuenciación de pares de apareamiento, que es básicamente una combinación de secuenciación de próxima generación con bibliotecas de saltos.

Análisis computacional

Se han desarrollado diferentes herramientas de ensamblaje para manejar datos de bibliotecas de saltos. Un ejemplo es DELLY. DELLY se desarrolló para descubrir variantes estructurales genómicas e "integra pares de extremos de inserción cortos, pares de acoplamiento de largo alcance y alineaciones de lectura dividida" para detectar reordenamientos a nivel de secuencia. [11]

Un ejemplo de desarrollo conjunto de un nuevo diseño experimental y desarrollo de algoritmos lo demuestra el ensamblador ALLPATHS-LG. [12]

Confirmación

Cuando se utilizan para la detección de cambios genéticos y genómicos, los clones saltadores requieren validación mediante secuenciación de Sanger .

Aplicaciones

Aplicaciones tempranas

En los primeros tiempos, se utilizaba el rastreo cromosómico a partir de marcadores de ADN ligados genéticamente para identificar y clonar genes de enfermedades. Sin embargo, la gran distancia molecular entre los marcadores conocidos y el gen de interés complicaba el proceso de clonación. En 1987, se construyó una biblioteca de saltos cromosómicos humanos para clonar el gen de la fibrosis quística. La fibrosis quística es una enfermedad autosómica recesiva que afecta a 1 de cada 2000 caucásicos. Esta fue la primera enfermedad en la que se demostró la utilidad de las bibliotecas de saltos. El oncogén Met era un marcador estrechamente ligado al gen de la fibrosis quística en el cromosoma humano 7, y se examinó la biblioteca en busca de un clon saltador que comenzara en este marcador. Se determinó que el gen de la fibrosis quística se localizaba 240 kb aguas abajo del gen met. Los saltos cromosómicos ayudaron a reducir los "pasos" de mapeo y a evitar las regiones altamente repetitivas en el genoma de los mamíferos. [13] Los saltos cromosómicos también permitieron la producción de sondas necesarias para un diagnóstico más rápido de esta y otras enfermedades. [1]

Nuevas aplicaciones

Caracterización de los reordenamientos cromosómicos

Los reordenamientos cromosómicos equilibrados pueden contribuir significativamente a las enfermedades, como lo demuestran los estudios de leucemia. [14] Sin embargo, muchos de ellos no se detectan mediante microarrays cromosómicos. El cariotipo y la hibridación in situ con fluorescencia pueden identificar translocaciones e inversiones equilibradas, pero requieren mucho trabajo y brindan una resolución baja (se pasan por alto pequeños cambios genómicos).

Se puede aplicar un enfoque combinado de NGS con bibliotecas de saltos para identificar dichos cambios genómicos. Por ejemplo, Slade et al. aplicaron este método para mapear con precisión una translocación balanceada de novo en un niño con tumor de Wilms . [15] Para este estudio, se generaron 50 millones de lecturas, pero solo el 11,6 % de ellas se pudieron mapear de manera única al genoma de referencia, lo que representa una cobertura de aproximadamente seis veces.

Talkowski et al. [9] compararon diferentes enfoques para detectar alteraciones cromosómicas equilibradas y demostraron que la biblioteca de saltos modificada en combinación con la secuenciación de ADN de próxima generación es un método preciso para mapear puntos de ruptura cromosómica. Se probaron dos variedades de bibliotecas de saltos (bibliotecas de saltos cortos y bibliotecas de saltos con código de barras personalizado) y se compararon con bibliotecas de secuenciación estándar. Para la NGS estándar, se generan fragmentos de 200-500 pb. Alrededor del 0,03%–0,54% de los fragmentos representan pares quiméricos, que son pares de lecturas finales que se asignan a dos cromosomas diferentes. Por lo tanto, muy pocos fragmentos cubren el área del punto de ruptura. Al usar bibliotecas de saltos cortos con fragmentos de 3,2–3,8 kb, el porcentaje de pares quiméricos aumentó al 1,3%. Con las bibliotecas de saltos con código de barras personalizado, el porcentaje de pares quiméricos aumentó aún más al 1,49%. [9]

Diagnóstico prenatal

Las pruebas citogenéticas convencionales no pueden ofrecer la resolución a nivel genético necesaria para predecir el resultado de un embarazo y la secuenciación profunda del genoma completo no es práctica para el diagnóstico prenatal de rutina. La biblioteca de saltos de genoma completo podría complementar las pruebas prenatales convencionales. Este nuevo método se aplicó con éxito para identificar un caso de síndrome de CHARGE . [6]

Asamblea de novo

En metagenómica , las regiones de los genomas que se comparten entre cepas suelen ser más largas que las lecturas. Esto complica el proceso de ensamblaje y hace que la reconstrucción de genomas individuales para una especie sea una tarea abrumadora. [10] Los pares quiméricos que se mapean muy separados en el genoma pueden facilitar el proceso de ensamblaje de novo. Al utilizar una biblioteca de saltos más largos, Ribeiro et al. demostraron que los ensamblajes de genomas bacterianos eran de alta calidad y al mismo tiempo reducían tanto el costo como el tiempo. [16]

Limitación

El coste de la secuenciación ha disminuido drásticamente, mientras que el coste de la construcción de bibliotecas de saltos no lo ha hecho. Por lo tanto, a medida que se desarrollen nuevas tecnologías de secuenciación y herramientas bioinformáticas, las bibliotecas de saltos pueden volverse redundantes.

Véase también

Referencias

  1. ^ abcdefgh Collins, FS; Weissman, SM (noviembre de 1984). "Clonación direccional de fragmentos de ADN a gran distancia de una sonda inicial: un método de circularización". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 81 (21): 6812–6. Bibcode :1984PNAS...81.6812C. doi : 10.1073/pnas.81.21.6812 . PMC  392022 . PMID  6093122.
  2. ^ abc Poustka, Annemarie; Lehrach, Hans (1 de enero de 1986). "Bibliotecas de salto y bibliotecas de enlace: la próxima generación de herramientas moleculares en genética de mamíferos". Tendencias en genética . 2 : 174–179. doi :10.1016/0168-9525(86)90219-2.
  3. ^ Poustka, A; Pohl, TM; Barlow, DP; Frischauf, AM; Lehrach, H (22-28 de enero de 1987). "Construcción y uso de bibliotecas de saltos de cromosomas humanos a partir de ADN digerido con NotI". Nature . 325 (6102): 353–5. Bibcode :1987Natur.325..353P. doi :10.1038/325353a0. PMID  3027567. S2CID  4241410.
  4. ^ ab Zabarovsky, ER; Boldog, F; Erlandsson, R; Kashuba, VI; Allikmets, RL; Marcsek, Z; Kisselev, LL; Stanbridge, E; Klein, G; Sumegi, J (diciembre de 1991). "Nueva estrategia para el mapeo del genoma humano basada en un nuevo procedimiento para la construcción de bibliotecas de saltos". Genómica . 11 (4): 1030–9. doi :10.1016/0888-7543(91)90029-e. PMID  1783374.
  5. ^ Shendure, J; Ji, H (octubre de 2008). "Secuenciación de ADN de próxima generación". Nature Biotechnology . 26 (10): 1135–45. doi :10.1038/nbt1486. ​​PMID  18846087. S2CID  6384349.
  6. ^ ab Talkowski, ME; Ordulu, Z; Pillalamarri, V; Benson, CB; Blumenthal, I; Connolly, S; Hanscom, C; Hussain, N; Pereira, S; Picker, J; Rosenfeld, JA; Shaffer, LG; Wilkins-Haug, LE; Gusella, JF; Morton, CC (6 de diciembre de 2012). "Diagnóstico clínico mediante secuenciación del genoma completo de una muestra prenatal". The New England Journal of Medicine . 367 (23): 2226–32. doi :10.1056/NEJMoa1208594. PMC 3579222 . PMID  23215558. 
  7. ^ Meldrum, C; Doyle, MA; Tothill, RW (noviembre de 2011). "Secuenciación de próxima generación para el diagnóstico del cáncer: una perspectiva práctica". The Clinical Biochemist. Reseñas / Asociación Australiana de Bioquímicos Clínicos . 32 (4): 177–95. PMC 3219767. PMID  22147957 . 
  8. ^ ab Williams, LJS; Tabbaa, DG; Li, N.; Berlín, AM; karité, TP; MacCallum, I.; Lawrence, MS; Secador, Y.; Getz, G.; Joven, SK; Jaffe, DB; Nusbaum, C.; Gnirke, A. (16 de julio de 2012). "Secuenciación de extremos emparejados de bibliotecas Fosmid por Illumina". Investigación del genoma . 22 (11): 2241–2249. doi :10.1101/gr.138925.112. PMC 3483553 . PMID  22800726. 
  9. ^ abcde Talkowski, ME; Ernst, C; Heilbut, A; Chiang, C; Hanscom, C; Lindgren, A; Kirby, A; Liu, S; Muddukrishna, B; Ohsumi, TK; Shen, Y; Borowsky, MZ; Daly, MJ; Morton, CC; Gusella, JF (8 de abril de 2011). "Las estrategias de secuenciación de próxima generación permiten la detección rutinaria de reordenamientos cromosómicos equilibrados para diagnósticos clínicos e investigación genética". American Journal of Human Genetics . 88 (4): 469–81. doi :10.1016/j.ajhg.2011.03.013. PMC 3071919 . PMID  21473983. 
  10. ^ abcd Nagarajan, Niranjan; Pop, Mihai (29 de enero de 2013). "Desmitificación del ensamblaje de secuencias". Nature Reviews Genetics . 14 (3): 157–167. doi :10.1038/nrg3367. PMID  23358380. S2CID  3519991.
  11. ^ Rausch, T.; Zichner, T.; Schlattl, A.; Stutz, AM; Benes, V.; Korbel, JO (7 de septiembre de 2012). "DELLY: descubrimiento de variantes estructurales mediante análisis integrado de extremos emparejados y lectura dividida". Bioinformática . 28 (18): i333–i339. doi :10.1093/bioinformatics/bts378. PMC 3436805 . PMID  22962449. 
  12. ^ Gnerre, S; Maccallum, I; Przybylski, D; Ribeiro, FJ; Burton, JN; Walker, BJ; Sharpe, T; Hall, G; Shea, TP; Sykes, S; Berlin, AM; Aird, D; Costello, M; Daza, R; Williams, L; Nicol, R; Gnirke, A; Nusbaum, C; Lander, ES; Jaffe, DB (25 de enero de 2011). "Borradores de alta calidad de genomas de mamíferos a partir de datos de secuencias masivamente paralelas". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 108 (4): 1513–8. Bibcode :2011PNAS..108.1513G. doi : 10.1073/pnas.1017351108 . PMC 3029755 . Número de modelo:  PMID21187386. 
  13. ^ Rommens, J.; Iannuzzi, M.; Kerem, B; Drumm, M.; Melmer, G; Dean, M; Rozmahel, R; Cole, J.; Kennedy, D; Hidaka, N; et al. (8 de septiembre de 1989). "Identificación del gen de la fibrosis quística: caminar y saltar sobre los cromosomas". Science . 245 (4922): 1059–1065. Bibcode :1989Sci...245.1059R. doi :10.1126/science.2772657. PMID  2772657.
  14. ^ Rowley, JD (1979). "Anomalías cromosómicas en la leucemia". Tendencias modernas en la leucemia humana III . Hematología y transfusión sanguínea / Hämatologie und Bluttransfusion. vol. 23. págs. 43–52. doi :10.1007/978-3-642-67057-2_5. ISBN 978-3-540-08999-5. Número PMID  232467. {{cite book}}: |journal=ignorado ( ayuda )
  15. ^ Slade, I.; Stephens, P.; Douglas, J.; Barker, K.; Stebbings, L.; Abbaszadeh, F.; Pritchard-Jones, K.; Cole, R.; Pizer, B.; Stiller, C.; Vujanic, G.; Scott, RH; Stratton, MR; Rahman, N. (30 de noviembre de 2009). "El mapeo de puntos de ruptura de translocación constitucional mediante secuenciación de extremos emparejados en todo el genoma identifica a HACE1 como un gen putativo de susceptibilidad al tumor de Wilms". Journal of Medical Genetics . 47 (5): 342–347. doi :10.1136/jmg.2009.072983. PMID  19948536. S2CID  24354213.
  16. ^ Ribeiro, FJ; Przybylski, D.; Yin, S.; Sharpe, T.; Gnerre, S.; Abouelleil, A.; Berlin, AM; Montmayeur, A.; Shea, TP; Walker, BJ; Young, SK; Russ, C.; Nusbaum, C.; MacCallum, I.; Jaffe, DB (24 de julio de 2012). "Genomas bacterianos terminados a partir de datos de secuencias shotgun". Genome Research . 22 (11): 2270–2277. doi :10.1101/gr.141515.112. PMC 3483556 . PMID  22829535. 

Enlaces externos

  1. ^ Butler, J; MacCallum, I; Kleber, M; Shlyakhter, IA; Belmonte, MK; Lander, ES; Nusbaum, C; Jaffe, DB (mayo de 2008). "ALLPATHS: ensamblaje de novo de microlecturas shotgun de todo el genoma". Genome Research . 18 (5): 810–20. doi :10.1101/gr.7337908. PMC 2336810 . PMID  18340039.