Biblioteca genómica

Una biblioteca genómica es una colección de fragmentos de ADN superpuestos que juntos forman el ADN genómico total de un solo organismo . El ADN se almacena en una población de vectores idénticos, cada uno de los cuales contiene un inserto diferente de ADN. Para construir una biblioteca genómica, el ADN del organismo se extrae de las células y luego se digiere con una enzima de restricción para cortar el ADN en fragmentos de un tamaño específico. Luego, los fragmentos se insertan en el vector utilizando ADN ligasa . ^[1] A continuación, el ADN del vector puede ser absorbido por un organismo huésped, generalmente una población de Escherichia coli o levadura , y cada célula contiene solo una molécula de vector. El uso de una célula huésped para transportar el vector permite una fácil amplificación y recuperación de clones específicos de la biblioteca para su análisis. ^[2]

Existen varios tipos de vectores disponibles con distintas capacidades de inserción. En general, las bibliotecas creadas a partir de organismos con genomas más grandes requieren vectores que incluyan insertos más grandes, por lo que se necesitan menos moléculas de vector para crear la biblioteca. Los investigadores pueden elegir un vector teniendo en cuenta también el tamaño ideal del inserto para encontrar la cantidad deseada de clones necesarios para la cobertura completa del genoma. ^[3]

Las bibliotecas genómicas se utilizan habitualmente para aplicaciones de secuenciación . Han desempeñado un papel importante en la secuenciación del genoma completo de varios organismos, incluido el genoma humano y varios organismos modelo . ^[4]^[5]

Historia

El primer genoma basado en ADN secuenciado por completo fue logrado por el dos veces ganador del Premio Nobel, Frederick Sanger , en 1977. Sanger y su equipo de científicos crearon una biblioteca del bacteriófago phi X 174 para su uso en la secuenciación de ADN . ^[6] La importancia de este éxito contribuyó a la creciente demanda de secuenciación de genomas para investigar la terapia génica . Los equipos ahora pueden catalogar polimorfismos en genomas e investigar aquellos genes candidatos que contribuyen a enfermedades como la enfermedad de Parkinson , la enfermedad de Alzheimer , la esclerosis múltiple , la artritis reumatoide y la diabetes tipo 1. ^[7] Esto se debe al avance de los estudios de asociación de todo el genoma a partir de la capacidad de crear y secuenciar bibliotecas genómicas. Antes, los estudios de ligamiento y de genes candidatos eran algunos de los únicos enfoques. ^[8]

Construcción de bibliotecas genómicas

La construcción de una biblioteca genómica implica la creación de muchas moléculas de ADN recombinante . El ADN genómico de un organismo se extrae y luego se digiere con una enzima de restricción . Para organismos con genomas muy pequeños (~10 kb) , los fragmentos digeridos se pueden separar mediante electroforesis en gel . Los fragmentos separados se pueden escindir y clonar en el vector por separado. Sin embargo, cuando se digiere un genoma grande con una enzima de restricción, hay demasiados fragmentos para escindir individualmente. El conjunto completo de fragmentos debe clonarse junto con el vector, y la separación de clones puede ocurrir después. En cualquier caso, los fragmentos se ligan a un vector que ha sido digerido con la misma enzima de restricción. El vector que contiene los fragmentos insertados de ADN genómico se puede introducir luego en un organismo huésped. ^[1]

A continuación se muestran los pasos para crear una biblioteca genómica a partir de un genoma grande.

Extraer y purificar ADN.
Digerir el ADN con una enzima de restricción. Esto crea fragmentos de tamaño similar, cada uno de los cuales contiene uno o más genes.
Inserte los fragmentos de ADN en vectores que fueron cortados con la misma enzima de restricción. Utilice la enzima ADN ligasa para sellar los fragmentos de ADN en el vector. Esto crea un gran grupo de moléculas recombinantes.
Estas moléculas recombinantes son absorbidas por una bacteria huésped mediante transformación , creando una biblioteca de ADN. ^[9]^[10]

A continuación se muestra un diagrama de los pasos descritos anteriormente.

Determinación del título de la biblioteca

Después de construir una biblioteca genómica con un vector viral, como el fago lambda , se puede determinar el título de la biblioteca. Calcular el título permite a los investigadores aproximarse a la cantidad de partículas virales infecciosas que se crearon con éxito en la biblioteca. Para ello, se utilizan diluciones de la biblioteca para transformar cultivos de E. coli de concentraciones conocidas. A continuación, los cultivos se siembran en placas de agar y se incuban durante la noche. Se cuenta el número de placas virales y se puede utilizar para calcular el número total de partículas virales infecciosas en la biblioteca. La mayoría de los vectores virales también llevan un marcador que permite distinguir los clones que contienen un inserto de los que no lo tienen. Esto permite a los investigadores determinar también el porcentaje de partículas virales infecciosas que realmente llevan un fragmento de la biblioteca. ^[11]

Se puede utilizar un método similar para titular bibliotecas genómicas creadas con vectores no virales, como plásmidos y BAC . Se puede utilizar una ligadura de prueba de la biblioteca para transformar E. coli. Luego, la transformación se extiende en placas de agar y se incuba durante la noche. El título de la transformación se determina contando el número de colonias presentes en las placas. Estos vectores generalmente tienen un marcador seleccionable que permite la diferenciación de clones que contienen un inserto de aquellos que no lo contienen. Al hacer esta prueba, los investigadores también pueden determinar la eficiencia de la ligadura y hacer los ajustes necesarios para asegurarse de obtener el número deseado de clones para la biblioteca. ^[12]

Biblioteca de proyección

Para aislar clones que contienen regiones de interés de una biblioteca, primero se debe examinar la biblioteca . Un método de examen es la hibridación . Cada célula huésped transformada de una biblioteca contendrá solo un vector con un inserto de ADN. La biblioteca completa se puede sembrar en un filtro sobre medio . El filtro y las colonias se preparan para la hibridación y luego se marcan con una sonda . ^[13] El ADN objetivo (inserto de interés) se puede identificar mediante detección como la autorradiografía debido a la hibridación con la sonda, como se ve a continuación.

Otro método de detección es la reacción en cadena de la polimerasa (PCR). Algunas bibliotecas se almacenan como grupos de clones y la detección mediante PCR es una forma eficiente de identificar grupos que contienen clones específicos. ^[2]

Tipos de vectores

El tamaño del genoma varía entre los distintos organismos y el vector de clonación debe seleccionarse en consecuencia. Para un genoma grande, se debe elegir un vector con una gran capacidad de modo que una cantidad relativamente pequeña de clones sea suficiente para cubrir todo el genoma. Sin embargo, a menudo es más difícil caracterizar un inserto contenido en un vector de mayor capacidad. ^[3]

A continuación se muestra una tabla de varios tipos de vectores comúnmente utilizados para bibliotecas genómicas y el tamaño de inserto que generalmente contiene cada uno.

Plásmidos

Un plásmido es una molécula de ADN circular de doble cadena que se utiliza habitualmente para la clonación molecular . Los plásmidos tienen generalmente una longitud de 2 a 4 kilopares de bases (kb) y son capaces de llevar insertos de hasta 15 kb. Los plásmidos contienen un origen de replicación que les permite replicarse dentro de una bacteria independientemente del cromosoma huésped . Los plásmidos suelen llevar un gen de resistencia a los antibióticos que permite la selección de células bacterianas que contienen el plásmido. Muchos plásmidos también llevan un gen reportero que permite a los investigadores distinguir los clones que contienen un inserto de los que no lo tienen. ^[3]

Fago lambda (λ)

El fago λ es un virus de ADN de doble cadena que infecta a E. coli . El cromosoma λ tiene una longitud de 48,5 kb y puede llevar insertos de hasta 25 kb. Estos insertos reemplazan secuencias virales no esenciales en el cromosoma λ, mientras que los genes necesarios para la formación de partículas virales y la infección permanecen intactos. El ADN insertado se replica con el ADN viral; por lo tanto, juntos se empaquetan en partículas virales. Estas partículas son muy eficientes en la infección y la multiplicación, lo que conduce a una mayor producción de cromosomas λ recombinantes. ^[3] Sin embargo, debido al menor tamaño del inserto, las bibliotecas creadas con el fago λ pueden requerir muchos clones para una cobertura completa del genoma. ^[14]

Cósmidos

Los vectores cósmidos son plásmidos que contienen una pequeña región de ADN del bacteriófago λ llamada secuencia cos. Esta secuencia permite que el cósmido se empaquete en partículas de bacteriófago λ. Estas partículas, que contienen un cósmido linealizado, se introducen en la célula huésped mediante transducción . Una vez dentro del huésped, los cósmidos se circularizan con la ayuda de la ADN ligasa del huésped y luego funcionan como plásmidos. Los cósmidos son capaces de transportar insertos de hasta 40 kb de tamaño. ^[2]

Vectores del bacteriófago P1

Los vectores del bacteriófago P1 pueden contener insertos de 70 a 100 kb de tamaño. Comienzan como moléculas de ADN lineales empaquetadas en partículas del bacteriófago P1. Estas partículas se inyectan en una cepa de E. coli que expresa la recombinasa Cre . El vector lineal P1 se vuelve circular por recombinación entre dos sitios loxP en el vector. Los vectores P1 generalmente contienen un gen para la resistencia a los antibióticos y un marcador de selección positiva para distinguir los clones que contienen un inserto de los que no. Los vectores P1 también contienen un replicón plasmídico P1 , que garantiza que solo una copia del vector esté presente en una célula. Sin embargo, hay un segundo replicón P1, llamado replicón lítico P1, que está controlado por un promotor inducible . Este promotor permite la amplificación de más de una copia del vector por célula antes de la extracción de ADN . ^[2]

Cromosomas artificiales P1

Los cromosomas artificiales P1 (PAC) tienen características tanto de los vectores P1 como de los cromosomas artificiales bacterianos (BAC). De manera similar a los vectores P1, contienen un plásmido y un replicón lítico como se describió anteriormente. A diferencia de los vectores P1, no necesitan ser empaquetados en partículas de bacteriófagos para la transducción. En cambio, se introducen en E. coli como moléculas de ADN circulares a través de electroporación, al igual que los BAC. ^[2] También similares a los BAC, estos son relativamente más difíciles de preparar debido a un único origen de replicación. ^[14]

Cromosomas artificiales bacterianos

Los cromosomas artificiales bacterianos (BAC) son moléculas de ADN circulares, normalmente de unos 7 kb de longitud, que son capaces de albergar insertos de hasta 300 kb de tamaño. Los vectores BAC contienen un replicón derivado del factor F de E. coli , que garantiza que se mantengan en una copia por célula. ^[4] Una vez que un inserto se liga a un BAC, el BAC se introduce en cepas de E. coli deficientes en recombinación mediante electroporación. La mayoría de los vectores BAC contienen un gen de resistencia a los antibióticos y también un marcador de selección positiva. ^[2] La figura de la derecha muestra un vector BAC que se corta con una enzima de restricción, seguido de la inserción de ADN extraño que se vuelve a hibridar con una ligasa. En general, se trata de un vector muy estable, pero puede ser difícil de preparar debido a un único origen de replicación, al igual que los PAC. ^[14]

Cromosomas artificiales de levadura

Los cromosomas artificiales de levadura (YAC) son moléculas de ADN lineales que contienen las características necesarias de un cromosoma de levadura auténtico, incluidos los telómeros , un centrómero y un origen de replicación . Se pueden ligar grandes insertos de ADN en el medio del YAC de modo que haya un "brazo" del YAC a cada lado del inserto. El YAC recombinante se introduce en la levadura por transformación; los marcadores seleccionables presentes en el YAC permiten la identificación de transformantes exitosos. Los YAC pueden contener insertos de hasta 2000 kb, pero la mayoría de las bibliotecas de YAC contienen insertos de 250-400 kb de tamaño. Teóricamente, no hay un límite superior en el tamaño de inserto que un YAC puede contener. Es la calidad en la preparación del ADN utilizado para los insertos lo que determina el límite de tamaño. ^[2] El aspecto más desafiante del uso de YAC es el hecho de que son propensos a la reorganización . ^[14]

Cómo seleccionar un vector

La selección de vectores requiere que uno se asegure de que la biblioteca creada sea representativa de todo el genoma. Cualquier inserción del genoma derivada de una enzima de restricción debe tener la misma probabilidad de estar en la biblioteca en comparación con cualquier otra inserción. Además, las moléculas recombinantes deben contener inserciones lo suficientemente grandes como para garantizar que el tamaño de la biblioteca se pueda manejar cómodamente. ^[14] Esto está determinado particularmente por el número de clones necesarios para tener en una biblioteca. El número de clones para obtener una muestra de todos los genes está determinado por el tamaño del genoma del organismo, así como por el tamaño promedio de la inserción. Esto se representa mediante la fórmula (también conocida como la fórmula de Carbon y Clarke): ^[15]

$N={\frac {ln(1-P)}{ln(1-f)}}$

dónde,

${\estilo de visualización N}$ es el número necesario de recombinantes ^[16]

${\estilo de visualización P}$ es la probabilidad deseada de que cualquier fragmento del genoma aparezca al menos una vez en la biblioteca creada

${\estilo de visualización f}$ es la proporción fraccionaria del genoma en un solo recombinante

${\estilo de visualización f}$ Se puede demostrar además que:

$f={\frac {i}{g}}$

dónde,

${\estilo de visualización i}$ ¿Cuál es el tamaño del inserto?

${\estilo de visualización g}$ ¿Cuál es el tamaño del genoma?

Por lo tanto, aumentar el tamaño del inserto (mediante la elección del vector) permitiría que se necesitaran menos clones para representar un genoma. La proporción del tamaño del inserto en relación con el tamaño del genoma representa la proporción del genoma respectivo en un solo clon. ^[14] Aquí está la ecuación con todas las partes consideradas:

$N={\frac {ln(1-P)}{ln(1-{\frac {i}{g}})}}$

Ejemplo de selección de vectores

La fórmula anterior se puede utilizar para determinar el nivel de confianza del 99 % de que todas las secuencias de un genoma están representadas mediante el uso de un vector con un tamaño de inserción de veinte mil pares de bases (como el vector del fago lambda). El tamaño del genoma del organismo es de tres mil millones de pares de bases en este ejemplo.

$N={\frac {ln(1-0.99)}{ln[1-{\frac {2.0\times 10^{4}basepairs}{3.0\times 10^{9}basepairs}}]}}$

$N={\frac {-4.61}{-6.7\times 10^{-6}}}$

$N=688,060$ Clones

Por lo tanto, se requieren aproximadamente 688.060 clones para garantizar una probabilidad del 99% de que una secuencia de ADN dada de este genoma de tres mil millones de pares de bases esté presente en una biblioteca que utilice un vector con un tamaño de inserto de veinte mil pares de bases.

Aplicaciones

Una vez creada una biblioteca, se puede secuenciar el genoma de un organismo para dilucidar cómo los genes afectan a un organismo o para comparar organismos similares a nivel de genoma. Los estudios de asociación de todo el genoma antes mencionados pueden identificar genes candidatos que se derivan de muchos rasgos funcionales. Los genes se pueden aislar a través de bibliotecas genómicas y usarse en líneas celulares humanas o modelos animales para realizar investigaciones más profundas. ^[17] Además, la creación de clones de alta fidelidad con una representación precisa del genoma y sin problemas de estabilidad contribuiría bien como intermediarios para la secuenciación shotgun o el estudio de genes completos en el análisis funcional. ^[10]

Secuenciación jerárquica

Un uso importante de las bibliotecas genómicas es la secuenciación shotgun jerárquica , que también se denomina secuenciación descendente, basada en mapas o clon por clon. Esta estrategia se desarrolló en la década de 1980 para secuenciar genomas completos antes de que estuvieran disponibles las técnicas de alto rendimiento para la secuenciación. Los clones individuales de las bibliotecas genómicas se pueden dividir en fragmentos más pequeños, generalmente de 500 pb a 1000 pb, que son más manejables para la secuenciación. ^[4] Una vez que se secuencia un clon de una biblioteca genómica, la secuencia se puede utilizar para examinar la biblioteca en busca de otros clones que contengan insertos que se superpongan con el clon secuenciado. Cualquier nuevo clon superpuesto se puede secuenciar formando un contig . Esta técnica, llamada caminata cromosómica , se puede aprovechar para secuenciar cromosomas completos. ^[2]

La secuenciación shotgun del genoma completo es otro método de secuenciación genómica que no requiere una biblioteca de vectores de alta capacidad. En cambio, utiliza algoritmos informáticos para ensamblar lecturas de secuencias cortas para cubrir todo el genoma. Las bibliotecas genómicas se utilizan a menudo en combinación con la secuenciación shotgun del genoma completo por este motivo. Se puede crear un mapa de alta resolución secuenciando ambos extremos de los insertos de varios clones en una biblioteca genómica. Este mapa proporciona secuencias con distancias conocidas entre sí, que se pueden utilizar para ayudar con el ensamblaje de lecturas de secuencias adquiridas mediante secuenciación shotgun. ^[4] La secuencia del genoma humano, que se declaró completa en 2003, se ensambló utilizando tanto una biblioteca BAC como la secuenciación shotgun. ^[18]^[19]

Estudios de asociación de todo el genoma

Los estudios de asociación de todo el genoma son aplicaciones generales para encontrar genes específicos y polimorfismos dentro de la raza humana. De hecho, el proyecto internacional HapMap fue creado a través de una asociación de científicos y agencias de varios países para catalogar y utilizar estos datos. ^[20] El objetivo de este proyecto es comparar secuencias genéticas de diferentes individuos para dilucidar similitudes y diferencias dentro de las regiones cromosómicas. ^[20] Los científicos de todas las naciones participantes están catalogando estos atributos con datos de poblaciones de ascendencia africana, asiática y europea. Estas evaluaciones de todo el genoma pueden conducir a más terapias diagnósticas y farmacológicas, al tiempo que ayudan a los futuros equipos a centrarse en orquestar terapias teniendo en cuenta las características genéticas. Estos conceptos ya se están explotando en la ingeniería genética . ^[20] Por ejemplo, un equipo de investigación ha construido un vector lanzadera PAC que crea una biblioteca que representa una cobertura doble del genoma humano. ^[17] Esto podría servir como un recurso increíble para identificar genes, o conjuntos de genes, que causan enfermedades. Además, estos estudios pueden servir como una forma poderosa de investigar la regulación transcripcional como se ha visto en el estudio de los baculovirus. ^[21] En general, los avances en la construcción de bibliotecas genómicas y la secuenciación de ADN han permitido el descubrimiento eficiente de diferentes objetivos moleculares. ^[5] La asimilación de estas características a través de métodos tan eficientes puede acelerar el empleo de nuevos fármacos candidatos.

Referencias

^ ab Losick, Richard; Watson, James D.; Tania A. Baker; Bell, Stephen; Gann, Alexander; Levine, Michael W. (2008). Biología molecular del gen . San Francisco: Pearson/Benjamin Cummings. ISBN 978-0-8053-9592-1.
^ abcdefgh Russell, David W.; Sambrook, Joseph (2001). Clonación molecular: manual de laboratorio . Cold Spring Harbor, Nueva York: Laboratorio Cold Spring Harbor. ISBN 978-0-87969-577-4.
^ abcd Hartwell, Leland (2008). Genética: de los genes a los genomas. Boston: McGraw-Hill Higher Education. ISBN 978-0-07-284846-5.
^ abcd Muse, Spencer V.; Gibson, Greg (2004). Introducción a la ciencia del genoma. Sunderland, Mass.: Sinauer Associates. ISBN 978-0-87893-232-0.
^ ab Henry RJ, Edwards M, Waters DL, et al. (noviembre de 2012). "Aplicación de la secuenciación a gran escala al descubrimiento de marcadores en plantas". J. Biosci . 37 (5): 829–41. doi :10.1007/s12038-012-9253-z. PMID 23107919. S2CID 14457634.
^ Sanger F, Air GM, Barrell BG, et al. (febrero de 1977). "Secuencia de nucleótidos del ADN del bacteriófago phi X174". Nature . 265 (5596): 687–95. Bibcode :1977Natur.265..687S. doi :10.1038/265687a0. PMID 870828. S2CID 4206886.
^ Menon R, Farina C (2011). "Marcos moleculares y funcionales compartidos entre cinco trastornos humanos complejos: un estudio comparativo sobre interactomas vinculados a genes de susceptibilidad". PLOS ONE . 6 (4): e18660. Bibcode :2011PLoSO...618660M. doi : 10.1371/journal.pone.0018660 . PMC 3080867 . PMID 21533026.
^ Cichon S, Mühleisen TW, Degenhardt FA, et al. (marzo de 2011). "Estudio de asociación de todo el genoma identifica la variación genética en neurocan como un factor de susceptibilidad para el trastorno bipolar". Am. J. Hum. Genet . 88 (3): 372–81. doi :10.1016/j.ajhg.2011.01.017. PMC 3059436. PMID 21353194 .
^ Yoo EY, Kim S, Kim JY, Kim BD (agosto de 2001). "Construcción y caracterización de una biblioteca de cromosomas artificiales bacterianos a partir de chile picante". Mol. Cells . 12 (1): 117–20. doi : 10.1016/S1016-8478(23)17070-1 . PMID 11561720.
^ ab Osoegawa K, de Jong PJ, Frengen E, Ioannou PA (mayo de 2001). "Construcción de bibliotecas de cromosomas artificiales bacterianos (BAC/PAC)". Curr Protoc Hum Genet . Capítulo 5: 5.15.1–5.15.33. doi :10.1002/0471142905.hg0515s21. PMID 18428289. S2CID 8208834.
^ John R. McCarrey; Williams, Steven J.; Barton E. Slatko (2006). Investigaciones de laboratorio en biología molecular . Boston: Jones and Bartlett Publishers. ISBN 978-0-7637-3329-2.
^ Peterson, Daniel; Jeffrey Tomkins; David Frisch (2000). "Construcción de bibliotecas de cromosomas artificiales bacterianos (BAC) de plantas: una guía ilustrada". Journal of Agricultural Genomics . 5 .
^ Kim UJ, Birren BW, Slepak T, et al. (junio de 1996). "Construcción y caracterización de una biblioteca de cromosomas artificiales bacterianos humanos". Genomics . 34 (2): 213–8. doi :10.1006/geno.1996.0268. PMID 8661051.
^ abcdef «Clonación de ADN genómico». University College London . Consultado el 13 de marzo de 2013 .^{[ enlace muerto permanente ]}
^ "Bibliotecas de genes". Archivado desde el original el 31 de marzo de 2013. Consultado el 5 de junio de 2013 .
^ Blaber, Michael. «Bibliotecas genómicas». Archivado desde el original el 13 de mayo de 2015. Consultado el 1 de abril de 2013 .
^ ab Fuesler J, Nagahama Y, Szulewski J, Mundorff J, Bireley S, Coren JS (abril de 2012). "Una biblioteca genómica humana en matriz construida en el vector lanzadera PAC pJCPAC-Mam2 para estudios de asociación de todo el genoma y terapia génica". Gene . 496 (2): 103–9. doi :10.1016/j.gene.2012.01.011. PMC 3488463 . PMID 22285925.
^ Pareek CS, Smoczynski R, Tretyn A (noviembre de 2011). "Tecnologías de secuenciación y secuenciación del genoma". J. Appl. Genet . 52 (4): 413–35. doi :10.1007/s13353-011-0057-x. PMC 3189340 . PMID 21698376.
^ Pennisi E (abril de 2003). "Genoma humano. Los laboratorios de secuenciación celebran haber alcanzado su objetivo antes de tiempo". Science . 300 (5618): 409. doi : 10.1126/science.300.5618.409 . PMID 12702850. S2CID 206577479.
^ abc "Página de inicio de HapMap".
^ Chen Y, Lin X, Yi Y, Lu Y, Zhang Z (2009). "Construcción y aplicación de una biblioteca genómica de baculovirus". Z. Naturforsch. C . 64 (7–8): 574–80. doi : 10.1515/znc-2009-7-817 . PMID 19791511.

Lectura adicional

Klug, Cummings, Spencer, Palladino (2010). Fundamentos de genética . Pearson. Págs. 355–264. ISBN. 978-0-321-61869-6.{{cite book}}: CS1 maint: multiple names: authors list (link)

Enlaces externos

Construcción de la biblioteca genómica BAC