La síntesis de genes artificiales , o simplemente síntesis de genes , se refiere a un grupo de métodos que se utilizan en biología sintética para construir y ensamblar genes a partir de nucleótidos de novo . A diferencia de la síntesis de ADN en células vivas, la síntesis de genes artificiales no requiere ADN molde, lo que permite sintetizar prácticamente cualquier secuencia de ADN en el laboratorio. Consta de dos pasos principales, el primero de los cuales es la síntesis de ADN en fase sólida , a veces conocida como impresión de ADN . [1] Esto produce fragmentos de oligonucleótidos que generalmente tienen menos de 200 pares de bases. Luego, el segundo paso implica conectar estos fragmentos de oligonucleótidos utilizando varios métodos de ensamblaje de ADN. Debido a que la síntesis de genes artificiales no requiere ADN molde, es teóricamente posible crear una molécula de ADN completamente sintética sin límites en la secuencia de nucleótidos o el tamaño.
La síntesis del primer gen completo, un ARNt de levadura , fue demostrada por Har Gobind Khorana y sus compañeros de trabajo en 1972. [2] La síntesis de los primeros genes codificadores de péptidos y proteínas se realizó en los laboratorios de Herbert Boyer y Alexander Markham , respectivamente. [3] [4] Más recientemente, se han desarrollado métodos de síntesis de genes artificiales que permitirán el ensamblaje de cromosomas y genomas completos. El primer cromosoma de levadura sintético se sintetizó en 2014, y también se sintetizaron cromosomas bacterianos funcionales completos. [5] Además, en el futuro la síntesis artificial de genes podría utilizar nuevos pares de nucleobases (pares de bases no naturales). [6] [7] [8]
Los oligonucleótidos se sintetizan químicamente utilizando bloques de construcción llamados fosforamiditas de nucleósidos . Estos pueden ser nucleósidos normales o modificados que tienen grupos protectores para evitar que sus aminas, grupos hidroxilo y grupos fosfato interactúen incorrectamente. Se añade una fosforamidita a la vez, se desprotege el grupo 5' hidroxilo y se añade una nueva base, y así sucesivamente. La cadena crece en la dirección 3' a 5', lo que está al revés en relación con la biosíntesis. Al final, se eliminan todos los grupos protectores. Sin embargo, al ser un proceso químico, se producen varias interacciones incorrectas que dan lugar a algunos productos defectuosos. Cuanto más larga sea la secuencia de oligonucleótidos que se sintetiza, más defectos habrá, por lo que este proceso sólo es práctico para producir secuencias cortas de nucleótidos . El límite práctico actual es de aproximadamente 200 pb ( pares de bases ) para un oligonucleótido con calidad suficiente para usarse directamente para una aplicación biológica. La HPLC se puede utilizar para aislar productos con la secuencia adecuada. Mientras tanto, se puede sintetizar una gran cantidad de oligos en paralelo en chips genéticos . Para un rendimiento óptimo en procedimientos posteriores de síntesis de genes, deben prepararse individualmente y en escalas mayores.
Por lo general, se elabora un conjunto de oligonucleótidos diseñados individualmente en sintetizadores automatizados de fase sólida, se purifican y luego se conectan mediante recocido específico y ligación estándar o reacciones de polimerasa . Para mejorar la especificidad de la hibridación de oligonucleótidos, el paso de síntesis se basa en un conjunto de enzimas ADN ligasa y polimerasa termoestables . Hasta la fecha, se han descrito varios métodos para la síntesis de genes, como la ligadura de oligonucleótidos superpuestos fosforilados, [2] [3] el método Fok I [4] y una forma modificada de reacción en cadena de la ligasa para la síntesis de genes. Además, se han descrito varios enfoques de ensamblaje de PCR . [9] Por lo general, emplean oligonucleótidos de 40 a 50 nucleótidos de longitud que se superponen entre sí. Estos oligonucleótidos están diseñados para cubrir la mayor parte de la secuencia de ambas cadenas, y la molécula de longitud completa se genera progresivamente mediante PCR de extensión superpuesta (OE), [9] PCR de adentro hacia afuera termodinámicamente equilibrada (TBIO) [10] o enfoques combinados. [11] Los genes sintetizados más comúnmente varían en tamaño de 600 a 1200 pb, aunque se han creado genes mucho más largos conectando fragmentos previamente ensamblados de menos de 1000 pb. En este rango de tamaño es necesario probar varios clones candidatos que confirmen la secuencia del gen sintético clonado mediante métodos de secuenciación automatizados.
Además, debido a que el ensamblaje del producto génico de longitud completa depende del alineamiento eficiente y específico de oligonucleótidos monocatenarios largos, los parámetros críticos para el éxito de la síntesis incluyen regiones de secuencia extendida que comprenden estructuras secundarias causadas por repeticiones invertidas, contenido de GC extraordinariamente alto o bajo, o estructuras repetitivas. Por lo general, estos segmentos de un gen particular sólo pueden sintetizarse dividiendo el procedimiento en varios pasos consecutivos y un ensamblaje final de subsecuencias más cortas, lo que a su vez conduce a un aumento significativo del tiempo y la mano de obra necesarios para su producción. El resultado de un experimento de síntesis genética depende en gran medida de la calidad de los oligonucleótidos utilizados. Para estos protocolos de síntesis de genes basados en recocido, la calidad del producto depende directa y exponencialmente de la exactitud de los oligonucleótidos empleados. Alternativamente, después de realizar la síntesis de genes con oligos de menor calidad, se debe hacer un mayor esfuerzo en el control de calidad posterior durante el análisis de clones, que generalmente se realiza mediante procedimientos estándar de clonación y secuenciación que consumen mucho tiempo. Otro problema asociado con todos los métodos actuales de síntesis de genes es la alta frecuencia de errores de secuencia debido al uso de oligonucleótidos sintetizados químicamente. La frecuencia de errores aumenta con oligonucleótidos más largos y, como consecuencia, el porcentaje de producto correcto disminuye drásticamente a medida que se utilizan más oligonucleótidos. El problema de la mutación podría resolverse utilizando oligonucleótidos más cortos para ensamblar el gen. Sin embargo, todos los métodos de ensamblaje basados en recocido requieren que los cebadores se mezclen en un tubo. En este caso, los solapamientos más cortos no siempre permiten una hibridación precisa y específica de cebadores complementarios, lo que da como resultado la inhibición de la formación del producto de longitud completa. El diseño manual de oligonucleótidos es un procedimiento laborioso y no garantiza la síntesis exitosa del gen deseado. Para un rendimiento óptimo de casi todos los métodos basados en recocido, se supone que las temperaturas de fusión de las regiones superpuestas son similares para todos los oligonucleótidos. La optimización necesaria del cebador debe realizarse utilizando programas especializados de diseño de oligonucleótidos. Hasta ahora se han presentado varias soluciones para el diseño automatizado de cebadores para la síntesis de genes. [12] [13] [14]
Para superar los problemas asociados con la calidad de los oligonucleótidos se han desarrollado varias estrategias elaboradas, empleando oligonucleótidos de pesca preparados por separado, [15] enzimas de unión no coincidentes de la familia mutS [16] o endonucleasas específicas de bacterias o fagos. [17] Sin embargo, todas estas estrategias aumentan el tiempo y los costos de la síntesis de genes basada en el recocido de oligonucleótidos sintetizados químicamente.
La secuenciación masiva en paralelo también se ha utilizado como herramienta para examinar bibliotecas de oligonucleótidos complejas y permitir la recuperación de moléculas precisas. En un enfoque, los oligonucleótidos se secuencian en la plataforma de pirosecuenciación 454 y un sistema robótico toma imágenes y selecciona perlas individuales correspondientes a la secuencia precisa. [18] En otro enfoque, se modifica una biblioteca compleja de oligonucleótidos con etiquetas flanqueantes únicas antes de la secuenciación masiva en paralelo. Los cebadores dirigidos por etiquetas permiten luego la recuperación de moléculas con las secuencias deseadas mediante PCR de marcado. [19]
Cada vez más, los genes se ordenan en conjuntos que incluyen genes funcionalmente relacionados o múltiples variantes de secuencia en un solo gen. Prácticamente todas las proteínas terapéuticas en desarrollo, como los anticuerpos monoclonales, se optimizan probando muchas variantes genéticas para mejorar su función o expresión.
Si bien la síntesis tradicional de ácidos nucleicos solo utiliza 4 pares de bases: adenina, timina, guanina y citosina, la síntesis de oligonucleótidos en el futuro podría incorporar el uso de pares de bases no naturales, que son nucleobases diseñadas y sintetizadas artificialmente que no se encuentran en la naturaleza.
En 2012, un grupo de científicos estadounidenses liderados por Floyd Romesberg, biólogo químico del Instituto de Investigación Scripps en San Diego, California, publicó que su equipo diseñó un par de bases no naturales (UBP). Los dos nuevos nucleótidos artificiales o Par de Bases No Naturales (UBP) recibieron el nombre de d5SICS y dNaM . Más técnicamente, estos nucleótidos artificiales que contienen nucleobases hidrofóbicas presentan dos anillos aromáticos fusionados que forman un complejo (d5SICS-dNaM) o par de bases en el ADN. En 2014, el mismo equipo del Instituto de Investigación Scripps informó que sintetizaron un tramo de ADN circular conocido como plásmido que contiene pares de bases naturales TA y CG junto con la UBP de mejor rendimiento que había diseñado el laboratorio de Romesberg, y lo insertaron en células del común. bacteria E. coli que replicó con éxito los pares de bases no naturales a través de múltiples generaciones. Este es el primer ejemplo conocido de un organismo vivo que transmite un código genético ampliado a las generaciones posteriores. Esto se logró en parte mediante la adición de un gen de alga de apoyo que expresa un transportador de nucleótidos trifosfato que importa eficientemente los trifosfatos tanto de d5SICSTP como de dNaMTP a la bacteria E. coli . Luego, las vías de replicación bacteriana naturales las utilizan para replicar con precisión el plásmido que contiene d5SICS-dNaM.
La incorporación exitosa de un tercer par de bases es un avance significativo hacia el objetivo de ampliar en gran medida el número de aminoácidos que puede codificar el ADN, de los 20 aminoácidos existentes a los 172 teóricamente posibles, ampliando así el potencial de los organismos vivos para producir nuevas proteínas . [20] En el futuro, estos pares de bases no naturales podrían sintetizarse e incorporarse a oligonucleótidos mediante métodos de impresión de ADN.
Por tanto, la impresión de ADN se puede utilizar para producir partes de ADN, que se definen como secuencias de ADN que codifican una función biológica específica (por ejemplo, promotores , secuencias reguladoras de la transcripción o marcos de lectura abiertos ). [21] Sin embargo, debido a que la síntesis de oligonucleótidos generalmente no puede producir con precisión secuencias de oligonucleótidos de más de unos pocos cientos de pares de bases, se deben emplear métodos de ensamblaje de ADN para ensamblar estas partes y crear genes funcionales, circuitos multigénicos o incluso cromosomas o genomas sintéticos completos. . Algunas técnicas de ensamblaje de ADN solo definen protocolos para unir partes de ADN, mientras que otras técnicas también definen las reglas para el formato de las partes de ADN que son compatibles con ellas. Estos procesos se pueden ampliar para permitir el ensamblaje de cromosomas o genomas completos. En los últimos años, ha habido una proliferación en el número de diferentes estándares de ensamblaje de ADN, con 14 estándares de ensamblaje diferentes desarrollados a partir de 2015, cada uno con sus pros y sus contras. [22] En general, el desarrollo de estándares de ensamblaje de ADN ha facilitado enormemente el flujo de trabajo de la biología sintética, ha ayudado al intercambio de material entre grupos de investigación y también ha permitido la creación de piezas de ADN modulares y reutilizables. [22]
Los diversos métodos de ensamblaje de ADN se pueden clasificar en tres categorías principales: ensamblaje mediado por endonucleasas, recombinación de sitio específico y ensamblaje basado en superposición prolongada. [22] Cada grupo de métodos tiene sus características distintas y sus propias ventajas y limitaciones.
Las endonucleasas son enzimas que reconocen y escinden segmentos de ácido nucleico y pueden usarse para dirigir el ensamblaje del ADN. De los diferentes tipos de enzimas de restricción, las enzimas de restricción de tipo II son las más comúnmente disponibles y utilizadas porque sus sitios de escisión están ubicados cerca de sus sitios de reconocimiento o en ellos. Por lo tanto, los métodos de ensamblaje mediados por endonucleasas hacen uso de esta propiedad para definir partes de ADN y protocolos de ensamblaje.
El estándar de ensamblaje de BioBricks fue descrito e introducido por Tom Knight en 2003 y ha sido actualizado constantemente desde entonces. [23] Actualmente, el estándar de BioBricks más utilizado es el estándar de ensamblaje 10, o BBF RFC 10. BioBricks define las secuencias de prefijo y sufijo necesarias para que una parte de ADN sea compatible con el método de ensamblaje de BioBricks, permitiendo la unión de todas las partes de ADN. que están en formato BioBricks.
El prefijo contiene los sitios de restricción para EcoRI, NotI y XBaI, mientras que el sufijo contiene los sitios de restricción SpeI, NotI y PstI. Fuera de las regiones de prefijo y sufijo, la parte de ADN no debe contener estos sitios de restricción. Para unir dos partes de BioBrick, uno de los plásmidos se digiere con EcoRI y SpeI mientras que el segundo plásmido se digiere con EcoRI y XbaI. Los dos salientes de EcoRI son complementarios y, por tanto, se fusionarán entre sí, mientras que SpeI y XbaI también producen salientes complementarios que también pueden ligarse entre sí. Como el plásmido resultante contiene las secuencias de prefijo y sufijo originales, se puede utilizar para unir más piezas de BioBricks. [24] Debido a esta propiedad, se dice que el estándar de ensamblaje de BioBricks es de naturaleza idempotente . Sin embargo, también se formará una secuencia de "cicatriz" (ya sea TACTAG o TACTAGAG) entre los dos BioBricks fusionados. Esto evita que los BioBricks se utilicen para crear proteínas de fusión, ya que la secuencia cicatricial de 6 pb codifica una tirosina y un codón de parada, lo que provoca que la traducción finalice después de que se expresa el primer dominio, mientras que la secuencia cicatricial de 8 pb provoca un cambio de marco , lo que impide la lectura continua de los codones. Para ofrecer secuencias de cicatriz alternativas que, por ejemplo, den una cicatriz de 6 pb, o secuencias de cicatriz que no contengan codones de terminación, se diseñaron otros estándares de ensamblaje como el ensamblaje BB-2, el ensamblaje BglBricks, el ensamblaje Silver y el ensamblaje de Friburgo. [25] [26] [27] [28]
Si bien el método más sencillo para ensamblar piezas de BioBrick se describe anteriormente, también existen otros métodos de ensamblaje comúnmente utilizados que ofrecen varias ventajas sobre el ensamblaje estándar. El conjunto de 3 antibióticos (3A) permite seleccionar el conjunto correcto mediante la selección de antibióticos, mientras que el conjunto de inserto amplificado busca superar la baja eficiencia de transformación observada en el conjunto 3A. [29] [30]
El estándar de ensamblaje de BioBrick también ha servido de inspiración para el uso de otros tipos de endonucleasas para el ensamblaje de ADN. Por ejemplo, tanto el estándar iBrick como los estándares de ensamblaje de vectores HomeRun emplean endonucleasas homing en lugar de enzimas de restricción de tipo II. [31] [32]
Algunos métodos de ensamblaje también utilizan endonucleasas de restricción de tipo II. Se diferencian de otras endonucleasas de tipo II en que cortan varios pares de bases del sitio de reconocimiento. Como resultado, la secuencia saliente se puede modificar para contener la secuencia deseada. Esto proporciona a los métodos de ensamblaje Tipo II dos ventajas: permite un ensamblaje "sin cicatrices" y permite el ensamblaje de varias piezas en un solo recipiente. Los métodos de ensamblaje que utilizan endonucleasas de tipo II incluyen Golden Gate y sus variantes asociadas.
El protocolo de montaje del Golden Gate fue definido por Engler et al. 2008 para definir un método de ensamblaje de ADN que proporcionaría una construcción final sin una secuencia cicatricial y al mismo tiempo carecería de los sitios de restricción originales. Esto permite que la proteína se exprese sin contener secuencias de proteínas no deseadas que podrían afectar negativamente al plegamiento o la expresión de las proteínas. Mediante el uso de la enzima de restricción BsaI que produce un saliente de 4 pares de bases, se pueden usar para el ensamblaje hasta 240 secuencias únicas no palindrómicas. [33]
Diseño y montaje de plásmidos.
En la clonación Golden Gate, cada fragmento de ADN que se va a ensamblar se coloca en un plásmido, flanqueado por sitios de restricción BsaI orientados hacia adentro que contienen las secuencias salientes programadas. Para cada fragmento de ADN, la secuencia sobresaliente 3' es complementaria a la secuencia sobresaliente 5' del siguiente fragmento de ADN aguas abajo. Para el primer fragmento, el saliente 5' es complementario al saliente 5' del plásmido de destino, mientras que el saliente 3' del fragmento final es complementario al saliente 3' del plásmido de destino. Este diseño permite ensamblar todos los fragmentos de ADN en una reacción de un solo recipiente (donde se mezclan todos los reactivos), con todos los fragmentos dispuestos en la secuencia correcta. Las construcciones ensambladas con éxito se seleccionan detectando la pérdida de función de un casete de detección que estaba originalmente en el plásmido de destino. [33]
MoClo y trenza dorada
El ensamblaje original del Golden Gate sólo permite realizar una única construcción en el vector de destino. Para permitir que esta construcción se utilice en una reacción posterior como vector de entrada, se diseñaron los estándares MoClo y Golden Braid. [34]
El estándar MoClo implica definir múltiples niveles de ensamblaje de ADN:
Cada nivel de ensamblaje alterna el uso de sitios de restricción BsaI y BpiI para minimizar el número de sitios prohibidos, y el ensamblaje secuencial para cada nivel se logra siguiendo el diseño del plásmido Golden Gate. En general, el estándar MoClo permite el ensamblaje de una construcción que contiene múltiples unidades de transcripción, todas ensambladas a partir de diferentes partes de ADN, mediante una serie de reacciones Golden Gate en un solo recipiente. Sin embargo, un inconveniente del estándar MoClo es que requiere el uso de "piezas ficticias" sin función biológica, si la construcción final requiere menos de cuatro componentes. [35] Por otro lado, el estándar Golden Braid introdujo un estándar de ensamblaje Golden Gate por pares.
El estándar Golden Braid utiliza el mismo ensamblaje por niveles que MoClo, pero cada nivel solo implica el ensamblaje de dos fragmentos de ADN, es decir, un enfoque por pares. Por lo tanto, en cada nivel, se clonan pares de genes en un fragmento de destino en la secuencia deseada y posteriormente se ensamblan de dos en dos en niveles sucesivos. Al igual que MoClo, el estándar Golden Braid alterna las enzimas de restricción BsaI y BpiI entre cada nivel.
El desarrollo de los métodos de ensamblaje del Golden Gate y sus variantes ha permitido a los investigadores diseñar kits de herramientas para acelerar el flujo de trabajo de la biología sintética. Por ejemplo, EcoFlex se desarrolló como un conjunto de herramientas para E. Coli que utiliza el estándar MoClo para sus partes de ADN, mientras que también se desarrolló un conjunto de herramientas similar para diseñar las microalgas Chlamydomonas reinhardtii . [36] [37]
La recombinación de sitio específico utiliza integrasas de fagos en lugar de enzimas de restricción, eliminando la necesidad de tener sitios de restricción en los fragmentos de ADN. En cambio, las integrasas utilizan sitios de unión únicos (att) y catalizan el reordenamiento del ADN entre el fragmento objetivo y el vector de destino. El sistema de clonación Invitrogen Gateway se inventó a finales de la década de 1990 y utiliza dos mezclas de enzimas patentadas, BP clonasa y LR clonasa. La mezcla de clonasa BP cataliza la recombinación entre los sitios attB y attP, generando sitios híbridos attL y attR, mientras que la mezcla de clonasa LR cataliza la recombinación de los sitios attL y attR para dar sitios attB y attP. Como cada mezcla de enzimas reconoce sólo sitios att específicos, la recombinación es muy específica y los fragmentos pueden ensamblarse en la secuencia deseada. [38]
Diseño y montaje de vectores.
Debido a que la clonación de Gateway es una tecnología patentada, todas las reacciones de Gateway deben realizarse con el kit de Gateway proporcionado por el fabricante. La reacción se puede resumir en dos pasos. El primer paso implica ensamblar los clones de entrada que contienen el fragmento de ADN de interés, mientras que el segundo paso implica insertar este fragmento de interés en el clon de destino.
Las primeras iteraciones del método de clonación Gateway solo permitían utilizar un clon de entrada para cada clon de destino producido. Sin embargo, investigaciones posteriores revelaron que se podrían generar cuatro secuencias att ortogonales más, lo que permitiría el ensamblaje de hasta cuatro fragmentos de ADN diferentes, y este proceso se conoce ahora como tecnología Multisite Gateway. [39]
Además de la clonación de Gateway, también se han desarrollado métodos no comerciales que utilizan otras integrasas. Por ejemplo, el método de ensamblaje recombinante de serina integrasa (SIRA) utiliza la integrasa ϕC31, mientras que el método de ensamblaje en tándem basado en recombinación específica del sitio (SSRTA) utiliza la integrasa φBT1 del fago Streptomyces . [40] [41] Otros métodos, como el sistema de ensamblaje de vectores HomeRun (HVAS), se basan en el sistema de clonación Gateway e incorporan además endonucleasas homing para diseñar un protocolo que potencialmente podría respaldar la síntesis industrial de construcciones de ADN sintético. [31]
En los últimos años se han desarrollado una variedad de métodos de ensamblaje basados en superposiciones prolongadas. Uno de los métodos más utilizados, el método de ensamblaje de Gibson, se desarrolló en 2009 y proporciona un método de ensamblaje de ADN en un solo recipiente que no requiere el uso de enzimas de restricción o integrasas. [42] Otros métodos de ensamblaje similares basados en superposición incluyen la clonación por extensión de polimerasa circular (CPEC), la clonación independiente de secuencia y ligasa (SLIC) y el extracto de clonación por ligadura sin fisuras (SLiCE). [43] [44] [45] A pesar de la presencia de muchos métodos de ensamblaje superpuestos, el método de ensamblaje Gibson sigue siendo el más popular. [46] Además de los métodos enumerados anteriormente, otros investigadores se han basado en los conceptos utilizados en el ensamblaje de Gibson y otros métodos de ensamblaje para desarrollar nuevas estrategias de ensamblaje como la estrategia Modular Overlap-Directed Assembly with Linkers (MODAL), o el Biopart Assembly Standard for Idempotent. Método de clonación (BÁSICO). [47] [48]
El método de ensamblaje de Gibson es un método de ensamblaje de ADN relativamente sencillo, que requiere solo unos pocos reactivos adicionales: la exonucleasa 5' T5 , la ADN polimerasa Phusion y la ADN ligasa Taq . Los fragmentos de ADN que se van a ensamblar se sintetizan para que tengan extremos 5' y 3' superpuestos en el orden en que se van a ensamblar. Estos reactivos se mezclan con los fragmentos de ADN que se van a ensamblar a 50 °C y se producen las siguientes reacciones:
Debido a que la exonucleasa T5 es termolábil, se inactiva a 50 °C después del paso inicial de masticación. De este modo, el producto es estable y los fragmentos se ensamblan en el orden deseado. Este protocolo de un solo recipiente puede ensamblar con precisión hasta cinco fragmentos diferentes, mientras que varios proveedores comerciales tienen kits para ensamblar con precisión hasta 15 fragmentos diferentes en una reacción de dos pasos. [49] Sin embargo, si bien el protocolo de ensamblaje de Gibson es rápido y utiliza relativamente pocos reactivos, requiere una síntesis de ADN personalizada, ya que cada fragmento debe diseñarse para contener secuencias superpuestas con los fragmentos adyacentes y amplificarse mediante PCR. Esta dependencia de la PCR también puede afectar la fidelidad de la reacción cuando se utilizan fragmentos largos, fragmentos con alto contenido de GC o secuencias repetidas. [48]
La estrategia MODAL define secuencias superpuestas conocidas como "enlazadores" para reducir la cantidad de personalización que se debe realizar con cada fragmento de ADN. Los enlazadores se diseñaron utilizando el software R2oDNA Designer y las regiones de superposición se diseñaron para tener una longitud de 45 pb para ser compatibles con el ensamblaje Gibson y otros métodos de ensamblaje de superposición. Para unir estos conectores a las piezas que se van a ensamblar, la PCR se realiza utilizando cebadores específicos de la pieza que contienen secuencias adaptadoras de prefijo y sufijo de 15 pb. Luego, los conectores se unen a las secuencias adaptadoras mediante una segunda reacción de PCR. Para posicionar los fragmentos de ADN, se unirá el mismo conector al sufijo del fragmento ascendente deseado y al prefijo de los fragmentos descendentes deseados. Una vez que se unen los enlazadores, se pueden utilizar el ensamblaje de Gibson, CPEC u otros métodos de ensamblaje de superposición para ensamblar los fragmentos de ADN en el orden deseado.
La estrategia de ensamblaje BÁSICO fue desarrollada en 2015 y buscaba abordar las limitaciones de las técnicas de ensamblaje anteriores, incorporando seis conceptos clave de las mismas: piezas estándar reutilizables; formato de un solo nivel (todas las piezas tienen el mismo formato y se ensamblan mediante el mismo proceso); clonación idempotente; ensamblaje de ADN paralelo (multiparte); independencia de tamaño; automatizabilidad. [48]
Diseño de piezas de ADN y enlazadores.
Las partes de ADN se diseñan y clonan en plásmidos de almacenamiento, con la parte flanqueada por una secuencia de prefijo integrado ( i P) y un sufijo integrado ( i S). Las secuencias i P e i S contienen sitios de restricción BsaI orientados hacia adentro, que contienen salientes complementarios a los conectores BASIC. [48] Al igual que en MODAL, los 7 enlazadores estándar utilizados en BASIC se diseñaron con el software R2oDNA Designer y se examinaron para garantizar que no contengan secuencias con homología con los genomas del chasis y que no contengan secuencias no deseadas como secuencias de estructura secundaria. , sitios de restricción o sitios de unión ribosómica. Cada secuencia conectora se divide en dos mitades, cada una con un saliente de 4 pb complementario al sitio de restricción BsaI, una secuencia bicatenaria de 12 pb y que comparte una secuencia de superposición de 21 pb con la otra mitad. La mitad que se unirá a la parte de ADN aguas arriba se conoce como parte del conector de sufijo (por ejemplo, L1S) y la mitad que se une a la parte descendente se conoce como parte del conector de prefijo (por ejemplo, L1P). Estos conectores forman la base para ensamblar las partes del ADN.
Además de dirigir el orden de montaje, los enlazadores BASIC estándar también se pueden modificar para realizar otras funciones. Para permitir el ensamblaje idempotente, también se diseñaron conectores con secuencias i P e i S metiladas adicionales insertadas para protegerlos de ser reconocidos por BsaI. Esta metilación se pierde después de la transformación y la replicación del plásmido in vivo, y los plásmidos pueden extraerse, purificarse y usarse para reacciones posteriores.
Debido a que la secuencia del conector es relativamente larga (45 pb para un conector estándar), existe la oportunidad de incorporar secuencias de ADN funcionales para reducir la cantidad de partes de ADN necesarias durante el ensamblaje. El estándar de ensamblaje BASIC proporciona varios enlazadores integrados con RBS de diferentes fortalezas. De manera similar, para facilitar la construcción de proteínas de fusión que contienen múltiples dominios proteicos, también se diseñaron varios conectores de fusión para permitir la lectura completa de la construcción de ADN. Estos conectores de fusión codifican un polipéptido de glicina y serina de 15 aminoácidos, que es un péptido conector ideal para proteínas de fusión con múltiples dominios.
Asamblea
Hay tres pasos principales en el montaje de la construcción final.
Dado que los métodos de impresión y ensamblaje de ADN han permitido que la síntesis de genes comerciales se vuelva progresiva y exponencialmente más barata en los últimos años, [50] la síntesis de genes artificiales representa una herramienta de ingeniería poderosa y flexible para crear y diseñar nuevas secuencias de ADN y funciones proteicas. Además de la biología sintética, varias áreas de investigación, como las que involucran la expresión de genes heterólogos , el desarrollo de vacunas , la terapia génica y la ingeniería molecular, se beneficiarían enormemente de tener métodos rápidos y baratos para sintetizar ADN para codificar proteínas y péptidos. [51] Los métodos utilizados para la impresión y el ensamblaje del ADN han permitido incluso el uso del ADN como medio de almacenamiento de información .
El 28 de junio de 2007, un equipo del Instituto J. Craig Venter publicó un artículo en Science Express , diciendo que habían trasplantado con éxito el ADN natural de una bacteria Mycoplasma mycoides a una célula de Mycoplasma capricolum , creando una bacteria que se comportaba como una M. micoides . [52]
El 6 de octubre de 2007, Craig Venter anunció en una entrevista con el periódico The Guardian del Reino Unido que el mismo equipo había sintetizado artificialmente una versión modificada del cromosoma único de Mycoplasma genitalium . El cromosoma fue modificado para eliminar todos los genes que las pruebas en bacterias vivas habían demostrado que eran innecesarios. El siguiente paso planificado en este proyecto de genoma mínimo es trasplantar el genoma mínimo sintetizado a una célula bacteriana sin su ADN antiguo; la bacteria resultante se llamará Mycoplasma laboratorium . Al día siguiente, el grupo canadiense de bioética ETC Group emitió un comunicado a través de su representante, Pat Mooney , diciendo que la "creación" de Venter era "un chasis sobre el que se podía construir casi cualquier cosa". El genoma sintetizado aún no había sido trasplantado a una célula funcional. [53]
El 21 de mayo de 2010, Science informó que el grupo Venter había sintetizado con éxito el genoma de la bacteria Mycoplasma mycoides a partir de un registro informático y trasplantado el genoma sintetizado a la célula existente de una bacteria Mycoplasma capricolum a la que se le había extraído el ADN. La bacteria "sintética" era viable, es decir, capaz de replicarse miles de millones de veces. El equipo había planeado originalmente utilizar la bacteria M. genitalium con la que habían estado trabajando anteriormente, pero cambió a M. mycoides porque esta última bacteria crece mucho más rápido, lo que se tradujo en experimentos más rápidos. [54] Venter la describe como "la primera especie... que tiene como padres una computadora". [55] La bacteria transformada es denominada " Synthia " por ETC. Un portavoz de Venter se ha negado a confirmar ningún avance al momento de escribir este artículo.
Como parte del proyecto Synthetic Yeast 2.0, diversos grupos de investigación de todo el mundo han participado en un proyecto para sintetizar genomas de levaduras sintéticas, y mediante este proceso, optimizar el genoma del organismo modelo Saccharomyces cerevisiae . [56] El proyecto Yeast 2.0 aplicó varios métodos de ensamblaje de ADN que se han discutido anteriormente, y en marzo de 2014, Jef Boeke del Centro Médico Langone de la Universidad de Nueva York, reveló que su equipo había sintetizado el cromosoma III de S. cerevisiae . [57] [58] El procedimiento implicó reemplazar los genes en el cromosoma original con versiones sintéticas y el cromosoma sintético terminado luego se integró en una célula de levadura. Fue necesario diseñar y crear 273.871 pares de bases de ADN, menos que los 316.667 pares del cromosoma original. En marzo de 2017, se había completado la síntesis de 6 de los 16 cromosomas y la síntesis de los demás aún estaba en curso. [59]
{{cite book}}
: Mantenimiento CS1: falta el editor de la ubicación ( enlace )