La genómica sintética es un campo incipiente de la biología sintética que utiliza aspectos de la modificación genética en formas de vida preexistentes o la síntesis de genes artificiales para crear nuevo ADN o formas de vida enteras.
La genómica sintética se diferencia de la modificación genética en el sentido de que no utiliza genes naturales en sus formas de vida. Puede hacer uso de series de pares de bases diseñadas a medida , aunque en un sentido más ampliado y actualmente no realizado, la genómica sintética podría utilizar códigos genéticos que no estén compuestos por los dos pares de bases del ADN que utiliza actualmente la vida.
El desarrollo de la genómica sintética está relacionado con ciertas capacidades técnicas y tecnologías recientes en el campo de la genética. La capacidad de construir largas cadenas de pares de bases de forma económica y precisa a gran escala ha permitido a los investigadores realizar experimentos con genomas que no existen en la naturaleza. Junto con los avances en los modelos de plegamiento de proteínas y la disminución de los costos computacionales, el campo de la genómica sintética está comenzando a entrar en una etapa productiva de vitalidad.
Los investigadores pudieron crear un organismo sintético por primera vez en 2010. [1] Este avance fue realizado por Synthetic Genomics, Inc. , que continúa especializándose en la investigación y comercialización de genomas diseñados a medida. [2] Se logró sintetizando un genoma de 600 kpb (parecido al de Mycoplasma genitalium , salvo la inserción de algunas marcas de agua) mediante el método de ensamblaje de Gibson y recombinación asociada a transformación. [3]
Poco después del descubrimiento de las endonucleasas y ligasas de restricción , el campo de la genética comenzó a utilizar estas herramientas moleculares para ensamblar secuencias artificiales a partir de fragmentos más pequeños de ADN sintético o natural. La ventaja de utilizar el enfoque recombinatorio en comparación con la síntesis continua de ADN surge de la relación inversa que existe entre la longitud del ADN sintético y el porcentaje de pureza de esa longitud sintética. En otras palabras, a medida que se sintetizan secuencias más largas, la cantidad de clones que contienen errores aumenta debido a las tasas de error inherentes a las tecnologías actuales. [4] Aunque la tecnología del ADN recombinante se utiliza más comúnmente en la construcción de proteínas de fusión y plásmidos , han surgido varias técnicas con mayores capacidades, que permiten la construcción de genomas completos. [5]
El ensamblaje cíclico de la polimerasa (PCA) utiliza una serie de oligonucleótidos (u oligos), de aproximadamente 40 a 60 nucleótidos de largo, que en conjunto constituyen ambas hebras del ADN que se sintetiza. Estos oligos están diseñados de manera que un único oligo de una cadena contiene una longitud de aproximadamente 20 nucleótidos en cada extremo que es complementaria a secuencias de dos oligos diferentes en la cadena opuesta, creando así regiones de superposición. Todo el conjunto se procesa mediante ciclos de: (a) hibridación a 60 °C; (b) elongación mediante Taq polimerasa y una ligasa estándar; y (c) desnaturalización a 95 °C, formando hebras contiguas progresivamente más largas y, en última instancia, dando como resultado el genoma final. [6] El PCA se utilizó para generar el primer genoma sintético de la historia, el del virus Phi X 174 . [7]
El método de ensamblaje Gibson , diseñado por Daniel Gibson durante su etapa en el Instituto J. Craig Venter , requiere de un conjunto de casetes de ADN bicatenario que constituyen el genoma completo que se está sintetizando. Tenga en cuenta que los casetes se diferencian de los cóntigos por definición en que estas secuencias contienen regiones de homología con otros casetes para fines de recombinación . A diferencia del ensamblaje cíclico de la polimerasa, el ensamblaje de Gibson es una reacción isotérmica de un solo paso con mayor capacidad de longitud de secuencia; ergo, se utiliza en lugar del ensamblaje cíclico de la polimerasa para genomas de más de 6 kb.
Una exonucleasa T5 realiza una reacción de masticación en los segmentos terminales, trabajando en la dirección 5' a 3', produciendo así salientes complementarios. Los salientes se hibridan entre sí, una ADN polimerasa Phusion rellena los nucleótidos faltantes y las mellas se sellan con una ligasa. Sin embargo, los genomas que pueden sintetizarse utilizando este método solo son limitados porque a medida que los casetes de ADN aumentan de longitud, requieren propagación in vitro para continuar con la hibridación; en consecuencia, el ensamblaje de Gibson se utiliza a menudo junto con la recombinación asociada a transformación (ver más abajo) para sintetizar genomas de varios cientos de kilobases de tamaño. [8]
El objetivo de la tecnología de recombinación asociada a transformación (TAR) en genómica sintética es combinar cóntigos de ADN mediante recombinación homóloga realizada por el cromosoma artificial de levadura (YAC). De importancia es el elemento CEN dentro del vector YAC, que corresponde al centrómero de levadura. Esta secuencia le da al vector la capacidad de comportarse de manera cromosómica, permitiéndole así realizar una recombinación homóloga. [9]
En primer lugar, se realiza la clonación de reparación de huecos para generar regiones de homología que flanquean los cóntigos de ADN. La clonación de reparación de huecos es una forma particular de reacción en cadena de la polimerasa en la que se utilizan cebadores especializados con extensiones más allá de la secuencia del ADN objetivo. [10] Luego, los casetes de ADN se exponen al vector YAC, que impulsa el proceso de recombinación homóloga, conectando así los casetes de ADN. El ensamblaje cíclico de la polimerasa y la tecnología TAR se utilizaron juntos para construir el genoma de Mycoplasma genitalium de 600 kb en 2008, el primer organismo sintético jamás creado. [11] Unos años más tarde, se tomaron medidas similares para sintetizar el genoma más grande de Mycoplasma mycoides . [12]
Un par de bases no naturales (UBP) es una subunidad diseñada (o nucleobase ) de ADN que se crea en un laboratorio y no se encuentra en la naturaleza. En 2012, un grupo de científicos estadounidenses liderados por Floyd E. Romesberg , biólogo químico del Instituto de Investigación Scripps en San Diego, California, publicó que su equipo diseñó un par de bases no naturales (UBP). [13] Los dos nuevos nucleótidos artificiales o Par de Bases No Naturales (UBP) fueron denominados d5SICS y dNaM . Más técnicamente, estos nucleótidos artificiales que contienen nucleobases hidrofóbicas presentan dos anillos aromáticos fusionados que forman un complejo (d5SICS-dNaM) o par de bases en el ADN. [14] [15] En 2014, el mismo equipo del Instituto de Investigación Scripps informó que sintetizaron un tramo de ADN circular conocido como plásmido que contiene pares de bases naturales TA y CG junto con la UBP de mejor rendimiento que el laboratorio de Romesberg había diseñado e insertado. en células de la bacteria común E. coli que replicaron con éxito los pares de bases no naturales a lo largo de múltiples generaciones. [16] Este es el primer ejemplo conocido de un organismo vivo que transmite un código genético ampliado a las generaciones posteriores. [14] [17] Esto se logró en parte mediante la adición de un gen de alga de apoyo que expresa un transportador de nucleótido trifosfato que importa eficientemente los trifosfatos de d5SICSTP y dNaMTP a la bacteria E. coli . [14] Luego, las vías de replicación bacteriana naturales las utilizan para replicar con precisión el plásmido que contiene d5SICS-dNaM.
La incorporación exitosa de un tercer par de bases es un avance significativo hacia el objetivo de ampliar en gran medida el número de aminoácidos que puede codificar el ADN, de los 20 aminoácidos existentes a los 172 teóricamente posibles, ampliando así el potencial de los organismos vivos para producir nuevas proteínas . [16] Las cadenas artificiales de ADN no codifican nada todavía, pero los científicos especulan que podrían diseñarse para fabricar nuevas proteínas que podrían tener usos industriales o farmacéuticos. [18]
En abril de 2019, los científicos de ETH Zurich informaron sobre la creación del primer genoma bacteriano del mundo , llamado Caulobacter ethensis-2.0 , elaborado íntegramente por computadora, aunque aún no existe una forma viable relacionada de C. ethensis-2.0 . [19] [20]