Diseño de ácidos nucleicos

El diseño de ácidos nucleicos es el proceso de generar un conjunto de secuencias de bases de ácidos nucleicos que se asociarán en una conformación deseada. El diseño de ácidos nucleicos es fundamental en los campos de la nanotecnología del ADN y la computación del ADN . ^[2] Es necesario porque hay muchas secuencias posibles de cadenas de ácidos nucleicos que se plegarán en una estructura secundaria dada , pero muchas de estas secuencias tendrán interacciones adicionales no deseadas que deben evitarse. Además, hay muchas consideraciones de estructura terciaria que afectan la elección de una estructura secundaria para un diseño dado. ^[3]^[4]

El diseño de ácidos nucleicos tiene objetivos similares al diseño de proteínas : en ambos, la secuencia de monómeros se diseña racionalmente para favorecer la estructura plegada o asociada deseada y para desfavorecer las estructuras alternativas. Sin embargo, el diseño de ácidos nucleicos tiene la ventaja de ser un problema computacionalmente mucho más simple, ya que la simplicidad de las reglas de emparejamiento de bases de Watson-Crick conduce a métodos heurísticos simples que producen diseños experimentalmente robustos. Los modelos computacionales para el plegamiento de proteínas requieren información de la estructura terciaria , mientras que el diseño de ácidos nucleicos puede operar en gran medida en el nivel de la estructura secundaria . Sin embargo, las estructuras de los ácidos nucleicos son menos versátiles que las proteínas en su funcionalidad. ^[2]^[5]

El diseño de ácidos nucleicos puede considerarse como el inverso de la predicción de la estructura de los ácidos nucleicos . En la predicción de la estructura, la estructura se determina a partir de una secuencia conocida, mientras que en el diseño de ácidos nucleicos, se genera una secuencia que formará una estructura deseada. ^[2]

Conceptos fundamentales

La estructura de los ácidos nucleicos consiste en una secuencia de nucleótidos . Existen cuatro tipos de nucleótidos que se distinguen por cuál de las cuatro nucleobases contienen: en el ADN son la adenina (A), la citosina (C), la guanina (G) y la timina (T). Los ácidos nucleicos tienen la propiedad de que dos moléculas se unirán entre sí para formar una doble hélice solo si las dos secuencias son complementarias , es decir, pueden formar secuencias coincidentes de pares de bases . Así, en los ácidos nucleicos la secuencia determina el patrón de unión y, por tanto, la estructura general. ^[5]

El diseño de ácidos nucleicos es el proceso mediante el cual, dada una estructura o funcionalidad deseada, se generan secuencias para cadenas de ácidos nucleicos que se autoensamblarán en esa estructura deseada. El diseño de ácidos nucleicos abarca todos los niveles de la estructura de los ácidos nucleicos :

Estructura primaria : la secuencia bruta de nucleobases de cada una de las cadenas de ácido nucleico componentes;
Estructura secundaria : el conjunto de interacciones entre bases, es decir, qué partes de qué cadenas están unidas entre sí; y
Estructura terciaria : las ubicaciones de los átomos en el espacio tridimensional, teniendo en cuenta las restricciones geométricas y estéricas .

Una de las mayores preocupaciones en el diseño de ácidos nucleicos es asegurar que la estructura objetivo tenga la energía libre más baja (es decir, sea la más favorable termodinámicamente ), mientras que las estructuras malformadas tienen valores más altos de energía libre y, por lo tanto, son desfavorecidas. ^[2] Estos objetivos se pueden lograr mediante el uso de una serie de enfoques, incluidos los heurísticos , termodinámicos y geométricos. Casi todas las tareas de diseño de ácidos nucleicos se realizan con la ayuda de computadoras, y hay varios paquetes de software disponibles para muchas de estas tareas.

Dos consideraciones en el diseño de ácidos nucleicos son que las hibridaciones deseadas deben tener temperaturas de fusión en un rango estrecho, y cualquier interacción espuria debe tener temperaturas de fusión muy bajas (es decir, deben ser muy débiles). ^[5] También existe un contraste entre el "diseño positivo" que optimiza la afinidad, que busca minimizar la energía de la estructura deseada en un sentido absoluto, y el "diseño negativo" que optimiza la especificidad, que considera la energía de la estructura objetivo en relación con las de las estructuras no deseadas. Los algoritmos que implementan ambos tipos de diseño tienden a funcionar mejor que aquellos que consideran solo un tipo. ^[2]

Aproches

Métodos heurísticos

Los métodos heurísticos utilizan criterios simples que pueden evaluarse rápidamente para juzgar la idoneidad de diferentes secuencias para una estructura secundaria dada. Tienen la ventaja de ser mucho menos costosos computacionalmente que los algoritmos de minimización de energía necesarios para el modelado termodinámico o geométrico, y de ser más fáciles de implementar, pero al costo de ser menos rigurosos que estos modelos.

La minimización de la simetría de secuencia es el enfoque más antiguo para el diseño de ácidos nucleicos y se utilizó por primera vez para diseñar versiones inmóviles de estructuras de ADN ramificadas. La minimización de la simetría de secuencia divide la secuencia de ácido nucleico en subsecuencias superpuestas de una longitud fija, llamada longitud de criterio. Cada una de las 4 ^N posibles subsecuencias de longitud N puede aparecer solo una vez en la secuencia. Esto garantiza que no se produzcan hibridaciones no deseadas que tengan una longitud mayor o igual a la longitud de criterio. ^[2]^[3]

Un enfoque heurístico relacionado es considerar la "distancia de desajuste", es decir, el número de posiciones en un marco determinado donde las bases no son complementarias . Una mayor distancia de desajuste reduce la posibilidad de que pueda ocurrir una fuerte interacción espuria. ^[5] Esto está relacionado con el concepto de distancia de Hamming en la teoría de la información . Otro enfoque relacionado pero más complejo es utilizar métodos de la teoría de la codificación para construir secuencias de ácidos nucleicos con las propiedades deseadas.

Modelos termodinámicos

La información sobre la estructura secundaria de un complejo de ácido nucleico junto con su secuencia se puede utilizar para predecir las propiedades termodinámicas del complejo.

Cuando se utilizan modelos termodinámicos en el diseño de ácidos nucleicos, normalmente hay dos consideraciones: las hibridaciones deseadas deben tener temperaturas de fusión en un rango estrecho, y cualquier interacción espuria debe tener temperaturas de fusión muy bajas (es decir, deben ser muy débiles). La energía libre de Gibbs de un dúplex de ácido nucleico perfectamente emparejado se puede predecir utilizando un modelo de vecino más cercano . Este modelo considera solo las interacciones entre un nucleótido y sus vecinos más cercanos en la cadena de ácido nucleico, sumando la energía libre de cada una de las subpalabras superpuestas de dos nucleótidos del dúplex. Esto luego se corrige para monómeros autocomplementarios y para el contenido de GC . Una vez que se conoce la energía libre, se puede determinar la temperatura de fusión del dúplex. El contenido de GC solo también se puede utilizar para estimar la energía libre y la temperatura de fusión de un dúplex de ácido nucleico. Esto es menos preciso pero también mucho menos costoso computacionalmente. ^[5]

El software para el modelado termodinámico de ácidos nucleicos incluye Nupack , ^[6]^[7] mfold/UNAFold, ^[8] y Vienna. ^[9]

Un enfoque relacionado, la predicción de estructura secundaria inversa, utiliza una búsqueda local estocástica que mejora una secuencia de ácido nucleico ejecutando un algoritmo de predicción de estructura y modificando la secuencia para eliminar características no deseadas. ^[5]

Modelos geométricos

Los modelos geométricos de los ácidos nucleicos se utilizan para predecir la estructura terciaria . Esto es importante porque los complejos de ácidos nucleicos diseñados suelen contener múltiples puntos de unión, lo que introduce restricciones geométricas en el sistema. Estas restricciones se derivan de la estructura básica de los ácidos nucleicos , principalmente de que la doble hélice formada por los dúplex de ácidos nucleicos tiene una helicidad fija de aproximadamente 10,4 pares de bases por vuelta y es relativamente rígida . Debido a estas restricciones, los complejos de ácidos nucleicos son sensibles a la orientación relativa de los surcos mayor y menor en los puntos de unión. El modelado geométrico puede detectar la tensión derivada de las desalineaciones en la estructura, que luego pueden ser corregidas por el diseñador. ^[4]^[11]

Los modelos geométricos de ácidos nucleicos para la nanotecnología del ADN generalmente utilizan representaciones reducidas del ácido nucleico, porque simular cada átomo sería muy costoso computacionalmente para sistemas tan grandes. Se ha informado que los modelos con tres pseudoátomos por par de bases, que representan los dos azúcares de la cadena principal y el eje de la hélice, tienen un nivel de detalle suficiente para predecir resultados experimentales. ^[11] Sin embargo, también se utilizan modelos con cinco pseudoátomos por par de bases, que incluyen explícitamente los fosfatos de la cadena principal. ^[12]

El software para el modelado geométrico de ácidos nucleicos incluye GIDEON, ^[11] Tiamat, ^[13] Nanoengineer-1 y UNIQUIMER 3D. ^[14] Las cuestiones geométricas son especialmente de interés en el diseño de origami de ADN , porque la secuencia está predeterminada por la elección de la cadena de andamiaje. Se ha creado software específicamente para el diseño de origami de ADN, incluyendo caDNAno ^[15] y SARSE. ^[16]

Aplicaciones

El diseño de ácidos nucleicos se utiliza en la nanotecnología del ADN para diseñar cadenas que se autoensamblen en una estructura deseada. Estos incluyen ejemplos como máquinas de ADN , redes periódicas bidimensionales y tridimensionales, poliedros y origami de ADN . ^[2] También se puede utilizar para crear conjuntos de cadenas de ácidos nucleicos que sean "ortogonales", o que no interactúen entre sí, de modo de minimizar o eliminar interacciones espurias. Esto es útil en la computación del ADN , así como para aplicaciones de códigos de barras moleculares en biología química y biotecnología . ^[5]

Véase también

Referencias

^ Mao, Chengde (diciembre de 2004). "El surgimiento de la complejidad: lecciones del ADN". PLOS Biology . 2 (12): 2036–2038. doi : 10.1371/journal.pbio.0020431 . ISSN 1544-9173. PMC 535573 . PMID 15597116.
^ abcdefg Dirks, Robert M.; Lin, Milo; Winfree, Erik; Pierce, Niles A. (2004). "Paradigmas para el diseño computacional de ácidos nucleicos". Investigación de ácidos nucleicos . 32 (4): 1392–1403. doi :10.1093/nar/gkh291. PMC 390280 . PMID 14990744.
^ ab Seeman, N (1982). "Uniones y redes de ácidos nucleicos". Journal of Theoretical Biology . 99 (2): 237–47. Bibcode :1982JThBi..99..237S. doi :10.1016/0022-5193(82)90002-9. PMID 6188926.
^ ab Sherman, W; Seeman, N (2006). "Diseño de nanotubos de ácido nucleico mínimamente deformados". Biophysical Journal . 90 (12): 4546–57. Bibcode :2006BpJ....90.4546S. doi :10.1529/biophysj.105.080390. PMC 1471877 . PMID 16581842.
^ abcdefg Brenneman, Arwen; Condon, Anne (2002). "Diseño de cadenas para computación biomolecular". Ciencias de la Computación Teórica . 287 : 39–58. doi : 10.1016/S0304-3975(02)00135-4 .
^ Dirks, Robert M.; Bois, Justin S.; Schaeffer, Joseph M.; Winfree, Erik; Pierce, Niles A. (2007). "Análisis termodinámico de cadenas de ácidos nucleicos en interacción". SIAM Review . 49 (1): 65–88. Bibcode :2007SIAMR..49...65D. CiteSeerX 10.1.1.523.4764 . doi :10.1137/060651100.
^ Zadeh, Joseph N.; Wolfe, Brian R.; Pierce, Niles A. (2011). "Diseño de secuencias de ácidos nucleicos mediante optimización eficiente de defectos de conjunto" (PDF) . Journal of Computational Chemistry . 32 (3): 439–452. doi :10.1002/jcc.21633. PMID 20717905. S2CID 1803200.
^ Zuker, M. (2003). "Servidor web Mfold para la predicción del plegamiento y la hibridación de ácidos nucleicos". Nucleic Acids Research . 31 (13): 3406–15. doi :10.1093/nar/gkg595. PMC 169194 . PMID 12824337.
^ Gruber AR, Lorenz R, Bernhart SH, Neuböck R, Hofacker IL (2008). "El conjunto web de ARN de Viena". Nucleic Acids Res . 36 (edición del servidor web): W70–4. doi :10.1093/nar/gkn188. PMC 2447809 . PMID 18424795.
^ Goodman, RP; Schaap, IAT; Tardin, CF; Erben, CM; Berry, RM; Schmidt, CF; Turberfield, AJ (9 de diciembre de 2005). "Ensamblaje quiral rápido de bloques de construcción de ADN rígidos para nanofabricación molecular". Science . 310 (5754): 1661–1665. Bibcode :2005Sci...310.1661G. doi :10.1126/science.1120367. ISSN 0036-8075. PMID 16339440. S2CID 13678773.
^ abc Birac, Jeffrey J.; Sherman, William B.; Kopatsch, Jens; Constantinou, Pamela E.; Seeman, Nadrian C. (2006). "Arquitectura con GIDEON, un programa para el diseño en nanotecnología estructural del ADN". Revista de gráficos y modelado molecular . 25 (4): 470–80. doi :10.1016/j.jmgm.2006.03.005. PMC 3465968 . PMID 16630733.
^ "Descripciones de los modelos PAM3 y PAM5". Wiki de documentación de Nanoengineer-1 . Nanorex . Consultado el 15 de abril de 2010 .
^ Williams, Sean; Lund, Kyle; Lin, Chenxiang; Wonka, Peter; Lindsay, Stuart; Yan, Hao (2009). "Tiamat: una herramienta de edición tridimensional para estructuras complejas de ADN". DNA Computing . Apuntes de clase en informática. Vol. 5347. Springer Berlin / Heidelberg. págs. 90–101. doi :10.1007/978-3-642-03076-5_8. ISBN 978-3-642-03075-8. ISSN 0302-9743.
^ Zhu, J.; Wei, B.; Yuan, Y.; Mi, Y. (2009). "UNIQUIMER 3D, un sistema de software para el diseño, análisis y evaluación de nanotecnología estructural del ADN". Nucleic Acids Research . 37 (7): 2164–75. doi :10.1093/nar/gkp005. PMC 2673411 . PMID 19228709.
^ Douglas, SM; Marblestone, AH; Teerapittayanon, S.; Vazquez, A.; Church, GM; Shih, WM (2009). "Prototipado rápido de formas de origami de ADN 3D con caDNAno". Nucleic Acids Research . 37 (15): 5001–6. doi :10.1093/nar/gkp436. PMC 2731887 . PMID 19531737.
^ Andersen, Ebbe S.; Dong, Mingdong; Nielsen, Morten M.; Jahn, Kasper; Lind-Thomsen, Allan; Mamdouh, Wael; Gothelf, Kurt V.; Besenbacher, Flemming; Kjems, JøRgen (2008). "Diseño de ADN en origami de estructuras en forma de delfín con colas flexibles". ACS Nano . 2 (6): 1213–8. doi :10.1021/nn800215j. PMID 19206339.

Lectura adicional

Brenneman, Arwen; Condon, Anne (2002). "Diseño de cadenas para computación biomolecular". Theoretical Computer Science . 287 : 39–58. doi : 10.1016/S0304-3975(02)00135-4 .—Una revisión de los enfoques para el diseño de la estructura primaria de los ácidos nucleicos.
Dirks, Robert M. ; Lin, Milo; Winfree, Erik; Pierce, Niles A. (2004). "Paradigmas para el diseño computacional de ácidos nucleicos". Nucleic Acids Research . 32 (4): 1392–1403. doi :10.1093/nar/gkh291. PMC 390280 . PMID 14990744.—Una comparación y evaluación de varios métodos heurísticos y termodinámicos para el diseño de ácidos nucleicos.
Seeman, N (1982). "Uniones y redes de ácidos nucleicos". Journal of Theoretical Biology . 99 (2): 237–47. Bibcode :1982JThBi..99..237S. doi :10.1016/0022-5193(82)90002-9. PMID 6188926.—Uno de los primeros artículos sobre diseño de ácidos nucleicos, que describe el uso de la minimización de la simetría de secuencia para construir uniones ramificadas inmóviles.
Andersen, Ebbe Sloth (2010). "Predicción y diseño de estructuras de ADN y ARN". Nueva Biotecnología . 27 (3): 184–193. doi :10.1016/j.nbt.2010.02.012. PMID 20193785.—Una revisión que compara las capacidades del software de diseño de ácidos nucleicos disponible.