El diseño de ácidos nucleicos es el proceso de generar un conjunto de secuencias de bases de ácidos nucleicos que se asociarán en una conformación deseada. El diseño de ácidos nucleicos es fundamental en los campos de la nanotecnología del ADN y la computación del ADN . [2] Es necesario porque hay muchas secuencias posibles de cadenas de ácidos nucleicos que se plegarán en una estructura secundaria dada , pero muchas de estas secuencias tendrán interacciones adicionales no deseadas que deben evitarse. Además, hay muchas consideraciones de estructura terciaria que afectan la elección de una estructura secundaria para un diseño dado. [3] [4]
El diseño de ácidos nucleicos tiene objetivos similares al diseño de proteínas : en ambos, la secuencia de monómeros se diseña racionalmente para favorecer la estructura plegada o asociada deseada y para desfavorecer las estructuras alternativas. Sin embargo, el diseño de ácidos nucleicos tiene la ventaja de ser un problema computacionalmente mucho más simple, ya que la simplicidad de las reglas de emparejamiento de bases de Watson-Crick conduce a métodos heurísticos simples que producen diseños experimentalmente robustos. Los modelos computacionales para el plegamiento de proteínas requieren información de la estructura terciaria , mientras que el diseño de ácidos nucleicos puede operar en gran medida en el nivel de la estructura secundaria . Sin embargo, las estructuras de los ácidos nucleicos son menos versátiles que las proteínas en su funcionalidad. [2] [5]
El diseño de ácidos nucleicos puede considerarse como el inverso de la predicción de la estructura de los ácidos nucleicos . En la predicción de la estructura, la estructura se determina a partir de una secuencia conocida, mientras que en el diseño de ácidos nucleicos, se genera una secuencia que formará una estructura deseada. [2]
La estructura de los ácidos nucleicos consiste en una secuencia de nucleótidos . Existen cuatro tipos de nucleótidos que se distinguen por cuál de las cuatro nucleobases contienen: en el ADN son la adenina (A), la citosina (C), la guanina (G) y la timina (T). Los ácidos nucleicos tienen la propiedad de que dos moléculas se unirán entre sí para formar una doble hélice solo si las dos secuencias son complementarias , es decir, pueden formar secuencias coincidentes de pares de bases . Así, en los ácidos nucleicos la secuencia determina el patrón de unión y, por tanto, la estructura general. [5]
El diseño de ácidos nucleicos es el proceso mediante el cual, dada una estructura o funcionalidad deseada, se generan secuencias para cadenas de ácidos nucleicos que se autoensamblarán en esa estructura deseada. El diseño de ácidos nucleicos abarca todos los niveles de la estructura de los ácidos nucleicos :
Una de las mayores preocupaciones en el diseño de ácidos nucleicos es asegurar que la estructura objetivo tenga la energía libre más baja (es decir, sea la más favorable termodinámicamente ), mientras que las estructuras malformadas tienen valores más altos de energía libre y, por lo tanto, son desfavorecidas. [2] Estos objetivos se pueden lograr mediante el uso de una serie de enfoques, incluidos los heurísticos , termodinámicos y geométricos. Casi todas las tareas de diseño de ácidos nucleicos se realizan con la ayuda de computadoras, y hay varios paquetes de software disponibles para muchas de estas tareas.
Dos consideraciones en el diseño de ácidos nucleicos son que las hibridaciones deseadas deben tener temperaturas de fusión en un rango estrecho, y cualquier interacción espuria debe tener temperaturas de fusión muy bajas (es decir, deben ser muy débiles). [5] También existe un contraste entre el "diseño positivo" que optimiza la afinidad, que busca minimizar la energía de la estructura deseada en un sentido absoluto, y el "diseño negativo" que optimiza la especificidad, que considera la energía de la estructura objetivo en relación con las de las estructuras no deseadas. Los algoritmos que implementan ambos tipos de diseño tienden a funcionar mejor que aquellos que consideran solo un tipo. [2]
Los métodos heurísticos utilizan criterios simples que pueden evaluarse rápidamente para juzgar la idoneidad de diferentes secuencias para una estructura secundaria dada. Tienen la ventaja de ser mucho menos costosos computacionalmente que los algoritmos de minimización de energía necesarios para el modelado termodinámico o geométrico, y de ser más fáciles de implementar, pero al costo de ser menos rigurosos que estos modelos.
La minimización de la simetría de secuencia es el enfoque más antiguo para el diseño de ácidos nucleicos y se utilizó por primera vez para diseñar versiones inmóviles de estructuras de ADN ramificadas. La minimización de la simetría de secuencia divide la secuencia de ácido nucleico en subsecuencias superpuestas de una longitud fija, llamada longitud de criterio. Cada una de las 4 N posibles subsecuencias de longitud N puede aparecer solo una vez en la secuencia. Esto garantiza que no se produzcan hibridaciones no deseadas que tengan una longitud mayor o igual a la longitud de criterio. [2] [3]
Un enfoque heurístico relacionado es considerar la "distancia de desajuste", es decir, el número de posiciones en un marco determinado donde las bases no son complementarias . Una mayor distancia de desajuste reduce la posibilidad de que pueda ocurrir una fuerte interacción espuria. [5] Esto está relacionado con el concepto de distancia de Hamming en la teoría de la información . Otro enfoque relacionado pero más complejo es utilizar métodos de la teoría de la codificación para construir secuencias de ácidos nucleicos con las propiedades deseadas.
La información sobre la estructura secundaria de un complejo de ácido nucleico junto con su secuencia se puede utilizar para predecir las propiedades termodinámicas del complejo.
Cuando se utilizan modelos termodinámicos en el diseño de ácidos nucleicos, normalmente hay dos consideraciones: las hibridaciones deseadas deben tener temperaturas de fusión en un rango estrecho, y cualquier interacción espuria debe tener temperaturas de fusión muy bajas (es decir, deben ser muy débiles). La energía libre de Gibbs de un dúplex de ácido nucleico perfectamente emparejado se puede predecir utilizando un modelo de vecino más cercano . Este modelo considera solo las interacciones entre un nucleótido y sus vecinos más cercanos en la cadena de ácido nucleico, sumando la energía libre de cada una de las subpalabras superpuestas de dos nucleótidos del dúplex. Esto luego se corrige para monómeros autocomplementarios y para el contenido de GC . Una vez que se conoce la energía libre, se puede determinar la temperatura de fusión del dúplex. El contenido de GC solo también se puede utilizar para estimar la energía libre y la temperatura de fusión de un dúplex de ácido nucleico. Esto es menos preciso pero también mucho menos costoso computacionalmente. [5]
El software para el modelado termodinámico de ácidos nucleicos incluye Nupack , [6] [7] mfold/UNAFold, [8] y Vienna. [9]
Un enfoque relacionado, la predicción de estructura secundaria inversa, utiliza una búsqueda local estocástica que mejora una secuencia de ácido nucleico ejecutando un algoritmo de predicción de estructura y modificando la secuencia para eliminar características no deseadas. [5]
Los modelos geométricos de los ácidos nucleicos se utilizan para predecir la estructura terciaria . Esto es importante porque los complejos de ácidos nucleicos diseñados suelen contener múltiples puntos de unión, lo que introduce restricciones geométricas en el sistema. Estas restricciones se derivan de la estructura básica de los ácidos nucleicos , principalmente de que la doble hélice formada por los dúplex de ácidos nucleicos tiene una helicidad fija de aproximadamente 10,4 pares de bases por vuelta y es relativamente rígida . Debido a estas restricciones, los complejos de ácidos nucleicos son sensibles a la orientación relativa de los surcos mayor y menor en los puntos de unión. El modelado geométrico puede detectar la tensión derivada de las desalineaciones en la estructura, que luego pueden ser corregidas por el diseñador. [4] [11]
Los modelos geométricos de ácidos nucleicos para la nanotecnología del ADN generalmente utilizan representaciones reducidas del ácido nucleico, porque simular cada átomo sería muy costoso computacionalmente para sistemas tan grandes. Se ha informado que los modelos con tres pseudoátomos por par de bases, que representan los dos azúcares de la cadena principal y el eje de la hélice, tienen un nivel de detalle suficiente para predecir resultados experimentales. [11] Sin embargo, también se utilizan modelos con cinco pseudoátomos por par de bases, que incluyen explícitamente los fosfatos de la cadena principal. [12]
El software para el modelado geométrico de ácidos nucleicos incluye GIDEON, [11] Tiamat, [13] Nanoengineer-1 y UNIQUIMER 3D. [14] Las cuestiones geométricas son especialmente de interés en el diseño de origami de ADN , porque la secuencia está predeterminada por la elección de la cadena de andamiaje. Se ha creado software específicamente para el diseño de origami de ADN, incluyendo caDNAno [15] y SARSE. [16]
El diseño de ácidos nucleicos se utiliza en la nanotecnología del ADN para diseñar cadenas que se autoensamblen en una estructura deseada. Estos incluyen ejemplos como máquinas de ADN , redes periódicas bidimensionales y tridimensionales, poliedros y origami de ADN . [2] También se puede utilizar para crear conjuntos de cadenas de ácidos nucleicos que sean "ortogonales", o que no interactúen entre sí, de modo de minimizar o eliminar interacciones espurias. Esto es útil en la computación del ADN , así como para aplicaciones de códigos de barras moleculares en biología química y biotecnología . [5]