La ingeniería de proteínas es el proceso de desarrollo de proteínas útiles o valiosas mediante el diseño y la producción de polipéptidos artificiales , a menudo alterando secuencias de aminoácidos que se encuentran en la naturaleza. [1] Es una disciplina joven, con mucha investigación en curso para comprender el plegamiento de proteínas y el reconocimiento de principios de diseño de proteínas . Se ha utilizado para mejorar la función de muchas enzimas para catálisis industrial. [2] También es un mercado de productos y servicios, con un valor estimado de $ 168 mil millones para 2017. [3]
Existen dos estrategias generales para la ingeniería de proteínas: el diseño racional de proteínas y la evolución dirigida . Estos métodos no son mutuamente excluyentes; los investigadores a menudo aplicarán ambos. En el futuro, un conocimiento más detallado de la estructura y función de las proteínas , y los avances en el cribado de alto rendimiento , pueden ampliar en gran medida las capacidades de la ingeniería de proteínas. Con el tiempo, incluso se podrán incluir aminoácidos no naturales, mediante métodos más nuevos, como el código genético expandido , que permiten codificar nuevos aminoácidos en el código genético. Las aplicaciones en numerosos campos, incluida la medicina y el bioprocesamiento industrial, son vastas y numerosas.
En el diseño racional de proteínas, un científico utiliza un conocimiento detallado de la estructura y función de una proteína para realizar los cambios deseados. En general, esto tiene la ventaja de ser económico y técnicamente fácil, ya que los métodos de mutagénesis dirigida están bien desarrollados. Sin embargo, su principal inconveniente es que a menudo no se dispone de un conocimiento estructural detallado de una proteína y, aun cuando se dispone de él, puede resultar muy difícil predecir los efectos de varias mutaciones, ya que la información estructural suele proporcionar una imagen estática de la estructura de una proteína. Sin embargo, programas como Folding@home y Foldit han utilizado técnicas de colaboración abierta para obtener información sobre los motivos de plegamiento de las proteínas. [4]
Los algoritmos de diseño computacional de proteínas buscan identificar secuencias de aminoácidos nuevas que tengan un bajo contenido de energía cuando se las dobla según la estructura objetivo preestablecida. Si bien el espacio de conformación de secuencias que se debe buscar es grande, el requisito más desafiante para el diseño computacional de proteínas es una función de energía rápida, pero precisa, que pueda distinguir las secuencias óptimas de las secuencias similares que no lo son.
Sin información estructural sobre una proteína, el análisis de secuencias suele ser útil para dilucidar información sobre la proteína. Estas técnicas implican la alineación de secuencias de proteínas objetivo con otras secuencias de proteínas relacionadas. Esta alineación puede mostrar qué aminoácidos se conservan entre especies y son importantes para la función de la proteína. Estos análisis pueden ayudar a identificar aminoácidos de puntos calientes que pueden servir como sitios objetivo para mutaciones. La alineación de secuencias múltiples utiliza bases de datos como PREFAB, SABMARK, OXBENCH, IRMBASE y BALIBASE para realizar referencias cruzadas de secuencias de proteínas objetivo con secuencias conocidas. A continuación se enumeran las técnicas de alineación de secuencias múltiples. [5] [ página necesaria ]
Este método comienza realizando una alineación de secuencias por pares utilizando los métodos de k-tuplas o Needleman–Wunsch . Estos métodos calculan una matriz que representa la similitud por pares entre los pares de secuencias. Los puntajes de similitud se transforman luego en puntajes de distancia que se utilizan para producir un árbol guía utilizando el método de unión de vecinos. Este árbol guía se emplea luego para producir una alineación de secuencias múltiples. [5] [ página necesaria ]
Este método es capaz de alinear hasta 190.000 secuencias utilizando el método k-tuple. Las siguientes secuencias se agrupan utilizando los métodos mBed y k -means . A continuación, se construye un árbol guía utilizando el método UPGMA que utiliza el paquete HH align. Este árbol guía se utiliza para generar múltiples alineaciones de secuencias. [5] [ página necesaria ]
Este método utiliza la transformada rápida de Fourier (FFT) que convierte las secuencias de aminoácidos en una secuencia compuesta por valores de volumen y polaridad para cada residuo de aminoácido. Esta nueva secuencia se utiliza para encontrar regiones homólogas. [5] [ página necesaria ]
Este método utiliza el algoritmo de coincidencia de cadenas aproximada de Wu-Manber para generar múltiples alineaciones de secuencias. [5] [ página necesaria ]
Este método utiliza las distancias de Kmer y Kimura para generar múltiples alineaciones de secuencias. [5] [ página necesaria ]
Este método utiliza funciones objetivas de consistencia basadas en árboles para la evolución de la alineación. Se ha demostrado que este método es entre un 5 y un 10 % más preciso que Clustal W. [5] [ página necesaria ]
El análisis coevolutivo también se conoce como mutación correlacionada, covariación o cosustitución. Este tipo de diseño racional implica cambios evolutivos recíprocos en loci que interactúan evolutivamente. Generalmente, este método comienza con la generación de alineaciones de secuencias múltiples seleccionadas para la secuencia objetivo. Esta alineación luego se somete a un refinamiento manual que implica la eliminación de secuencias con muchos espacios vacíos, así como secuencias con baja identidad de secuencia. Este paso aumenta la calidad de la alineación. A continuación, la alineación procesada manualmente se utiliza para realizar más mediciones coevolutivas utilizando distintos algoritmos de mutación correlacionada. Estos algoritmos dan como resultado una matriz de puntuación de coevolución. Esta matriz se filtra mediante la aplicación de varias pruebas de significancia para extraer valores de coevolución significativos y eliminar el ruido de fondo. Las mediciones coevolutivas se evalúan más a fondo para evaluar su rendimiento y rigurosidad. Finalmente, los resultados de este análisis coevolutivo se validan experimentalmente. [5] [ página necesaria ]
La generación de proteínas de novo se beneficia del conocimiento de las estructuras proteínicas existentes. Este conocimiento de la estructura proteínica existente ayuda a predecir nuevas estructuras proteínicas. Los métodos para predecir la estructura proteínica se dividen en cuatro categorías: métodos ab initio, métodos basados en fragmentos, modelado de homología y enhebrado de proteínas. [5] [ página necesaria ]
Estos métodos implican un modelado libre sin utilizar ninguna información estructural sobre la plantilla. Los métodos ab initio tienen como objetivo la predicción de las estructuras nativas de las proteínas correspondientes al mínimo global de su energía libre. Algunos ejemplos de métodos ab initio son AMBER, GROMOS, GROMACS, CHARMM, OPLS y ENCEPP12. Los pasos generales para los métodos ab initio comienzan con la representación geométrica de la proteína de interés. A continuación, se desarrolla un modelo de función de energía potencial para la proteína. Este modelo se puede crear utilizando potenciales de mecánica molecular o funciones potenciales derivadas de la estructura de la proteína. Después del desarrollo de un modelo de potencial, se aplican a la proteína técnicas de búsqueda de energía que incluyen simulaciones de dinámica molecular, simulaciones de Monte Carlo y algoritmos genéticos. [5] [ página necesaria ]
Estos métodos utilizan información de bases de datos sobre estructuras para hacer coincidir estructuras homólogas con las secuencias de proteínas creadas. Estas estructuras homólogas se ensamblan para dar estructuras compactas utilizando procedimientos de puntuación y optimización, con el objetivo de lograr la puntuación de energía potencial más baja. Los servidores web para la información de fragmentos son I-TASSER, ROSETTA, ROSETTA @ home, FRAGFOLD, CABS fold, PROFESY, CREF, QUARK, UNDERTAKER, HMM y ANGLOR. [5] : 72
Estos métodos se basan en la homología de las proteínas. Estos métodos también se conocen como modelado comparativo. El primer paso en el modelado de homología es generalmente la identificación de secuencias de plantilla de estructura conocida que son homólogas a la secuencia de consulta. A continuación, la secuencia de consulta se alinea con la secuencia de plantilla. Después de la alineación, las regiones estructuralmente conservadas se modelan utilizando la estructura de la plantilla. A esto le sigue el modelado de cadenas laterales y bucles que son distintos de la plantilla. Finalmente, la estructura modelada se somete a un refinamiento y evaluación de calidad. Los servidores que están disponibles para los datos de modelado de homología se enumeran aquí: SWISS MODEL, MODELLER, ReformAlign, PyMOD, TIP-STRUCTFAST, COMPASS, 3d-PSSM, SAMT02, SAMT99, HHPRED, FAGUE, 3D-JIGSAW, META-PP, ROSETTA e I-TASSER. [5] [ página necesaria ]
El enhebrado de proteínas se puede utilizar cuando no se puede encontrar un homólogo fiable para la secuencia de consulta. Este método comienza obteniendo una secuencia de consulta y una biblioteca de estructuras de plantilla. A continuación, la secuencia de consulta se enhebra sobre estructuras de plantilla conocidas. Estos modelos candidatos se califican utilizando funciones de puntuación. Estos se califican en función de los modelos de energía potencial tanto de la secuencia de consulta como de la secuencia de plantilla. A continuación, se selecciona la coincidencia con el modelo de energía potencial más bajo. Los métodos y servidores para recuperar datos de enhebrado y realizar cálculos se enumeran aquí: GenTHREADER, pGenTHREADER, pDomTHREADER, ORFEUS, PROSPECT, BioShell-Threading, FFASO3, RaptorX, HHPred, LOOPP server, Sparks-X, SEGMER, THREADER2, ESYPRED3D, LIBRA, TOPITS, RAPTOR, COTH, MUSTER. [5] [ página necesaria ]
Para obtener más información sobre el diseño racional, consulte mutagénesis dirigida al sitio .
La unión multivalente se puede utilizar para aumentar la especificidad y la afinidad de la unión a través de efectos de avidez . Tener múltiples dominios de unión en una única biomolécula o complejo aumenta la probabilidad de que se produzcan otras interacciones a través de eventos de unión individuales. La avidez o afinidad efectiva puede ser mucho mayor que la suma de las afinidades individuales, lo que proporciona una herramienta rentable y eficaz en términos de tiempo para la unión dirigida. [6]
Las proteínas multivalentes son relativamente fáciles de producir mediante modificaciones postraduccionales o multiplicando la secuencia de ADN que codifica la proteína. La principal ventaja de las proteínas multivalentes y multiespecíficas es que pueden aumentar la afinidad efectiva por un objetivo de una proteína conocida. En el caso de un objetivo no homogéneo, el uso de una combinación de proteínas que dé como resultado una unión multiespecífica puede aumentar la especificidad, lo que tiene una gran aplicabilidad en la terapéutica proteica.
El ejemplo más común de unión multivalente son los anticuerpos, y existe una amplia investigación sobre los anticuerpos biespecíficos. Las aplicaciones de los anticuerpos biespecíficos cubren un amplio espectro que incluye el diagnóstico, la obtención de imágenes, la profilaxis y la terapia. [7] [8]
En la evolución dirigida, se aplica mutagénesis aleatoria , por ejemplo, mediante PCR propensa a errores o mutagénesis de saturación de secuencia , a una proteína, y se utiliza un régimen de selección para seleccionar variantes que tengan los rasgos deseados. Luego se aplican rondas adicionales de mutación y selección. Este método imita la evolución natural y, en general, produce resultados superiores al diseño racional. Un proceso adicional, denominado mezcla de ADN , mezcla y combina fragmentos de variantes exitosas para producir mejores resultados. Estos procesos imitan la recombinación que ocurre naturalmente durante la reproducción sexual . Las ventajas de la evolución dirigida son que no requiere un conocimiento estructural previo de una proteína, ni es necesario poder predecir qué efecto tendrá una mutación dada. De hecho, los resultados de los experimentos de evolución dirigida a menudo son sorprendentes en el sentido de que los cambios deseados a menudo son causados por mutaciones que no se esperaba que tuvieran algún efecto. El inconveniente es que requieren un cribado de alto rendimiento , lo que no es factible para todas las proteínas. Se deben mutar grandes cantidades de ADN recombinante y analizar los productos para detectar los rasgos deseados. La gran cantidad de variantes a menudo requiere equipos robóticos costosos para automatizar el proceso. Además, no es fácil seleccionar todas las actividades deseadas.
La evolución darwiniana natural puede ser imitada con eficacia en el laboratorio para adaptar las propiedades de las proteínas a diversas aplicaciones, incluida la catálisis. Existen muchas tecnologías experimentales para producir bibliotecas de proteínas grandes y diversas y para examinar o seleccionar variantes funcionales plegadas. Las proteínas plegadas surgen con una frecuencia sorprendente en el espacio de secuencias aleatorias, un fenómeno que se puede aprovechar para desarrollar catalizadores y ligantes selectivos. Si bien es más conservador que la selección directa a partir del espacio de secuencias profundas, el rediseño de proteínas existentes mediante mutagénesis aleatoria y selección/examen es un método particularmente sólido para optimizar o alterar las propiedades existentes. También representa un excelente punto de partida para alcanzar objetivos de ingeniería más ambiciosos. Aliar la evolución experimental con métodos computacionales modernos es probablemente la estrategia más amplia y fructífera para generar macromoléculas funcionales desconocidas para la naturaleza. [9]
Los principales desafíos para diseñar bibliotecas de mutantes de alta calidad han mostrado un progreso significativo en el pasado reciente. Este progreso ha sido en la forma de mejores descripciones de los efectos de las cargas mutacionales en las características de las proteínas. También los enfoques computacionales han mostrado grandes avances en el incontable espacio de secuencias a tamaños más manejables y de detección, creando así bibliotecas inteligentes de mutantes. El tamaño de la biblioteca también se ha reducido a tamaños más fáciles de detectar mediante la identificación de residuos beneficiosos clave utilizando algoritmos para la recombinación sistemática. Finalmente, se ha dado un paso significativo hacia una reingeniería eficiente de enzimas con el desarrollo de modelos estadísticos y algoritmos más precisos que cuantifican y predicen los efectos mutacionales acoplados en las funciones de las proteínas. [10]
En general, la evolución dirigida puede resumirse como un proceso iterativo de dos pasos que implica la generación de bibliotecas de proteínas mutantes y procesos de selección de alto rendimiento para seleccionar variantes con características mejoradas. Esta técnica no requiere conocimiento previo de la relación entre la estructura y la función de la proteína. La evolución dirigida utiliza mutagénesis aleatoria o focalizada para generar bibliotecas de proteínas mutantes. Las mutaciones aleatorias pueden introducirse utilizando PCR propensa a errores o mutagénesis de saturación de sitio. Los mutantes también pueden generarse utilizando la recombinación de múltiples genes homólogos. La naturaleza ha desarrollado un número limitado de secuencias beneficiosas. La evolución dirigida permite identificar secuencias de proteínas no descubiertas que tienen funciones novedosas. Esta capacidad depende de la capacidad de las proteínas para tolerar sustituciones de residuos de aminoácidos sin comprometer el plegamiento o la estabilidad. [5] [ página necesaria ]
Los métodos de evolución dirigida pueden clasificarse en dos estrategias: métodos asexuales y sexuales.
Los métodos asexuales no generan enlaces cruzados entre los genes parentales. Se utilizan genes individuales para crear bibliotecas de mutantes mediante diversas técnicas mutagénicas. Estos métodos asexuales pueden producir mutagénesis aleatoria o focalizada.
Los métodos de mutagénesis aleatoria producen mutaciones al azar en todo el gen de interés. La mutagénesis aleatoria puede introducir los siguientes tipos de mutaciones: transiciones, transversiones, inserciones, deleciones, inversiones, mutaciones sin sentido y mutaciones sin sentido. A continuación se ofrecen ejemplos de métodos para producir mutagénesis aleatoria.
La PCR propensa a errores aprovecha el hecho de que la ADN polimerasa Taq carece de actividad exonucleasa 3' a 5'. Esto da como resultado una tasa de error de 0,001–0,002% por nucleótido por replicación. Este método comienza con la elección del gen, o el área dentro de un gen, que se desea mutar. A continuación, se calcula el grado de error requerido en función del tipo y el grado de actividad que se desea generar. Este grado de error determina la estrategia de PCR propensa a errores que se empleará. Después de la PCR, los genes se clonan en un plásmido y se introducen en sistemas celulares competentes. A continuación, se examinan estas células para detectar los rasgos deseados. A continuación, se aíslan los plásmidos en busca de colonias que muestren rasgos mejorados y, a continuación, se utilizan como plantillas para la siguiente ronda de mutagénesis. La PCR propensa a errores muestra sesgos para ciertas mutaciones en relación con otras, como sesgos para las transiciones sobre las transversiones. [5] [ página necesaria ]
Las tasas de error en la PCR se pueden incrementar de las siguientes maneras: [5] [ página necesaria ]
Consulte también la reacción en cadena de la polimerasa para obtener más información.
Este método de PCR se basa en la amplificación por círculo rodante, que se basa en el método que utilizan las bacterias para amplificar el ADN circular. Este método da como resultado dúplex de ADN lineales. Estos fragmentos contienen repeticiones en tándem de ADN circular llamadas concatámeros, que se pueden transformar en cepas bacterianas. Las mutaciones se introducen clonando primero la secuencia diana en un plásmido apropiado. A continuación, comienza el proceso de amplificación utilizando cebadores hexaméricos aleatorios y la ADN polimerasa Φ29 en condiciones de amplificación por círculo rodante propensas a errores. Las condiciones adicionales para producir la amplificación por círculo rodante propensa a errores son 1,5 pM de ADN molde, 1,5 mM de MnCl 2 y un tiempo de reacción de 24 horas. Se añade MnCl 2 a la mezcla de reacción para promover mutaciones puntuales aleatorias en las cadenas de ADN. Las tasas de mutación se pueden aumentar aumentando la concentración de MnCl 2 o disminuyendo la concentración del ADN molde. La amplificación por círculo rodante propensa a errores es ventajosa en comparación con la PCR propensa a errores debido a que utiliza cebadores hexaméricos aleatorios universales, en lugar de cebadores específicos. Además, los productos de reacción de esta amplificación no necesitan ser tratados con ligasas o endonucleasas. Esta reacción es isotérmica. [5] [ página necesaria ]
La mutagénesis química implica el uso de agentes químicos para introducir mutaciones en secuencias genéticas. A continuación se presentan algunos ejemplos de mutágenos químicos.
El bisulfato de sodio es eficaz para mutar secuencias genómicas ricas en G/C. Esto se debe a que el bisulfato de sodio cataliza la desaminación de la citosina no metilada a uracilo. [5] [ página necesaria ]
El etil metanosulfonato alquila residuos de guanidina. Esta alteración provoca errores durante la replicación del ADN. [5] [ página necesaria ]
El ácido nitroso provoca la transversión por desaminación de la adenina y la citosina. [5] [ página necesaria ]
El enfoque dual para la mutagénesis química aleatoria es un proceso iterativo de dos pasos. Primero implica la mutagénesis química in vivo del gen de interés mediante EMS. A continuación, el gen tratado se aísla y se clona en un vector de expresión no tratado para evitar mutaciones en la estructura principal del plásmido. [5] [ página necesaria ] Esta técnica preserva las propiedades genéticas de los plásmidos. [5] [ página necesaria ]
Este método se ha utilizado para crear mutagénesis in vivo dirigida en levaduras. Este método implica la fusión de una ADN glicosilasa de 3-metiladenina con el dominio de unión al ADN de tetR. Se ha demostrado que esto aumenta las tasas de mutación en más de 800 veces en regiones del genoma que contienen sitios tetO. [5] [ página necesaria ]
Este método implica la alteración de la longitud de la secuencia mediante la eliminación e inserción simultáneas de fragmentos de bases de longitud arbitraria. Se ha demostrado que este método produce proteínas con nuevas funcionalidades mediante la introducción de nuevos sitios de restricción, codones específicos y codones de cuatro bases para aminoácidos no naturales. [5] [ página necesaria ]
Recientemente se han descrito muchos métodos de mutagénesis aleatoria basada en transposones. Estos métodos incluyen, entre otros, los siguientes: PERMUTE (permutación circular aleatoria), truncamiento aleatorio de proteínas, sustitución aleatoria de tripletes de nucleótidos, inserción aleatoria de dominios/etiquetas/múltiples aminoácidos, mutagénesis por barrido de codones y mutagénesis por barrido de multicodones. Todas estas técnicas mencionadas anteriormente requieren el diseño de minitransposones Mu. Thermo Scientific fabrica kits para el diseño de estos transposones. [5] [ página necesaria ]
Estos métodos implican la alteración de la longitud de los genes mediante mutaciones de inserción y deleción. Un ejemplo es el método de inserción de repeticiones en tándem (TRINS). Esta técnica genera repeticiones en tándem de fragmentos aleatorios del gen objetivo mediante la amplificación por círculo rodante y la incorporación simultánea de estas repeticiones en el gen objetivo. [5] [ página necesaria ]
Las cepas mutantes son líneas celulares bacterianas que son deficientes en uno o más mecanismos de reparación del ADN. Un ejemplo de una cepa mutante es la E. coli XL1-RED. [5] [ página requerida ] Esta cepa subordinada de E. coli es deficiente en las vías de reparación del ADN MutS, MutD y MutT. El uso de cepas mutantes es útil para introducir muchos tipos de mutaciones; sin embargo, estas cepas muestran una enfermedad progresiva del cultivo debido a la acumulación de mutaciones en el propio genoma de la cepa. [5] [ página requerida ]
Los métodos de mutagénesis focalizada producen mutaciones en residuos de aminoácidos predeterminados. Estas técnicas requieren una comprensión de la relación secuencia-función de la proteína de interés. La comprensión de esta relación permite la identificación de residuos que son importantes para la estabilidad, la estereoselectividad y la eficiencia catalítica. [5] [ página necesaria ] A continuación se presentan ejemplos de métodos que producen mutagénesis focalizada.
La mutagénesis por saturación de sitio es un método basado en PCR que se utiliza para identificar aminoácidos con papeles importantes en la función de las proteínas. Las dos técnicas más comunes para realizarla son la PCR simple de plásmido completo y la PCR de extensión superpuesta.
La PCR simple de plásmido completo también se conoce como mutagénesis dirigida al sitio (SDM). Los productos de SDM se someten a digestión con endonucleasa Dpn. Esta digestión da como resultado la escisión de solo la cadena parental, porque la cadena parental contiene un GmATC que está metilado en N6 de adenina. La SDM no funciona bien para plásmidos grandes de más de diez kilobases. Además, este método solo es capaz de reemplazar dos nucleótidos a la vez. [5] [ página necesaria ]
La PCR de extensión por superposición requiere el uso de dos pares de cebadores. Un cebador en cada conjunto contiene una mutación. Se realiza una primera ronda de PCR utilizando estos conjuntos de cebadores y se forman dos dúplex de ADN bicatenario. Luego se realiza una segunda ronda de PCR en la que estos dúplex se desnaturalizan y se hibridan nuevamente con los conjuntos de cebadores para producir heterodúplex, en los que cada cadena tiene una mutación. Cualquier espacio en estos heterodúplex recién formados se llena con ADN polimerasas y se amplifica aún más. [5] [ página necesaria ]
La mutagénesis por saturación de secuencias da como resultado la aleatorización de la secuencia objetivo en cada posición de nucleótido. Este método comienza con la generación de fragmentos de ADN de longitud variable con bases universales en los extremos 3' mediante el uso de transferasas de plantilla. A continuación, estos fragmentos se extienden hasta su longitud completa utilizando una plantilla de cadena sencilla. Las bases universales se reemplazan con una base estándar aleatoria, lo que provoca mutaciones. Existen varias versiones modificadas de este método, como SeSAM-Tv-II, SeSAM-Tv+ y SeSAM-III. [5] [ página necesaria ]
Este método de mutagénesis por saturación de sitio implica dos reacciones de PCR independientes. La primera de las cuales utiliza solo cebadores directos, mientras que la segunda reacción utiliza solo cebadores inversos. Esto evita la formación de dímeros de cebadores. [5] [ página necesaria ]
Esta técnica mutagénica de saturación de sitio comienza con un oligonucleótido mutagénico y un cebador flanqueador universal. Estos dos reactivos se utilizan para un ciclo de PCR inicial. Los productos de este primer ciclo de PCR se utilizan como megacebadores para la siguiente PCR. [5] [ página necesaria ]
Este método mutagénico de saturación de sitio se basa en la PCR de extensión por superposición. Se utiliza para introducir mutaciones en cualquier sitio de un plásmido circular. [5] [ página necesaria ]
Este método utiliza mutagénesis dirigida al sitio definida por el usuario en uno o varios sitios simultáneamente. OSCARR es un acrónimo de one pot simple methodology for cassette randomization and recombination (metodología simple en un solo paso para la aleatorización y recombinación de casetes). Esta aleatorización y recombinación da como resultado la aleatorización de los fragmentos deseados de una proteína. Omnichange es una mutagénesis de saturación multisitio independiente de la secuencia que puede saturar hasta cinco codones independientes en un gen.
Este método elimina codones redundantes y codones de parada.
Este es un método basado en PCR. La mutagénesis en casete comienza con la síntesis de un casete de ADN que contiene el gen de interés, que está flanqueado a ambos lados por sitios de restricción. La endonucleasa que corta estos sitios de restricción también corta sitios en el plásmido objetivo. El casete de ADN y el plásmido objetivo se tratan con endonucleasas para cortar estos sitios de restricción y crear extremos pegajosos. A continuación, los productos de esta escisión se ligan entre sí, lo que da como resultado la inserción del gen en el plásmido objetivo. Una forma alternativa de mutagénesis en casete llamada mutagénesis en casete combinatoria se utiliza para identificar las funciones de los residuos de aminoácidos individuales en la proteína de interés. La mutagénesis de conjunto recursiva utiliza luego la información de la mutagénesis en casete combinatoria anterior. La mutagénesis en casete de codón le permite insertar o reemplazar un solo codón en un sitio particular en ADN bicatenario. [5] [ página necesaria ]
Los métodos sexuales de evolución dirigida implican la recombinación in vitro que imita la recombinación natural in vivo . Generalmente, estas técnicas requieren una alta homología de secuencia entre las secuencias parentales. Estas técnicas se utilizan a menudo para recombinar dos genes parentales diferentes y estos métodos crean entrecruzamientos entre estos genes. [5] [ página necesaria ]
La recombinación homóloga se puede clasificar como in vivo o in vitro. La recombinación homóloga in vitro imita la recombinación natural in vivo . Estos métodos de recombinación in vitro requieren una alta homología de secuencia entre las secuencias parentales. Estas técnicas explotan la diversidad natural de los genes parentales al recombinarlos para producir genes quiméricos. La quimera resultante muestra una mezcla de características parentales. [5] [ página necesaria ]
Esta técnica in vitro fue una de las primeras técnicas en la era de la recombinación. Comienza con la digestión de genes parentales homólogos en pequeños fragmentos por la DNasa 1. Estos pequeños fragmentos se purifican a partir de genes parentales no digeridos. Los fragmentos purificados se vuelven a ensamblar mediante PCR sin cebadores. Esta PCR implica que fragmentos homólogos de diferentes genes parentales se ceben entre sí, lo que da como resultado un ADN quimérico. El ADN quimérico del tamaño parental se amplifica luego utilizando cebadores terminales en la PCR regular. [5] [ página necesaria ]
Este método de recombinación homóloga in vitro comienza con la síntesis de muchos fragmentos cortos de genes que presentan mutaciones puntuales utilizando iniciadores de secuencias aleatorias. Estos fragmentos se reensamblan para formar genes parentales de longitud completa utilizando PCR sin iniciadores. Estas secuencias reensambladas se amplifican luego utilizando PCR y se someten a procesos de selección adicionales. Este método es ventajoso en relación con la recombinación de ADN porque no se utiliza DNasa1, por lo que no hay sesgo para la recombinación junto a un nucleótido de pirimidina. Este método también es ventajoso debido a su uso de iniciadores aleatorios sintéticos que son uniformes en longitud y carecen de sesgos. Finalmente, este método es independiente de la longitud de la secuencia de plantilla de ADN y requiere una pequeña cantidad de ADN parental. [5] [ página necesaria ]
Este método genera genes quiméricos directamente a partir de muestras metagenómicas. Comienza con el aislamiento del gen deseado mediante un cribado funcional a partir de una muestra de ADN metagenómico. A continuación, se diseñan y utilizan cebadores específicos para amplificar los genes homólogos a partir de diferentes muestras ambientales. Por último, se generan bibliotecas quiméricas para recuperar los clones funcionales deseados mediante la mezcla de estos genes homólogos amplificados. [5] [ página necesaria ]
Este método in vitro se basa en el cambio de plantilla para generar genes quiméricos. Este método basado en PCR comienza con una desnaturalización inicial de la plantilla, seguida de la hibridación de cebadores y un breve tiempo de extensión. Todos los ciclos posteriores generan hibridación entre los fragmentos cortos generados en ciclos anteriores y diferentes partes de la plantilla. Estos fragmentos cortos y las plantillas se hibridan entre sí en función de la complementariedad de secuencias. Este proceso de hibridación de fragmentos con ADN plantilla se conoce como cambio de plantilla. Estos fragmentos hibridados servirán entonces como cebadores para una extensión posterior. Este método se lleva a cabo hasta que se obtiene la secuencia del gen quimérico de longitud parental. La ejecución de este método solo requiere cebadores flanqueantes para comenzar. Tampoco es necesaria la enzima Dnase1. [5] [ página necesaria ]
Se ha demostrado que este método genera bibliotecas de genes quiméricos con un promedio de 14 cruces por gen quimérico. Comienza alineando fragmentos de una hebra superior parental sobre la hebra inferior de una plantilla que contiene uracilo de un gen homólogo. Las solapas salientes 5' y 3' se cortan y los espacios se llenan mediante las actividades de exonucleasa y endonucleasa de las ADN polimerasas Pfu y taq. Luego, la plantilla que contiene uracilo se elimina del heterodúplex mediante tratamiento con una ADN glucosilasa de uracilo, seguido de una amplificación adicional mediante PCR. Este método es ventajoso porque genera quimeras con una frecuencia de cruce relativamente alta. Sin embargo, es algo limitado debido a la complejidad y la necesidad de generación de ADN monocatenario y ADN monocatenario que contiene uracilo. [5] [ página necesaria ]
La mezcla de oligonucleótidos sintéticos degenerados agrega flexibilidad a los métodos de mezcla, ya que se pueden incluir oligonucleótidos que contienen codones óptimos y mutaciones beneficiosas. [5] [ página necesaria ]
La clonación realizada en levaduras implica el reensamblaje dependiente de PCR de vectores de expresión fragmentados. Estos vectores reensamblados se introducen luego en la levadura y se clonan en ella. El uso de levadura para clonar el vector evita la toxicidad y la contraselección que se introducirían mediante la ligación y propagación en E. coli. [5] [ página necesaria ]
Este método introduce mutaciones en regiones específicas de genes mientras deja otras partes intactas utilizando la alta frecuencia de recombinación homóloga en la levadura. [5] [ página necesaria ]
Este método utiliza un bacteriófago con un ciclo de vida modificado para transferir genes en evolución de un huésped a otro. El ciclo de vida del fago está diseñado de tal manera que la transferencia está correlacionada con la actividad de interés de la enzima. Este método es ventajoso porque requiere una intervención humana mínima para la evolución continua del gen. [5]
Estos métodos se basan en el hecho de que las proteínas pueden exhibir una identidad estructural similar aunque carezcan de homología de secuencia.
La reorganización de exones es la combinación de exones de diferentes proteínas mediante eventos de recombinación que ocurren en los intrones. La reorganización de exones ortólogos implica la combinación de exones de genes ortólogos de diferentes especies. La reorganización de dominios ortólogos implica la reorganización de dominios proteicos completos de genes ortólogos de diferentes especies. La reorganización de exones paralógicos implica la reorganización de exones de diferentes genes de la misma especie. La reorganización de dominios paralógicos implica la reorganización de dominios proteicos completos de proteínas paralógicas de la misma especie. La reorganización de homólogos funcionales implica la reorganización de dominios no homólogos que están funcionalmente relacionados. Todos estos procesos se realizan con la amplificación de los exones deseados de diferentes genes utilizando oligonucleótidos sintéticos quiméricos. Estos productos de amplificación luego se reensamblan en genes de longitud completa utilizando PCR sin cebadores. Durante estos ciclos de PCR, los fragmentos actúan como plantillas y cebadores. Esto da como resultado genes quiméricos de longitud completa, que luego se someten a cribado. [5] [ página necesaria ]
Los fragmentos de genes parentales se crean mediante digestión controlada por exonucleasa III. Estos fragmentos se embotan mediante endonucleasa y se ligan para producir genes híbridos. THIOITCHY es una técnica ITCHY modificada que utiliza análogos de trifosfato de nucleótidos como dNTP de α-fosfotioato. La incorporación de estos nucleótidos bloquea la digestión por exonucleasa III. Esta inhibición de la digestión por exonucleasa III se denomina "spiking". El "spiking" se puede lograr truncando primero los genes con exonucleasa para crear fragmentos con salientes cortos de cadena sencilla. Estos fragmentos luego sirven como plantillas para la amplificación por ADN polimerasa en presencia de pequeñas cantidades de dNTP de fosfotioato. Estos fragmentos resultantes luego se ligan entre sí para formar genes de longitud completa. Alternativamente, los genes parentales intactos se pueden amplificar por PCR en presencia de dNTP normales y dNTP de fosfotioato. Estos productos de amplificación de longitud completa luego se someten a digestión por una exonucleasa. La digestión continuará hasta que la exonucleasa encuentre un α-pdNTP, lo que dará como resultado fragmentos de diferente longitud. Estos fragmentos luego se ligan entre sí para generar genes quiméricos. [5] [ página necesaria ]
Este método genera bibliotecas de genes híbridos que inhiben los cruces múltiples mediante la combinación de la redistribución de ADN e ITCHY. Este método comienza con la construcción de dos bibliotecas ITCHY independientes. La primera con el gen A en el extremo N-terminal y la otra con el gen B en el extremo N-terminal. Estos fragmentos de genes híbridos se separan mediante digestión con enzimas de restricción o PCR con cebadores terminales mediante electroforesis en gel de agarosa. A continuación, estos fragmentos aislados se mezclan y se digieren aún más utilizando DNasa1. A continuación, los fragmentos digeridos se vuelven a ensamblar mediante PCR sin cebadores con cambio de plantilla. [5] [ página necesaria ]
Este método genera bibliotecas de genes híbridos mediante el intercambio de plantillas de polinucleótidos que crecen unidireccionalmente en presencia de fragmentos de ADN monocatenario como plantillas para quimeras. Este método comienza con la preparación de fragmentos de ADN monocatenario mediante transcripción inversa a partir del ARNm objetivo. A continuación, se unen cebadores específicos de genes al ADN monocatenario. A continuación, estos genes se extienden durante un ciclo de PCR. A este ciclo le sigue el intercambio de plantillas y el apareamiento de los fragmentos cortos obtenidos de la extensión de cebador anterior con otros fragmentos de ADN monocatenario. Este proceso se repite hasta obtener el ADN monocatenario de longitud completa. [5] [ página necesaria ]
Este método genera una recombinación entre genes con poca o ninguna homología de secuencia. Estas quimeras se fusionan a través de una secuencia de enlace que contiene varios sitios de restricción. Luego, esta construcción se digiere utilizando DNasa1. Los fragmentos se convierten en extremos romos utilizando la nucleasa S1. Estos fragmentos de extremos romos se juntan en una secuencia circular mediante ligadura. Luego, esta construcción circular se linealiza utilizando enzimas de restricción para las cuales los sitios de restricción están presentes en la región de enlace. Esto da como resultado una biblioteca de genes quiméricos en la que la contribución de los genes al extremo 5' y 3' se invertirá en comparación con la construcción inicial. [5] [ página necesaria ]
Este método da como resultado una biblioteca de genes con múltiples cruces de varios genes parentales. Este método no requiere identidad de secuencia entre los genes parentales. Esto requiere uno o dos aminoácidos conservados en cada posición de cruce. Comienza con la alineación de las secuencias parentales y la identificación de las regiones de consenso que sirven como sitios de cruce. A esto le sigue la incorporación de etiquetas específicas que contienen sitios de restricción seguida de la eliminación de las etiquetas mediante digestión con Bac1, lo que da como resultado genes con extremos cohesivos. Estos fragmentos de genes se mezclan y se ligan en un orden apropiado para formar bibliotecas quiméricas. [5] [ página necesaria ]
Este método comienza con la alineación de genes homólogos, seguida de la identificación de regiones de polimorfismo. A continuación, la hebra superior del gen se divide en pequeños oligonucleótidos degenerados. La hebra inferior también se digiere en oligonucleótidos para que sirvan como andamiaje. Estos fragmentos se combinan en solución y los oligonucleótidos de la hebra superior se ensamblan con los oligonucleótidos de la hebra inferior. Los espacios entre estos fragmentos se rellenan con polimerasa y se ligan. [5] [ página necesaria ]
Este método implica la mezcla de fragmentos de ADN plurales sin homología en una única PCR, lo que da como resultado la reconstrucción de proteínas completas mediante el ensamblaje de módulos que codifican diferentes unidades estructurales. [5] [ página necesaria ]
Este método comienza con la amplificación de fragmentos de genes que necesitan ser recombinados, utilizando dNTP de uracilo. Esta solución de amplificación también contiene cebadores, PfuTurbo y ADN polimerasa Cx Hotstart. A continuación, los productos amplificados se incuban con la enzima USER. Esta enzima cataliza la eliminación de residuos de uracilo del ADN creando espacios de un solo par de bases. Los fragmentos tratados con la enzima USER se mezclan y se ligan utilizando la ADN ligasa T4 y se someten a digestión con Dpn1 para eliminar el ADN molde. Estos fragmentos de cadena dingle resultantes se someten a amplificación mediante PCR y se transforman en E. coli. [5] [ página necesaria ]
Este método permite recombinar al menos 9 fragmentos diferentes en un vector aceptor mediante el uso de una enzima de restricción de tipo 2 que corta fuera de los sitios de restricción. Comienza con la subclonación de fragmentos en vectores separados para crear secuencias flanqueantes de Bsa1 en ambos lados. Estos vectores se escinden luego utilizando la enzima de restricción de tipo II Bsa1, que genera cuatro nucleótidos salientes de cadena sencilla. Los fragmentos con salientes complementarios se hibridan y se ligan utilizando la ADN ligasa T4. Finalmente, estos constructos se transforman en células de E. coli, que se examinan para determinar los niveles de expresión. [5] [ página necesaria ]
Este método se puede utilizar para recombinar elementos estructurales o dominios proteicos completos. Este método se basa en la química de los fosforotioatos, que permite la escisión específica de los enlaces fosforotiodiéster. El primer paso del proceso comienza con la amplificación de los fragmentos que deben recombinarse junto con la cadena principal del vector. Esta amplificación se logra utilizando cebadores con nucleótidos fosforotiolados en los extremos 5'. Los productos de PCR amplificados se escinden en una solución de etanol y yodo a altas temperaturas. A continuación, estos fragmentos se hibridan a temperatura ambiente y se transforman en E. coli que repara las muescas. [5] [ página necesaria ]
Este sistema se basa en un sistema de recombinación específico de sitio natural en E. coli. Este sistema se denomina sistema integrón y produce una redistribución natural de genes. Este método se utilizó para construir y optimizar un operón biosintético de triptófano funcional en E. coli deficiente en trp mediante la administración de casetes de recombinación individuales o genes trpA-E junto con elementos reguladores con el sistema integrón. [5] [ página necesaria ]
Este método genera cadenas de ADN monocatenario, que comprenden una secuencia de un solo bloque en el extremo 5' o 3', secuencias complementarias en una región de bucle de tallo y una región de ramificación D que sirve como sitio de unión del cebador para PCR. Se mezclan cantidades equivalentes de ambas mitades de cadena 5' y 3' y se forma un híbrido debido a la complementariedad en la región del tallo. Los híbridos con el extremo 5' fosforilado libre en las mitades de cadena 3' se ligan luego con los extremos 3' libres en las mitades de cadena 5' utilizando la ADN ligasa T4 en presencia de 0,1 mM de ATP. Los productos ligados se amplifican luego mediante dos tipos de PCR para generar productos de PCR pre mitad 5' y pre mitad 3'. Estos productos de PCR se convierten en cadenas sencillas a través de la unión de avidina-biotina al extremo 5' de los cebadores que contienen secuencias del tallo que fueron marcadas con biotina. A continuación, las semicadenas 5' biotiniladas y las semicadenas 3' no biotiniladas se utilizan como semicadenas 5' y 3' para el siguiente ciclo de ligadura Y. [5] [ página necesaria ]
El diseño semirracional utiliza información sobre la secuencia, la estructura y la función de una proteína, junto con algoritmos predictivos. En conjunto, estos se utilizan para identificar los residuos de aminoácidos objetivo que tienen más probabilidades de influir en la función de la proteína. Las mutaciones de estos residuos de aminoácidos clave crean bibliotecas de proteínas mutantes que tienen más probabilidades de tener propiedades mejoradas. [11]
Los avances en la ingeniería enzimática semirracional y el diseño de enzimas de novo proporcionan a los investigadores nuevas estrategias poderosas y efectivas para manipular biocatalizadores. La integración de enfoques basados en secuencias y estructuras en el diseño de bibliotecas ha demostrado ser una gran guía para el rediseño de enzimas. En general, los métodos computacionales de novo y de rediseño actuales no se comparan con las variantes evolucionadas en el rendimiento catalítico. Aunque se puede producir una optimización experimental utilizando la evolución dirigida, se lograrán mejoras adicionales en la precisión de las predicciones de la estructura y una mayor capacidad catalítica con mejoras en los algoritmos de diseño. Se pueden incluir mejoras funcionales adicionales en futuras simulaciones mediante la integración de la dinámica de proteínas. [11]
Los estudios bioquímicos y biofísicos, junto con el ajuste de los marcos predictivos, serán útiles para evaluar experimentalmente la importancia funcional de las características de diseño individuales. Una mejor comprensión de estas contribuciones funcionales proporcionará entonces retroalimentación para la mejora de los diseños futuros. [11]
La evolución dirigida probablemente no será reemplazada como el método de elección para la ingeniería de proteínas, aunque el diseño computacional de proteínas ha cambiado fundamentalmente la forma en que la ingeniería de proteínas puede manipular biomacromoléculas. Se pueden generar bibliotecas más pequeñas, más enfocadas y funcionalmente ricas utilizando métodos que incorporan marcos predictivos para la ingeniería de proteínas basada en hipótesis. Las nuevas estrategias de diseño y los avances técnicos han comenzado a alejarse de los protocolos tradicionales, como la evolución dirigida, que representa la estrategia más efectiva para identificar candidatos de alto rendimiento en bibliotecas enfocadas. La síntesis de bibliotecas de genes completos está reemplazando los protocolos de mezcla y mutagénesis para la preparación de bibliotecas. También se aplican cada vez más ensayos de cribado de bajo rendimiento altamente específicos en lugar de esfuerzos monumentales de cribado y selección de millones de candidatos. En conjunto, estos avances están preparados para llevar la ingeniería de proteínas más allá de la evolución dirigida y hacia estrategias prácticas y más eficientes para adaptar los biocatalizadores. [11]
Una vez que una proteína ha experimentado una evolución dirigida, un diseño de ración o un diseño de semi-ración, las bibliotecas de proteínas mutantes deben examinarse para determinar qué mutantes muestran propiedades mejoradas. Los métodos de presentación de fagos son una opción para examinar proteínas. Este método implica la fusión de genes que codifican los polipéptidos variantes con genes de proteínas de la cubierta del fago. Las variantes de proteínas expresadas en las superficies de los fagos se seleccionan mediante la unión con objetivos inmovilizados in vitro. Los fagos con variantes de proteínas seleccionadas se amplifican luego en bacterias, seguido de la identificación de clones positivos mediante un ensayo inmunoabsorbente ligado a enzimas. Estos fagos seleccionados se someten luego a secuenciación de ADN. [5] [ página necesaria ]
Los sistemas de visualización de la superficie celular también se pueden utilizar para examinar bibliotecas de polipéptidos mutantes. Los genes mutantes de la biblioteca se incorporan a vectores de expresión que luego se transforman en células hospedadoras apropiadas. Estas células hospedadoras se someten a otros métodos de examen de alto rendimiento para identificar las células con los fenotipos deseados. [5] [ página necesaria ]
Se han desarrollado sistemas de visualización sin células para explotar la traducción de proteínas in vitro o la traducción sin células. Estos métodos incluyen la visualización de ARNm, la visualización de ribosomas, la visualización de ADN covalente y no covalente y la compartimentación in vitro . [5] : 53
La ingeniería enzimática es la aplicación de la modificación de la estructura de una enzima (y, por lo tanto, de su función) o de la actividad catalítica de enzimas aisladas para producir nuevos metabolitos, para permitir que se produzcan nuevas vías (catalizadas) para que se produzcan reacciones [12] o para convertir ciertos compuestos en otros ( biotransformación ). Estos productos son útiles como productos químicos, farmacéuticos, combustibles, alimentos o aditivos agrícolas.
Un reactor enzimático [13] consiste en un recipiente que contiene un medio de reacción que se utiliza para realizar una conversión deseada por medios enzimáticos. Las enzimas utilizadas en este proceso están libres en la solución. Los microorganismos también son un origen importante para las enzimas genuinas. [14]
Se han utilizado métodos informáticos para diseñar una proteína con un nuevo pliegue, como Top7 , [15] y sensores para moléculas no naturales. [16] La ingeniería de proteínas de fusión ha producido rilonacept , un producto farmacéutico que ha obtenido la aprobación de la Administración de Alimentos y Medicamentos (FDA) para el tratamiento del síndrome periódico asociado a la criopirina .
Otro método computacional, IPRO, diseñó con éxito el cambio de especificidad del cofactor de la xilosa reductasa de Candida boidinii . [17] El rediseño y optimización iterativo de proteínas (IPRO) rediseña proteínas para aumentar o dar especificidad a sustratos y cofactores nativos o nuevos. Esto se hace perturbando aleatoriamente de manera repetida la estructura de las proteínas alrededor de posiciones de diseño específicas, identificando la combinación de rotámeros de menor energía y determinando si el nuevo diseño tiene una energía de enlace menor que los anteriores. [18]
El diseño asistido por computación también se ha utilizado para diseñar propiedades complejas de un ensamblaje de nanoproteínas altamente ordenado. [19] Una jaula de proteína, la bacterioferritina de E. coli (EcBfr), que naturalmente muestra inestabilidad estructural y un comportamiento de autoensamblaje incompleto al poblar dos estados de oligomerización, es la proteína modelo en este estudio. A través del análisis computacional y la comparación con sus homólogos , se ha encontrado que esta proteína tiene una interfaz dimérica más pequeña que el promedio en su eje de simetría doble debido principalmente a la existencia de una bolsa de agua interfacial centrada en dos residuos de asparagina con puentes de agua. Para investigar la posibilidad de diseñar EcBfr para una estabilidad estructural modificada, se utiliza un método computacional semiempírico para explorar virtualmente las diferencias de energía de los 480 mutantes posibles en la interfaz dimérica en relación con el EcBfr de tipo salvaje . Este estudio computacional también converge en las asparaginas con puentes de agua . La sustitución de estas dos asparaginas por aminoácidos hidrófobos da como resultado proteínas que se pliegan en monómeros alfa-helicoidales y se ensamblan en jaulas, como se evidencia mediante dicroísmo circular y microscopía electrónica de transmisión. Tanto la desnaturalización térmica como la química confirman que todas las proteínas rediseñadas, de acuerdo con los cálculos, poseen una mayor estabilidad. Una de las tres mutaciones desplaza la población a favor del estado de oligomerización de orden superior en solución, como se muestra tanto mediante cromatografía de exclusión por tamaño como mediante electroforesis en gel nativo. [19]
Se desarrolló un método in silico , PoreDesigner, [20] para rediseñar la proteína del canal bacteriano (OmpF) a fin de reducir el tamaño de poro de 1 nm a cualquier dimensión subnm deseada. Los experimentos de transporte en los poros diseñados más estrechos revelaron un rechazo total de la sal cuando se ensamblaron en matrices de polímeros en bloque biomiméticos.