La producción de proteínas es el proceso biotecnológico de generar una proteína específica . Normalmente se logra mediante la manipulación de la expresión genética en un organismo de modo que exprese grandes cantidades de un gen recombinante . Esto incluye la transcripción del ADN recombinante en ARN mensajero ( ARNm ), la traducción del ARNm en cadenas polipeptídicas , que finalmente se pliegan en proteínas funcionales y pueden dirigirse a ubicaciones subcelulares o extracelulares específicas. [1]
Los sistemas de producción de proteínas (también conocidos como sistemas de expresión ) se utilizan en las ciencias biológicas , la biotecnología y la medicina . La investigación en biología molecular utiliza numerosas proteínas y enzimas, muchas de las cuales provienen de sistemas de expresión; particularmente ADN polimerasa para PCR , transcriptasa inversa para análisis de ARN, endonucleasas de restricción para clonación y para producir proteínas que se analizan en el descubrimiento de fármacos como objetivos biológicos o como fármacos potenciales en sí mismos. También existen aplicaciones importantes para los sistemas de expresión en la fermentación industrial , en particular la producción de productos biofarmacéuticos como la insulina humana para tratar la diabetes y para fabricar enzimas .
Los sistemas de producción de proteínas comúnmente utilizados incluyen aquellos derivados de bacterias , [2] [3] levaduras , [4] [5] baculovirus / insectos , [6] células de mamíferos , [7] [8] y, más recientemente, hongos filamentosos como Myceliophthora thermophila. . [9] Cuando se producen productos biofarmacéuticos con uno de estos sistemas, las impurezas relacionadas con el proceso denominadas proteínas de la célula huésped también llegan al producto final en cantidades mínimas. [10]
Los sistemas de expresión más antiguos y más utilizados están basados en células y pueden definirse como la " combinación de un vector de expresión , su ADN clonado y el huésped del vector que proporciona un contexto para permitir la función de un gen extraño en una célula huésped, que es decir, producir proteínas a un alto nivel ". [11] [12] La sobreexpresión es un nivel anormal y excesivamente alto de expresión genética que produce un fenotipo pronunciado relacionado con el gen . [13] [14] [ se necesita aclaración ]
Hay muchas formas de introducir ADN extraño en una célula para su expresión, y se pueden utilizar muchas células huésped diferentes para la expresión; cada sistema de expresión tiene distintas ventajas y desventajas. Los sistemas de expresión normalmente se denominan huésped y fuente de ADN o mecanismo de entrega del material genético. Por ejemplo, los huéspedes comunes son bacterias (como E. coli , B. subtilis ), levaduras (como S. cerevisiae [5] ) o líneas celulares eucariotas . Las fuentes de ADN y los mecanismos de entrega comunes son virus (como baculovirus , retrovirus , adenovirus ), plásmidos , cromosomas artificiales y bacteriófagos (como lambda ). El mejor sistema de expresión depende del gen involucrado; por ejemplo, a menudo se prefiere Saccharomyces cerevisiae para proteínas que requieren una modificación postraduccional significativa . Las líneas celulares de insectos o mamíferos se utilizan cuando se requiere un empalme de ARNm similar al humano. No obstante, la expresión bacteriana tiene la ventaja de producir fácilmente grandes cantidades de proteína, que se requiere para la cristalografía de rayos X o los experimentos de resonancia magnética nuclear para la determinación de la estructura.
Debido a que las bacterias son procariotas , no están equipadas con la maquinaria enzimática completa para lograr las modificaciones postraduccionales o el plegamiento molecular requeridos. Por lo tanto, las proteínas eucariotas multidominio expresadas en bacterias a menudo no son funcionales. Además, muchas proteínas se vuelven insolubles como cuerpos de inclusión que son difíciles de recuperar sin desnaturalizantes agresivos y el engorroso replegamiento de proteínas posterior.
Para abordar estas preocupaciones, se desarrollaron sistemas de expresión que utilizan múltiples células eucariotas para aplicaciones que requieren que las proteínas estén conformadas como en organismos eucariotas o más cerca de ellos: células de plantas (es decir, tabaco), de insectos o mamíferos (es decir, bovinos) se transfectan con genes y cultivados en suspensión e incluso como tejidos u organismos completos, para producir proteínas completamente plegadas. Sin embargo, los sistemas de expresión in vivo en mamíferos tienen un rendimiento bajo y otras limitaciones (consumo de tiempo, toxicidad para las células huésped, etc.). Para combinar el alto rendimiento/productividad y las características proteicas escalables de las bacterias y las levaduras, y las características epigenéticas avanzadas de los sistemas de plantas, insectos y mamíferos, se desarrollan otros sistemas de producción de proteínas utilizando eucariotas unicelulares (es decir, células de ' Leishmania ' no patógenas).
E. coli es uno de los huéspedes de expresión más utilizados y el ADN normalmente se introduce en un vector de expresión plasmídico . Las técnicas de sobreexpresión en E. coli están bien desarrolladas y funcionan aumentando el número de copias del gen o aumentando la fuerza de unión de la región promotora, ayudando así a la transcripción. [3]
Por ejemplo, una secuencia de ADN para una proteína de interés podría clonarse o subclonarse en un plásmido de alto número de copias que contenga el promotor lac (a menudo LacUV5 ), que luego se transforma en la bacteria E. coli . La adición de IPTG (un análogo de la lactosa ) activa el promotor lac y hace que las bacterias expresen la proteína de interés. [2]
Las cepas de E. coli BL21 y BL21(DE3) son dos cepas comúnmente utilizadas para la producción de proteínas. Como miembros del linaje B, carecen de proteasas lon y OmpT , lo que protege las proteínas producidas de la degradación. El profago DE3 que se encuentra en BL21(DE3) proporciona ARN polimerasa T7 (impulsada por el promotor LacUV5), lo que permite utilizar vectores con el promotor T7 en su lugar. [15]
Las especies no patógenas de Corynebacterium grampositivas se utilizan para la producción comercial de diversos aminoácidos. La especie C. glutamicum se utiliza ampliamente para producir glutamato y lisina , [16] componentes de alimentos humanos, piensos para animales y productos farmacéuticos.
La expresión del factor de crecimiento epidérmico humano funcionalmente activo se ha realizado en C. glutamicum , [17] demostrando así un potencial para la producción a escala industrial de proteínas humanas. Las proteínas expresadas pueden ser objeto de secreción a través de la vía secretora general (Sec) o de la vía de translocación de arginina gemela (Tat). [18]
A diferencia de las bacterias gramnegativas , las Corynebacterium grampositivas carecen de lipopolisacáridos que funcionan como endotoxinas antigénicas en humanos. [ cita necesaria ]
La bacteria no patógena y gramnegativa, Pseudomonas fluorescens , se utiliza para la producción de alto nivel de proteínas recombinantes; comúnmente para el desarrollo de bioterapéuticos y vacunas. P. fluorescens es un organismo metabólicamente versátil, lo que permite una detección de alto rendimiento y un rápido desarrollo de proteínas complejas. P. fluorescens es más conocido por su capacidad para producir rápida y exitosamente altos títulos de proteína soluble activa. [19]
Los sistemas de expresión que utilizan S. cerevisiae o Pichia pastoris permiten una producción estable y duradera de proteínas que se procesan de manera similar a las células de mamíferos, con alto rendimiento, en medios de proteínas químicamente definidos. [4] [5]
Los hongos filamentosos, especialmente Aspergillus y Trichoderma , se utilizan desde hace mucho tiempo para producir diversas enzimas industriales a partir de sus propios genomas ("nativos", "homólogos") y de ADN recombinante ("heterólogos"). [9]
Más recientemente, Myceliophthora thermophila C1 se ha convertido en una plataforma de expresión para la detección y producción de proteínas nativas y heterólogas. El sistema de expresión C1 muestra una morfología de baja viscosidad en cultivo sumergido, lo que permite el uso de medios de producción y crecimiento complejos. C1 tampoco "hiperglicosila" proteínas heterólogas, como tienden a hacer Aspergillus y Trichoderma . [9]
Las células de insectos infectadas con baculovirus [20] ( Sf9 , Sf21 , cepas High Five ) o células de mamíferos [21] ( HeLa , HEK 293 ) permiten la producción de proteínas glicosiladas o de membrana que no pueden producirse utilizando sistemas fúngicos o bacterianos. [20] [6] Es útil para la producción de proteínas en grandes cantidades. Los genes no se expresan continuamente porque las células huésped infectadas eventualmente se lisan y mueren durante cada ciclo de infección. [22]
La expresión de células de insecto no líticas es una alternativa al sistema de expresión de baculovirus líticos. En la expresión no lítica, los vectores se transfectan de forma transitoria o estable en el ADN cromosómico de células de insecto para la posterior expresión genética. [23] [24] A esto le sigue la selección y el cribado de clones recombinantes. [25] El sistema no lítico se ha utilizado para proporcionar un mayor rendimiento proteico y una expresión más rápida de genes recombinantes en comparación con la expresión de células infectadas con baculovirus. [24] Las líneas celulares utilizadas para este sistema incluyen: Sf9 , Sf21 de células de Spodoptera frugiperda , Hi-5 de células de Trichoplusia ni y células Schneider 2 y Schneider 3 de células de Drosophila melanogaster . [23] [25] Con este sistema, las células no se lisan y se pueden utilizar varios modos de cultivo. [23] Además, las series de producción de proteínas son reproducibles. [23] [24] Este sistema da un producto homogéneo. [24] Un inconveniente de este sistema es el requisito de un paso de selección adicional para seleccionar clones viables . [25]
Los sistemas de expresión de Leishmania tarentolae (no pueden infectar mamíferos) permiten una producción estable y duradera de proteínas con un alto rendimiento, en medios químicamente definidos. Las proteínas producidas exhiben modificaciones postraduccionales totalmente eucariotas, incluida la glicosilación y la formación de enlaces disulfuro. [ cita necesaria ]
Los sistemas de expresión de mamíferos más comunes son las células de ovario de hámster chino (CHO) y de riñón embrionario humano (HEK). [26] [27] [28]
La producción de proteínas sin células se realiza in vitro utilizando ARN polimerasa, ribosomas, ARNt y ribonucleótidos purificados. Estos reactivos pueden producirse mediante extracción a partir de células o a partir de un sistema de expresión basado en células. Debido a los bajos niveles de expresión y el alto costo de los sistemas libres de células, los sistemas basados en células se utilizan más ampliamente. [29]
Aspergillus y Trichoderma son actualmente los principales géneros de hongos utilizados para producir enzimas industriales.
La producción de cantidades anormalmente grandes de una sustancia codificada por un gen o grupo de genes en particular;
la aparición en el fenotipo en un grado anormalmente alto de un carácter o efecto atribuido a un gen particular.
sobreexpresar
En biología, hacer demasiadas copias de una proteína u otra sustancia.
La sobreexpresión de ciertas proteínas u otras sustancias puede desempeñar un papel en el desarrollo del cáncer.