La producción de proteínas es el proceso biotecnológico de generar una proteína específica . Generalmente se logra mediante la manipulación de la expresión genética en un organismo de modo que exprese grandes cantidades de un gen recombinante . Esto incluye la transcripción del ADN recombinante a ARN mensajero ( ARNm ), la traducción del ARNm en cadenas polipeptídicas , que finalmente se pliegan en proteínas funcionales y pueden dirigirse a ubicaciones subcelulares o extracelulares específicas. [1]
Los sistemas de producción de proteínas (también conocidos como sistemas de expresión ) se utilizan en las ciencias de la vida , la biotecnología y la medicina . La investigación en biología molecular utiliza numerosas proteínas y enzimas, muchas de las cuales provienen de sistemas de expresión; en particular, la ADN polimerasa para PCR , la transcriptasa inversa para el análisis de ARN, las endonucleasas de restricción para la clonación y para producir proteínas que se examinan en el descubrimiento de fármacos como objetivos biológicos o como fármacos potenciales en sí mismos. También existen aplicaciones significativas para los sistemas de expresión en la fermentación industrial , en particular la producción de productos biofarmacéuticos como la insulina humana para tratar la diabetes y para fabricar enzimas .
Los sistemas de producción de proteínas comúnmente utilizados incluyen aquellos derivados de bacterias , [2] [3] levaduras , [4] [5] baculovirus / insectos , [6] células de mamíferos , [7] [8] y más recientemente hongos filamentosos como Myceliophthora thermophila . [9] Cuando se producen productos biofarmacéuticos con uno de estos sistemas, las impurezas relacionadas con el proceso denominadas proteínas de la célula huésped también llegan al producto final en cantidades traza. [10]
Los sistemas de expresión más antiguos y más utilizados son los basados en células y pueden definirse como la " combinación de un vector de expresión , su ADN clonado y el huésped del vector que proporciona un contexto para permitir la función de un gen extraño en una célula huésped, es decir, producir proteínas a un alto nivel ". [11] [12] La sobreexpresión es un nivel anormal y excesivamente alto de expresión genética que produce un fenotipo pronunciado relacionado con el gen . [13] [14] [ aclaración necesaria ]
Existen muchas formas de introducir ADN extraño en una célula para su expresión, y se pueden utilizar muchas células huésped diferentes para la expresión; cada sistema de expresión tiene distintas ventajas y desventajas. Normalmente, los sistemas de expresión se denominan huésped y fuente de ADN o mecanismo de administración del material genético. Por ejemplo, los huéspedes habituales son bacterias (como E. coli , B. subtilis ), levaduras (como S. cerevisiae [5] ) o líneas celulares eucariotas . Las fuentes de ADN y los mecanismos de administración habituales son los virus (como baculovirus , retrovirus , adenovirus ), plásmidos , cromosomas artificiales y bacteriófagos (como lambda ). El mejor sistema de expresión depende del gen implicado; por ejemplo, el Saccharomyces cerevisiae suele preferirse para proteínas que requieren una modificación postraduccional significativa . Se utilizan líneas celulares de insectos o mamíferos cuando se requiere un empalme de ARNm similar al humano. Sin embargo, la expresión bacteriana tiene la ventaja de producir fácilmente grandes cantidades de proteína, lo cual es necesario para experimentos de cristalografía de rayos X o de resonancia magnética nuclear para la determinación de la estructura.
Debido a que las bacterias son procariotas , no están equipadas con la maquinaria enzimática completa para lograr las modificaciones postraduccionales o el plegamiento molecular requeridos. Por lo tanto, las proteínas eucariotas multidominio expresadas en bacterias a menudo no son funcionales. Además, muchas proteínas se vuelven insolubles como cuerpos de inclusión que son difíciles de recuperar sin desnaturalizantes agresivos y el posterior y engorroso replegamiento de proteínas.
Para abordar estas preocupaciones, se desarrollaron sistemas de expresión que utilizan múltiples células eucariotas para aplicaciones que requieren que las proteínas estén conformadas como en los organismos eucariotas o más cerca de ellos: células de plantas (por ejemplo, tabaco), de insectos o mamíferos (por ejemplo, bovinos) se transfectan con genes y se cultivan en suspensión e incluso como tejidos u organismos completos, para producir proteínas completamente plegadas. Sin embargo, los sistemas de expresión in vivo en mamíferos tienen un bajo rendimiento y otras limitaciones (consumo de tiempo, toxicidad para las células huésped, etc.). Para combinar el alto rendimiento/productividad y las características proteicas escalables de las bacterias y levaduras, y las características epigenéticas avanzadas de los sistemas de plantas, insectos y mamíferos, se desarrollan otros sistemas de producción de proteínas utilizando eucariotas unicelulares (por ejemplo, células ' Leishmania ' no patógenas ).
La E. coli es uno de los hospedadores de expresión más utilizados y el ADN se introduce normalmente en un vector de expresión plasmídico . Las técnicas de sobreexpresión en E. coli están bien desarrolladas y funcionan aumentando el número de copias del gen o aumentando la fuerza de unión de la región promotora, lo que favorece la transcripción. [3]
Por ejemplo, una secuencia de ADN de una proteína de interés podría clonarse o subclonarse en un plásmido con un elevado número de copias que contenga el promotor lac (a menudo LacUV5 ), que luego se transforma en la bacteria E. coli . La adición de IPTG (un análogo de la lactosa ) activa el promotor lac y hace que la bacteria exprese la proteína de interés. [2]
Las cepas de E. coli BL21 y BL21(DE3) son dos cepas que se utilizan habitualmente para la producción de proteínas. Como miembros del linaje B, carecen de las proteasas lon y OmpT , lo que protege a las proteínas producidas de la degradación. El profago DE3 que se encuentra en BL21(DE3) proporciona la ARN polimerasa T7 (controlada por el promotor LacUV5), lo que permite utilizar vectores con el promotor T7 en su lugar. [15]
Las especies no patógenas de Corynebacterium grampositivas se utilizan para la producción comercial de diversos aminoácidos. La especie C. glutamicum se utiliza ampliamente para producir glutamato y lisina , [16] componentes de alimentos para humanos, piensos para animales y productos farmacéuticos.
Se ha realizado la expresión del factor de crecimiento epidérmico humano funcionalmente activo en C. glutamicum [ 17] , lo que demuestra un potencial para la producción a escala industrial de proteínas humanas. Las proteínas expresadas pueden ser dirigidas para su secreción a través de la vía secretora general (Sec) o la vía de translocación de arginina gemela (Tat). [18]
A diferencia de las bacterias gramnegativas , las Corynebacterium grampositivas carecen de lipopolisacáridos que funcionan como endotoxinas antigénicas en los seres humanos. [ cita requerida ]
La bacteria no patógena y gramnegativa Pseudomonas fluorescens se utiliza para la producción de alto nivel de proteínas recombinantes; comúnmente para el desarrollo de productos bioterapéuticos y vacunas. P. fluorescens es un organismo metabólicamente versátil, que permite un cribado de alto rendimiento y un rápido desarrollo de proteínas complejas. P. fluorescens es más conocida por su capacidad para producir de forma rápida y exitosa títulos altos de proteína activa soluble. [19]
Los sistemas de expresión que utilizan S. cerevisiae o Pichia pastoris permiten una producción estable y duradera de proteínas que se procesan de manera similar a las células de mamíferos, con un alto rendimiento, en medios de proteínas definidos químicamente. [4] [5]
Los hongos filamentosos, especialmente Aspergillus y Trichoderma , se han utilizado durante mucho tiempo para producir diversas enzimas industriales a partir de sus propios genomas ("nativos", "homólogos") y de ADN recombinante ("heterólogos"). [9]
Más recientemente, Myceliophthora thermophila C1 se ha desarrollado como una plataforma de expresión para la detección y producción de proteínas nativas y heterólogas. El sistema de expresión C1 muestra una morfología de baja viscosidad en cultivos sumergidos, lo que permite el uso de medios de crecimiento y producción complejos. C1 tampoco "hiperglicosila" las proteínas heterólogas, como tienden a hacer Aspergillus y Trichoderma . [9]
Las células de insectos infectadas por baculovirus [20] ( cepas Sf9 , Sf21 , High Five ) o las células de mamíferos [21] ( HeLa , HEK 293 ) permiten la producción de proteínas glicosiladas o de membrana que no se pueden producir utilizando sistemas fúngicos o bacterianos. [20] [6] Es útil para la producción de proteínas en grandes cantidades. Los genes no se expresan de forma continua porque las células huésped infectadas acaban lisándose y muriendo durante cada ciclo de infección. [22]
La expresión no lítica de células de insectos es una alternativa al sistema de expresión lítica de baculovirus. En la expresión no lítica, los vectores se transfectan de forma transitoria o estable en el ADN cromosómico de las células de insectos para la posterior expresión génica. [23] [24] A esto le sigue la selección y el cribado de clones recombinantes. [25] El sistema no lítico se ha utilizado para dar un mayor rendimiento proteico y una expresión más rápida de genes recombinantes en comparación con la expresión celular infectada con baculovirus. [24] Las líneas celulares utilizadas para este sistema incluyen: Sf9 , Sf21 de células de Spodoptera frugiperda , Hi-5 de células de Trichoplusia ni y células Schneider 2 y células Schneider 3 de células de Drosophila melanogaster . [23] [25] Con este sistema, las células no se lisan y se pueden utilizar varios modos de cultivo. [23] Además, las corridas de producción de proteínas son reproducibles. [23] [24] Este sistema da un producto homogéneo. [24] Una desventaja de este sistema es el requisito de un paso de selección adicional para seleccionar clones viables . [25]
Los sistemas de expresión de Leishmania tarentolae (que no puede infectar a los mamíferos) permiten la producción estable y duradera de proteínas con un alto rendimiento en medios definidos químicamente. Las proteínas producidas presentan modificaciones postraduccionales completamente eucariotas, incluidas la glicosilación y la formación de enlaces disulfuro. [ cita requerida ]
Los sistemas de expresión de mamíferos más comunes son las células de ovario de hámster chino (CHO) y las células de riñón embrionario humano (HEK). [26] [27] [28]
La producción de proteínas sin células se realiza in vitro utilizando ARN polimerasa purificada, ribosomas, ARNt y ribonucleótidos. Estos reactivos pueden producirse mediante extracción a partir de células o a partir de un sistema de expresión basado en células. Debido a los bajos niveles de expresión y al alto costo de los sistemas sin células, los sistemas basados en células son los más utilizados. [29]
Aspergillus y Trichoderma son actualmente los principales géneros de hongos utilizados para producir enzimas industriales.
Producción de cantidades anormalmente grandes de una sustancia codificada por un gen o grupo de genes en particular; aparición en el fenotipo en un grado anormalmente alto de un carácter o efecto atribuido a un gen en particular.
sobreexpresar
En biología, hacer demasiadas copias de una proteína u otra sustancia. La sobreexpresión de ciertas proteínas u otras sustancias puede desempeñar un papel en el desarrollo del cáncer.