proteoma

El proteoma es el conjunto completo de proteínas que es, o puede ser, expresada por un genoma , célula, tejido u organismo en un momento determinado. Es el conjunto de proteínas expresadas en un determinado tipo de célula u organismo, en un momento determinado, en condiciones definidas. La proteómica es el estudio del proteoma.

Tipos de proteomas

Si bien el proteoma generalmente se refiere al proteoma de un organismo, los organismos multicelulares pueden tener proteomas muy diferentes en diferentes células, por lo que es importante distinguir los proteomas en células y organismos.

Un proteoma celular es el conjunto de proteínas que se encuentran en un tipo de célula particular bajo un conjunto particular de condiciones ambientales, como la exposición a la estimulación hormonal .

También puede resultar útil considerar el proteoma completo de un organismo , que puede conceptualizarse como el conjunto completo de proteínas de todos los proteomas celulares. Esto es, aproximadamente, el equivalente proteico del genoma .

El término proteoma también se ha utilizado para referirse a la colección de proteínas en ciertos sistemas subcelulares , como los orgánulos. Por ejemplo, el proteoma mitocondrial puede estar formado por más de 3.000 proteínas distintas. ^[1]^[2]^[3]

Las proteínas de un virus pueden denominarse proteoma viral . Por lo general, los proteomas virales se predicen a partir del genoma viral ^[4], pero se han realizado algunos intentos para determinar todas las proteínas expresadas a partir del genoma de un virus, es decir, el proteoma viral. ^[5] Sin embargo, con mayor frecuencia, la proteómica viral analiza los cambios de las proteínas del huésped tras la infección del virus, de modo que, en efecto, se estudian dos proteomas (del virus y su huésped). ^[6]

Importancia en el cáncer

El proteoma se puede utilizar para analizar comparativamente diferentes líneas celulares cancerosas. Se han utilizado estudios proteómicos para identificar la probabilidad de metástasis en las líneas celulares de cáncer de vejiga KK47 e YTS1 y se encontró que tenían 36 proteínas no reguladas y 74 proteínas reguladas negativamente. ^[7] Las diferencias en la expresión de proteínas pueden ayudar a identificar nuevos mecanismos de señalización del cáncer.

Se han encontrado biomarcadores de cáncer mediante análisis proteómicos basados en espectrometría de masas . El uso de la proteómica o el estudio del proteoma es un paso adelante en la medicina personalizada para adaptar cócteles de fármacos al perfil proteómico y genómico específico del paciente. ^[8] El análisis de líneas celulares de cáncer de ovario mostró que los biomarcadores putativos para el cáncer de ovario incluyen "α-enolasa (ENOA), factor de elongación Tu , mitocondrial (EFTU), gliceraldehído-3-fosfato deshidrogenasa (G3P) , proteína estrés-70, mitocondrial (GRP75), apolipoproteína A-1 (APOA1) , peroxiredoxina (PRDX2) y anexina A (ANXA) ". ^[9]

Los análisis proteómicos comparativos de 11 líneas celulares demostraron la similitud entre los procesos metabólicos de cada línea celular; En este estudio se identificaron completamente 11.731 proteínas. Las proteínas domésticas tienden a mostrar una mayor variabilidad entre líneas celulares. ^[10]

Aún no se comprende bien la resistencia a ciertos medicamentos contra el cáncer. El análisis proteómico se ha utilizado para identificar proteínas que pueden tener propiedades farmacológicas contra el cáncer, específicamente para el fármaco contra el cáncer de colon irinotecán . ^[11] Los estudios de la línea celular de adenocarcinoma LoVo demostraron que 8 proteínas no estaban reguladas y 7 proteínas estaban reguladas negativamente. Las proteínas que mostraron una expresión diferencial estuvieron involucradas en procesos como la transcripción, la apoptosis y la proliferación/diferenciación celular, entre otros.

El proteoma en los sistemas bacterianos.

Se han realizado análisis proteómicos en diferentes tipos de bacterias para evaluar sus reacciones metabólicas ante diferentes condiciones. Por ejemplo, en bacterias como Clostridium y Bacillus , se utilizaron análisis proteómicos para investigar cómo diferentes proteínas ayudan a que las esporas de cada una de estas bacterias germinen después de un período prolongado de latencia. ^[12] Para comprender mejor cómo eliminar adecuadamente las esporas, se debe realizar un análisis proteómico.

Historia

Marc Wilkins acuñó el término proteoma ^[13] en 1994 en un simposio sobre "Electroforesis 2D: de mapas de proteínas a genomas" celebrado en Siena, Italia. Apareció impreso en 1995, ^[14] con la publicación de parte de su tesis doctoral. Wilkins utilizó el término para describir el complemento completo de proteínas expresadas por un genoma, célula, tejido u organismo.

Tamaño y contenido

Los genomas de virus y procariotas codifican un proteoma relativamente bien definido, ya que cada proteína se puede predecir con gran confianza, basándose en su marco de lectura abierto (en virus que van desde ~3 a ~1000, en bacterias que van desde aproximadamente 500 proteínas a aproximadamente 10,000). ). ^[15] Sin embargo, la mayoría de los algoritmos de predicción de proteínas utilizan ciertos límites, como 50 o 100 aminoácidos, por lo que dichas predicciones a menudo pasan por alto las proteínas pequeñas. ^[16] En eucariotas, esto se vuelve mucho más complicado ya que se puede producir más de una proteína a partir de la mayoría de los genes debido al empalme alternativo (por ejemplo, el proteoma humano codifica alrededor de 20.000 proteínas, pero algunas estimaciones predijeron 92.179 proteínas ^{[ cita necesaria ]} de las cuales 71.173 son empalmes variantes ^{[ cita necesaria ]} ). ^[17]

Asociación del tamaño del proteoma con la capacidad de reparación del ADN.

El concepto de “restricción proteómica” es que la capacidad de reparación del ADN se correlaciona positivamente con el contenido de información de un genoma , que, a su vez, está aproximadamente relacionado con el tamaño del proteoma. ^[18] En bacterias , arqueas y virus de ADN , la capacidad de reparación del ADN está relacionada positivamente con el contenido de información del genoma y con el tamaño del genoma. ^[18] La “restricción proteómica” propone que los moduladores de las tasas de mutación, como los genes de reparación del ADN, están sujetos a una presión de selección proporcional a la cantidad de información en un genoma. ^[18]

Proteoformas . Existen diferentes factores que pueden agregar variabilidad a las proteínas. Los SAP (polimorfismos de un solo aminoácido) y los polimorfismos de un solo nucleótido no sinónimos (nsSNP) pueden conducir a diferentes "proteoformas" ^[19] o "proteomorfos". Estimaciones recientes han encontrado ~135 000 cSNP no sinónimos validados actualmente alojados en SwissProt. En dbSNP, hay 4,7 millones de cSNP candidatos, pero solo ~670.000 cSNP se han validado en el conjunto de 1.000 genomas como cSNP no sinónimos que cambian la identidad de un aminoácido en una proteína. ^[19]

Proteoma oscuro . El término proteoma oscuro acuñado por Perdigão y colegas define regiones de proteínas que no tienen una homología de secuencia detectable con otras proteínas de estructura tridimensional conocida y, por lo tanto, no pueden modelarse mediante homología . Para 546.000 proteínas Swiss-Prot, se encontró que entre el 44% y el 54% del proteoma en eucariotas y virus era "oscuro", en comparación con sólo ~14% en arqueas y bacterias . ^[20]

Proteoma humano . Actualmente, varios proyectos tienen como objetivo mapear el proteoma humano, incluido Human Proteome Map, ProteomicsDB, isoform.io y The Human Proteome Project (HPP). Al igual que el proyecto del genoma humano , estos proyectos buscan encontrar y recopilar evidencia de todos los genes codificadores de proteínas predichos en el genoma humano. El mapa del proteoma humano actualmente (octubre de 2020) afirma 17.294 proteínas y ProteomicsDB 15.479, utilizando diferentes criterios. El 16 de octubre de 2020, el HPP publicó un plan muy riguroso ^[21] que cubre más del 90% de los genes codificadores de proteínas previstos. Las proteínas se identifican a partir de una amplia gama de tejidos y tipos de células fetales y adultas, incluidas las células hematopoyéticas .

Métodos para estudiar el proteoma.

El análisis de proteínas resulta más difícil que el análisis de secuencias de ácidos nucleicos. Si bien sólo hay 4 nucleótidos que forman el ADN, hay al menos 20 aminoácidos diferentes que pueden formar una proteína. Además, actualmente no se conoce ninguna tecnología de alto rendimiento para hacer copias de una sola proteína. Hay numerosos métodos disponibles para estudiar proteínas, conjuntos de proteínas o el proteoma completo. De hecho, las proteínas a menudo se estudian de forma indirecta, por ejemplo utilizando métodos computacionales y análisis de genomas. A continuación se dan sólo algunos ejemplos.

Técnicas de separación y electroforesis.

La proteómica , el estudio del proteoma, se ha practicado en gran medida mediante la separación de proteínas mediante electroforesis en gel bidimensional . En la primera dimensión, las proteínas se separan mediante enfoque isoeléctrico , que resuelve las proteínas en función de la carga. En la segunda dimensión, las proteínas se separan por peso molecular mediante SDS-PAGE . El gel se tiñe con azul brillante de Coomassie o plata para visualizar las proteínas. Las manchas en el gel son proteínas que han migrado a lugares específicos.

Espectrometría de masas

Un espectrómetro de masas Orbitrap comúnmente utilizado en proteómica

La espectrometría de masas es uno de los métodos clave para estudiar el proteoma. ^[22] Algunos métodos importantes de espectrometría de masas incluyen la espectrometría de masas Orbitrap, MALDI (desorción/ionización láser asistida por matriz) y ESI (ionización por electropulverización). La toma de huellas dactilares de masas peptídicas identifica una proteína dividiéndola en péptidos cortos y luego deduce la identidad de la proteína comparando las masas peptídicas observadas con una base de datos de secuencias . La espectrometría de masas en tándem , por otro lado, puede obtener información de secuencia de péptidos individuales aislándolos, colisionándolos con un gas no reactivo y luego catalogando los iones fragmentados producidos. ^[23]

En mayo de 2014, se publicó en Nature un borrador de mapa del proteoma humano . ^[24] Este mapa se generó utilizando espectrometría de masas por transformada de Fourier de alta resolución. Este estudio perfiló 30 muestras humanas histológicamente normales, lo que dio como resultado la identificación de proteínas codificadas por 17.294 genes. Esto representa alrededor del 84% del total de genes codificadores de proteínas anotados.

cromatografía

La cromatografía líquida es una herramienta importante en el estudio del proteoma. Permite una separación muy sensible de diferentes tipos de proteínas en función de su afinidad por una matriz. Algunos métodos más nuevos para la separación e identificación de proteínas incluyen el uso de columnas capilares monolíticas, cromatografía de alta temperatura y electrocromatografía capilar. ^[25]

secar

La transferencia Western se puede utilizar para cuantificar la abundancia de determinadas proteínas. Utilizando anticuerpos específicos para la proteína de interés, es posible detectar la presencia de proteínas específicas a partir de una mezcla de proteínas.

Ensayos de complementación de proteínas y pantallas de interacción.

Los ensayos de complementación de fragmentos de proteínas se utilizan a menudo para detectar interacciones entre proteínas . El ensayo de dos híbridos en levadura es el más popular de ellos, pero existen numerosas variaciones, tanto utilizadas in vitro como in vivo . Los ensayos desplegables son un método para determinar las parejas de unión a proteínas de una proteína determinada. ^[26]

Predicción de la estructura de las proteínas.

La predicción de la estructura de proteínas se puede utilizar para proporcionar predicciones tridimensionales de la estructura de proteínas de proteomas completos. En 2022, una colaboración a gran escala entre EMBL-EBI y DeepMind proporcionó estructuras previstas para más de 200 millones de proteínas de todo el árbol de la vida. ^[27] Proyectos más pequeños también han utilizado la predicción de la estructura de las proteínas para ayudar a mapear el proteoma de organismos individuales; por ejemplo, isoform.io proporciona cobertura de múltiples isoformas de proteínas para más de 20.000 genes en el genoma humano . ^[28]

Bases de datos de proteínas

El Atlas de proteínas humanas contiene información sobre las proteínas humanas en células, tejidos y órganos. Todos los datos del recurso de conocimiento son de acceso abierto para permitir que los científicos, tanto del mundo académico como de la industria, accedan libremente a los datos para la exploración del proteoma humano. La organización ELIXIR ha seleccionado el atlas de proteínas como recurso principal debido a su importancia fundamental para una comunidad más amplia de ciencias biológicas.

La base de datos de proteomas plasmáticos Archivada el 27 de enero de 2021 en Wayback Machine contiene información sobre 10.500 proteínas del plasma sanguíneo . Debido a que el rango de contenidos de proteínas en el plasma es muy grande, es difícil detectar proteínas que tienden a ser escasas en comparación con las proteínas abundantes. Este es un límite analítico que posiblemente pueda ser una barrera para la detección de proteínas con concentraciones ultrabajas. ^[29]

Las bases de datos como neXtprot y UniProt son recursos centrales para datos proteómicos humanos.

Ver también

Referencias

^ Johnson, DT; Harris, RA; francés, S.; Blair, PV; Tú, J.; Bemis, KG; Wang, M.; Balaban, RS (2006). "Heterogeneidad tisular del proteoma mitocondrial de mamíferos". Revista americana de fisiología. Fisiología celular . 292 (2): c689-c697. doi :10.1152/ajpcell.00108.2006. PMID 16928776. S2CID 24412700.
^ Morgenstern, Marcel; Stiller, Sebastián B.; Lübbert, Philipp; Peikert, Christian D.; Dannenmaier, Stefan; Drepper, Friedel; Bueno, Uri; Hoess, Philipp; Feuerstein, Reinhild; Gebert, Michael; Bohnert, María (junio de 2017). "Definición de un proteoma mitocondrial de alta confianza a escala cuantitativa". Informes celulares . 19 (13): 2836–2852. doi :10.1016/j.celrep.2017.06.014. ISSN 2211-1247. PMC 5494306 . PMID 28658629.
↑ Gómez-Serrano, M (noviembre de 2018). "Mitoproteómica: abordar la disfunción mitocondrial en las enfermedades humanas". Oxid Med Cell Longev . 2018 : 1435934. doi : 10.1155/2018/1435934 . PMC 6250043 . PMID 30533169.
^ Uetz, P. (15 de octubre de 2004). "De ORFeomes a mapas de interacción de proteínas en virus". Investigación del genoma . 14 (10b): 2029-2033. doi : 10.1101/gr.2583304 . ISSN 1088-9051. PMID 15489322.
^ Maxwell, Karen L.; Frappier, Lori (junio de 2007). "Proteómica viral". Reseñas de Microbiología y Biología Molecular . 71 (2): 398–411. doi :10.1128/MMBR.00042-06. ISSN 1092-2172. PMC 1899879 . PMID 17554050.
^ Viswanathan, Kasinath; Früh, Klaus (diciembre de 2007). "Proteómica viral: evaluación global de los virus y su interacción con el huésped". Revisión de expertos en proteómica . 4 (6): 815–829. doi :10.1586/14789450.4.6.815. ISSN 1744-8387. PMID 18067418. S2CID 25742649.
^ Yang, Ganglong; Xu, Zhipeng; Lu, Wei; Li, Xiang; Sol, Chengwen; Guo, Jia; Xue, Peng; Guan, Feng (31 de julio de 2015). "Análisis cuantitativo de la expresión diferencial del proteoma en el cáncer de vejiga frente a las células de la vejiga normales mediante el método SILAC". MÁS UNO . 10 (7): e0134727. Código Bib : 2015PLoSO..1034727Y. doi : 10.1371/journal.pone.0134727 . ISSN 1932-6203. PMC 4521931 . PMID 26230496.
^ Un, Yao; Zhou, Li; Huang, Zhao; Niza, Édouard C.; Zhang, Haiyuan; Huang, Canhua (4 de mayo de 2019). "Conocimientos moleculares sobre la resistencia a los medicamentos contra el cáncer desde una perspectiva proteómica". Revisión de expertos en proteómica . 16 (5): 413–429. doi :10.1080/14789450.2019.1601561. ISSN 1478-9450. PMID 30925852. S2CID 88474614.
^ Cruz, Isa N.; Coley, Helen M.; Kramer, Holger B.; Madhuri, Thumuluru Kavitah; Safuwan, Nur a. METRO.; Angelino, Ana Rita; Yang, Min (1 de enero de 2017). "El análisis proteómico de tejidos y líneas celulares de cáncer de ovario revela proteínas asociadas a la resistencia a los medicamentos". Genómica y proteómica del cáncer . 14 (1): 35–51. doi :10.21873/cgp.20017. ISSN 1109-6535. PMC 5267499 . PMID 28031236.
^ Geiger, Tamar; Wehner, Anja; Schaab, Christoph; Cox, Jürgen; Mann, Matthias (marzo de 2012). "El análisis proteómico comparativo de once líneas celulares comunes revela una expresión ubicua pero variable de la mayoría de las proteínas". Proteómica molecular y celular . 11 (3): M111.014050. doi : 10.1074/mcp.M111.014050 . ISSN 1535-9476. PMC 3316730 . PMID 22278370.
^ Peng, Xing-Chen; Gong, Feng Ming; Wei, Meng; Chen, Xi; Chen, Ye; Cheng, Ke; Gao, Feng; Xu, Feng; Bi, Feng; Liu, Ji-Yan (diciembre de 2010). "Análisis proteómico de líneas celulares para identificar las proteínas de resistencia al irinotecán". Revista de Biociencias . 35 (4): 557–564. doi :10.1007/s12038-010-0064-9. ISSN 0250-5991. PMID 21289438. S2CID 6082637.
^ Chen, Yan; Barat, Bidisha; Ray, W. Keith; Timón, Richard F.; Melville, Stephen B.; Popham, David L. (15 de marzo de 2019). "Proteomas de membrana y transportadores de iones en Bacillus anthracis y Bacillus subtilis esporas latentes y germinantes". Revista de Bacteriología . 201 (6). doi :10.1128/JB.00662-18. ISSN 0021-9193. PMC 6398275 . PMID 30602489.
^ Wilkins, Marc (diciembre de 2009). "Minería de datos proteómica". Revisión de expertos en proteómica . 6 (6). Inglaterra : 599–603. doi :10.1586/epr.09.81. PMID 19929606. S2CID 207211912.
^ Wasinger VC, Cordwell SJ, Cerpa-Poljak A, Yan JX, Gooley AA, Wilkins MR, Duncan MW, Harris R, Williams KL, Humphery-Smith I (1995). "Avances en el mapeo de productos genéticos de Mollicutes: Mycoplasma genitalium". Electroforesis . 16 (1): 1090–94. doi : 10.1002/elps.11501601185. PMID 7498152. S2CID 9269742.
^ Kozlowski, LP (26 de octubre de 2016). "Proteome-pI: base de datos del punto isoeléctrico del proteoma". Investigación de ácidos nucleicos . 45 (D1): D1112-D1116. doi :10.1093/nar/gkw978. PMC 5210655 . PMID 27789699.
^ Leslie, Mitch (18 de octubre de 2019). "Impacto descomunal". Ciencia . 366 (6463): 296–299. Código Bib : 2019 Ciencia... 366.. 296L. doi : 10.1126/ciencia.366.6463.296. ISSN 0036-8075. PMID 31624194. S2CID 204774732.
^ Uniprot, Consorcio (2014). "UniProt: un centro de información sobre proteínas". Investigación de ácidos nucleicos . 43 (D1): D204–D212. doi : 10.1093/nar/gku989. ISSN 0305-1048. PMC 4384041 . PMID 25348405.
^ abc Acosta S, Carela M, García-González A, Ginés M, Vicens L, Cruet R, Massey SE. La reparación del ADN está asociada con el contenido de información en bacterias, arqueas y virus del ADN. J Hered. 2015 septiembre-octubre;106(5):644-59. doi: 10.1093/jhered/esv055. Publicación electrónica del 29 de agosto de 2015. PMID: 26320243
^ ab Aebersold, Ruedi; Agar, Jeffrey N; Amster, yo Jonathan; panadero, Mark S; Bertozzi, Carolyn R; Boja, Emily S; Costello, Catherine E; Cravatt, Benjamín F; Fenselau, Catalina; García, Benjamín A; Ge, Ying (marzo de 2018). "¿Cuántas proteoformas humanas hay?". Biología Química de la Naturaleza . 14 (3): 206–214. doi :10.1038/nchembio.2576. hdl :1721.1/120977. ISSN 1552-4450. PMC 5837046 . PMID 29443976.
^ Perdigão, Nelson; et al. (2015). "Características inesperadas del proteoma oscuro". PNAS . 112 (52): 15898–15903. Código Bib : 2015PNAS..11215898P. doi : 10.1073/pnas.1508380112 . PMC 4702990 . PMID 26578815.
^ Adhikari, S (octubre de 2020). "Un modelo de alto rigor del proteoma humano". Comunicaciones de la naturaleza . 11 (1): 5301. Código bibliográfico : 2020NatCo..11.5301A. doi :10.1038/s41467-020-19045-9. PMC 7568584 . PMID 33067450.
^ Altelaar, AF; Muñoz, J; Diablos, AJ (enero de 2013). "Proteómica de próxima generación: hacia una visión integradora de la dinámica del proteoma". Naturaleza Reseñas Genética . 14 (1): 35–48. doi :10.1038/nrg3356. PMID 23207911. S2CID 10248311.
^ Wilhelm, Mathías; Schlegl, Judith; Hahne, Hannes; Gholami, Amin Moghaddas; Lieberenz, Marcos; Savitski, Mijaíl M.; Ziegler, Emanuel; Butzmann, Lars; Gessulat, Sigfrido; Marx, Harald; Mathieson, Toby; Lemeer, Simone; Schnatbaum, Karsten; Reimer, Ulf; Wenschuh, Holger; Mollenhauer, Martín; Slotta-Huspenina, Julia; Boese, Joos-Hendrik; Bantscheff, Marcos; Gerstmair, Anja; Faerber, Franz; Kuster, Bernhard (2014). "Borrador del proteoma humano basado en espectrometría de masas". Naturaleza . 509 (7502): 582–7. Código Bib :2014Natur.509..582W. doi : 10.1038/naturaleza13319. PMID 24870543. S2CID 4467721. Archivado desde el original el 2018-08-20 . Consultado el 29 de septiembre de 2016 .
^ Kim, Min-Sik; et al. (mayo de 2014). "Un borrador de mapa del proteoma humano". Naturaleza . 509 (7502): 575–81. Código Bib :2014Natur.509..575K. doi : 10.1038/naturaleza13302. PMC 4403737 . PMID 24870542.
^ Shi, Yang; Xiang, Rong; Horváth, Csaba; Wilkins, James A. (22 de octubre de 2004). "El papel de la cromatografía líquida en proteómica". Revista de cromatografía A. Química bioanalítica: perspectivas y avances recientes con reconocimiento de Barry L. Karger. 1053 (1): 27–36. doi :10.1016/j.chroma.2004.07.044. ISSN 0021-9673. PMID 15543969.
^ "Ensayos desplegables - EE. UU.". www.thermofisher.com . Consultado el 5 de diciembre de 2019 .
^ Callaway, Ewen (28 de julio de 2022). "'Todo el universo de las proteínas: la IA predice la forma de casi todas las proteínas conocidas ". Naturaleza . 608 (7921): 15-16. Código Bib :2022Natur.608...15C. doi : 10.1038/d41586-022-02083-2 . PMID 35902752. S2CID 251159714.
^ Sommer, Markus J.; Cha, Sooyoung; Varabyou, Ales; Rincón, Natalia; Parque, Sukhwan; Minkin, Ilia; Pertea, Mihaela; Steinegger, Martín; Salzberg, Steven L. (15 de diciembre de 2022). "Identificación de isoformas guiada por estructura para el transcriptoma humano". eVida . 11 : e82556. doi : 10.7554/eLife.82556 . PMC 9812405 . PMID 36519529.
^ Ponomarenko, Elena A.; Poverennaya, Ekaterina V.; Ilgisonis, Ekaterina V.; Pyatnitskiy, Mikhail A.; Kopylov, Arthur T.; Zgoda, Víctor G.; Lisitsa, Andrey V.; Archakov, Alejandro I. (2016). "El tamaño del proteoma humano: el ancho y la profundidad". Revista Internacional de Química Analítica . 2016 : 7436849. doi : 10.1155/2016/7436849 . ISSN 1687-8760. PMC 4889822 . PMID 27298622.

enlaces externos

base de datos PIR
Base de datos UniProt
Base de datos Pfam en los archivos web de la Biblioteca del Congreso (archivado el 6 de mayo de 2011)