Base de datos de proteínas humanas
El Atlas de Proteínas Humanas (HPA) es un programa con sede en Suecia que comenzó en 2003 con el objetivo de mapear todas las proteínas humanas en células , tejidos y órganos utilizando la integración de varias tecnologías ómicas , incluidas las imágenes basadas en anticuerpos , la proteómica basada en espectrometría de masas , la transcriptómica y la biología de sistemas . Todos los datos en el recurso de conocimiento son de acceso abierto para permitir que los científicos, tanto del ámbito académico como de la industria, accedan libremente a los datos para la exploración del proteoma humano . En junio de 2023, se lanzó la versión 23, donde se introdujo una nueva sección de Interacción que contiene redes de interacción proteína-proteína humana para más de 11.000 genes que agregarán nuevos aspectos en términos de función de las proteínas.
El recurso incluye ahora doce secciones independientes con información complementaria sobre todas las proteínas humanas. Todos los datos se han actualizado en los aproximadamente 5 millones de páginas web individuales. El programa Atlas de Proteínas Humanas ya ha contribuido a varios miles de publicaciones en el campo de la biología y las enfermedades humanas y fue seleccionado por la organización ELIXIR como recurso central europeo debido a su importancia fundamental para una comunidad más amplia de ciencias de la vida. El consorcio HPA está financiado por la Fundación Knut y Alice Wallenberg .
Doce secciones
El Atlas de Proteínas Humanas consta de doce secciones:
- La sección Tejido [1] del Atlas de Proteínas Humanas se centra en los perfiles de expresión de genes en tejidos humanos, tanto a nivel de ARNm como de proteínas. Los datos de expresión de proteínas de 44 tipos de tejidos humanos normales se derivan de la elaboración de perfiles de proteínas basados en anticuerpos mediante inmunohistoquímica convencional y multiplex . Todas las imágenes subyacentes de tejidos normales teñidos mediante inmunohistoquímica están disponibles junto con una anotación basada en el conocimiento de los niveles de expresión de proteínas.
- La sección Cerebro [2] proporciona un perfil espacial completo del cerebro, que incluye una descripción general de la expresión de proteínas en el cerebro de los mamíferos basada en la integración de datos de humanos, cerdos y ratones. Los datos transcriptómicos combinados con la localización in situ de proteínas basada en la afinidad hasta el detalle de una sola célula están disponibles en este subatlas centrado en el cerebro del Atlas de Proteínas Humanas. Los datos presentados corresponden a genes humanos y sus ortólogos uno a uno en cerdos y ratones. Las páginas de resumen de genes proporcionan el panorama de expresión jerárquico desde 13 regiones principales del cerebro hasta núcleos individuales y subcampos para cada gen codificador de proteínas. Para proteínas seleccionadas, hay imágenes de alto contenido disponibles para explorar la distribución de proteínas celular y subcelular. Además, la sección Cerebro contiene listas de genes con expresión elevada en una o un grupo de regiones para ayudar al usuario a identificar perfiles de expresión de proteínas únicos vinculados con la fisiología y la función.
- La sección Tipo de célula única [3] contiene información basada en datos de secuenciación de ARN de células individuales (scRNAseq) de 31 tejidos humanos, incluidas células mononucleares de sangre periférica (PBMC). Los datos están vinculados a secciones de tejido teñidas inmunohistoquímicamente generadas internamente que se presentan en la sección Tejido para visualizar los patrones de expresión de proteínas espaciales correspondientes. El análisis de scRNAseq se basó en datos de expresión de todo el genoma disponibles públicamente y comprende todos los genes codificadores de proteínas en 557 grupos de tipos de células individuales correspondientes a 15 grupos de tipos de células diferentes. Se realizó una clasificación de especificidad para determinar la cantidad de genes elevados en estos tipos de células individuales. Los genes expresados en cada uno de los tipos de células se pueden explorar en gráficos UMAP interactivos y gráficos de barras, con enlaces a las tinciones inmunohistoquímicas correspondientes en tejidos humanos.
- La sección Tipo de célula tisular contiene predicciones de especificidad de expresión de tipo celular para todos los genes codificadores de proteínas humanas, generadas mediante análisis de red integrado de datos de secuenciación de ARN masivos disponibles públicamente. Se utiliza una clasificación de especificidad para predecir qué genes están enriquecidos en cada tipo de célula constituyente dentro de un tejido individual. Los datos se pueden explorar tejido por tejido, junto con secciones de tejido teñidas inmunohistoquímicamente generadas internamente. Además, un análisis de tipo de célula central se centra en los tipos de células que se encuentran en todos o en la mayoría de los tejidos perfilados, por ejemplo, células endoteliales o macrófagos. Aquí, se detallan los genes con especificidad predicha en estos tipos de células centrales en múltiples tejidos.
- La sección Patología [4] contiene información basada en datos de expresión de ARNm y proteínas de 17 formas diferentes de cáncer humano, junto con millones de imágenes de secciones de tejido teñidas inmunohistoquímicamente generadas internamente y gráficos de Kaplan-Meier que muestran la correlación entre la expresión de ARNm de cada gen de proteína humana y la supervivencia del paciente con cáncer.
- La sección Enfermedades contiene información sobre los niveles de proteínas en la sangre de pacientes con diferentes enfermedades y destaca las proteínas asociadas con estas enfermedades mediante análisis de expresión diferencial y una estrategia de predicción de enfermedades basada en aprendizaje automático.
- La sección Células inmunitarias [5] contiene información de células individuales sobre perfiles de expresión de ARN de todo el genoma de genes codificadores de proteínas humanas que abarcan diversas células B y T, monocitos, granulocitos y células dendríticas. El análisis transcriptómico abarca 18 tipos de células aisladas mediante clasificación celular e incluye una clasificación basada en la especificidad, la distribución y el grupo de expresión en todas las células inmunitarias.
- La sección Proteínas de la sangre [6] presenta concentraciones plasmáticas estimadas de las proteínas detectadas en la sangre humana a partir de estudios proteómicos basados en espectrometría de masas, datos publicados de ensayos inmunológicos y un estudio longitudinal basado en el ensayo de extensión de proximidad (PEA). Además, se presenta un análisis del “secretoma humano” que incluye la anotación de los genes que se prevé que se secreten activamente a la sangre humana, así como a otros compartimentos o sistemas orgánicos del cuerpo humano, como el tracto digestivo o el cerebro.
- La sección Subcelular [7] del Atlas de Proteínas Humanas proporciona información de alta resolución sobre la expresión y la distribución espaciotemporal de las proteínas codificadas por 13147 genes (65% de los genes codificadores de proteínas humanas). Para cada gen, se ha investigado la distribución subcelular de la proteína mediante inmunofluorescencia (ICC-IF) y microscopía confocal en hasta tres líneas celulares diferentes, seleccionadas de un panel de 37 líneas celulares utilizadas en la sección subcelular. Tras el análisis de imágenes, se ha clasificado la localización subcelular de la proteína en uno o más de 35 orgánulos diferentes y estructuras subcelulares finas. Además, la sección incluye una anotación de genes que muestran variación unicelular en los niveles de expresión de proteínas y/o distribución subcelular, así como un análisis ampliado de la dependencia del ciclo celular de dichas variaciones.
- La sección de Líneas celulares contiene información sobre los perfiles de expresión de ARN de todo el genoma de genes codificadores de proteínas humanas en 1206 líneas celulares humanas, incluidas 1132 líneas celulares cancerosas. El análisis transcriptómico incluye una clasificación basada en el análisis de especificidad en 28 tipos de cáncer, análisis de distribución y grupos de expresión en todas las líneas celulares y, para tipos de cáncer seleccionados, también un análisis de similitud de las líneas celulares con su tipo de cáncer correspondiente.
- La sección Estructura contiene información sobre la estructura tridimensional de las proteínas humanas.
- La sección Interacción presenta datos sobre redes de interacción basadas en interacciones proteína-proteína de la base de datos IntAct [8] y vías metabólicas del Atlas Metabólico. [9]
Características adicionales
Además de las doce secciones de HPA que exploran la expresión de genes y proteínas, hay varias funciones disponibles en el sitio web de HPA para ayudar a la comunidad de investigación, incluidos recursos externos integrados, como el Atlas Metabólico, material educativo y datos descargables gratuitos.
- La sección “Aprender” de HPA incluye recursos educativos, incluida información sobre aplicaciones y técnicas basadas en anticuerpos, un diccionario de histología y videos educativos en 3D. El diccionario es una herramienta interactiva para la exploración gratuita en pantalla completa de imágenes de diapositivas completas de órganos y tejidos humanos normales, tejidos cancerosos y estructuras celulares, guiadas con anotaciones detalladas de todos los elementos estructurales principales. HPA ha producido videos educativos que muestran la exploración del cuerpo humano en 3D, utilizando perfiles de tejidos basados en anticuerpos y microscopía de lámina óptica. Las películas están disponibles en el sitio web de HPA, así como en un canal de YouTube.
- Los conjuntos de datos utilizados en HPA se ponen a disposición de forma gratuita para fomentar la realización de más estudios en la comunidad de investigación. El acceso a los amplios conjuntos de datos se realiza a través de la página de datos descargables de HPA, en la que se encuentran disponibles 29 archivos descargables diferentes que contienen datos de todo el genoma a través de varios ensayos.
Historia
El programa Atlas de Proteínas Humanas se inició en 2003 y está financiado por la organización sin fines de lucro Fundación Knut y Alice Wallenberg (KAW). El sitio principal del proyecto es el Instituto Real de Tecnología (KTH), Facultad de Ciencias de la Ingeniería en Química, Biotecnología y Salud (Estocolmo, Suecia). Además, el proyecto involucra a grupos de investigación de la Universidad de Uppsala, el Instituto Karolinska, la Universidad Tecnológica de Chalmers y la Universidad de Lund, así como varias colaboraciones internacionales actuales y pasadas iniciadas con grupos de investigación en Europa, Estados Unidos, Corea del Sur, China e India. El profesor Mathias Uhlén es el director del programa.
La investigación que sustenta el inicio de la exploración de todo el proteoma humano en el programa Atlas de Proteínas Humanas se llevó a cabo a finales de los años 1990 y principios de los años 2000. Se llevó a cabo un estudio piloto que empleaba una estrategia de proteómica de afinidad utilizando anticuerpos purificados por afinidad generados contra fragmentos de proteína humana recombinante para un perfil proteico de todo el cromosoma 21. [10] También se llevaron a cabo otros proyectos para establecer procesos para la purificación por afinidad paralela y automatizada de anticuerpos monoespecíficos y su validación. [11] [12]
Investigación
Los anticuerpos y antígenos producidos en el flujo de trabajo del Atlas de Proteínas Humanas se utilizan en proyectos de investigación para estudiar posibles biomarcadores en diversas enfermedades, como cáncer de mama, cáncer de próstata, cáncer de colon, diabetes, enfermedades autoinmunes, cáncer de ovario e insuficiencia renal. [13] [14] [15] [16] [17] [18]
Los investigadores que participan en los proyectos del Atlas de Proteínas Humanas comparten protocolos y detalles de métodos en un grupo de acceso abierto en protocols.io. [19] Se hace un gran esfuerzo para validar los reactivos de anticuerpos utilizados para la elaboración de perfiles de tejidos y células, y la HPA ha implementado criterios estrictos de validación de anticuerpos, tal como lo sugiere el Grupo de Trabajo Internacional para la Validación de Anticuerpos (IWGAV). [20] [21] [22]
Colaboraciones
El programa Atlas de Proteínas Humanas ha participado en 9 proyectos de investigación de la UE: ENGAGE, PROSPECTS, BIO_NMD, AFFINOMICS, CAGEKID, EURATRANS, ITFoM, DIRECT y PRIMES.
Véase también
Referencias
- El texto fue copiado de The Human Protein Atlas, que está disponible bajo una licencia Creative Commons Attribution-ShareAlike 3.0 Unported.
- ^ Uhlén M , Fagerberg L, Hallström BM, Lindskog C, Oksvold P, Mardinoglu A, et al. (enero de 2015). "Proteómica. Mapa tisular del proteoma humano". Science . 347 (6220): 1260419. doi :10.1126/science.1260419. PMID 25613900. S2CID 802377.
- ^ Sjöstedt, E; Zhong, W; Fagerberg, L; Karlsson, M; Mitsios, N; Adori, C; Oksvold, P; Edfors, F; Limiszewska, A; Hikmet, F; Huang, J; Du, Y; Lin, L; Dong, Z; Yang, L; Liu, X; Jiang, H; Xu, X; Wang, J; Yang, H; Bolund, L; Mardinoglu, A; Zhang, C; von Feilitzen, K; Lindskog, C; Pontén, F; Luo, Y; Hökfelt, T; Uhlén, M; Mulder, J (2020). "Un atlas de los genes codificadores de proteínas en el cerebro humano, de cerdo y de ratón". Ciencia . 367 (6482). doi : 10.1126/ciencia.aay5947. Número de modelo: PMID 32139519. Número de modelo: S2CID 212560645.
- ^ Karlsson, M; Zhang, C; Méar, L; Zhong, W; Digré, A; Katona, B; Sjöstedt, E; Mayordomo, L; Odeberg, J; Dusart, P; Edfors, F; Oksvold, P; von Feilitzen, K; Zwahlen, M; Arif, M; Altay, O; Li, X; Ozcán, M; Mardinoglu, A; Fagerberg, L; Mulder, J; Luo, Y; Ponten, F; Uhlén, M; Lindskog, C (julio de 2021). "Un mapa transcriptómico de tipo unicelular de tejidos humanos". Avances científicos . 7 (31). Código Bib : 2021SciA....7.2169K. doi :10.1126/sciadv.abh2169. PMC 8318366 . Número de modelo: PMID34321199.
- ^ Uhlen, M; Zhang, C; Lee, S; Sjöstedt, E; Fagerberg, L; Bidkhori, G; Benfeitas, R; Arif, M; Liu, Z; Edfors, F; Sanli, K; von Feilitzen, K; Oksvold, P; Lundberg, E; Hober, S; Nilsson, P; Mattsson, J; Schwenk, JM; Brunnström, H; Glimelio, B; Sjoblom, T; Edqvist, PH; Djureinovic, D; Micke, P; Lindskog, C; Mardinoglu, A; Ponten, F (18 de agosto de 2017). "Un atlas de patología del transcriptoma del cáncer humano". Ciencia . 357 (6352). doi : 10.1126/ciencia.aan2507 . Número de modelo: PMID 28818916. Número de modelo: S2CID 206659235.
- ^ Uhlen, M; Karlsson, MJ; Zhong, W; Tebani, A; Pou, C; Mikes, J; Lakshmikanth, T; Forsström, B; Edfors, F; Odeberg, J; Mardinoglu, A; Zhang, C; von Feilitzen, K; Mulder, J; Sjöstedt, E; Hober, A; Oksvold, P; Zwahlen, M; Ponten, F; Lindskog, C; Sivertsson, Å; Fagerberg, L; Brodin, P (20 de diciembre de 2019). "Un análisis transcriptómico de todo el genoma de genes codificadores de proteínas en células sanguíneas humanas". Ciencia . 366 (6472). doi : 10.1126/ciencia.aax9198. PMID 31857451. S2CID 209424418.
- ^ Uhlén, M; Karlsson, MJ; Hober, A; Svensson, AS; Scheffel, J; Kotol, D; Zhong, W; Tebani, A; Strandberg, L; Edfors, F; Sjöstedt, E; Mulder, J; Mardinoglu, A; Berlín, A; Ekblad, S; Dannemeyer, M; Kanje, S; Rockberg, J; Lundqvist, M; Malm, M; Volk, AL; Nilsson, P; Manberg, A; Dodig-Crnkovic, T; Alfiler, E; Zwahlen, M; Oksvold, P; von Feilitzen, K; Häussler, RS; Hong, MG; Lindskog, C; Ponten, F; Katona, B; Vuu, J; Lindstrom, E; Nielsen, J; Robinson, J; Ayoglu, B; Mahdessian, D; Sullivan, D; Thul, P; Danielsson, F; Stadler, C; Lundberg, E; Bergstrom, G; Gummesson, A; Voldborg, BG; Tegel, H; Hober, S; Forsström, B; Schwenk, JM; Fagerberg, L; Sivertsson, Å (26 de noviembre de 2019). "El secretoma humano". Señalización científica . 12 (609). doi : 10.1126/scisignal.aaz0274 . PMID 31772123. S2CID 208321549.
- ^ Thul, PJ; Åkesson, L; Wiking, M; Mahdessian, D; Geladaki, A; Ait Blal, H; Alm, T; Asplund, A; Bjork, L; Breckels, LM; Bäckström, A; Danielsson, F; Fagerberg, L; Otoño, J; Gatto, L; Gnann, C; Hober, S; Hjelmare, M; Johansson, F; Lee, S; Lindskog, C; Mulder, J; Mulvey, CM; Nilsson, P; Oksvold, P; Rockberg, J; Schutten, R; Schwenk, JM; Sivertsson, Å; Sjöstedt, E; Skogs, M; Stadler, C; Sullivan, DP; Tegel, H; Winsnes, C; Zhang, C; Zwahlen, M; Mardinoglu, A; Pontén, F; von Feilitzen, K; Lilley, KS; Uhlén, M; Lundberg, E (26 de mayo de 2017). "Un mapa subcelular del proteoma humano". Science . 356 (6340). doi :10.1126 /ciencia.aal3321. PMID 28495876. S2CID 10744558.
- ^ Huerto, S; Ammari, M; Aranda, B; Breuza, L; Briganti, L; Broakes-Carter, F; Campbell, Nuevo Hampshire; Chavali, G; Chen, C; del Toro, N; Duesbury, M; Dumousseau, M; Galeota, E; Hinz, U; Iannuccelli, M; Jagannathan, S; Jiménez, R; Khadake, J; Lagreid, A; Licata, L; Amante, RC; Meldal, B; Melidoni, AN; Milagros, M; Peluso, D; Perfecto, L; Porras, P; Raghunath, A; Ricard-Blum, S; Roechert, B; Stutz, A; Tognolli, M; van Roey, K; Cesareni, G; Hermjakob, H (enero de 2014). "El proyecto MIntAct: IntAct como plataforma de conservación común para 11 bases de datos de interacción molecular". Nucleic Acids Research . 42 (número de base de datos): D358-63. doi :10.1093/nar/gkt1115. PMC 3965093 . PMID 24234451.
- ^ Robinson, JL; Kocabaş, P; Wang, H; Cholley, PE; Cocinero, D; Nilsson, A; Antón, M; Ferreira, R; Domenzain, yo; Billa, V; Limata, A; Hedin, A; Gustafsson, J; Kerkhoven, EJ; Svensson, LT; Palsson, BO; Mardinoglu, A; Hansson, L; Uhlén, M; Nielsen, J (24 de marzo de 2020). "Un atlas del metabolismo humano". Señalización científica . 13 (624). doi : 10.1126/scisignal.aaz1482. PMC 7331181 . PMID 32209698.
- ^ Agaton C, Galli J, Höidén Guthenberg I, Janzon L, Hansson M, Asplund A, Brundell E, Lindberg S, Ruthberg I, Wester K, Wurtz D, Höög C, Lundeberg J, Ståhl S, Pontén F, Uhlén M ( junio de 2003). "Proteómica de afinidad para el perfilado sistemático de proteínas de los productos genéticos del cromosoma 21 en tejidos humanos". Proteómica molecular y celular . 2 (6): 405–14. doi : 10.1074/mcp.M300022-MCP200 . PMID 12796447.
- ^ Falk R, Agaton C, Kiesler E, Jin S, Wieslander L, Visa N, Hober S, Ståhl S (diciembre de 2003). "Un concepto mejorado de expresión dual, que genera anticuerpos de alta calidad para la investigación proteómica". Biotecnología y bioquímica aplicada . 38 (parte 3): 231–9. doi :10.1042/BA20030091. PMID 12875650. S2CID 43820440.
- ^ Uhlén M, Björling E, Agaton C, Szigyarto CA, Amini B, Andersen E, et al. (diciembre de 2005). "Atlas de proteínas humanas para tejidos normales y cancerosos basado en proteómica de anticuerpos". Molecular & Cellular Proteomics . 4 (12): 1920–32. doi : 10.1074/mcp.M500279-MCP200 . PMID 16127175.
- ^ Jonsson L, Gaber A, Ulmert D, Uhlén M, Bjartell A, Jirström K (2011). "La alta expresión de RBM3 en el cáncer de próstata predice de forma independiente un riesgo reducido de recurrencia bioquímica y progresión de la enfermedad". Patología diagnóstica . 6 : 91. doi : 10.1186/1746-1596-6-91 . PMC 3195697. PMID 21955582 .
- ^
- ^ Lindskog C, Asplund A, Engkvist M, Uhlen M, Korsgren O, Ponten F (junio de 2010). "Proteómica basada en anticuerpos para el descubrimiento y la exploración de proteínas expresadas en islotes pancreáticos". Discovery Medicine . 9 (49): 565–78. PMID 20587347.
- ^ Neiman M, Hedberg JJ, Dönnes PR, Schuppe-Koistinen I, Hanschke S, Schindler R, Uhlén M, Schwenk JM, Nilsson P (noviembre de 2011). "El perfil plasmático revela la fibulina-1 humana como marcador candidato para la insuficiencia renal". Revista de investigación del proteoma . 10 (11): 4925–34. doi :10.1021/pr200286c. PMID 21888404.
- ^ Nodin B, Fridberg M, Jonsson L, Bergman J, Uhlén M, Jirström K (2012). "La expresión elevada de MCM3 es un biomarcador independiente de mal pronóstico y se correlaciona con la expresión reducida de RBM3 en una cohorte prospectiva de melanoma maligno". Patología diagnóstica . 7 : 82. doi : 10.1186/1746-1596-7-82 . PMC 3433373 . PMID 22805320.
- ^ Schwenk JM, Igel U, Neiman M, Langen H, Becker C, Bjartell A, Ponten F, Wiklund F, Grönberg H, Nilsson P, Uhlen M (noviembre de 2010). "Hacia la próxima generación de perfiles de plasma mediante la recuperación de epítopos inducidos por calor y ensayos basados en matrices". Molecular & Cellular Proteomics . 9 (11): 2497–507. doi : 10.1074/mcp.M110.001560 . PMC 2984230 . PMID 20682762.
- ^ "Atlas de proteínas humanas - grupo de investigación en protocols.io". protocols.io . Consultado el 12 de diciembre de 2019 .
- ^ Uhlen, M; Bandrowski, A; Carr, S; Edwards, A; Ellenberg, J; Lundberg, E; Rimm, DL; Rodriguez, H; Hiltke, T; Snyder, M; Yamamoto, T (octubre de 2016). "Una propuesta para la validación de anticuerpos". Nature Methods . 13 (10): 823–7. doi :10.1038/nmeth.3995. PMC 10335836 . PMID 27595404. S2CID 34259132.
- ^ Edfors, F; Hober, A; Linderbäck, K; Maddalo, G; Azimi, A; Sivertsson, Å; Tegel, H; Hober, S; Szigyarto, California; Fagerberg, L; von Feilitzen, K; Oksvold, P; Lindskog, C; Forsström, B; Uhlen, M (8 de octubre de 2018). "Validación mejorada de anticuerpos para aplicaciones de investigación". Comunicaciones de la naturaleza . 9 (1): 4130. Código bibliográfico : 2018NatCo...9.4130E. doi :10.1038/s41467-018-06642-y. PMC 6175901 . PMID 30297845.
- ^ Sivertsson, Å; Lindstrom, E; Oksvold, P; Katona, B; Hikmet, F; Vuu, J; Gustavsson, J; Sjöstedt, E; von Feilitzen, K; Kampf, C; Schwenk, JM; Uhlén, M; Lindskog, C (10 de noviembre de 2020). "La validación mejorada de anticuerpos permite el descubrimiento de proteínas faltantes". Revista de investigación del proteoma . 19 (12): 4766–4781. doi : 10.1021/acs.jproteome.0c00486. PMC 7723238 . PMID 33170010.