El Human Protein Atlas (HPA) es un programa sueco iniciado en 2003 con el objetivo de mapear todas las proteínas humanas en células , tejidos y órganos mediante la integración de varias tecnologías ómicas , incluidas imágenes basadas en anticuerpos , proteómica basada en espectrometría de masas , Transcriptómica y biología de sistemas . Todos los datos del recurso de conocimiento son de acceso abierto para permitir que los científicos, tanto del mundo académico como de la industria, accedan libremente a los datos para la exploración del proteoma humano . En junio de 2023 se lanzó la versión 23 donde se introdujo una nueva sección de Interacción que contiene redes de interacción proteína-proteína humana para más de 11.000 genes que agregarán nuevos aspectos en términos de función de las proteínas.
El recurso ahora incluye doce secciones separadas con información complementaria sobre todas las proteínas humanas. Todos los datos se han actualizado en aproximadamente 5 millones de páginas web individuales. El programa Human Protein Atlas ya ha contribuido a varios miles de publicaciones en el campo de la biología y las enfermedades humanas y fue seleccionado por la organización ELIXIR como recurso central europeo debido a su importancia fundamental para una comunidad más amplia de ciencias de la vida. El consorcio HPA está financiado por la Fundación Knut y Alice Wallenberg .
Doce secciones
El Atlas de la proteína humana consta de doce secciones:
- La sección Tejido [1] del Atlas de proteínas humanas se centra en los perfiles de expresión en tejidos humanos de genes tanto a nivel de ARNm como de proteína. Los datos de expresión de proteínas de 44 tipos de tejido humano normal se derivan de perfiles de proteínas basados en anticuerpos utilizando inmunohistoquímica convencional y múltiple . Todas las imágenes subyacentes de tejidos normales teñidos con inmunohistoquímica están disponibles junto con anotaciones basadas en conocimientos de los niveles de expresión de proteínas.
- La sección Cerebro [2] proporciona un perfil espacial completo del cerebro, incluida una descripción general de la expresión de proteínas en el cerebro de los mamíferos basada en la integración de datos de humanos, cerdos y ratones. Los datos de transcriptómica combinados con la localización in situ de proteínas basada en afinidad hasta el detalle de una sola célula están disponibles en este subatlas centrado en el cerebro del Human Protein Atlas. Los datos presentados son para genes humanos y sus ortólogos uno a uno en cerdos y ratones. Las páginas de resumen de genes proporcionan el panorama de expresión jerárquica desde 13 regiones principales del cerebro hasta núcleos y subcampos individuales para cada gen codificante de proteínas. Para proteínas seleccionadas, hay disponibles imágenes de alto contenido para explorar la distribución de proteínas celulares y subcelulares. Además, la sección Cerebro contiene listas de genes con expresión elevada en una o un grupo de regiones para ayudar al usuario a identificar perfiles de expresión de proteínas únicos relacionados con la fisiología y la función.
- La sección Tipo de célula única [3] contiene información basada en datos de secuenciación de ARN de célula única (scRNAseq) de 31 tejidos humanos, incluidas células mononucleares de sangre periférica (PBMC). Los datos están vinculados a secciones de tejido teñidas inmunohistoquímicamente generadas internamente y presentadas en la sección Tejido para visualizar los patrones de expresión de proteínas espaciales correspondientes. El análisis scRNAseq se basó en datos de expresión de todo el genoma disponibles públicamente y comprende todos los genes codificadores de proteínas en 557 grupos de tipos de células individuales correspondientes a 15 grupos de tipos de células diferentes. Se realizó una clasificación de especificidad para determinar la cantidad de genes elevados en estos tipos de células individuales. Los genes expresados en cada uno de los tipos de células se pueden explorar en gráficos y gráficos de barras UMAP interactivos, con enlaces a las tinciones inmunohistoquímicas correspondientes en tejidos humanos.
- La sección Tipo de célula de tejido contiene predicciones de especificidad de expresión de tipo celular para todos los genes codificantes de proteínas humanas, generadas mediante análisis de red integrado de datos masivos de RNAseq disponibles públicamente. Se utiliza una clasificación de especificidad para predecir qué genes están enriquecidos en cada tipo de célula constituyente dentro de un tejido individual. Los datos se pueden explorar tejido por tejido, junto con secciones de tejido teñidas inmunohistoquímicamente generadas internamente. Además, un análisis del tipo de célula central se centra en los tipos de células que se encuentran en todos, o en la mayoría, de los tejidos perfilados, por ejemplo, células endoteliales o macrófagos. Aquí se detallan los genes con especificidad prevista en estos tipos de células centrales en múltiples tejidos.
- La sección Patología [4] contiene información basada en datos de expresión de ARNm y proteínas de 17 formas diferentes de cáncer humano, junto con millones de imágenes de secciones de tejido teñidas inmunohistoquímicamente generadas internamente y gráficos de Kaplan-Meier que muestran la correlación entre la expresión de ARNm de cada ser humano. gen proteico y supervivencia del paciente con cáncer.
- La sección Enfermedad contiene información sobre los niveles de proteínas en sangre en pacientes con diferentes enfermedades y destaca las proteínas asociadas con estas enfermedades mediante análisis de expresión diferencial y una estrategia de predicción de enfermedades basada en el aprendizaje automático.
- La sección Células inmunes [5] contiene información de células individuales sobre perfiles de expresión de ARN en todo el genoma de genes codificadores de proteínas humanas que cubren diversas células B y T, monocitos, granulocitos y células dendríticas. El análisis transcriptómico cubre 18 tipos de células aisladas con clasificación celular e incluye una clasificación basada en la especificidad, distribución y grupo de expresión en todas las células inmunes.
- La sección Proteína sanguínea [6] presenta las concentraciones plasmáticas estimadas de las proteínas detectadas en la sangre humana a partir de estudios proteómicos basados en espectrometría de masas, datos de ensayos inmunológicos publicados y un estudio longitudinal basado en el ensayo de extensión de proximidad (PEA). Además, se presenta un análisis del "secretoma humano" que incluye la anotación de los genes que se predice que se secretarán activamente en la sangre humana, así como en otros compartimentos o sistemas de órganos del cuerpo humano, como el tracto digestivo o el cerebro.
- La sección Subcelular [7] del Human Protein Atlas proporciona información de alta resolución sobre la expresión y distribución espaciotemporal de proteínas codificadas por 13147 genes (65% de los genes codificadores de proteínas humanas). Para cada gen, se ha investigado la distribución subcelular de la proteína mediante inmunofluorescencia (ICC-IF) y microscopía confocal en hasta tres líneas celulares diferentes, seleccionadas de un panel de 37 líneas celulares utilizadas en el corte subcelular. Tras el análisis de imágenes, la localización subcelular de la proteína se clasificó en uno o más de 35 orgánulos diferentes y estructuras subcelulares finas. Además, la sección incluye una anotación de genes que muestran variación unicelular en los niveles de expresión de proteínas y/o distribución subcelular, así como un análisis extendido de la dependencia del ciclo celular de tales variaciones.
- La sección Línea celular contiene información sobre los perfiles de expresión de ARN de todo el genoma de genes codificadores de proteínas humanas en 1206 líneas celulares humanas, incluidas 1132 líneas celulares cancerosas. El análisis transcriptómico incluye clasificación basada en análisis de especificidad en 28 tipos de cáncer, análisis de distribución y expresión en todas las líneas celulares y, para tipos de cáncer seleccionados, también análisis de similitud de las líneas celulares con su tipo de cáncer correspondiente.
- La sección Estructura contiene información sobre la estructura tridimensional de las proteínas humanas.
- La sección Interacción presenta datos sobre redes de interacción basadas en interacciones proteína-proteína de la base de datos IntAct [8] y vías metabólicas del Atlas Metabólico. [9]
Características adicionales
Además de las doce secciones de HPA, que exploran la expresión de genes y proteínas, hay varias funciones disponibles en el sitio web de HPA para ayudar a la comunidad de investigación, incluidos recursos externos integrados, como Metabolic Atlas, material educativo y datos descargables de forma gratuita.
- La sección "Aprender" de HPA incluye recursos educativos, incluida información sobre aplicaciones y técnicas basadas en anticuerpos, un diccionario de histología y vídeos educativos en 3D. El diccionario es una herramienta interactiva para la exploración gratuita en pantalla completa de imágenes de diapositivas completas de órganos y tejidos humanos normales, tejidos cancerosos y estructuras celulares, guiada con anotaciones detalladas de todos los elementos estructurales principales. HPA ha producido vídeos educativos que muestran la exploración del cuerpo humano en 3D, utilizando perfiles de tejidos basados en anticuerpos y microscopía de lámina luminosa. Las películas están disponibles en el sitio web de HPA y en un canal de YouTube.
- Los conjuntos de datos utilizados en HPA se ponen a disposición de forma gratuita para fomentar más estudios dentro de la comunidad de investigación. El acceso a los extensos conjuntos de datos se brinda a través de la página de datos descargables de HPA, donde están disponibles 29 archivos descargables diferentes que contienen datos de todo el genoma en varios ensayos.
Historia
El programa Human Protein Atlas se inició en 2003 y fue financiado por la organización sin fines de lucro Knut and Alice Wallenberg Foundation (KAW). El sitio principal del proyecto es el Real Instituto de Tecnología (KTH), Facultad de Ciencias de la Ingeniería en Química, Biotecnología y Salud (Estocolmo, Suecia). Además, el proyecto involucra a grupos de investigación de la Universidad de Uppsala, el Instituto Karolinska, la Universidad Tecnológica de Chalmers y la Universidad de Lund, así como varias colaboraciones internacionales presentes y pasadas iniciadas con grupos de investigación en Europa, Estados Unidos, Corea del Sur, China e India. El profesor Mathias Uhlén es el director del programa.
La investigación que sustenta el inicio de la exploración de todo el proteoma humano en el programa Human Protein Atlas se llevó a cabo a finales de los años 90 y principios de los 2000. Se llevó a cabo un estudio piloto que emplea una estrategia de proteómica de afinidad utilizando anticuerpos purificados por afinidad generados contra fragmentos de proteínas humanas recombinantes para un perfil de proteínas del cromosoma 21 en todo el cromosoma. [10] También se llevaron a cabo otros proyectos para establecer procesos de afinidad paralela y automatizada. Purificación de anticuerpos monoespecíficos y su validación. [11] [12]
Investigación
Los anticuerpos y antígenos, producidos en el flujo de trabajo de Human Protein Atlas, se utilizan en proyectos de investigación para estudiar posibles biomarcadores en diversas enfermedades, como cáncer de mama, cáncer de próstata, cáncer de colon, diabetes, enfermedades autoinmunes, cáncer de ovario e insuficiencia renal. [13] [14] [15] [16] [17] [18]
Los investigadores involucrados en los proyectos Human Protein Atlas comparten protocolos y detalles de métodos en un grupo de acceso abierto en protocolos.io. [19] Se realiza un gran esfuerzo para validar los reactivos de anticuerpos utilizados para la elaboración de perfiles de tejidos y células, y la HPA ha implementado estrictos criterios de validación de anticuerpos según lo sugerido por el Grupo de Trabajo Internacional para la Validación de Anticuerpos (IWGAV). [20] [21] [22]
Colaboraciones
El programa Human Protein Atlas ha participado en 9 proyectos de investigación de la UE ENGAGE, PROSPECTS, BIO_NMD, AFFINOMICS, CAGEKID, EURATRANS, ITFoM, DIRECT y PRIMES.
Ver también
Referencias
El texto se copió de The Human Protein Atlas, que está disponible bajo una licencia Creative Commons Attribution-ShareAlike 3.0 Unported.
- ^ Uhlén M , Fagerberg L, Hallström BM, Lindskog C, Oksvold P, Mardinoglu A, et al. (Enero de 2015). "Proteómica. Mapa tisular del proteoma humano". Ciencia . 347 (6220): 1260419. doi : 10.1126/science.1260419. PMID 25613900. S2CID 802377.
- ^ Sjöstedt, E; Zhong, W; Fagerberg, L; Karlsson, M; Mitsios, N; Adori, C; Oksvold, P; Edfors, F; Limiszewska, A; Hikmet, F; Huang, J; Du, Y; Lin, L; Dong, Z; Yang, L; Liu, X; Jiang, H; Xu, X; Wang, J; Yang, H; Bolund, L; Mardinoglu, A; Zhang, C; von Feilitzen, K; Lindskog, C; Pontén, F; Luo, Y; Hökfelt, T; Uhlén, M; Mulder, J (2020). "Un atlas de los genes codificadores de proteínas en el cerebro humano, de cerdo y de ratón". Ciencia . 367 (6482). doi : 10.1126/ciencia.aay5947. PMID 32139519. S2CID 212560645.
- ^ Karlsson, M; Zhang, C; Méar, L; Zhong, W; Digré, A; Katona, B; Sjöstedt, E; Mayordomo, L; Odeberg, J; Dusart, P; Edfors, F; Oksvold, P; von Feilitzen, K; Zwahlen, M; Arif, M; Altay, O; Li, X; Ozcán, M; Mardinoglu, A; Fagerberg, L; Mulder, J; Luo, Y; Ponten, F; Uhlén, M; Lindskog, C (julio de 2021). "Un mapa transcriptómico de tipo unicelular de tejidos humanos". Avances científicos . 7 (31). Código Bib : 2021SciA....7.2169K. doi :10.1126/sciadv.abh2169. PMC 8318366 . PMID 34321199.
- ^ Uhlen, M; Zhang, C; Lee, S; Sjöstedt, E; Fagerberg, L; Bidkhori, G; Benfeitas, R; Arif, M; Liu, Z; Edfors, F; Sanli, K; von Feilitzen, K; Oksvold, P; Lundberg, E; Hober, S; Nilsson, P; Mattsson, J; Schwenk, JM; Brunnström, H; Glimelio, B; Sjoblom, T; Edqvist, PH; Djureinovic, D; Micke, P; Lindskog, C; Mardinoglu, A; Ponten, F (18 de agosto de 2017). "Un atlas de patología del transcriptoma del cáncer humano". Ciencia . 357 (6352). doi : 10.1126/ciencia.aan2507 . PMID 28818916. S2CID 206659235.
- ^ Uhlen, M; Karlsson, MJ; Zhong, W; Tebani, A; Pou, C; Mikes, J; Lakshmikanth, T; Forsström, B; Edfors, F; Odeberg, J; Mardinoglu, A; Zhang, C; von Feilitzen, K; Mulder, J; Sjöstedt, E; Hober, A; Oksvold, P; Zwahlen, M; Ponten, F; Lindskog, C; Sivertsson, Å; Fagerberg, L; Brodin, P (20 de diciembre de 2019). "Un análisis transcriptómico de todo el genoma de genes codificadores de proteínas en células sanguíneas humanas". Ciencia . 366 (6472). doi : 10.1126/ciencia.aax9198. PMID 31857451. S2CID 209424418.
- ^ Uhlén, M; Karlsson, MJ; Hober, A; Svensson, AS; Scheffel, J; Kotol, D; Zhong, W; Tebani, A; Strandberg, L; Edfors, F; Sjöstedt, E; Mulder, J; Mardinoglu, A; Berlín, A; Ekblad, S; Dannemeyer, M; Kanje, S; Rockberg, J; Lundqvist, M; Malm, M; Volk, AL; Nilsson, P; Manberg, A; Dodig-Crnkovic, T; Alfiler, E; Zwahlen, M; Oksvold, P; von Feilitzen, K; Häussler, RS; Hong, MG; Lindskog, C; Ponten, F; Katona, B; Vuu, J; Lindstrom, E; Nielsen, J; Robinson, J; Ayoglu, B; Mahdessian, D; Sullivan, D; Thul, P; Danielsson, F; Stadler, C; Lundberg, E; Bergstrom, G; Gummesson, A; Voldborg, BG; Tegel, H; Hober, S; Forsström, B; Schwenk, JM; Fagerberg, L; Sivertsson, Å (26 de noviembre de 2019). "El secretoma humano". Señalización científica . 12 (609). doi : 10.1126/scisignal.aaz0274 . PMID 31772123. S2CID 208321549.
- ^ Thul, PJ; Åkesson, L; Wiking, M; Mahdessian, D; Geladaki, A; Ait Blal, H; Alm, T; Asplund, A; Bjork, L; Breckels, LM; Bäckström, A; Danielsson, F; Fagerberg, L; Otoño, J; Gatto, L; Gnann, C; Hober, S; Hjelmare, M; Johansson, F; Lee, S; Lindskog, C; Mulder, J; Mulvey, CM; Nilsson, P; Oksvold, P; Rockberg, J; Schutten, R; Schwenk, JM; Sivertsson, Å; Sjöstedt, E; Skogs, M; Stadler, C; Sullivan, DP; Tegel, H; Winsnes, C; Zhang, C; Zwahlen, M; Mardinoglu, A; Pontén, F; von Feilitzen, K; Lilley, KS; Uhlén, M; Lundberg, E (26 de mayo de 2017). "Un mapa subcelular del proteoma humano". Ciencia . 356 (6340). doi : 10.1126/ciencia.aal3321. PMID 28495876. S2CID 10744558.
- ^ Huerto, S; Ammari, M; Aranda, B; Breuza, L; Briganti, L; Broakes-Carter, F; Campbell, Nuevo Hampshire; Chavali, G; Chen, C; del Toro, N; Duesbury, M; Dumousseau, M; Galeota, E; Hinz, U; Iannuccelli, M; Jagannathan, S; Jiménez, R; Khadake, J; Lagreid, A; Licata, L; Amante, RC; Meldal, B; Melidoni, AN; Milagros, M; Peluso, D; Perfecto, L; Porras, P; Raghunath, A; Ricard-Blum, S; Roechert, B; Stutz, A; Tognolli, M; van Roey, K; Cesareni, G; Hermjakob, H (enero de 2014). "El proyecto MIntAct: IntAct como plataforma de curación común para 11 bases de datos de interacción molecular". Investigación de ácidos nucleicos . 42 (Problema de base de datos): D358-63. doi : 10.1093/nar/gkt1115. PMC 3965093 . PMID 24234451.
- ^ Robinson, JL; Kocabaş, P; Wang, H; Cholley, PE; Cocinero, D; Nilsson, A; Antón, M; Ferreira, R; Domenzain, yo; Billa, V; Limata, A; Hedin, A; Gustafsson, J; Kerkhoven, EJ; Svensson, LT; Palsson, BO; Mardinoglu, A; Hansson, L; Uhlén, M; Nielsen, J (24 de marzo de 2020). "Un atlas del metabolismo humano". Señalización científica . 13 (624). doi : 10.1126/scisignal.aaz1482. PMC 7331181 . PMID 32209698.
- ^ Agaton C, Galli J, Höidén Guthenberg I, Janzon L, Hansson M, Asplund A, Brundell E, Lindberg S, Ruthberg I, Wester K, Wurtz D, Höög C, Lundeberg J, Ståhl S, Pontén F, Uhlén M ( junio de 2003). "Proteómica de afinidad para el perfilado sistemático de proteínas de los productos genéticos del cromosoma 21 en tejidos humanos". Proteómica molecular y celular . 2 (6): 405–14. doi : 10.1074/mcp.M300022-MCP200 . PMID 12796447.
- ^ Falk R, Agaton C, Kiesler E, Jin S, Wieslander L, Visa N, Hober S, Ståhl S (diciembre de 2003). "Un concepto mejorado de expresión dual que genera anticuerpos de alta calidad para la investigación proteómica". Biotecnología y Bioquímica Aplicada . 38 (parte 3): 231–9. doi :10.1042/BA20030091. PMID 12875650. S2CID 43820440.
- ^ Uhlén M, Björling E, Agaton C, Szigyarto CA, Amini B, Andersen E, et al. (diciembre de 2005). "Un atlas de proteínas humanas para tejidos normales y cancerosos basado en la proteómica de anticuerpos". Proteómica molecular y celular . 4 (12): 1920–32. doi : 10.1074/mcp.M500279-MCP200 . PMID 16127175.
- ^ Jonsson L, Gaber A, Ulmert D, Uhlén M, Bjartell A, Jirström K (2011). "La alta expresión de RBM3 en el cáncer de próstata predice de forma independiente un riesgo reducido de recurrencia bioquímica y progresión de la enfermedad". Patología Diagnóstica . 6 : 91. doi : 10.1186/1746-1596-6-91 . PMC 3195697 . PMID 21955582.
- ^
- ^ Lindskog C, Asplund A, Engkvist M, Uhlen M, Korsgren O, Ponten F (junio de 2010). "Proteómica basada en anticuerpos para el descubrimiento y exploración de proteínas expresadas en islotes pancreáticos". Medicina del descubrimiento . 9 (49): 565–78. PMID 20587347.
- ^ Neiman M, Hedberg JJ, Dönnes PR, Schuppe-Koistinen I, Hanschke S, Schindler R, Uhlén M, Schwenk JM, Nilsson P (noviembre de 2011). "El perfil plasmático revela la fibulina-1 humana como marcador candidato para la insuficiencia renal". Revista de investigación del proteoma . 10 (11): 4925–34. doi :10.1021/pr200286c. PMID 21888404.
- ^ Nodin B, Fridberg M, Jonsson L, Bergman J, Uhlén M, Jirström K (2012). "La alta expresión de MCM3 es un biomarcador independiente de mal pronóstico y se correlaciona con una expresión reducida de RBM3 en una cohorte prospectiva de melanoma maligno". Patología Diagnóstica . 7 : 82. doi : 10.1186/1746-1596-7-82 . PMC 3433373 . PMID 22805320.
- ^ Schwenk JM, Igel U, Neiman M, Langen H, Becker C, Bjartell A, Ponten F, Wiklund F, Grönberg H, Nilsson P, Uhlen M (noviembre de 2010). "Hacia el perfilado de plasma de próxima generación mediante la recuperación de epítopos inducida por calor y ensayos basados en matrices". Proteómica molecular y celular . 9 (11): 2497–507. doi :10.1074/mcp.M110.001560. PMC 2984230 . PMID 20682762.
- ^ "Atlas de proteínas humanas - grupo de investigación sobre protocolos.io". protocolos.io . Consultado el 12 de diciembre de 2019 .
- ^ Uhlen, M; Bandrowski, A; Carr, S; Edwards, A; Ellenberg, J; Lundberg, E; Rimm, DL; Rodríguez, H; Hiltke, T; Snyder, M; Yamamoto, T (octubre de 2016). "Una propuesta para la validación de anticuerpos". Métodos de la naturaleza . 13 (10): 823–7. doi :10.1038/nmeth.3995. PMC 10335836 . PMID 27595404. S2CID 34259132.
- ^ Edfors, F; Hober, A; Linderbäck, K; Maddalo, G; Azimi, A; Sivertsson, Å; Tegel, H; Hober, S; Szigyarto, California; Fagerberg, L; von Feilitzen, K; Oksvold, P; Lindskog, C; Forsström, B; Uhlen, M (8 de octubre de 2018). "Validación mejorada de anticuerpos para aplicaciones de investigación". Comunicaciones de la naturaleza . 9 (1): 4130. Código bibliográfico : 2018NatCo...9.4130E. doi :10.1038/s41467-018-06642-y. PMC 6175901 . PMID 30297845.
- ^ Sivertsson, Å; Lindstrom, E; Oksvold, P; Katona, B; Hikmet, F; Vuu, J; Gustavsson, J; Sjöstedt, E; von Feilitzen, K; Kampf, C; Schwenk, JM; Uhlén, M; Lindskog, C (10 de noviembre de 2020). "La validación mejorada de anticuerpos permite el descubrimiento de proteínas faltantes". Revista de investigación del proteoma . 19 (12): 4766–4781. doi : 10.1021/acs.jproteome.0c00486. PMC 7723238 . PMID 33170010.