Una superfamilia de proteínas es el grupo ( clado ) más grande de proteínas para el cual se puede inferir una ascendencia común (ver homología ). Por lo general, esta ascendencia común se infiere a partir del alineamiento estructural [1] y la similitud mecanística, incluso si no es evidente ninguna similitud de secuencia. [2] La homología de secuencia se puede deducir incluso si no es evidente (debido a la baja similitud de secuencia). Las superfamilias suelen contener varias familias de proteínas que muestran similitud de secuencia dentro de cada familia. El término clan de proteínas se usa comúnmente para las superfamilias de proteasas y glicosilhidrolasas según los sistemas de clasificación MEROPS y CAZy . [2] [3]
Las superfamilias de proteínas se identifican mediante varios métodos. Los miembros estrechamente relacionados pueden identificarse mediante métodos diferentes a los necesarios para agrupar a los miembros evolutivamente divergentes.
Similitud de secuencia
Históricamente, la similitud de diferentes secuencias de aminoácidos ha sido el método más común para inferir homología . [5] La similitud de secuencia se considera un buen predictor de parentesco, ya que secuencias similares son más probablemente el resultado de la duplicación de genes y la evolución divergente , en lugar del resultado de una evolución convergente . La secuencia de aminoácidos suele estar más conservada que la secuencia de ADN (debido al código genético degenerado ), por lo que es un método de detección más sensible. Dado que algunos de los aminoácidos tienen propiedades similares (p. ej., carga, hidrofobicidad, tamaño), las mutaciones conservadoras que los intercambian suelen tener una función neutra . Las regiones de secuencia más conservadas de una proteína a menudo corresponden a regiones funcionalmente importantes como sitios catalíticos y sitios de unión, ya que estas regiones son menos tolerantes a los cambios de secuencia.
El uso de similitud de secuencia para inferir homología tiene varias limitaciones. No existe un nivel mínimo de similitud de secuencia garantizado para producir estructuras idénticas. Durante largos períodos de evolución, las proteínas relacionadas pueden no mostrar ninguna similitud de secuencia detectable entre sí. En ocasiones, las secuencias con muchas inserciones y eliminaciones también pueden ser difíciles de alinear y, por lo tanto, identificar las regiones de secuencias homólogas. En el clan de proteasas PA , por ejemplo, no se conserva ni un solo residuo a través de la superfamilia, ni siquiera los de la tríada catalítica . Por el contrario, las familias individuales que forman una superfamilia se definen en función de su alineación de secuencias, por ejemplo, la familia de proteasa C04 dentro del clan PA.
Sin embargo, la similitud de secuencia es la forma de evidencia más comúnmente utilizada para inferir la relación, ya que el número de secuencias conocidas supera ampliamente el número de estructuras terciarias conocidas . [6] En ausencia de información estructural, la similitud de secuencia limita los límites de qué proteínas pueden asignarse a una superfamilia. [6]
Similitud estructural
La estructura está mucho más conservada evolutivamente que la secuencia, de modo que proteínas con estructuras muy similares pueden tener secuencias completamente diferentes. [7] En escalas de tiempo evolutivas muy largas, muy pocos residuos muestran una conservación de la secuencia de aminoácidos detectable; sin embargo, los elementos estructurales secundarios y los motivos estructurales terciarios están altamente conservados. También se pueden conservar algunas dinámicas de proteínas [8] y cambios conformacionales de la estructura de las proteínas, como se observa en la superfamilia de las serpinas . [9] En consecuencia, la estructura terciaria de las proteínas se puede utilizar para detectar homología entre proteínas incluso cuando no queda evidencia de relación en sus secuencias. Los programas de alineación estructural , como DALI , utilizan la estructura 3D de una proteína de interés para encontrar proteínas con pliegues similares. [10] Sin embargo, en raras ocasiones, las proteínas relacionadas pueden evolucionar hasta ser estructuralmente diferentes [11] y la relación sólo puede inferirse mediante otros métodos. [12] [13] [14]
Similitud mecanicista
El mecanismo catalítico de las enzimas dentro de una superfamilia suele conservarse, aunque la especificidad del sustrato puede ser significativamente diferente. [15] Los residuos catalíticos también tienden a aparecer en el mismo orden en la secuencia de proteínas. [16] Para las familias dentro del clan de proteasas PA, aunque ha habido una evolución divergente de los residuos de la tríada catalítica utilizados para realizar la catálisis, todos los miembros utilizan un mecanismo similar para realizar la catálisis nucleofílica covalente en proteínas, péptidos o aminoácidos. [17] Sin embargo, el mecanismo por sí solo no es suficiente para inferir la relación. Algunos mecanismos catalíticos han evolucionado de manera convergente varias veces de forma independiente, por lo que forman superfamilias separadas, [18] [19] [20] y en algunas superfamilias muestran una variedad de mecanismos diferentes (aunque a menudo químicamente similares). [15] [21]
Importancia evolutiva
Las superfamilias de proteínas representan los límites actuales de nuestra capacidad para identificar una ascendencia común. [22] Son el grupo evolutivo más grande basado en evidencia directa que es actualmente posible. Por lo tanto, se encuentran entre los eventos evolutivos más antiguos estudiados actualmente. Algunas superfamilias tienen miembros presentes en todos los reinos de la vida , lo que indica que el último ancestro común de esa superfamilia estuvo en el último ancestro común universal de toda la vida (LUCA). [23]
Los miembros de la superfamilia pueden pertenecer a diferentes especies, siendo la proteína ancestral la forma de la proteína que existía en la especie ancestral ( ortología ). Por el contrario, las proteínas pueden pertenecer a la misma especie, pero evolucionaron a partir de una única proteína cuyo gen se duplicó en el genoma ( parálogía ).
Diversificación
La mayoría de las proteínas contienen múltiples dominios. Entre el 66% y el 80% de las proteínas eucariotas tienen múltiples dominios, mientras que alrededor del 40% al 60% de las proteínas procarióticas tienen múltiples dominios. [5] Con el tiempo, muchas de las superfamilias de dominios se han mezclado. De hecho, es muy raro encontrar “superfamilias consistentemente aisladas”. [5] [1] Cuando los dominios se combinan, el orden de los dominios del terminal N al C (la "arquitectura de dominio") suele estar bien conservado. Además, el número de combinaciones de dominios que se ven en la naturaleza es pequeño en comparación con el número de posibilidades, lo que sugiere que la selección actúa sobre todas las combinaciones. [5]
Los miembros comparten una estructura tipo sándwich de dos láminas de hebras β antiparalelas ( pliegue Ig ) y participan en el reconocimiento, la unión y la adhesión . [30] [31]
Los miembros comparten un pliegue estresado de alta energía que puede sufrir un gran cambio conformacional , que generalmente se usa para inhibir las serina y cisteína proteasas al alterar su estructura. [9]
Los miembros comparten una gran estructura de barril α 8 β 8 . Es uno de los pliegues proteicos más comunes y la monofilia de esta superfamilia todavía está en duda. [35] [36]
Recursos de la superfamilia de proteínas
Varias bases de datos biológicas documentan superfamilias de proteínas y pliegues de proteínas, por ejemplo:
Pfam : base de datos de alineamientos y HMM de familias de proteínas
PROSITE - Base de datos de dominios, familias y sitios funcionales de proteínas
PASS2 - Alineación de proteínas como superfamilias estructurales v2
SUPERFAMILIA : Biblioteca de HMM que representan superfamilias y base de datos de anotaciones (superfamilias y familias) para todos los organismos completamente secuenciados.
SCOP y CATH : clasificaciones de estructuras de proteínas en superfamilias, familias y dominios
De manera similar, existen algoritmos que buscan en el PDB proteínas con homología estructural con una estructura objetivo, por ejemplo:
DALI - Alineación estructural basada en un método matricial de alineación a distancia
^ ab Holm L, Rosenström P (julio de 2010). "Servidor Dali: mapeo de conservación en 3D". Investigación de ácidos nucleicos . 38 (problema del servidor web): W545–9. doi : 10.1093/nar/gkq366. PMC 2896194 . PMID 20457744.
^ abc Rawlings ND, Barrett AJ, Bateman A (enero de 2012). "MEROPS: la base de datos de enzimas proteolíticas, sus sustratos e inhibidores". Investigación de ácidos nucleicos . 40 (Problema de la base de datos): D343–50. doi : 10.1093/nar/gkr987. PMC 3245014 . PMID 22086950.
^ Henrissat B, Bairoch A (junio de 1996). "Actualización de la clasificación basada en secuencias de glicosilhidrolasas". La revista bioquímica . 316 (parte 2): 695–6. doi :10.1042/bj3160695. PMC 1217404 . PMID 8687420.
^ "Preguntas frecuentes sobre #Símbolos de Clustal". Clustal . Archivado desde el original el 24 de octubre de 2016 . Consultado el 8 de diciembre de 2014 .
^ abcd Han JH, Batey S, Nickson AA, Teichmann SA, Clarke J (abril de 2007). "El plegamiento y evolución de proteínas multidominio". Reseñas de la naturaleza Biología celular molecular . 8 (4): 319–30. doi :10.1038/nrm2144. PMID 17356578. S2CID 13762291.
^ ab Pandit SB, Gosar D, Abhiman S, Sujatha S, Dixit SS, Mhatre NS, Sowdhamini R, Srinivasan N (enero de 2002). "SUPFAM: una base de datos de posibles relaciones de superfamilias de proteínas derivadas de la comparación de familias basadas en secuencias y basadas en estructuras: implicaciones para la genómica estructural y la anotación de funciones en los genomas". Investigación de ácidos nucleicos . 30 (1): 289–93. doi :10.1093/nar/30.1.289. PMC 99061 . PMID 11752317.
^ Orengo CA, Thornton JM (2005). "Familias de proteínas y su evolución: una perspectiva estructural". Revista Anual de Bioquímica . 74 (1): 867–900. doi : 10.1146/annurev.biochem.74.082803.133029. PMID 15954844.
^ Liu Y, Bahar I (septiembre de 2012). "La evolución de la secuencia se correlaciona con la dinámica estructural". Biología Molecular y Evolución . 29 (9): 2253–63. doi :10.1093/molbev/mss097. PMC 3424413 . PMID 22427707.
^ ab Silverman GA, Bird PI, Carrell RW, Church FC, Coughlin PB, Gettins PG, Irving JA, Lomas DA, Luke CJ, Moyer RW, Pemberton PA, Remold-O'Donnell E, Salvesen GS, Travis J, Whisstock JC (Septiembre de 2001). "Las serpinas son una superfamilia en expansión de proteínas estructuralmente similares pero funcionalmente diversas. Evolución, mecanismo de inhibición, funciones novedosas y una nomenclatura revisada". La Revista de Química Biológica . 276 (36): 33293–6. doi : 10.1074/jbc.R100016200 . PMID 11435447.
^ Holm L, Laakso LM (julio de 2016). "Actualización del servidor Dali". Investigación de ácidos nucleicos . 44 (W1): W351–5. doi :10.1093/nar/gkw357. PMC 4987910 . PMID 27131377.
^ Pascual-García A, Abia D, Ortiz ÁR, Bastolla U (2009). "Cruce entre el espacio de estructura de proteínas continua y discreta: conocimientos sobre la clasificación automática y las redes de estructuras de proteínas". PLOS Biología Computacional . 5 (3): e1000331. Código Bib : 2009PLSCB...5E0331P. doi : 10.1371/journal.pcbi.1000331 . PMC 2654728 . PMID 19325884.
^ Li D, Zhang L, Yin H, Xu H, Satkoski Trask J, Smith DG, Li Y, Yang M, Zhu Q (junio de 2014). "Evolución de las defensinas α y θ de primates revelada por análisis de genomas". Informes de biología molecular . 41 (6): 3859–66. doi :10.1007/s11033-014-3253-z. PMID 24557891. S2CID 14936647.
^ Krishna SS, Grishin NV (abril de 2005). "Deriva estructural: un posible camino hacia el cambio del pliegue de las proteínas". Bioinformática . 21 (8): 1308–10. doi : 10.1093/bioinformática/bti227 . PMID 15604105.
^ Bryan PN, Orban J (agosto de 2010). "Proteínas que cambian de pliegue". Opinión actual en biología estructural . 20 (4): 482–8. doi :10.1016/j.sbi.2010.06.002. PMC 2928869 . PMID 20591649.
^ ab Dessailly, Benoit H.; Dawson, Natalie L.; Das, Sayoni; Orengo, Christine A. (2017), "Diversidad de funciones dentro de pliegues y superfamilias", de la estructura de las proteínas a la función con bioinformática , Springer Países Bajos, págs. 295–325, doi :10.1007/978-94-024-1069-3_9, ISBN9789402410679
^ Echave J, Spielman SJ, Wilke CO (febrero de 2016). "Causas de variación de la tasa evolutiva entre sitios de proteínas". Reseñas de la naturaleza. Genética . 17 (2): 109–21. doi :10.1038/nrg.2015.18. PMC 4724262 . PMID 26781812.
^ Shafee T, Gatti-Lafranconi P, Minter R, Hollfelder F (septiembre de 2015). "La evolución de la recuperación de discapacidad conduce a una proteasa permisiva a nucleófilos químicamente versátil". ChemBioChem . 16 (13): 1866–1869. doi :10.1002/cbic.201500295. PMC 4576821 . PMID 26097079.
^ Buller AR, Townsend CA (febrero de 2013). "Limitaciones evolutivas intrínsecas sobre la estructura de la proteasa, la acilación de enzimas y la identidad de la tríada catalítica". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 110 (8): E653–61. Código Bib : 2013PNAS..110E.653B. doi : 10.1073/pnas.1221050110 . PMC 3581919 . PMID 23382230.
^ Coutinho PM, Deleury E, Davies GJ, Henrissat B (abril de 2003). "Una clasificación familiar jerárquica en evolución para las glicosiltransferasas". Revista de biología molecular . 328 (2): 307–17. doi :10.1016/S0022-2836(03)00307-3. PMID 12691742.
^ Zámocký M, Hofbauer S, Schaffner I, Gasselhuber B, Nicolussi A, Soudi M, Pirker KF, Furtmüller PG, Obinger C (mayo de 2015). "Evolución independiente de cuatro superfamilias de hemo peroxidasas". Archivos de Bioquímica y Biofísica . 574 : 108-19. doi :10.1016/j.abb.2014.12.025. PMC 4420034 . PMID 25575902.
^ Akiva, Eyal; Marrón, Shoshana; Almonacid, Daniel E.; Barbero, Alan E.; Custer, Ashley F.; Hicks, Michael A.; Huang, Conrado C.; Lauck, Florián; Mashiyama, Susan T. (23 de noviembre de 2013). "La base de datos sobre vínculos estructura-función". Investigación de ácidos nucleicos . 42 (D1): D521-D530. doi : 10.1093/nar/gkt1130. ISSN 0305-1048. PMC 3965090 . PMID 24271399.
^ Shakhnovich BE, Deeds E, Delisi C, Shakhnovich E (marzo de 2005). "La estructura de las proteínas y la historia evolutiva determinan la topología del espacio de secuencia". Investigación del genoma . 15 (3): 385–92. arXiv : q-bio/0404040 . doi :10.1101/gr.3133605. PMC 551565 . PMID 15741509.
^ Ranea JA, Sillero A, Thornton JM, Orengo CA (octubre de 2006). "Evolución de la superfamilia de proteínas y el último ancestro común universal (LUCA)". Revista de evolución molecular . 63 (4): 513–25. Código Bib : 2006JMolE..63..513R. doi :10.1007/s00239-005-0289-7. hdl :10261/78338. PMID 17021929. S2CID 25258028.
^ Carr PD, Ollis DL (2009). "Pliegue alfa / beta hidrolasa: una actualización". Cartas de proteínas y péptidos . 16 (10): 1137–48. doi :10.2174/092986609789071298. PMID 19508187.
^ Nardini M, Dijkstra BW (diciembre de 1999). "Enzimas plegadoras alfa / beta hidrolasa: la familia sigue creciendo". Opinión actual en biología estructural . 9 (6): 732–7. doi :10.1016/S0959-440X(99)00037-8. PMID 10607665.
^ "SCOP". Archivado desde el original el 29 de julio de 2014 . Consultado el 28 de mayo de 2014 .
^ Mohamed MF, Hollfelder F (enero de 2013). "Promiscuidad catalítica cruzada eficiente entre enzimas que catalizan la transferencia de fosforilo". Biochimica et Biophysica Acta (BBA) - Proteínas y Proteómica . 1834 (1): 417–24. doi :10.1016/j.bbapap.2012.07.015. PMID 22885024.
^ Branden C, Tooze J (1999). Introducción a la estructura de las proteínas (2ª ed.). Nueva York: Pub Garland. ISBN978-0815323051.
^ Bolognesi M, Onesti S, Gatti G, Coda A, Ascenzi P, Brunori M (febrero de 1989). "Mioglobina de Aplysia limacina. Análisis cristalográfico a una resolución de 1,6 A". Revista de biología molecular . 205 (3): 529–44. doi :10.1016/0022-2836(89)90224-6. PMID 2926816.
^ Bork P, Holm L, Sander C (septiembre de 1994). "El pliegue de las inmunoglobulinas. Clasificación estructural, patrones de secuencia y núcleo común". Revista de biología molecular . 242 (4): 309–20. doi :10.1006/jmbi.1994.1582. PMID 7932691.
^ Bazán JF, Fletterick RJ (noviembre de 1988). "Las cisteína proteasas virales son homólogas a la familia de serina proteasas similares a la tripsina: implicaciones estructurales y funcionales". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 85 (21): 7872–6. Código bibliográfico : 1988PNAS...85.7872B. doi : 10.1073/pnas.85.21.7872 . PMC 282299 . PMID 3186696.
^ Vetter IR, Wittinghofer A (noviembre de 2001). "El interruptor de unión de nucleótidos de guanina en tres dimensiones". Ciencia . 294 (5545): 1299–304. Código Bib : 2001 Ciencia... 294.1299V. doi : 10.1126/ciencia.1062023. PMID 11701921. S2CID 6636339.
^ Atkinson, Gemma C.; Tenson, Tanel; Hauryliuk, Vasili (9 de agosto de 2011). "La superfamilia RelA / Spot Homolog (RSH): distribución y evolución funcional de ppGpp sintetasas e hidrolasas en el árbol de la vida". MÁS UNO . 6 (8): e23479. Código Bib : 2011PLoSO...623479A. doi : 10.1371/journal.pone.0023479 . ISSN 1932-6203. PMC 3153485 . PMID 21858139.
^ Nagano N, Orengo CA, Thornton JM (agosto de 2002). "Un pliegue con muchas funciones: las relaciones evolutivas entre las familias de barriles TIM en función de sus secuencias, estructuras y funciones". Revista de biología molecular . 321 (5): 741–65. doi :10.1016/s0022-2836(02)00649-6. PMID 12206759.
^ Farber G (1993). "Un barril α/β lleno de problemas evolutivos". Opinión actual en biología estructural . 3 (3): 409–412. doi :10.1016/S0959-440X(05)80114-9.
enlaces externos
Medios relacionados con las superfamilias de proteínas en Wikimedia Commons