stringtranslate.com

Homología de secuencia

Filogenia génica como ramas rojas y azules dentro de la filogenia de especies grises. Arriba: Una duplicación génica ancestral produce dos parálogos ( histonas H1.1 y 1.2 ). Un evento de especiación produce ortólogos en las dos especies hijas (humana y chimpancé). Abajo: en una especie separada ( E. coli ), un gen tiene una función similar ( proteína estructurante de nucleoides similar a histona ) pero tiene un origen evolutivo separado y, por lo tanto, es un análogo .

La homología de secuencia es la homología biológica entre secuencias de ADN , ARN o proteínas , definida en términos de ascendencia compartida en la historia evolutiva de la vida . Dos segmentos de ADN pueden tener ascendencia compartida debido a tres fenómenos: un evento de especiación (ortólogos), un evento de duplicación (parálogos) o un evento de transferencia génica horizontal (o lateral) (xenólogos). [1]

La homología entre el ADN, el ARN o las proteínas se suele inferir a partir de la similitud de sus secuencias de nucleótidos o aminoácidos . Una similitud significativa es una prueba contundente de que dos secuencias están relacionadas por cambios evolutivos a partir de una secuencia ancestral común. Las alineaciones de múltiples secuencias se utilizan para indicar qué regiones de cada secuencia son homólogas.

Identidad, similitud y conservación

Alineación de secuencias de proteínas histónicas de mamíferos . Las secuencias son los residuos de aminoácidos 120 a 180 centrales de las proteínas. Los residuos que se conservan en todas las secuencias se resaltan en gris. La clave que aparece a continuación indica secuencia conservada (*), mutaciones conservadoras (:), mutaciones semiconservadoras (.) y mutaciones no conservadoras ( ). [2]

El término "porcentaje de homología" se utiliza a menudo para significar "similitud de secuencia", es decir, el porcentaje de residuos idénticos ( porcentaje de identidad ), o el porcentaje de residuos conservados con propiedades fisicoquímicas similares ( porcentaje de similitud ), por ejemplo, leucina e isoleucina , se utiliza normalmente para "cuantificar la homología". Con base en la definición de homología especificada anteriormente, esta terminología es incorrecta ya que la similitud de secuencia es la observación, la homología es la conclusión. [3] Las secuencias son homólogas o no. [3] Esto implica que el término "porcentaje de homología" es un nombre inapropiado. [4]

Al igual que con las estructuras morfológicas y anatómicas, la similitud de secuencias puede ocurrir debido a la evolución convergente o, como ocurre con las secuencias más cortas, por casualidad, lo que significa que no son homólogas. Las regiones de secuencia homóloga también se denominan conservadas . Esto no debe confundirse con la conservación en las secuencias de aminoácidos , donde el aminoácido en una posición específica ha sido sustituido por uno diferente que tiene propiedades fisicoquímicas funcionalmente equivalentes.

La homología parcial puede ocurrir cuando un segmento de las secuencias comparadas tiene un origen compartido, mientras que el resto no. Esta homología parcial puede ser resultado de un evento de fusión génica .

Ortología

Arriba: un gen ancestral se duplica para producir dos parálogos (genes A y B). Un evento de especiación produce ortólogos en las dos especies hijas. Abajo: en una especie distinta, un gen no relacionado tiene una función similar (gen C) pero tiene un origen evolutivo distinto y, por lo tanto, es un análogo .

Las secuencias homólogas son ortólogas si se infiere que descienden de la misma secuencia ancestral separada por un evento de especiación : cuando una especie diverge en dos especies separadas, se dice que las copias de un solo gen en las dos especies resultantes son ortólogas. Los ortólogos, o genes ortólogos, son genes en diferentes especies que se originaron por descendencia vertical a partir de un solo gen del último ancestro común . El término "ortólogo" fue acuñado en 1970 por el evolucionista molecular Walter Fitch . [5]

Por ejemplo, la proteína reguladora de la gripe de la planta está presente tanto en Arabidopsis (planta multicelular superior) como en Chlamydomonas (alga verde unicelular). La versión de Chlamydomonas es más compleja: cruza la membrana dos veces en lugar de una, contiene dominios adicionales y sufre un empalme alternativo. Sin embargo, puede sustituir por completo a la proteína mucho más simple de Arabidopsis , si se transfiere del genoma de las algas al de la planta mediante ingeniería genética . La similitud significativa de secuencias y los dominios funcionales compartidos indican que estos dos genes son genes ortólogos, [6] heredados del ancestro compartido .

La ortología se define estrictamente en términos de ascendencia. Dado que la ascendencia exacta de los genes en diferentes organismos es difícil de determinar debido a eventos de duplicación de genes y reordenamiento del genoma, la evidencia más sólida de que dos genes similares son ortólogos generalmente se encuentra al realizar un análisis filogenético del linaje genético. Los ortólogos a menudo, pero no siempre, tienen la misma función. [7]

Las secuencias ortólogas proporcionan información útil en la clasificación taxonómica y los estudios filogenéticos de los organismos. El patrón de divergencia genética se puede utilizar para rastrear el parentesco entre los organismos. Es probable que dos organismos que están muy estrechamente relacionados muestren secuencias de ADN muy similares entre dos ortólogos. Por el contrario, es probable que un organismo que se encuentre más alejado evolutivamente de otro organismo muestre una mayor divergencia en la secuencia de los ortólogos estudiados. [ cita requerida ]

Bases de datos de genes ortólogos

Dada su tremenda importancia para la biología y la bioinformática , los genes ortólogos se han organizado en varias bases de datos especializadas que proporcionan herramientas para identificar y analizar secuencias de genes ortólogos. Estos recursos emplean enfoques que se pueden clasificar generalmente en aquellos que utilizan el análisis heurístico de todas las comparaciones de secuencias por pares y aquellos que utilizan métodos filogenéticos . Los métodos de comparación de secuencias se introdujeron por primera vez en la base de datos COGs en 1997. [8] Estos métodos se han ampliado y automatizado en doce bases de datos diferentes, siendo la más avanzada AYbRAH Analyzing Yeasts by Reconstructing Ancestry of Homologs [9] , así como las siguientes bases de datos en este momento.

Los enfoques filogenéticos basados ​​en árboles tienen como objetivo distinguir la especiación de los eventos de duplicación de genes comparando árboles de genes con árboles de especies, tal como se implementan en bases de datos y herramientas de software como:

Una tercera categoría de enfoques híbridos utiliza métodos heurísticos y filogenéticos para construir grupos y determinar árboles, por ejemplo:

Paralogía

Los genes paralógicos son genes que están relacionados a través de eventos de duplicación en el último ancestro común (LCA) de la especie que se compara. Son el resultado de la mutación de genes duplicados durante eventos de especiación separados. Cuando los descendientes del LCA comparten homólogos mutados de los genes duplicados originales, esos genes se consideran parálogos. [1]

Por ejemplo, en la LCA, un gen (gen A) puede duplicarse para formar un gen similar separado (gen B), y esos dos genes continuarán transmitiéndose a las generaciones posteriores. Durante la especiación, un entorno favorecerá una mutación en el gen A (gen A1), produciendo una nueva especie con los genes A1 y B. Luego, en un evento de especiación separado, un entorno favorecerá una mutación en el gen B (gen B1) dando lugar a una nueva especie con los genes A y B1. Los genes A1 y B1 de los descendientes son parálogos entre sí porque son homólogos que están relacionados a través de un evento de duplicación en el último ancestro común de las dos especies. [1]

Las clasificaciones adicionales de los parálogos incluyen aloparálogos (out-parálogos) y simparalogos (in-parálogos). Los aloparálogos son parálogos que evolucionaron a partir de duplicaciones genéticas que precedieron al evento de especiación dado. En otras palabras, los aloparálogos son parálogos que evolucionaron a partir de eventos de duplicación que ocurrieron en el LCA de los organismos que se están comparando. El ejemplo anterior es un ejemplo de aloparalogía. Los simparalogos son parálogos que evolucionaron a partir de la duplicación genética de genes parálogos en eventos de especiación posteriores. Del ejemplo anterior, si el descendiente con los genes A1 y B experimentó otro evento de especiación donde el gen A1 se duplicó, la nueva especie tendría los genes B, A1a y A1b. En este ejemplo, los genes A1a y A1b son simparalogos. [1]

Los genes Hox de vertebrados están organizados en conjuntos de parálogos. Cada grupo Hox (HoxA, HoxB, etc.) se encuentra en un cromosoma diferente. Por ejemplo, el grupo HoxA humano se encuentra en el cromosoma 7. El grupo HoxA del ratón que se muestra aquí tiene 11 genes parálogos (faltan 2). [37]

Los genes paralógicos pueden dar forma a la estructura de genomas completos y, por lo tanto, explicar la evolución del genoma en gran medida. Algunos ejemplos incluyen los genes Homeobox ( Hox ) en animales. Estos genes no solo sufrieron duplicaciones genéticas dentro de los cromosomas , sino también duplicaciones de todo el genoma . Como resultado, los genes Hox en la mayoría de los vertebrados se agrupan en múltiples cromosomas, siendo los grupos HoxA-D los mejor estudiados. [37]

Otro ejemplo son los genes de globina que codifican la mioglobina y la hemoglobina y se consideran parálogos antiguos. De manera similar, las cuatro clases conocidas de hemoglobinas ( hemoglobina A , hemoglobina A2 , hemoglobina B y hemoglobina F ) son parálogos entre sí. Si bien cada una de estas proteínas cumple la misma función básica de transporte de oxígeno, ya han divergido ligeramente en su función: la hemoglobina fetal (hemoglobina F) tiene una mayor afinidad por el oxígeno que la hemoglobina adulta. Sin embargo, la función no siempre se conserva. La angiogenina humana divergió de la ribonucleasa , por ejemplo, y si bien los dos parálogos siguen siendo similares en su estructura terciaria, sus funciones dentro de la célula ahora son bastante diferentes. [ cita requerida ]

A menudo se afirma que los ortólogos son funcionalmente más similares que los parálogos de divergencia similar, pero varios artículos han cuestionado esta noción. [38] [39] [40]

Regulación

Los parálogos suelen estar regulados de forma diferente, por ejemplo, al tener diferentes patrones de expresión específicos de tejido (ver genes Hox). Sin embargo, también pueden estar regulados de forma diferente a nivel proteico. Por ejemplo, Bacillus subtilis codifica dos parálogos de la glutamato deshidrogenasa : GudB se transcribe de forma constitutiva, mientras que RocG está regulada de forma estricta. En sus estados oligoméricos activos, ambas enzimas muestran tasas enzimáticas similares. Sin embargo, los intercambios de enzimas y promotores causan graves pérdidas de aptitud, lo que indica una coevolución promotor-enzima. La caracterización de las proteínas muestra que, en comparación con RocG, la actividad enzimática de GudB depende en gran medida del glutamato y el pH. [41]

Regiones cromosómicas paralógicas

A veces, grandes regiones de cromosomas comparten contenido genético similar a otras regiones cromosómicas dentro del mismo genoma. [42] Están bien caracterizadas en el genoma humano, donde se han utilizado como evidencia para apoyar la hipótesis 2R . Se deduce que los conjuntos de genes duplicados, triplicados y cuadruplicados, con los genes relacionados en diferentes cromosomas, son restos de duplicaciones genómicas o cromosómicas. Un conjunto de regiones de paralogía se denomina en conjunto paralogón . [43] Los conjuntos de regiones de paralogía bien estudiados incluyen regiones de los cromosomas humanos 2, 7, 12 y 17 que contienen grupos de genes Hox , genes de colágeno , genes de queratina y otros genes duplicados, [44] regiones de los cromosomas humanos 4, 5, 8 y 10 que contienen genes de receptores de neuropéptidos, genes homeobox de clase NK y muchas más familias de genes , [45] [46] [47] y partes de los cromosomas humanos 13, 4, 5 y X que contienen los genes ParaHox y sus vecinos. [48] El complejo mayor de histocompatibilidad (MHC) en el cromosoma humano 6 tiene regiones de paralogía en los cromosomas 1, 9 y 19. [49] Gran parte del genoma humano parece ser asignable a regiones de paralogía. [50]

Ohnología

Los genes ohnólogos son genes paralógicos que se han originado mediante un proceso de duplicación de todo el genoma . El nombre fue dado por primera vez en honor a Susumu Ohno por Ken Wolfe. [51] Los ohnólogos son útiles para el análisis evolutivo porque todos los ohnólogos en un genoma han estado divergiendo durante el mismo período de tiempo (desde su origen común en la duplicación del genoma completo). También se sabe que los ohnólogos muestran una mayor asociación con cánceres, trastornos genéticos dominantes y variaciones patógenas en el número de copias. [52] [53] [54] [55] [56]

Xenología

Los homólogos resultantes de la transferencia horizontal de genes entre dos organismos se denominan xenólogos. Los xenólogos pueden tener diferentes funciones si el nuevo entorno es muy diferente para el gen que se mueve horizontalmente. Sin embargo, en general, los xenólogos suelen tener una función similar en ambos organismos. El término fue acuñado por Walter Fitch. [5]

Homeología

Los cromosomas homólogos (también escritos homeólogos) o partes de cromosomas son aquellos que se unen después de la hibridación entre especies y la alopoliploidización para formar un genoma híbrido , y cuya relación era completamente homóloga en una especie ancestral. [57] En los alopoliploides, los cromosomas homólogos dentro de cada subgenoma parental deben aparearse fielmente durante la meiosis , lo que lleva a la herencia disómica; sin embargo, en algunos alopoliploides, los cromosomas homólogos de los genomas parentales pueden ser casi tan similares entre sí como los cromosomas homólogos, lo que lleva a la herencia tetrasómica (cuatro cromosomas apareándose en la meiosis), la recombinación intergenómica y la fertilidad reducida. [ cita requerida ]

Gametología

La gametología denota la relación entre genes homólogos en cromosomas sexuales opuestos no recombinantes . El término fue acuñado por García-Moreno y Mindell. [58] 2000. Los gametólogos son el resultado del origen de la determinación genética del sexo y de las barreras a la recombinación entre cromosomas sexuales. Algunos ejemplos de gametólogos incluyen CHDW y CHDZ en aves. [58]

Véase también

Referencias

  1. ^ abcd Koonin EV (2005). "Ortólogos, parálogos y genómica evolutiva". Revisión anual de genética . 39 : 309–38. doi :10.1146/annurev.genet.39.073003.114725. PMID  16285863.
  2. ^ "Preguntas frecuentes sobre Clustal n.º símbolos". Clustal . Consultado el 8 de diciembre de 2014 .
  3. ^ por Reeck GR, de Haën C, Teller DC, Doolittle RF, Fitch WM, Dickerson RE, et al. (agosto de 1987). ""Homología" en proteínas y ácidos nucleicos: un embrollo terminológico y una salida al mismo". Cell . 50 (5): 667. doi :10.1016/0092-8674(87)90322-9. PMID  3621342. S2CID  42949514.
  4. ^ Holman C (enero de 2004). "Puntuación de similitud de proteínas: una versión simplificada de la puntuación Blast como una alternativa superior al porcentaje de identidad para reclamar géneros de secuencias de proteínas relacionadas". Revista de Derecho de Alta Tecnología de Santa Clara . 21 (1): 55. ISSN  0882-3383.
  5. ^ ab Fitch WM (junio de 1970). "Distinguir proteínas homólogas de análogas". Zoología sistemática . 19 (2): 99–113. doi :10.2307/2412448. JSTOR  2412448. PMID  5449325. Cuando la homología es el resultado de la duplicación génica, de modo que ambas copias han descendido una al lado de la otra durante la historia de un organismo (por ejemplo, hemoglobina a y b), los genes deberían llamarse paralógicos (para = en paralelo). Cuando la homología es el resultado de la especiación, de modo que la historia del gen refleja la historia de la especie (por ejemplo, una hemoglobina en el hombre y el ratón), los genes deberían llamarse ortólogos (orto = exactos).
  6. ^ Falciatore A, Merendino L, Barneche F, Ceol M, Meskauskiene R, Apel K, Rochaix JD (enero de 2005). "Las proteínas FLP actúan como reguladores de la síntesis de clorofila en respuesta a la luz y las señales de los plástidos en Chlamydomonas". Genes & Development . 19 (1): 176–87. doi :10.1101/gad.321305. PMC 540235 . PMID  15630026. 
  7. ^ Fang G, Bhardwaj N, Robilotto R, Gerstein MB (marzo de 2010). "Introducción a la ortología génica y el análisis funcional". PLOS Computational Biology . 6 (3): e1000703. Bibcode :2010PLSCB...6E0703F. doi : 10.1371/journal.pcbi.1000703 . PMC 2845645 . PMID  20361041. 
  8. ^ COGs: Clusters of Orthologous Groups of proteinas Tatusov RL, Koonin EV, Lipman DJ (octubre de 1997). "Una perspectiva genómica sobre las familias de proteínas". Science . 278 (5338): 631–7. Bibcode :1997Sci...278..631T. doi :10.1126/science.278.5338.631. PMID  9381173.
  9. ^ Correia K, Yu SM, Mahadevan R (enero de 2019). "AYbRAH: una base de datos de ortólogos curada para levaduras y hongos que abarca 600 millones de años de evolución". Base de datos . 2019 . doi :10.1093/database/baz022. PMC 6425859 . PMID  30893420. 
  10. ^ eggNOG: genealogía evolutiva de genes: grupos ortólogos no supervisados ​​Muller J, Szklarczyk D, Julien P, Letunic I, Roth A, Kuhn M, et al. (enero de 2010). "eggNOG v2.0: extensión de la genealogía evolutiva de genes con grupos ortólogos no supervisados ​​mejorados, especies y anotaciones funcionales". Nucleic Acids Research . 38 (número de base de datos): D190-5. doi :10.1093/nar/gkp951. PMC 2808932 . PMID  19900971.
     
  11. ^ Powell S, Forslund K, Szklarczyk D, Trachana K, Roth A, Huerta-Cepas J, et al. (enero de 2014). "eggNOG v4.0: inferencia de ortología anidada en 3686 organismos". Nucleic Acids Research . 42 (número de base de datos): D231-9. doi :10.1093/nar/gkt1253. PMC 3964997 . PMID  24297252. 
  12. ^ GreenPhylDB Conte MG, Gaillard S, Lanau N, Rouard M, Périn C (enero de 2008). "GreenPhylDB: una base de datos para la genómica comparativa de plantas". Nucleic Acids Research . 36 (número de la base de datos): D991-8. doi :10.1093/nar/gkm934. PMC 2238940 . PMID  17986457.
     
  13. ^ Rouard M, Guignon V, Aluome C, Laporte MA, Droc G, Walde C, et al. (enero de 2011). "GreenPhylDB v2.0: genómica comparativa y funcional en plantas". Nucleic Acids Research . 39 (número de la base de datos): D1095-102. doi :10.1093/nar/gkq811. PMC 3013755 . PMID  20864446. 
  14. ^ Inparanoid: grupos de ortólogos eucariotas Ostlund G, Schmitt T, Forslund K, Köstler T, Messina DN, Roopra S, et al. (enero de 2010). "InParanoid 7: nuevos algoritmos y herramientas para el análisis de ortología eucariota". Nucleic Acids Research . 38 (número de la base de datos): D196-203. doi :10.1093/nar/gkp931. PMC 2808972 . PMID  19892828.
     
  15. ^ Sonnhammer EL, Östlund G (enero de 2015). "InParanoid 8: análisis de ortología entre 273 proteomas, principalmente eucariotas". Nucleic Acids Research . 43 (número de la base de datos): D234-9. doi :10.1093/nar/gku1203. PMC 4383983 . PMID  25429972. 
  16. ^ Singh PP, Arora J, Isambert H (julio de 2015). "Identificación de genes ohnológicos originados a partir de la duplicación del genoma completo en vertebrados tempranos, basada en la comparación de sintenia en múltiples genomas". PLOS Computational Biology . 11 (7): e1004394. Bibcode :2015PLSCB..11E4394S. doi : 10.1371/journal.pcbi.1004394 . PMC 4504502 . PMID  26181593. 
  17. ^ "Ohnologs de vertebrados". ohnologs.curie.fr . Consultado el 12 de octubre de 2018 .
  18. ^ Altenhoff AM, Glover NM, Train CM, Kaleb K, Warwick Vesztrocy A, Dylus D, et al. (enero de 2018). "La base de datos de ortología OMA en 2018: recuperación de relaciones evolutivas entre todos los dominios de la vida a través de interfaces web y programáticas más ricas". Nucleic Acids Research . 46 (D1): D477–D485. doi :10.1093/nar/gkx1019. PMC 5753216 . PMID  29106550. 
  19. ^ Zdobnov EM, Tegenfeldt F, Kuznetsov D, Waterhouse RM, Simão FA, Ioannidis P, et al. (enero de 2017). "OrthoDB v9.1: catalogación de anotaciones evolutivas y funcionales para ortólogos animales, fúngicos, vegetales, arqueológicos, bacterianos y virales". Nucleic Acids Research . 45 (D1): D744–D749. doi :10.1093/nar/gkw1119. PMC 5210582 . PMID  27899580. 
  20. ^ Nevers Y, Kress A, Defosset A, Ripp R, Linard B, Thompson JD, et al. (enero de 2019). "OrthoInspector 3.0: portal abierto para la genómica comparativa". Nucleic Acids Research . 47 (D1): D411–D418. doi : 10.1093/nar/gky1068 . PMC 6323921 . PMID  30380106. 
  21. ^ OrthologID Chiu JC, Lee EK, Egan MG, Sarkar IN, Coruzzi GM, DeSalle R (marzo de 2006). "OrthologID: automatización de la identificación de ortólogos a escala del genoma dentro de un marco de parsimonia". Bioinformática . 22 (6): 699–707. doi : 10.1093/bioinformatics/btk040 . PMID  16410324.
  22. ^ Egan M, Lee EK, Chiu JC, Coruzzi G, Desalle R (2009). "Evaluación de la ortología de genes con OrthologID". En Posada D (ed.). Bioinformática para el análisis de secuencias de ADN . Métodos en biología molecular. Vol. 537. Humana Press. págs. 23–38. doi :10.1007/978-1-59745-251-9_2. ISBN . 978-1-59745-251-9. Número de identificación personal  19378138.
  23. ^ OrthoMaM Ranwez V, Delsuc F, Ranwez S, Belkhir K, Tilak MK, Douzery EJ (noviembre de 2007). "OrthoMaM: una base de datos de marcadores genómicos ortólogos para la filogenética de mamíferos placentarios". BMC Evolutionary Biology . 7 (1): 241. Bibcode :2007BMCEE...7..241R. doi : 10.1186/1471-2148-7-241 . PMC 2249597 . PMID  18053139.
     
  24. ^ Douzery EJ, Scornavacca C, Romiguier J, Belkhir K, Galtier N, Delsuc F, Ranwez V (julio de 2014). "OrthoMaM v8: una base de datos de exones ortólogos y secuencias codificantes para la genómica comparativa en mamíferos". Biología molecular y evolución . 31 (7): 1923–8. doi : 10.1093/molbev/msu132 . PMID  24723423.
  25. ^ Scornavacca C, Belkhir K, Lopez J, Dernat R, Delsuc F, Douzery EJ, Ranwez V (abril de 2019). "OrthoMaM v10: ampliación de la secuencia codificante ortóloga y alineaciones de exones con más de cien genomas de mamíferos". Biología molecular y evolución . 36 (4): 861–862. doi :10.1093/molbev/msz015. PMC 6445298 . PMID  30698751. 
  26. ^ OrthoMCL: Identificación de grupos ortólogos para genomas eucariotas Chen F, Mackey AJ, Stoeckert CJ, Roos DS (enero de 2006). "OrthoMCL-DB: consulta de una colección completa de grupos ortólogos de múltiples especies". Nucleic Acids Research . 34 (número de base de datos): D363-8. doi :10.1093/nar/gkj123. PMC 1347485 . PMID  16381887.
     
  27. ^ Fischer S, Brunk BP, Chen F, Gao X, Harb OS, Iodice JB, et al. (septiembre de 2011). "Uso de OrthoMCL para asignar proteínas a grupos OrthoMCL-DB o para agrupar proteomas en nuevos grupos ortólogos". Protocolos actuales en bioinformática . Capítulo 6 (1): Unidad 6.12.1–19. doi :10.1002/0471250953.bi0612s35. ISBN 978-0471250951. PMC  3196566 . PMID  21901743.
  28. ^ Roundup Deluca TF, Wu IH, Pu J, Monaghan T, Peshkin L, Singh S, Wall DP (agosto de 2006). "Roundup: un repositorio multigenómico de ortólogos y distancias evolutivas". Bioinformática . 22 (16): 2044–6. doi : 10.1093/bioinformatics/btl286 . PMID  16777906.
  29. ^ TreeFam: Base de datos de familias de árboles van der Heijden RT, Snel B, van Noort V, Huynen MA (marzo de 2007). "Predicción de ortología con resolución escalable mediante análisis de árboles filogenéticos". BMC Bioinformatics . 8 : 83. doi : 10.1186/1471-2105-8-83 . PMC 1838432 . PMID  17346331.
     
  30. ^ TreeFam: base de datos de familias de árboles Ruan J, Li H, Chen Z, Coghlan A, Coin LJ, Guo Y, et al. (enero de 2008). "TreeFam: actualización de 2008". Nucleic Acids Research . 36 (número de la base de datos): D735-40. doi :10.1093/nar/gkm1005. PMC 2238856 . PMID  18056084.
     
  31. ^ Schreiber F, Patricio M, Muffato M, Pignatelli M, Bateman A (enero de 2014). "TreeFam v9: un nuevo sitio web, más especies y ortología sobre la marcha". Nucleic Acids Research . 42 (número de la base de datos): D922-5. doi :10.1093/nar/gkt1055. PMC 3965059 . PMID  24194607. 
  32. ^ OrthoFinder: Ortólogos de árboles genéticos Emms DM, Kelly S (noviembre de 2019). "OrthoFinder: inferencia de ortología filogenética para genómica comparativa". Genome Biology . 20 (1): 238. doi : 10.1186/s13059-019-1832-y . PMC 6857279 . PMID  31727128.
     
  33. ^ Vilella AJ, Severin J, Ureta-Vidal A, Heng L, Durbin R, Birney E (febrero de 2009). "EnsemblCompara GeneTrees: Árboles filogenéticos completos que tienen en cuenta la duplicación en vertebrados". Genome Research . 19 (2): 327–35. doi :10.1101/gr.073585.107. PMC 2652215 . PMID  19029536. 
  34. ^ Thanki AS, Soranzo N, Haerty W, Davey RP (marzo de 2018). "GeneSeqToFamily: un flujo de trabajo de Galaxy para encontrar familias de genes basado en el pipeline Ensembl Compara GeneTrees". GigaScience . 7 (3): 1–10. doi :10.1093/gigascience/giy005. PMC 5863215 . PMID  29425291. 
  35. ^ Sayers EW, Barrett T, Benson DA, Bolton E, Bryant SH, Canese K, et al. (enero de 2011). "Recursos de la base de datos del Centro Nacional de Información Biotecnológica". Nucleic Acids Research . 39 (número de la base de datos): D38-51. doi :10.1093/nar/gkq1172. PMC 3013733 . PMID  21097890. 
  36. ^ Fulton DL, Li YY, Laird MR, Horsman BG, Roche FM, Brinkman FS (mayo de 2006). "Mejora de la especificidad de la predicción de ortólogos de alto rendimiento". BMC Bioinformatics . 7 : 270. doi : 10.1186/1471-2105-7-270 . PMC 1524997 . PMID  16729895. 
  37. ^ ab Zakany J, Duboule D (agosto de 2007). "El papel de los genes Hox durante el desarrollo de las extremidades de los vertebrados". Current Opinion in Genetics & Development . 17 (4): 359–66. doi :10.1016/j.gde.2007.05.011. PMID  17644373.
  38. ^ Studer RA, Robinson-Rechavi M (mayo de 2009). "¿Hasta qué punto podemos estar seguros de que los ortólogos son similares, pero los parálogos difieren?". Trends in Genetics . 25 (5): 210–6. doi :10.1016/j.tig.2009.03.004. PMID  19368988.
  39. ^ Nehrt NL, Clark WT, Radivojac P, Hahn MW (junio de 2011). "Prueba de la conjetura del ortólogo con datos genómicos funcionales comparativos de mamíferos". PLOS Computational Biology . 7 (6): e1002073. Bibcode :2011PLSCB...7E2073N. doi : 10.1371/journal.pcbi.1002073 . PMC 3111532 . PMID  21695233. 
  40. ^ Eisen J (20 de septiembre de 2011). "Publicación especial invitada y debate de Matthew Hahn sobre el artículo de conjeturas de ortólogos".
  41. ^ Noda-García L, Romero Romero ML, Longo LM, Kolodkin-Gal I, Tawfik DS (julio de 2017). "Las glutamato deshidrogenasas de los bacilos divergieron a través de la coevolución de la transcripción y la regulación enzimática". EMBO Reports . 18 (7): 1139–1149. doi :10.15252/embr.201743990. PMC 5494520 . PMID  28468957. 
  42. ^ Lundin LG (abril de 1993). "Evolución del genoma de vertebrados reflejada en regiones cromosómicas parálogas en el hombre y el ratón doméstico". Genómica . 16 (1): 1–19. doi :10.1006/geno.1993.1133. PMID  8486346.
  43. ^ Coulier F, Popovici C, Villet R, Birnbaum D (diciembre de 2000). "Agrupamientos de genes MetaHox". Revista de zoología experimental . 288 (4): 345–51. doi :10.1002/1097-010X(20001215)288:4<345::AID-JEZ7>3.0.CO;2-Y. PMID  11144283.
  44. ^ Ruddle FH, Bentley KL, Murtha MT, Risch N (1994). "Pérdida y ganancia de genes en la evolución de los vertebrados". Desarrollo . 1994 : 155–61. doi :10.1242/dev.1994.Supplement.155. PMID  7579516.
  45. ^ Pébusque MJ, Coulier F, Birnbaum D, Pontarotti P (septiembre de 1998). "Duplicaciones de genomas antiguos a gran escala: análisis filogenéticos y de ligamiento arrojan luz sobre la evolución del genoma de los cordados". Biología molecular y evolución . 15 (9): 1145–59. doi : 10.1093/oxfordjournals.molbev.a026022 . PMID  9729879.
  46. ^ Larsson TA, Olsson F, Sundstrom G, Lundin LG, Brenner S, Venkatesh B, Larhammar D (junio de 2008). "Duplicaciones cromosómicas de vertebrados tempranos y evolución de las regiones génicas del receptor del neuropéptido Y". BMC Evolutionary Biology . 8 (1): 184. Bibcode :2008BMCEE...8..184L. doi : 10.1186/1471-2148-8-184 . PMC 2453138 . PMID  18578868. 
  47. ^ Pollard SL, Holland PW (septiembre de 2000). "Evidencia de 14 grupos de genes homeobox en la ascendencia del genoma humano". Current Biology . 10 (17): 1059–62. doi : 10.1016/S0960-9822(00)00676-X . PMID  10996074. S2CID  32135432.
  48. ^ Mulley JF, Chiu CH, Holland PW (julio de 2006). "Desintegración de un grupo homeobox tras la duplicación del genoma en teleósteos". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 103 (27): 10369–10372. Bibcode :2006PNAS..10310369M. doi : 10.1073/pnas.0600341103 . PMC 1502464 . PMID  16801555. 
  49. ^ Flajnik MF, Kasahara M (septiembre de 2001). "Genómica comparativa del MHC: vislumbres de la evolución del sistema inmunitario adaptativo". Inmunidad . 15 (3): 351–62. doi : 10.1016/S1074-7613(01)00198-4 . PMID  11567626.
  50. ^ McLysaght A, Hokamp K, Wolfe KH (junio de 2002). "Extensa duplicación genómica durante la evolución temprana de los cordados". Nature Genetics . 31 (2): 200–4. doi :10.1038/ng884. PMID  12032567. S2CID  8263376.
  51. ^ Wolfe K (mayo de 2000). "Robustez: no está donde crees que está". Nature Genetics . 25 (1): 3–4. doi :10.1038/75560. PMID  10802639. S2CID  85257685.
  52. ^ Singh PP, Affeldt S, Cascone I, Selimoglu R, Camonis J, Isambert H (noviembre de 2012). "Sobre la expansión de repertorios de genes "peligrosos" mediante duplicaciones de todo el genoma en vertebrados primitivos". Cell Reports . 2 (5): 1387–98. doi : 10.1016/j.celrep.2012.09.034 . PMID  23168259.
  53. ^ Malaguti G, Singh PP, Isambert H (mayo de 2014). "Sobre la retención de duplicados de genes propensos a mutaciones deletéreas dominantes". Biología de poblaciones teórica . 93 : 38–51. doi :10.1016/j.tpb.2014.01.004. PMID  24530892.
  54. ^ Singh PP, Affeldt S, Malaguti G, Isambert H (julio de 2014). "Los genes dominantes de enfermedades humanas se enriquecen con parálogos que se originan a partir de la duplicación del genoma completo". PLOS Computational Biology . 10 (7): e1003754. Bibcode :2014PLSCB..10E3754S. doi : 10.1371/journal.pcbi.1003754 . PMC 4117431 . PMID  25080083. 
  55. ^ McLysaght A, Makino T, Grayton HM, Tropeano M, Mitchell KJ, Vassos E, Collier DA (enero de 2014). "Los ohnólogos están sobrerrepresentados en mutaciones patogénicas del número de copias". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 111 (1): 361–6. Bibcode :2014PNAS..111..361M. doi : 10.1073/pnas.1309324111 . PMC 3890797 . PMID  24368850. 
  56. ^ Makino T, McLysaght A (mayo de 2010). "Los ohnólogos en el genoma humano tienen una dosis equilibrada y se asocian frecuentemente con enfermedades". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 107 (20): 9270–4. Bibcode :2010PNAS..107.9270M. doi : 10.1073/pnas.0914697107 . PMC 2889102 . PMID  20439718. 
  57. ^ Glover NM, Redestig H, Dessimoz C (julio de 2016). "Homoeólogos: ¿qué son y cómo los inferimos?". Tendencias en la ciencia vegetal . 21 (7). Cell Press : 609–621. doi :10.1016/j.tplants.2016.02.005. PMC 4920642. PMID  27021699 . 
  58. ^ ab García-Moreno J, Mindell DP (diciembre de 2000). "Enraizamiento de una filogenia con genes homólogos en cromosomas sexuales opuestos (gametólogos): un estudio de caso utilizando CHD aviar". Biología molecular y evolución . 17 (12): 1826–32. doi : 10.1093/oxfordjournals.molbev.a026283 . PMID  11110898.