stringtranslate.com

Homología de secuencia

Filogenia de genes como ramas rojas y azules dentro de la filogenia de especies grises. Arriba: la duplicación de un gen ancestral produce dos parálogos ( histonas H1.1 y 1.2 ). Un evento de especiación produce ortólogos en las dos especies hijas (humana y chimpancé). Abajo: en una especie separada ( E. coli ), un gen tiene una función similar ( proteína estructurante de nucleoides similar a histonas ), pero tiene un origen evolutivo separado y, por lo tanto, es un análogo .

La homología de secuencia es la homología biológica entre secuencias de ADN , ARN o proteínas , definida en términos de ascendencia compartida en la historia evolutiva de la vida . Dos segmentos de ADN pueden tener ascendencia compartida debido a tres fenómenos: ya sea un evento de especiación (ortólogos), o un evento de duplicación (parálogos), o bien un evento de transferencia genética horizontal (o lateral) (xenólogos). [1]

La homología entre el ADN, el ARN o las proteínas normalmente se infiere a partir de la similitud de la secuencia de nucleótidos o aminoácidos . Una similitud significativa es una fuerte evidencia de que dos secuencias están relacionadas por cambios evolutivos a partir de una secuencia ancestral común. Se utilizan alineaciones de múltiples secuencias para indicar qué regiones de cada secuencia son homólogas.

Identidad, semejanza y conservación.

Una alineación de secuencia de proteínas histonas de mamíferos . Las secuencias son los 120-180 residuos de aminoácidos del medio de las proteínas. Los residuos que se conservan en todas las secuencias se resaltan en gris. La siguiente clave denota secuencia conservada (*), mutaciones conservadoras (:), mutaciones semiconservadoras (.) y mutaciones no conservadoras (). [2]

El término "porcentaje de homología" se utiliza a menudo para referirse a "similitud de secuencia", es decir, el porcentaje de residuos idénticos ( porcentaje de identidad ), o el porcentaje de residuos conservados con propiedades fisicoquímicas similares ( porcentaje de similitud ), por ejemplo, leucina e isoleucina . Se utiliza para "cuantificar la homología". Según la definición de homología especificada anteriormente, esta terminología es incorrecta ya que la similitud de secuencia es la observación, la homología es la conclusión [ 3 ] Las secuencias son homólogas o no. "porcentaje de homología" es un nombre inapropiado [4] .

Al igual que con las estructuras morfológicas y anatómicas, la similitud de secuencia puede ocurrir debido a una evolución convergente o, como ocurre con las secuencias más cortas, por casualidad, lo que significa que no son homólogas. Las regiones de secuencia homóloga también se denominan conservadas . Esto no debe confundirse con la conservación en secuencias de aminoácidos , donde el aminoácido en una posición específica se ha sustituido por uno diferente que tiene propiedades fisicoquímicas funcionalmente equivalentes.

Puede ocurrir una homología parcial cuando un segmento de las secuencias comparadas tiene un origen compartido, mientras que el resto no. Esta homología parcial puede resultar de un evento de fusión genética .

Ortología

Arriba: un gen ancestral se duplica para producir dos parálogos (genes A y B). Un evento de especiación produce ortólogos en las dos especies hijas. Abajo: en una especie separada, un gen no relacionado tiene una función similar (gen C), pero tiene un origen evolutivo separado y, por lo tanto, es un análogo .

Las secuencias homólogas son ortólogas si se infiere que descienden de la misma secuencia ancestral separada por un evento de especiación : cuando una especie diverge en dos especies separadas, se dice que las copias de un solo gen en las dos especies resultantes son ortólogas. Los ortólogos, o genes ortólogos, son genes de diferentes especies que se originaron por descendencia vertical de un único gen del último ancestro común . El término "ortólogo" fue acuñado en 1970 por el evolucionista molecular Walter Fitch . [5]

Por ejemplo, la proteína reguladora de la gripe vegetal está presente tanto en Arabidopsis (planta superior multicelular) como en Chlamydomonas (alga verde unicelular). La versión de Chlamydomonas es más compleja: cruza la membrana dos veces en lugar de una, contiene dominios adicionales y se somete a un empalme alternativo. Sin embargo, puede sustituir completamente a la proteína Arabidopsis , mucho más simple , si se transfiere del genoma de las algas al genoma de las plantas mediante ingeniería genética . La similitud de secuencia significativa y los dominios funcionales compartidos indican que estos dos genes son genes ortólogos, [6] heredados del ancestro compartido .

La ortología está estrictamente definida en términos de ascendencia. Dado que es difícil determinar la ascendencia exacta de genes en diferentes organismos debido a la duplicación de genes y a eventos de reordenamiento del genoma, la evidencia más sólida de que dos genes similares son ortólogos generalmente se encuentra realizando un análisis filogenético del linaje de genes. Los ortólogos suelen, pero no siempre, tener la misma función. [7]

Las secuencias ortólogas proporcionan información útil en la clasificación taxonómica y estudios filogenéticos de organismos. El patrón de divergencia genética se puede utilizar para rastrear la relación de los organismos. Es probable que dos organismos que están muy relacionados muestren secuencias de ADN muy similares entre dos ortólogos. Por el contrario, un organismo que está más alejado evolutivamente de otro organismo probablemente muestre una mayor divergencia en la secuencia de los ortólogos que se estudian. [ cita necesaria ]

Bases de datos de genes ortólogos.

Dada su tremenda importancia para la biología y la bioinformática , los genes ortólogos se han organizado en varias bases de datos especializadas que proporcionan herramientas para identificar y analizar secuencias de genes ortólogos. Estos recursos emplean enfoques que generalmente se pueden clasificar en aquellos que utilizan análisis heurístico de todas las comparaciones de secuencias por pares y aquellos que utilizan métodos filogenéticos . Los métodos de comparación de secuencias fueron pioneros en la base de datos COG en 1997. [8] Estos métodos se han ampliado y automatizado en doce bases de datos diferentes, siendo la más avanzada AYbRAH Analyzing Yeasts by Reconstructing Ancestry of Homologs [9], así como las siguientes bases de datos en este momento. .

Los enfoques filogenéticos basados ​​en árboles tienen como objetivo distinguir la especiación de los eventos de duplicación de genes comparando árboles de genes con árboles de especies, tal como se implementan en bases de datos y herramientas de software como:

Una tercera categoría de enfoques híbridos utiliza métodos tanto heurísticos como filogenéticos para construir grupos y determinar árboles, por ejemplo:

paralogía

Los genes parálogos son genes que se relacionan mediante eventos de duplicación en el último ancestro común (LCA) de la especie que se compara. Resultan de la mutación de genes duplicados durante eventos de especiación separados. Cuando los descendientes de LCA comparten homólogos mutados de los genes duplicados originales, esos genes se consideran parálogos. [1]

Por ejemplo, en el LCA, un gen (gen A) puede duplicarse para formar un gen similar (gen B); esos dos genes continuarán transmitiéndose a las generaciones posteriores. Durante la especiación, un ambiente favorecerá una mutación en el gen A (gen A1), produciendo una nueva especie con los genes A1 y B. Luego, en un evento de especiación separado, un ambiente favorecerá una mutación en el gen B (gen B1) dando lugar a una nueva especie con genes A y B1. Los genes A1 y B1 de los descendientes son parálogos entre sí porque son homólogos que están relacionados mediante un evento de duplicación en el último ancestro común de las dos especies. [1]

Las clasificaciones adicionales de parálogos incluyen aloparálogos (parálogos externos) y simparalogos (parálogos internos). Los aloparálogos son parálogos que evolucionaron a partir de duplicaciones de genes que precedieron al evento de especiación dado. En otras palabras, los aloparálogos son parálogos que evolucionaron a partir de eventos de duplicación que ocurrieron en el ACV de los organismos que se comparan. El ejemplo anterior es un ejemplo de aloparalogía. Los simparalogos son parálogos que evolucionaron a partir de la duplicación de genes parálogos en eventos de especiación posteriores. Según el ejemplo anterior, si el descendiente con los genes A1 y B sufriera otro evento de especiación en el que el gen A1 se duplicara, la nueva especie tendría los genes B, A1a y A1b. En este ejemplo, los genes A1a y A1b son simpalogos. [1]

Los genes Hox de los vertebrados están organizados en conjuntos de parálogos. Cada grupo Hox (HoxA, HoxB, etc.) está en un cromosoma diferente. Por ejemplo, el grupo HoxA humano está en el cromosoma 7 . El grupo HoxA de ratón que se muestra aquí tiene 11 genes parálogos (faltan 2). [37]

Los genes parálogos pueden dar forma a la estructura de genomas completos y, por tanto, explicar en gran medida la evolución del genoma. Los ejemplos incluyen los genes Homeobox ( Hox ) en animales. Estos genes no sólo sufrieron duplicaciones genéticas dentro de los cromosomas sino también duplicaciones del genoma completo . Como resultado, los genes Hox en la mayoría de los vertebrados están agrupados en múltiples cromosomas, siendo los grupos HoxA-D los mejor estudiados. [37]

Otro ejemplo son los genes de globina que codifican la mioglobina y la hemoglobina y se consideran parálogos antiguos. De manera similar, las cuatro clases conocidas de hemoglobinas ( hemoglobina A , hemoglobina A2 , hemoglobina B y hemoglobina F ) son parálogos entre sí. Si bien cada una de estas proteínas cumple la misma función básica de transporte de oxígeno, sus funciones ya han divergido ligeramente: la hemoglobina fetal (hemoglobina F) tiene una mayor afinidad por el oxígeno que la hemoglobina adulta. Sin embargo, la función no siempre se conserva. La angiogenina humana se separó de la ribonucleasa , por ejemplo, y aunque los dos parálogos siguen siendo similares en su estructura terciaria, sus funciones dentro de la célula son ahora bastante diferentes. [ cita necesaria ]

A menudo se afirma que los ortólogos son más similares funcionalmente que los parálogos de divergencia similar, pero varios artículos han cuestionado esta noción. [38] [39] [40]

Regulación

Los parálogos a menudo se regulan de manera diferente, por ejemplo, al tener diferentes patrones de expresión específicos de tejido (ver genes Hox). Sin embargo, también pueden regularse de forma diferente a nivel de proteínas. Por ejemplo, Bacillus subtilis codifica dos parálogos de la glutamato deshidrogenasa : GudB se transcribe constitutivamente mientras que RocG está estrictamente regulado. En sus estados oligoméricos activos, ambas enzimas muestran tasas enzimáticas similares. Sin embargo, los intercambios de enzimas y promotores provocan graves pérdidas de aptitud física, lo que indica una coevolución promotor-enzima. La caracterización de las proteínas muestra que, en comparación con RocG, la actividad enzimática de GudB depende en gran medida del glutamato y del pH. [41]

Regiones cromosómicas parálogas

A veces, grandes regiones de cromosomas comparten contenido genético similar a otras regiones cromosómicas dentro del mismo genoma. [42] Están bien caracterizados en el genoma humano, donde se han utilizado como evidencia para apoyar la hipótesis 2R . Se deduce que conjuntos de genes duplicados, triplicados y cuadruplicados, con los genes relacionados en diferentes cromosomas, son restos del genoma o duplicaciones cromosómicas. Un conjunto de regiones paralógicas se denomina en conjunto paralogon. [43] Los conjuntos de regiones paralógicas bien estudiados incluyen regiones del cromosoma humano 2, 7, 12 y 17 que contienen grupos de genes Hox , genes de colágeno , genes de queratina y otros genes duplicados, [44] regiones de los cromosomas humanos 4, 5, 8 y 10 que contienen genes de receptores de neuropéptidos, genes homeobox de clase NK y muchas más familias de genes , [45] [46] [47] y partes de los cromosomas humanos 13, 4, 5 y X que contienen los genes ParaHox y sus vecinos. [48] ​​El complejo mayor de histocompatibilidad (MHC) en el cromosoma 6 humano tiene regiones paralógicas en los cromosomas 1, 9 y 19. [49] Gran parte del genoma humano parece asignarse a regiones paralógicas. [50]

Ohnología

Los genes ohnólogos son genes parálogos que se han originado mediante un proceso de duplicación de todo el genoma . El nombre fue dado por primera vez en honor a Susumu Ohno por Ken Wolfe. [51] Los ohnólogos son útiles para el análisis evolutivo porque todos los ohnólogos en un genoma han divergido durante el mismo período de tiempo (desde su origen común en la duplicación del genoma completo). También se sabe que los ohnólogos muestran una mayor asociación con cánceres, trastornos genéticos dominantes y variaciones en el número de copias patógenas. [52] [53] [54] [55] [56]

xenología

Los homólogos resultantes de la transferencia horizontal de genes entre dos organismos se denominan xenólogos. Los xenólogos pueden tener diferentes funciones si el nuevo entorno es muy diferente para el gen que se mueve horizontalmente. Sin embargo, en general, los xenólogos suelen tener funciones similares en ambos organismos. El término fue acuñado por Walter Fitch. [5]

homeología

Los cromosomas o partes de cromosomas homólogos (también escritos homeólogos) son aquellos que se reúnen después de una hibridación y alopoliploidización entre especies para formar un genoma híbrido , y cuya relación era completamente homóloga en una especie ancestral. [57] En los alopoliploides, los cromosomas homólogos dentro de cada subgenoma parental deben emparejarse fielmente durante la meiosis , lo que lleva a la herencia disómica; sin embargo, en algunos alopoliploides, los cromosomas homólogos de los genomas parentales pueden ser casi tan similares entre sí como los cromosomas homólogos, lo que lleva a herencia tetrasómica (cuatro cromosomas apareados en la meiosis), recombinación intergenómica y fertilidad reducida. [ cita necesaria ]

Gametología

La gametología denota la relación entre genes homólogos en cromosomas de sexos opuestos que no se recombinan . El término fue acuñado por García-Moreno y Mindell. [58] 2000. Los gametólogos son el resultado del origen de la determinación genética del sexo y las barreras a la recombinación entre los cromosomas sexuales. Ejemplos de gametólogos incluyen CHDW y CHDZ en aves. [58]

Ver también

Referencias

  1. ^ abcd Koonin EV (2005). "Ortólogos, parálogos y genómica evolutiva". Revista Anual de Genética . 39 : 309–38. doi :10.1146/annurev.genet.39.073003.114725. PMID  16285863.
  2. ^ "Preguntas frecuentes sobre #Símbolos de Clustal". Clustal . Consultado el 8 de diciembre de 2014 .
  3. ^ ab Reeck GR, de Haën C, Teller DC, Doolittle RF, Fitch WM, Dickerson RE, et al. (Agosto de 1987). ""Homología" en proteínas y ácidos nucleicos: una confusión terminológica y una salida a ella". Cell . 50 (5): 667. doi :10.1016/0092-8674(87)90322-9. PMID  3621342. S2CID  42949514.
  4. ^ Holman C (enero de 2004). "Puntuación de similitud de proteínas: una versión simplificada de Blast Score como una alternativa superior al porcentaje de identidad para reclamar géneros de secuencias de proteínas relacionadas". Revista de Derecho de Alta Tecnología de Santa Clara . 21 (1): 55. ISSN  0882-3383.
  5. ^ ab Fitch WM (junio de 1970). "Distinguir las proteínas homólogas de las análogas". Zoología Sistemática . 19 (2): 99-113. doi :10.2307/2412448. JSTOR  2412448. PMID  5449325. Cuando la homología es el resultado de la duplicación de genes, de modo que ambas copias han descendido una al lado de la otra durante la historia de un organismo (por ejemplo, hemoglobina a y b), los genes deben denominarse parálogos (para = en paralelo ). Cuando la homología es el resultado de la especiación, de modo que la historia del gen refleja la historia de la especie (por ejemplo, una hemoglobina en el hombre y el ratón), los genes deben denominarse ortólogos (orto = exacto).
  6. ^ Falciatore A, Merendino L, Barneche F, Ceol M, Meskauskiene R, Apel K, Rochaix JD (enero de 2005). "Las proteínas FLP actúan como reguladores de la síntesis de clorofila en respuesta a señales luminosas y de plastidios en Chlamydomonas". Genes y desarrollo . 19 (1): 176–87. doi :10.1101/gad.321305. PMC 540235 . PMID  15630026. 
  7. ^ Fang G, Bhardwaj N, Robilotto R, Gerstein MB (marzo de 2010). "Introducción a la ortología genética y el análisis funcional". PLOS Biología Computacional . 6 (3): e1000703. Código Bib : 2010PLSCB...6E0703F. doi : 10.1371/journal.pcbi.1000703 . PMC 2845645 . PMID  20361041. 
  8. ^ COG: grupos de grupos ortólogos de proteínas Tatusov RL, Koonin EV, Lipman DJ (octubre de 1997). "Una perspectiva genómica de las familias de proteínas". Ciencia . 278 (5338): 631–7. Código Bib : 1997 Ciencia... 278..631T. doi : 10.1126/ciencia.278.5338.631. PMID  9381173.
  9. ^ Correia K, Yu SM, Mahadevan R (enero de 2019). "AYbRAH: una base de datos de ortólogos seleccionados para levaduras y hongos que abarca 600 millones de años de evolución". Base de datos . 2019 . doi : 10.1093/database/baz022. PMC 6425859 . PMID  30893420. 
  10. ^ eggNOG: genealogía evolutiva de genes: grupos ortólogos no supervisados ​​Muller J, Szklarczyk D, Julien P, Letunic I, Roth A, Kuhn M, et al. (Enero de 2010). "eggNOG v2.0: ampliación de la genealogía evolutiva de genes con anotaciones funcionales, especies y grupos ortólogos no supervisados ​​mejorados". Investigación de ácidos nucleicos . 38 (Problema de base de datos): D190-5. doi : 10.1093/nar/gkp951. PMC 2808932 . PMID  19900971.
     
  11. ^ Powell S, Forslund K, Szklarczyk D, Trachana K, Roth A, Huerta-Cepas J, et al. (Enero 2014). "eggNOG v4.0: inferencia de ortología anidada en 3686 organismos". Investigación de ácidos nucleicos . 42 (Problema de base de datos): D231-9. doi : 10.1093/nar/gkt1253. PMC 3964997 . PMID  24297252. 
  12. ^ GreenPhylDB Conte MG, Gaillard S, Lanau N, Rouard M, Périn C (enero de 2008). "GreenPhylDB: una base de datos para genómica comparativa de plantas". Investigación de ácidos nucleicos . 36 (Problema de base de datos): D991-8. doi : 10.1093/nar/gkm934. PMC 2238940 . PMID  17986457.
     
  13. ^ Rouard M, Guignon V, Aluome C, Laporte MA, Droc G, Walde C, et al. (Enero de 2011). "GreenPhylDB v2.0: genómica comparativa y funcional en plantas". Investigación de ácidos nucleicos . 39 (Problema de base de datos): D1095-102. doi : 10.1093/nar/gkq811. PMC 3013755 . PMID  20864446. 
  14. ^ Inparanoico: grupos de ortólogos eucariotas Ostlund G, Schmitt T, Forslund K, Köstler T, Messina DN, Roopra S, et al. (Enero de 2010). "InParanoid 7: nuevos algoritmos y herramientas para el análisis de ortología eucariota". Investigación de ácidos nucleicos . 38 (Problema de base de datos): D196-203. doi : 10.1093/nar/gkp931. PMC 2808972 . PMID  19892828.
     
  15. ^ Sonnhammer EL, Östlund G (enero de 2015). "InParanoid 8: análisis de ortología entre 273 proteomas, en su mayoría eucariotas". Investigación de ácidos nucleicos . 43 (Problema de base de datos): D234-9. doi : 10.1093/nar/gku1203. PMC 4383983 . PMID  25429972. 
  16. ^ Singh PP, Arora J, Isambert H (julio de 2015). "Identificación de genes Ohnolog que se originan a partir de la duplicación del genoma completo en vertebrados tempranos, basada en una comparación de sintenia entre múltiples genomas". PLOS Biología Computacional . 11 (7): e1004394. Código Bib : 2015PLSCB..11E4394S. doi : 10.1371/journal.pcbi.1004394 . PMC 4504502 . PMID  26181593. 
  17. ^ "Ohnólogos de vertebrados". ohnologs.curie.fr . Consultado el 12 de octubre de 2018 .
  18. ^ Altenhoff AM, Glover NM, Train CM, Kaleb K, Warwick Vesztrocy A, Dylus D, et al. (Enero de 2018). "La base de datos de ortología OMA en 2018: recuperando relaciones evolutivas entre todos los dominios de la vida a través de interfaces web y programáticas más ricas". Investigación de ácidos nucleicos . 46 (D1): D477–D485. doi : 10.1093/nar/gkx1019. PMC 5753216 . PMID  29106550. 
  19. ^ Zdobnov EM, Tegenfeldt F, Kuznetsov D, Waterhouse RM, Simão FA, Ioannidis P, et al. (Enero de 2017). "OrthoDB v9.1: catalogación de anotaciones evolutivas y funcionales para ortólogos de animales, hongos, plantas, arqueas, bacterias y virus". Investigación de ácidos nucleicos . 45 (D1): D744–D749. doi : 10.1093/nar/gkw1119. PMC 5210582 . PMID  27899580. 
  20. ^ Nevers Y, Kress A, Defosset A, Ripp R, Linard B, Thompson JD y col. (Enero de 2019). "OrthoInspector 3.0: portal abierto de genómica comparada". Investigación de ácidos nucleicos . 47 (D1): D411-D418. doi : 10.1093/nar/gky1068 . PMC 6323921 . PMID  30380106. 
  21. ^ OrthologID Chiu JC, Lee EK, Egan MG, Sarkar IN, Coruzzi GM, DeSalle R (marzo de 2006). "OrthologID: automatización de la identificación de ortólogos a escala genómica dentro de un marco de parsimonia". Bioinformática . 22 (6): 699–707. doi : 10.1093/bioinformática/btk040 . PMID  16410324.
  22. ^ Egan M, Lee EK, Chiu JC, Coruzzi G, Desalle R (2009). "Evaluación de ortología genética con OrthologID". En Posada D (ed.). Bioinformática para el análisis de secuencias de ADN . Métodos en biología molecular. vol. 537. Prensa Humana. págs. 23–38. doi :10.1007/978-1-59745-251-9_2. ISBN 978-1-59745-251-9. PMID  19378138.
  23. ^ OrthoMaM Ranwez V, Delsuc F, Ranwez S, Belkhir K, Tilak MK, Douzery EJ (noviembre de 2007). "OrthoMaM: una base de datos de marcadores genómicos ortólogos para la filogenética de mamíferos placentarios". Biología Evolutiva del BMC . 7 (1): 241. Código bibliográfico : 2007BMCEE...7..241R. doi : 10.1186/1471-2148-7-241 . PMC 2249597 . PMID  18053139.
     
  24. ^ Douzery EJ, Scornavacca C, Romiguier J, Belkhir K, Galtier N, Delsuc F, Ranwez V (julio de 2014). "OrthoMaM v8: una base de datos de exones ortólogos y secuencias codificantes para genómica comparativa en mamíferos". Biología Molecular y Evolución . 31 (7): 1923–8. doi : 10.1093/molbev/msu132 . PMID  24723423.
  25. ^ Scornavacca C, Belkhir K, Lopez J, Dernat R, Delsuc F, Douzery EJ, Ranwez V (abril de 2019). "OrthoMaM v10: ampliación de la secuencia de codificación ortóloga y alineaciones de exones con más de cien genomas de mamíferos". Biología Molecular y Evolución . 36 (4): 861–862. doi :10.1093/molbev/msz015. PMC 6445298 . PMID  30698751. 
  26. ^ OrthoMCL: identificación de grupos de ortólogos para genomas eucarióticos Chen F, Mackey AJ, Stoeckert CJ, Roos DS (enero de 2006). "OrthoMCL-DB: consulta de una colección completa de grupos de ortólogos de múltiples especies". Investigación de ácidos nucleicos . 34 (Problema de base de datos): D363-8. doi : 10.1093/nar/gkj123. PMC 1347485 . PMID  16381887.
     
  27. ^ Fischer S, Brunk BP, Chen F, Gao X, Harb OS, Iodice JB y col. (Septiembre de 2011). "Uso de OrthoMCL para asignar proteínas a grupos OrthoMCL-DB o para agrupar proteomas en nuevos grupos de ortólogos". Protocolos Actuales en Bioinformática . Capítulo 6 (1): Unidad 6.12.1–19. doi :10.1002/0471250953.bi0612s35. ISBN 978-0471250951. PMC  3196566 . PMID  21901743.
  28. ^ Resumen Deluca TF, Wu IH, Pu J, Monaghan T, Peshkin L, Singh S, Wall DP (agosto de 2006). "Resumen: un repositorio multigenomático de ortólogos y distancias evolutivas". Bioinformática . 22 (16): 2044–6. doi : 10.1093/bioinformática/btl286 . PMID  16777906.
  29. ^ TreeFam: base de datos de familias de árboles van der Heijden RT, Snel B, van Noort V, Huynen MA (marzo de 2007). "Predicción de ortología con resolución escalable mediante análisis de árboles filogenéticos". Bioinformática BMC . 8 : 83. doi : 10.1186/1471-2105-8-83 . PMC 1838432 . PMID  17346331.
     
  30. ^ TreeFam: base de datos de familias de árboles Ruan J, Li H, Chen Z, Coghlan A, Coin LJ, Guo Y, et al. (Enero de 2008). "TreeFam: Actualización de 2008". Investigación de ácidos nucleicos . 36 (Problema de base de datos): D735-40. doi :10.1093/nar/gkm1005. PMC 2238856 . PMID  18056084.
     
  31. ^ Schreiber F, Patricio M, Muffato M, Pignatelli M, Bateman A (enero de 2014). "TreeFam v9: un nuevo sitio web, más especies y ortología sobre la marcha". Investigación de ácidos nucleicos . 42 (Problema de base de datos): D922-5. doi : 10.1093/nar/gkt1055. PMC 3965059 . PMID  24194607. 
  32. ^ OrthoFinder: ortólogos de árboles genéticos Emms DM, Kelly S (noviembre de 2019). "OrthoFinder: inferencia de ortología filogenética para genómica comparada". Biología del genoma . 20 (1): 238. doi : 10.1186/s13059-019-1832-y . PMC 6857279 . PMID  31727128.
     
  33. ^ Vilella AJ, Severin J, Ureta-Vidal A, Heng L, Durbin R, Birney E (febrero de 2009). "EnsemblCompara GeneTrees: árboles filogenéticos completos y conscientes de la duplicación en vertebrados". Investigación del genoma . 19 (2): 327–35. doi :10.1101/gr.073585.107. PMC 2652215 . PMID  19029536. 
  34. ^ Thanki AS, Soranzo N, Haerty W, Davey RP (marzo de 2018). "GeneSeqToFamily: un flujo de trabajo de Galaxy para encontrar familias de genes basado en el proceso Ensembl Compara GeneTrees". GigaCiencia . 7 (3): 1–10. doi : 10.1093/gigascience/giy005. PMC 5863215 . PMID  29425291. 
  35. ^ Sayers EW, Barrett T, Benson DA, Bolton E, Bryant SH, Canese K, et al. (Enero de 2011). "Recursos de base de datos del Centro Nacional de Información Biotecnológica". Investigación de ácidos nucleicos . 39 (Problema de base de datos): D38-51. doi : 10.1093/nar/gkq1172. PMC 3013733 . PMID  21097890. 
  36. ^ Fulton DL, Li YY, Laird MR, Horsman BG, Roche FM, Brinkman FS (mayo de 2006). "Mejora de la especificidad de la predicción ortóloga de alto rendimiento". Bioinformática BMC . 7 : 270. doi : 10.1186/1471-2105-7-270 . PMC 1524997 . PMID  16729895. 
  37. ^ ab Zakany J, Duboule D (agosto de 2007). "El papel de los genes Hox durante el desarrollo de las extremidades de los vertebrados". Opinión actual en genética y desarrollo . 17 (4): 359–66. doi :10.1016/j.gde.2007.05.011. PMID  17644373.
  38. ^ Studer RA, Robinson-Rechavi M (mayo de 2009). "¿Qué tan seguros podemos estar de que los ortólogos son similares, pero los parálogos difieren?". Tendencias en Genética . 25 (5): 210–6. doi :10.1016/j.tig.2009.03.004. PMID  19368988.
  39. ^ Nehrt NL, Clark WT, Radivojac P, Hahn MW (junio de 2011). "Prueba de la conjetura del ortólogo con datos genómicos funcionales comparativos de mamíferos". PLOS Biología Computacional . 7 (6): e1002073. Código Bib : 2011PLSCB...7E2073N. doi : 10.1371/journal.pcbi.1002073 . PMC 3111532 . PMID  21695233. 
  40. ^ Eisen J (20 de septiembre de 2011). "Invitación especial a publicación e invitación a debate de Matthew Hahn sobre el documento de conjeturas de ortólogos".
  41. ^ Noda-García L, Romero Romero ML, Longo LM, Kolodkin-Gal I, Tawfik DS (julio de 2017). "Las bacilos glutamato deshidrogenasas divergieron mediante la coevolución de la transcripción y la regulación enzimática". Informes EMBO . 18 (7): 1139-1149. doi :10.15252/embr.201743990. PMC 5494520 . PMID  28468957. 
  42. ^ Lundin LG (abril de 1993). "Evolución del genoma de los vertebrados reflejada en regiones cromosómicas parálogas en el hombre y el ratón doméstico". Genómica . 16 (1): 1–19. doi :10.1006/geno.1993.1133. PMID  8486346.
  43. ^ Coulier F, Popovici C, Villet R, Birnbaum D (diciembre de 2000). "Grupos de genes MetaHox". La Revista de Zoología Experimental . 288 (4): 345–51. doi :10.1002/1097-010X(20001215)288:4<345::AID-JEZ7>3.0.CO;2-Y. PMID  11144283.
  44. ^ Ruddle FH, Bentley KL, Murtha MT, Risch N (1994). "Pérdida y ganancia de genes en la evolución de los vertebrados". Desarrollo . 1994 : 155–61. doi :10.1242/dev.1994.Suplemento.155. PMID  7579516.
  45. ^ Pébusque MJ, Coulier F, Birnbaum D, Pontarotti P (septiembre de 1998). "Antiguas duplicaciones de genomas a gran escala: análisis filogenéticos y de ligamiento arrojan luz sobre la evolución del genoma de los cordados". Biología Molecular y Evolución . 15 (9): 1145–59. doi : 10.1093/oxfordjournals.molbev.a026022 . PMID  9729879.
  46. ^ Larsson TA, Olsson F, Sundstrom G, Lundin LG, Brenner S, Venkatesh B, Larhammar D (junio de 2008). "Duplicaciones tempranas de cromosomas de vertebrados y la evolución de las regiones del gen del receptor del neuropéptido Y". Biología Evolutiva del BMC . 8 (1): 184. Código bibliográfico : 2008BMCEE...8..184L. doi : 10.1186/1471-2148-8-184 . PMC 2453138 . PMID  18578868. 
  47. ^ Pollard SL, Holland PW (septiembre de 2000). "Evidencia de 14 grupos de genes homeobox en la ascendencia del genoma humano". Biología actual . 10 (17): 1059–62. doi : 10.1016/S0960-9822(00)00676-X . PMID  10996074. S2CID  32135432.
  48. ^ Mulley JF, Chiu CH, Holland PW (julio de 2006). "Rotura de un grupo de homeobox después de la duplicación del genoma en teleósteos". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 103 (27): 10369–10372. Código bibliográfico : 2006PNAS..10310369M. doi : 10.1073/pnas.0600341103 . PMC 1502464 . PMID  16801555. 
  49. ^ Flajnik MF, Kasahara M (septiembre de 2001). "Genómica comparada del MHC: vistazos a la evolución del sistema inmunológico adaptativo". Inmunidad . 15 (3): 351–62. doi : 10.1016/S1074-7613(01)00198-4 . PMID  11567626.
  50. ^ McLysaght A, Hokamp K, Wolfe KH (junio de 2002). "Amplia duplicación genómica durante la evolución temprana de los cordados". Genética de la Naturaleza . 31 (2): 200–4. doi :10.1038/ng884. PMID  12032567. S2CID  8263376.
  51. ^ Wolfe K (mayo de 2000). "Robustez: no está donde crees que está". Genética de la Naturaleza . 25 (1): 3–4. doi :10.1038/75560. PMID  10802639. S2CID  85257685.
  52. ^ Singh PP, Affeldt S, Cascone I, Selimoglu R, Camonis J, Isambert H (noviembre de 2012). "Sobre la expansión de repertorios de genes" peligrosos "mediante duplicaciones del genoma completo en los primeros vertebrados". Informes celulares . 2 (5): 1387–98. doi : 10.1016/j.celrep.2012.09.034 . PMID  23168259.
  53. ^ Malaguti G, Singh PP, Isambert H (mayo de 2014). "Sobre la retención de duplicados de genes propensos a mutaciones nocivas dominantes". Biología Teórica de Poblaciones . 93 : 38–51. doi :10.1016/j.tpb.2014.01.004. PMID  24530892.
  54. ^ Singh PP, Affeldt S, Malaguti G, Isambert H (julio de 2014). "Los genes de enfermedades dominantes humanas están enriquecidos en parálogos que se originan en la duplicación del genoma completo". PLOS Biología Computacional . 10 (7): e1003754. Código Bib : 2014PLSCB..10E3754S. doi : 10.1371/journal.pcbi.1003754 . PMC 4117431 . PMID  25080083. 
  55. ^ McLysaght A, Makino T, Grayton HM, Tropeano M, Mitchell KJ, Vassos E, Collier DA (enero de 2014). "Los ohnólogos están sobrerrepresentados en mutaciones patógenas del número de copias". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 111 (1): 361–6. Código Bib : 2014PNAS..111..361M. doi : 10.1073/pnas.1309324111 . PMC 3890797 . PMID  24368850. 
  56. ^ Makino T, McLysaght A (mayo de 2010). "Los ohnólogos del genoma humano tienen dosis equilibradas y frecuentemente se asocian con enfermedades". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 107 (20): 9270–4. Código Bib : 2010PNAS..107.9270M. doi : 10.1073/pnas.0914697107 . PMC 2889102 . PMID  20439718. 
  57. ^ Glover NM, Redestig H, Dessimoz C (julio de 2016). "Homólogos: ¿qué son y cómo los inferimos?". Tendencias en ciencia vegetal . 21 (7). Prensa celular : 609–621. doi :10.1016/j.tplants.2016.02.005. PMC 4920642 . PMID  27021699. 
  58. ^ ab García-Moreno J, Mindell DP (diciembre de 2000). "Enraizamiento de una filogenia con genes homólogos en cromosomas del sexo opuesto (gametólogos): un estudio de caso utilizando CHD aviar". Biología Molecular y Evolución . 17 (12): 1826–32. doi : 10.1093/oxfordjournals.molbev.a026283 . PMID  11110898.