stringtranslate.com

secuencia conservada

Una alineación de secuencia múltiple de cinco proteínas histonas H1
de mamíferos . Las secuencias son los aminoácidos de los residuos 120-180 de las proteínas. Los residuos que se conservan en todas las secuencias se resaltan en gris. Debajo de cada sitio (es decir, posición) de la alineación de la secuencia de proteínas hay una clave que indica sitios conservados (*), sitios con reemplazos conservadores (:), sitios con reemplazos semiconservadores (.) y sitios con reemplazos no conservadores (). . [1]

En biología evolutiva , las secuencias conservadas son secuencias idénticas o similares en ácidos nucleicos ( ADN y ARN ) o proteínas entre especies ( secuencias ortólogas ), o dentro de un genoma ( secuencias parálogas ), o entre taxones donantes y receptores ( secuencias xenólogas ). La conservación indica que una secuencia se ha mantenido por selección natural .

Una secuencia altamente conservada es aquella que ha permanecido relativamente sin cambios en etapas muy anteriores del árbol filogenético y, por tanto, en tiempos geológicos muy lejanos . Ejemplos de secuencias altamente conservadas incluyen los componentes de ARN de los ribosomas presentes en todos los ámbitos de la vida, las secuencias homeobox muy extendidas entre los eucariotas y el ARNtm en las bacterias . El estudio de la conservación de secuencias se superpone con los campos de la genómica , la proteómica , la biología evolutiva , la filogenética , la bioinformática y las matemáticas .

Historia

El descubrimiento del papel del ADN en la herencia y las observaciones realizadas por Frederick Sanger sobre la variación entre las insulinas animales en 1949 [2] impulsaron a los primeros biólogos moleculares a estudiar la taxonomía desde una perspectiva molecular. [3] [4] Los estudios realizados en la década de 1960 utilizaron técnicas de hibridación de ADN y reactividad cruzada de proteínas para medir la similitud entre proteínas ortólogas conocidas , como la hemoglobina [5] y el citocromo c . [6] En 1965, Émile Zuckerkandl y Linus Pauling introdujeron el concepto de reloj molecular , [7] proponiendo que se podrían utilizar tasas constantes de reemplazo de aminoácidos para estimar el tiempo transcurrido desde que dos organismos divergieron . Si bien las filogenias iniciales coincidían estrechamente con el registro fósil , las observaciones de que algunos genes parecían evolucionar a ritmos diferentes llevaron al desarrollo de teorías de la evolución molecular . [3] [4] La comparación de secuencias de ferredoxina realizada por Margaret Dayhoff en 1966 mostró que la selección natural actuaría para conservar y optimizar secuencias de proteínas esenciales para la vida. [8]

Mecanismos

A lo largo de muchas generaciones, las secuencias de ácidos nucleicos en el genoma de un linaje evolutivo pueden cambiar gradualmente con el tiempo debido a mutaciones y deleciones aleatorias . [9] [10] Las secuencias también pueden recombinarse o eliminarse debido a reordenamientos cromosómicos . Las secuencias conservadas son secuencias que persisten en el genoma a pesar de tales fuerzas y tienen tasas de mutación más lentas que la tasa de mutación de fondo. [11]

La conservación puede ocurrir en secuencias de ácidos nucleicos codificantes y no codificantes . Se cree que las secuencias de ADN altamente conservadas tienen valor funcional, aunque no se comprende bien el papel de muchas secuencias de ADN no codificantes altamente conservadas . [12] [13] El grado de conservación de una secuencia puede verse afectado por diferentes presiones de selección , su resistencia a la mutación, el tamaño de la población y la deriva genética . Muchas secuencias funcionales también son modulares y contienen regiones que pueden estar sujetas a presiones de selección independientes , como los dominios proteicos . [14]

Secuencia de codificación

En las secuencias codificantes, la secuencia de ácidos nucleicos y aminoácidos puede conservarse en diferentes grados, ya que la degeneración del código genético significa que mutaciones sinónimas en una secuencia codificante no afectan la secuencia de aminoácidos de su producto proteico. [15]

Las secuencias de aminoácidos se pueden conservar para mantener la estructura o función de una proteína o dominio. Las proteínas conservadas sufren menos reemplazos de aminoácidos , o es más probable que sustituyan aminoácidos con propiedades bioquímicas similares . [16] Dentro de una secuencia, los aminoácidos que son importantes para el plegamiento , la estabilidad estructural o que forman un sitio de unión pueden estar más conservados. [17] [18]

La secuencia de ácido nucleico de un gen codificante de proteína también puede conservarse mediante otras presiones selectivas. El sesgo en el uso de codones en algunos organismos puede restringir los tipos de mutaciones sinónimas en una secuencia. Las secuencias de ácido nucleico que causan una estructura secundaria en el ARNm de un gen codificante pueden seleccionarse, ya que algunas estructuras pueden afectar negativamente a la traducción, o conservarse cuando el ARNm también actúa como un ARN no codificante funcional. [19] [20]

Sin codificación

Las secuencias no codificantes importantes para la regulación genética , como los sitios de unión o reconocimiento de los ribosomas y los factores de transcripción , pueden conservarse dentro de un genoma. Por ejemplo, también puede conservarse el promotor de un gen u operón conservado. Al igual que ocurre con las proteínas, también se pueden conservar los ácidos nucleicos que son importantes para la estructura y función del ARN no codificante (ARNnc). Sin embargo, la conservación de la secuencia en los ncRNA es generalmente deficiente en comparación con las secuencias que codifican proteínas, y en su lugar a menudo se conservan los pares de bases que contribuyen a la estructura o función. [21] [22]

Identificación

Las secuencias conservadas normalmente se identifican mediante enfoques bioinformáticos basados ​​en el alineamiento de secuencias . Los avances en la secuenciación de ADN de alto rendimiento y la espectrometría de masas de proteínas han aumentado sustancialmente la disponibilidad de secuencias de proteínas y genomas completos para comparar desde principios de la década de 2000. [23] [24]

Búsqueda de homología

Las secuencias conservadas pueden identificarse mediante búsqueda de homología , utilizando herramientas como BLAST , HMMER , OrthologR, [25] e Infernal. [26] Las herramientas de búsqueda de homología pueden tomar una secuencia de proteína o ácido nucleico individual como entrada, o utilizar modelos estadísticos generados a partir de múltiples alineamientos de secuencias relacionadas conocidas. Los modelos estadísticos como los HMM de perfil y los modelos de covarianza de ARN que también incorporan información estructural [27] pueden ser útiles cuando se buscan secuencias relacionadas más distantes. Luego, las secuencias de entrada se alinean con una base de datos de secuencias de individuos u otras especies relacionadas. Luego, los alineamientos resultantes se califican en función del número de aminoácidos o bases coincidentes y del número de espacios o deleciones generados por el alineamiento. Se pueden identificar sustituciones conservadoras aceptables utilizando matrices de sustitución como PAM y BLOSUM . Se supone que las alineaciones con puntuaciones altas provienen de secuencias homólogas. La conservación de una secuencia puede entonces inferirse mediante la detección de homólogos muy similares en un amplio rango filogenético. [28]

Alineación de secuencias múltiples

Un logotipo de secuencia para el motivo de unión a LexA de bacterias grampositivas . Como la adenosina en la posición 5 está muy conservada, parece más grande que otros caracteres. [29]

Se pueden utilizar múltiples alineamientos de secuencias para visualizar secuencias conservadas. El formato CLUSTAL incluye una clave de texto sin formato para anotar columnas conservadas de la alineación, que denota secuencia conservada (*), mutaciones conservadoras (:), mutaciones semiconservadoras (.) y mutaciones no conservativas () [30] Logotipos de secuencia También puede mostrar una secuencia conservada representando las proporciones de caracteres en cada punto de la alineación por altura. [29]

Alineación del genoma

Esta imagen del navegador ECR [31] muestra el resultado de alinear diferentes genomas de vertebrados con el genoma humano en el gen OTX2 conservado . Arriba: anotaciones genéticas de exones e intrones del gen OTX2. Para cada genoma, se traza la similitud de secuencia (%) en comparación con el genoma humano. Las huellas muestran los genomas del pez cebra , el perro , el pollo , la rana con garras occidental , la zarigüeya , el ratón , el macaco rhesus y el chimpancé . Los picos muestran regiones de alta similitud de secuencia en todos los genomas, lo que demuestra que esta secuencia está altamente conservada.

Las alineaciones del genoma completo (WGA) también se pueden utilizar para identificar regiones altamente conservadas entre especies. Actualmente, la precisión y escalabilidad de las herramientas WGA siguen siendo limitadas debido a la complejidad computacional de lidiar con reordenamientos, regiones repetidas y el gran tamaño de muchos genomas eucariotas. [32] Sin embargo, los WGA de 30 o más bacterias estrechamente relacionadas (procariotas) son ahora cada vez más factibles. [33] [34]

Sistemas de puntuación

Otros enfoques utilizan mediciones de conservación basadas en pruebas estadísticas que intentan identificar secuencias que mutan de manera diferente a una tasa de mutación de fondo (neutral) esperada.

El marco GERP (Genomic Evolutionary Rate Profiling) puntúa la conservación de secuencias genéticas entre especies. Este enfoque estima la tasa de mutación neutra en un conjunto de especies a partir de un alineamiento de secuencias múltiples y luego identifica regiones de la secuencia que exhiben menos mutaciones de las esperadas. Luego, a estas regiones se les asignan puntuaciones basadas en la diferencia entre la tasa de mutación observada y la tasa de mutación de fondo esperada. Una puntuación GERP alta indica una secuencia altamente conservada. [35] [36]

La LISTA [37] [38] (Identidad local y taxones compartidos) se basa en el supuesto de que las variaciones observadas en especies estrechamente relacionadas con los humanos son más significativas al evaluar la conservación en comparación con las de especies lejanamente relacionadas. Por lo tanto, LIST utiliza la identidad de alineación local alrededor de cada posición para identificar secuencias relevantes en la alineación de secuencias múltiples (MSA) y luego estima la conservación en función de las distancias taxonómicas de estas secuencias a los humanos. A diferencia de otras herramientas, LIST ignora el recuento/frecuencia de variaciones en el MSA.

Aminode [39] combina múltiples alineamientos con análisis filogenético para analizar cambios en proteínas homólogas y producir un gráfico que indique las tasas locales de cambios evolutivos. Este enfoque identifica las regiones evolutivamente restringidas en una proteína, que son segmentos que están sujetos a una selección purificadora y que suelen ser críticos para la función normal de la proteína.

Otros enfoques como PhyloP y PhyloHMM incorporan métodos filogenéticos estadísticos para comparar distribuciones de probabilidad de tasas de sustitución, lo que permite la detección tanto de conservación como de mutación acelerada. Primero, se genera una distribución de probabilidad de fondo del número de sustituciones que se espera que ocurran para una columna en una alineación de secuencia múltiple, basada en un árbol filogenético . Las relaciones evolutivas estimadas entre las especies de interés se utilizan para calcular la importancia de cualquier sustitución (es decir, una sustitución entre dos especies estrechamente relacionadas puede ser menos probable que ocurra que entre especies distantes y, por lo tanto, más significativa). Para detectar la conservación, se calcula una distribución de probabilidad para un subconjunto del alineamiento de secuencias múltiples y se compara con la distribución de fondo mediante una prueba estadística como una prueba de razón de verosimilitud o una prueba de puntuación . Los valores P generados al comparar las dos distribuciones se utilizan luego para identificar regiones conservadas. PhyloHMM utiliza modelos ocultos de Markov para generar distribuciones de probabilidad. El paquete de software PhyloP compara distribuciones de probabilidad utilizando una prueba de índice de verosimilitud o una prueba de puntuación , además de utilizar un sistema de puntuación similar a GERP. [40] [41] [42]

Conservación extrema

Elementos ultraconservados

Los elementos ultraconservados o UCE son secuencias que son muy similares o idénticas en múltiples agrupaciones taxonómicas . Estos se descubrieron por primera vez en vertebrados , [43] y posteriormente se identificaron dentro de taxones muy diferentes. [44] Si bien el origen y la función de las UCE no se conocen bien, [45] se han utilizado para investigar divergencias en el tiempo profundo en amniotas , [46] insectos , [47] y entre animales y plantas . [48]

Genes universalmente conservados

Los genes mejor conservados son los que se pueden encontrar en todos los organismos. Estos consisten principalmente en los ncRNA y proteínas necesarios para la transcripción y la traducción , que se supone que se conservaron del último ancestro común universal de toda la vida. [49]

Los genes o familias de genes que se han encontrado universalmente conservados incluyen factores de elongación de unión a GTP , metionina aminopeptidasa 2 , serina hidroximetiltransferasa y transportadores de ATP . [50] Los componentes de la maquinaria de transcripción, como la ARN polimerasa y las helicasas , y de la maquinaria de traducción, como los ARN ribosómicos , los ARNt y las proteínas ribosómicas también se conservan universalmente. [51]

Aplicaciones

Filogenética y taxonomía.

A menudo se utilizan conjuntos de secuencias conservadas para generar árboles filogenéticos , ya que se puede suponer que los organismos con secuencias similares están estrechamente relacionados. [52] La elección de las secuencias puede variar dependiendo del alcance taxonómico del estudio. Por ejemplo, los genes más conservados, como el ARN 16S y otras secuencias ribosómicas, son útiles para reconstruir relaciones filogenéticas profundas e identificar filos bacterianos en estudios de metagenómica . [53] [54] Las secuencias que se conservan dentro de un clado pero que sufren algunas mutaciones, como los genes de mantenimiento , se pueden utilizar para estudiar las relaciones entre especies. [55] [56] [57] La ​​región espaciadora transcrita interna (ITS), que se requiere para espaciar los genes de ARNr conservados pero que experimenta una rápida evolución, se usa comúnmente para clasificar hongos y cepas de bacterias que evolucionan rápidamente. [58] [59] [60] [61]

Investigación médica

Como las secuencias altamente conservadas a menudo tienen funciones biológicas importantes, pueden ser un punto de partida útil para identificar la causa de enfermedades genéticas . Muchos trastornos metabólicos congénitos y enfermedades por almacenamiento lisosomal son el resultado de cambios en genes conservados individuales, lo que da como resultado enzimas faltantes o defectuosas que son la causa subyacente de los síntomas de la enfermedad. Las enfermedades genéticas se pueden predecir identificando secuencias que se conservan entre humanos y organismos de laboratorio, como ratones [62] o moscas de la fruta , [63] y estudiando los efectos de la desactivación de estos genes. [64] Los estudios de asociación de todo el genoma también se pueden utilizar para identificar variaciones en secuencias conservadas asociadas con enfermedades o resultados de salud. Se han descubierto más de dos docenas de nuevos loci potenciales de susceptibilidad a la enfermedad de Alzheimer. [65] [66]

Anotación funcional

La identificación de secuencias conservadas se puede utilizar para descubrir y predecir secuencias funcionales como genes. [67] Las secuencias conservadas con una función conocida, como dominios de proteínas, también se pueden utilizar para predecir la función de una secuencia. Las bases de datos de dominios de proteínas conservados, como Pfam y la base de datos de dominios conservados, se pueden utilizar para anotar dominios funcionales en genes codificantes de proteínas predichos. [68]

Ver también

Referencias

  1. ^ "Preguntas frecuentes sobre #Símbolos de Clustal". Clustal . Archivado desde el original el 24 de octubre de 2016 . Consultado el 8 de diciembre de 2014 .
  2. ^ Sanger, F. (24 de septiembre de 1949). "Diferencias entre especies en insulinas". Naturaleza . 164 (4169): 529. Bibcode :1949Natur.164..529S. doi : 10.1038/164529a0 . PMID  18141620. S2CID  4067991.
  3. ^ ab Marmur, J; Falkow, S; Mandel, M (octubre de 1963). "Nuevos enfoques de la taxonomía bacteriana". Revista Anual de Microbiología . 17 (1): 329–372. doi : 10.1146/annurev.mi.17.100163.001553. PMID  14147455.
  4. ^ ab Ritmo, NR; Sapp, J.; Goldenfeld, N. (17 de enero de 2012). "Filogenia y más allá: significado científico, histórico y conceptual del primer árbol de la vida". Procedimientos de la Academia Nacional de Ciencias . 109 (4): 1011–1018. Código Bib : 2012PNAS..109.1011P. doi : 10.1073/pnas.1109716109 . PMC 3268332 . PMID  22308526. 
  5. ^ Zuckerlandl, Emilio ; Pauling, Linus B. (1962). "Enfermedad molecular, evolución y heterogeneidad genética". Horizontes en bioquímica : 189–225.
  6. ^ Margoliash, E (octubre de 1963). "Estructura primaria y evolución del citocromo C". Proc Natl Acad Sci Estados Unidos . 50 (4): 672–679. Código bibliográfico : 1963PNAS...50..672M. doi : 10.1073/pnas.50.4.672 . PMC 221244 . PMID  14077496. 
  7. ^ Zuckerkandl, E; Pauling, LB (1965). Divergencia y convergencia evolutiva en proteínas . págs. 96-166. doi :10.1016/B978-1-4832-2734-4.50017-6. ISBN 9781483227344. {{cite book}}: |journal=ignorado ( ayuda )
  8. ^ Eck, RV; Dayhoff, MO (15 de abril de 1966). "Evolución de la estructura de la ferredoxina basada en reliquias vivas de secuencias primitivas de aminoácidos". Ciencia . 152 (3720): 363–366. Código bibliográfico : 1966 Ciencia... 152..363E. doi : 10.1126/ciencia.152.3720.363. PMID  17775169. S2CID  23208558.
  9. ^ Kimura, M (17 de febrero de 1968). "Tasa de evolución a nivel molecular". Naturaleza . 217 (5129): 624–626. Código Bib :1968Natur.217..624K. doi :10.1038/217624a0. PMID  5637732. S2CID  4161261.
  10. ^ Rey, JL; Jukes, TH (16 de mayo de 1969). "Evolución no darwiniana". Ciencia . 164 (3881): 788–798. Código bibliográfico : 1969 Ciencia... 164..788L. doi : 10.1126/ciencia.164.3881.788. PMID  5767777.
  11. ^ Kimura, M; Ohta, T (1974). "Sobre algunos principios que gobiernan la evolución molecular". Proc Natl Acad Sci Estados Unidos . 71 (7): 2848–2852. Código bibliográfico : 1974PNAS...71.2848K. doi : 10.1073/pnas.71.7.2848 . PMC 388569 . PMID  4527913. 
  12. ^ Asthana, Saurabh; Roytberg, Mijaíl; Stamatoyannopoulos, John; Sunyaev, Shamil (28 de diciembre de 2007). Brudno, Michael (ed.). "Análisis de conservación de secuencia en resolución de nucleótidos". PLOS Biología Computacional . 3 (12): e254. Código Bib : 2007PLSCB...3..254A. doi : 10.1371/journal.pcbi.0030254 . ISSN  1553-7358. PMC 2230682 . PMID  18166073. 
  13. ^ Cooper, gerente general; Brown, CD (1 de febrero de 2008). "Calificar la relación entre conservación de secuencia y función molecular". Investigación del genoma . 18 (2): 201–205. doi : 10.1101/gr.7205808 . ISSN  1088-9051. PMID  18245453.
  14. ^ Gilson, Amy I.; Marshall-Christensen, Ahmee; Choi, Jeong-Mo; Shakhnovich, Eugenio I. (2017). "El papel de la selección evolutiva en la dinámica de la evolución de la estructura de las proteínas". Revista Biofísica . 112 (7): 1350-1365. arXiv : 1606.05802 . Código Bib : 2017BpJ...112.1350G. doi :10.1016/j.bpj.2017.02.029. PMC 5390048 . PMID  28402878. 
  15. ^ Caza, Ryan C.; Simhadri, Vijaya L.; Iandoli, Mateo; Sauna, Zuben E.; Kimchi-Sarfaty, Chava (2014). "Exponiendo mutaciones sinónimas". Tendencias en Genética . 30 (7): 308–321. doi :10.1016/j.tig.2014.04.006. PMID  24954581.
  16. ^ Zhang, Jianzhi (2000). "Tasas de sustituciones de nucleótidos no sinónimos conservadoras y radicales en genes nucleares de mamíferos". Revista de evolución molecular . 50 (1): 56–68. Código Bib : 2000JMolE..50...56Z. doi :10.1007/s002399910007. ISSN  0022-2844. PMID  10654260. S2CID  15248867.
  17. ^ Sousounis, Konstantinos; Haney, Carl E; Cao, Jin; Sunchu, Bharat; Tsonis, Panagiotis A (2012). "Conservación de la estructura tridimensional en proteínas no homólogas o no relacionadas". Genómica humana . 6 (1): 10. doi : 10.1186/1479-7364-6-10 . ISSN  1479-7364. PMC 3500211 . PMID  23244440. 
  18. ^ Kairys, Visvaldas; Fernández, Miguel X. (2007). "SitCon: herramienta de visualización de conservación de residuos del sitio de unión y relación de secuencia a función de proteínas". Revista Internacional de Química Cuántica . 107 (11): 2100–2110. Código Bib : 2007IJQC..107.2100K. doi :10.1002/qua.21396. hdl : 10400.13/5004 . ISSN  0020-7608.
  19. ^ Chamary, JV; Hurst, Laurence D (2005). "Evidencia de selección de mutaciones sinónimas que afectan la estabilidad de la estructura secundaria del ARNm en mamíferos". Biología del genoma . 6 (9): R75. doi : 10.1186/gb-2005-6-9-r75 . PMC 1242210 . PMID  16168082. 
  20. ^ Wadler, CS; Vanderpool, CK (27 de noviembre de 2007). "Una función dual para un ARN pequeño bacteriano: SgrS realiza una regulación dependiente del emparejamiento de bases y codifica un polipéptido funcional". Procedimientos de la Academia Nacional de Ciencias . 104 (51): 20454–20459. Código Bib : 2007PNAS..10420454W. doi : 10.1073/pnas.0708102104 . PMC 2154452 . PMID  18042713. 
  21. ^ Johnsson, por; Lipovich, Leonard; Grandér, Dan; Morris, Kevin V. (marzo de 2014). "Conservación evolutiva de ARN largos no codificantes; secuencia, estructura, función". Biochimica et Biophysica Acta (BBA) - Temas generales . 1840 (3): 1063-1071. doi :10.1016/j.bbagen.2013.10.035. PMC 3909678 . PMID  24184936. 
  22. ^ Freyhult, EK; Bolback, JP; Gardner, PP (6 de diciembre de 2006). "Explorando la materia oscura genómica: una evaluación crítica del rendimiento de los métodos de búsqueda de homología en ARN no codificante". Investigación del genoma . 17 (1): 117–125. doi :10.1101/gr.5890907. PMC 1716261 . PMID  17151342. 
  23. ^ Margulies, EH (1 de diciembre de 2003). "Identificación y caracterización de secuencias conservadas de múltiples especies". Investigación del genoma . 13 (12): 2507–2518. doi :10.1101/gr.1602203. ISSN  1088-9051. PMC 403793 . PMID  14656959. 
  24. ^ Edwards, John R.; Ruparel, Hameer; Ju, Jingyue (2005). "Secuenciación de ADN por espectrometría de masas". Investigación de mutaciones/Mecanismos fundamentales y moleculares de la mutagénesis . 573 (1–2): 3–12. doi :10.1016/j.mrfmmm.2004.07.021. PMID  15829234.
  25. ^ Drost, Hajk-Georg; Gabel, Alejandro; Grosse, Ivo; Quint, Marcel (1 de mayo de 2015). "Evidencia del mantenimiento activo de patrones filotranscriptómicos en forma de reloj de arena en la embriogénesis de animales y plantas". Biología Molecular y Evolución . 32 (5): 1221-1231. doi :10.1093/molbev/msv012. ISSN  0737-4038. PMC 4408408 . PMID  25631928. 
  26. ^ Nawrocki, EP; Eddy, SR (4 de septiembre de 2013). "Infernal 1.1: búsquedas de homología de ARN 100 veces más rápidas". Bioinformática . 29 (22): 2933–2935. doi : 10.1093/bioinformática/btt509. PMC 3810854 . PMID  24008419. 
  27. ^ Eddy, SR; Durbin, R (11 de junio de 1994). "Análisis de secuencia de ARN mediante modelos de covarianza". Investigación de ácidos nucleicos . 22 (11): 2079–88. doi :10.1093/nar/22.11.2079. PMC 308124 . PMID  8029015. 
  28. ^ Trivedi, Rakesh; Nagarajaram, Hampapathalu Adimurthy (2020). "Matrices de puntuación de sustitución para proteínas: descripción general". Ciencia de las proteínas . 29 (11): 2150–2163. doi :10.1002/pro.3954. ISSN  0961-8368. PMC 7586916 . PMID  32954566. 
  29. ^ ab "Logotipo web". UC Berkeley . Consultado el 30 de diciembre de 2017 .
  30. ^ "Preguntas frecuentes sobre #Símbolos de Clustal". Clustal . Archivado desde el original el 24 de octubre de 2016 . Consultado el 8 de diciembre de 2014 .
  31. ^ "Navegador ECR". Navegador ECR . Consultado el 9 de enero de 2018 .
  32. ^ Conde, Dent; Nguyen, Ngan; Hickey, Glenn; Harris, Robert S.; Fitzgerald, Stephen; Beal, Kathryn; Seledtsov, Igor; Molodtsov, Vladimir; Raney, Brian J.; Clawson, Hiram; Kim, Jaebum; Kemena, Carsten; Chang, Jia-Ming; Erb, Ionas; Poliakov, Alejandro; Hou, Minmei; Herrero, Javier; Kent, William James; Soloviev, Víctor; Querido, Aaron E.; Mamá, Jian; Notredame, Cedric; Brudno, Michael; Dubchak, Inna; Haussler, David; Paten, Benedict (diciembre de 2014). "Alignathon: una evaluación competitiva de métodos de alineación del genoma completo". Investigación del genoma . 24 (12): 2077–2089. doi :10.1101/gr.174920.114. PMC 4248324 . PMID  25273068. 
  33. ^ Rouli, L.; Merhej, V.; Fournier, P.-E.; Raoult, D. (septiembre de 2015). "El pangenoma bacteriano como nueva herramienta para el análisis de bacterias patógenas". Nuevos microbios y nuevas infecciones . 7 : 72–85. doi :10.1016/j.nmni.2015.06.005. PMC 4552756 . PMID  26442149. 
  34. ^ Méric, Guillaume; Yahara, Koji; Mageiros, Leonardos; Pascoe, Ben; Doncella, Martín CJ; Jolley, Keith A.; Sheppard, Samuel K.; Bereswill, Stefan (27 de marzo de 2014). "Un enfoque pangenómico de referencia para la genómica bacteriana comparada: identificación de nuevos marcadores epidemiológicos en Campylobacter patógeno". MÁS UNO . 9 (3): e92798. Código Bib : 2014PLoSO...992798M. doi : 10.1371/journal.pone.0092798 . PMC 3968026 . PMID  24676150. 
  35. ^ Cooper, GM (17 de junio de 2005). "Distribución e intensidad de restricción en la secuencia genómica de mamíferos". Investigación del genoma . 15 (7): 901–913. doi :10.1101/gr.3577405. PMC 1172034 . PMID  15965027. 
  36. ^ "Laboratorio Sidow - GERP".
  37. ^ Nawar Malhis; Steven JM Jones; Jörg Gsponer (2019). "Medidas mejoradas para la conservación evolutiva que explotan las distancias taxonómicas". Comunicaciones de la naturaleza . 10 (1): 1556. Código bibliográfico : 2019NatCo..10.1556M. doi :10.1038/s41467-019-09583-2. PMC 6450959 . PMID  30952844. 
  38. ^ Nawar Malhis; Mateo Jacobson; Steven JM Jones; Jörg Gsponer (2020). "LISTA-S2: Clasificación basada en taxonomía de mutaciones nocivas de sentido erróneo entre especies". Investigación de ácidos nucleicos . 48 (W1): W154-W161. doi : 10.1093/nar/gkaa288 . PMC 7319545 . PMID  32352516. 
  39. ^ Chang KT, Guo J, di Ronza A, Sardiello M (enero de 2018). "Aminodo: identificación de limitaciones evolutivas en el proteoma humano". Ciencia. Representante . 8 (1): 1357. Código bibliográfico : 2018NatSR...8.1357C. doi :10.1038/s41598-018-19744-w. PMC 5778061 . PMID  29358731. 
  40. ^ Pollard, KS; Hubisz, MJ; Rosenbloom, KR; Siepel, A. (26 de octubre de 2009). "Detección de tasas de sustitución no neutrales en filogenias de mamíferos". Investigación del genoma . 20 (1): 110-121. doi :10.1101/gr.097857.109. PMC 2798823 . PMID  19858363. 
  41. ^ "PHAST: Inicio".
  42. ^ Fanático, Xiaodan; Zhu, junio; Schadt, Eric E; Liu, Jun S (2007). "Poder estadístico de phylo-HMM para la detección de elementos conservados evolutivamente". Bioinformática BMC . 8 (1): 374. doi : 10.1186/1471-2105-8-374 . PMC 2194792 . PMID  17919331. 
  43. ^ Bejerano, G. (28 de mayo de 2004). "Elementos ultraconservados del genoma humano". Ciencia . 304 (5675): 1321–1325. Código bibliográfico : 2004 Ciencia... 304.1321B. CiteSeerX 10.1.1.380.9305 . doi : 10.1126/ciencia.1098119. PMID  15131266. S2CID  2790337. 
  44. ^ Siepel, A. (1 de agosto de 2005). "Elementos evolutivamente conservados en genomas de vertebrados, insectos, gusanos y levaduras". Investigación del genoma . 15 (8): 1034-1050. doi :10.1101/gr.3715005. PMC 1182216 . PMID  16024819. 
  45. ^ Harmston, N.; Barésic, A.; Lenhard, B. (11 de noviembre de 2013). "El misterio de la conservación extrema sin codificación". Transacciones Filosóficas de la Royal Society B: Ciencias Biológicas . 368 (1632): 20130021. doi :10.1098/rstb.2013.0021. PMC 3826495 . PMID  24218634. 
  46. ^ Faircloth, antes de Cristo; McCormack, JE; Crawford, NG; Harvey, MG; Brumfield, RT; Glenn, TC (9 de enero de 2012). "Los elementos ultraconservados anclan miles de marcadores genéticos que abarcan múltiples escalas de tiempo evolutivas". Biología Sistemática . 61 (5): 717–726. doi : 10.1093/sysbio/sys004 . PMID  22232343.
  47. ^ Tela justa, Brant C.; Branstetter, Michael G.; Blanco, Noor D.; Brady, Seán G. (mayo de 2015). "El enriquecimiento objetivo de elementos ultraconservados de artrópodos proporciona una perspectiva genómica sobre las relaciones entre himenópteros". Recursos de ecología molecular . 15 (3): 489–501. doi :10.1111/1755-0998.12328. PMC 4407909 . PMID  25207863. 
  48. ^ Reneker, J.; Lyon, E.; Conant, GC; Pires, JC; Freeling, M.; Shyu, CR; Korkin, D. (10 de abril de 2012). "Elementos multiespecies idénticos durante mucho tiempo en genomas de plantas y animales". Procedimientos de la Academia Nacional de Ciencias . 109 (19): E1183–E1191. doi : 10.1073/pnas.1121356109 . PMC 3358895 . PMID  22496592. 
  49. ^ Isenbarger, Thomas A.; Carr, Christopher E.; Johnson, Sarah Stewart; Finney, Michael; Iglesia, George M.; Gilbert, Walter; Zuber, María T.; Ruvkun, Gary (14 de octubre de 2008). "Los segmentos del genoma más conservados para la detección de vida en la Tierra y otros planetas". Orígenes de la vida y evolución de las biosferas . 38 (6): 517–533. Código Bib : 2008OLEB...38..517I. doi :10.1007/s11084-008-9148-z. PMID  18853276. S2CID  15707806.
  50. ^ Harris, JK (12 de febrero de 2003). "El núcleo genético del antepasado universal". Investigación del genoma . 13 (3): 407–412. doi :10.1101/gr.652803. PMC 430263 . PMID  12618371. 
  51. ^ Prohibición, Nenad; Beckmann, Roland; Cate, Jamie HD; Dinman, Jonathan D; Dragón, François; Ellis, Steven R; Lafontaine, Denis LJ; Lindahl, Lasse; Liljas, Anders; Lipton, Jeffrey M; McAlear, Michael A; Moore, Peter B; Noller, Harry F; Ortega, Joaquín; Panse, Vikram Govind; Ramakrishnan, V; Spahn, Christian MT; Steitz, Thomas A; Tchorzewski, Marek; Tollervey, David; Warren, Alan J; Williamson, James R; Wilson, Daniel; Yonath, Ada; Yusupov, Marat (febrero de 2014). "Un nuevo sistema para nombrar proteínas ribosómicas". Opinión actual en biología estructural . 24 : 165-169. doi :10.1016/j.sbi.2014.01.002. PMC 4358319 . PMID  24524803. 
  52. ^ Gadagkar, Sudhindra R.; Rosenberg, Michael S.; Kumar, Sudhir (15 de enero de 2005). "Inferir filogenias de especies a partir de múltiples genes: árbol de secuencias concatenadas versus árbol de genes de consenso". Journal of Experimental Zoology Parte B: Evolución molecular y del desarrollo . 304B (1): 64–74. Código Bib : 2005JEZB..304...64G. doi : 10.1002/jez.b.21026 . PMID  15593277.
  53. ^ Luis, W; Schleifer, KH (octubre de 1994). "Filogenia bacteriana basada en análisis de secuencia de ARNr 16S y 23S". Reseñas de microbiología FEMS . 15 (2–3): 155–73. doi : 10.1111/j.1574-6976.1994.tb00132.x . PMID  7524576.
  54. ^ Abrazo, Laura A.; Panadero, Brett J.; Anantharaman, Karthik; Marrón, Christopher T.; Probst, Alejandro J.; Castelle, Cindy J.; Butterfield, Cristina N.; Hernsdorf, Alex W.; Amano, Yuki; Ise, Kotaro; Suzuki, Yohey; Dudek, Natasha; Relman, David A.; Finstad, Kari M.; Amundson, Ronald; Thomas, Brian C.; Banfield, Jillian F. (11 de abril de 2016). "Una nueva visión del árbol de la vida". Microbiología de la naturaleza . 1 (5): 16048. doi : 10.1038/nmicrobiol.2016.48 . PMID  27572647.
  55. ^ Zhang, Liqing; Li, Wen-Hsiung (febrero de 2004). "Los genes domésticos de los mamíferos evolucionan más lentamente que los genes específicos de tejidos". Biología Molecular y Evolución . 21 (2): 236–239. doi : 10.1093/molbev/msh010 . PMID  14595094.
  56. ^ Clermont, O.; Bonacorsi, S.; Bingen, E. (1 de octubre de 2000). "Determinación rápida y sencilla del grupo filogenético de Escherichia coli". Microbiología Aplicada y Ambiental . 66 (10): 4555–4558. Código Bib : 2000ApEnM..66.4555C. doi :10.1128/AEM.66.10.4555-4558.2000. PMC 92342 . PMID  11010916. 
  57. ^ Kullberg, Morgan; Nilsson, María A.; Arnason, Ulfur; Harley, Eric H.; Janke, Axel (agosto de 2006). "Genes internos para el análisis filogenético de las relaciones euterianas". Biología Molecular y Evolución . 23 (8): 1493-1503. doi : 10.1093/molbev/msl027 . PMID  16751257.
  58. ^ Schoch, CL; Seifert, KA; Huhndorf, S.; Roberto, V.; Spouge, JL; Levesque, California; Chen, W.; Bolchacova, E.; Voigt, K.; Crous, PW; Molinero, AN; Wingfield, MJ; Aimé, MC; An, K.-D.; Bai, F.-Y.; Barreto, RW; Begerow, D.; Bergeron, MJ; Blackwell, M.; Boekhout, T.; Bogale, M.; Boonyuen, N.; Burgaz, AR; Buyck, B.; Cai, L.; Cai, Q.; Cardinali, G.; Chaverri, P.; Coppins, BJ; Crespo, A.; Cubas, P.; Cummings, C.; Damm, U.; de Beer, ZW; de Hoog, GS; Del Prado, R.; Dentinger, B.; Diéguez-Uribeondo, J.; Divakar, PK; Douglas, B.; Dueñas, M.; Duong, TA; Eberhardt, U.; Edwards, JE; Elshahed, MS; Fliegerova, K.; Furtado, M.; García, MA; Ge, Z.-W.; Griffith, GW; Griffiths, K.; Groenewald, JZ; Groenewald, M.; Grube, M.; Gryzenhout, M.; Guo, L.-D.; Hagen, F.; Hambleton, S.; Hamelín, RC; Hansen, K.; Harrold, P.; Heller, G.; Herrera, C.; Hirayama, K.; Hirooka, Y.; Ho, H.-M.; Hoffmann, K.; Hofstetter, V.; Hognabba, F.; Hollingsworth, PM; Hong, S.-B.; Hosaka, K.; Houbraken, J.; Hughes, K.; Huhtinen, S.; Hyde, KD; James, T.; Johnson, EM; Johnson, JE; Johnston, relaciones públicas; Jones, EBG; Kelly, LJ; Kirk, primer ministro; Knapp, director general; Koljalg, U.; Kovacs, director general; Kurtzman, CP; Landvik, S.; Leavitt, SD; Liggenstoffer, AS; Liimatainen, K.; Lombardo, L.; Luangsa-ard, JJ; Lumbsch, HT; Maganti, H.; Maharachchikumbura, SSN; Martín, diputado; mayo, TW; McTaggart, AR; Methven, AS; Meyer, W.; Moncalvo, J.-M.; Mongkolsamrit, S.; Nagy, LG; Nilsson, RH; Niskanen, T.; Nyilasi, I.; Okada, G.; Okane, I.; Olariaga, I.; Otte, J.; Papp, T.; Parque, D.; Petkovits, T.; Pino-Bodas, R.; Quaedvlieg, W.; Raja, HA; Redecker, D.; Rintoul, TL; Ruibal, C.; Sarmiento-Ramírez, JM; Schmitt, I.; Schussler, A.; Esquilador, C.; Sotome, K.; Stefani, FOP; Stenroos, S.; Stielow, B.; Stockinger, H.; Suetrong, S.; Suh, S.-O.; Sung, GH; Suzuki, M.; Tanaka, K.; Tedersoo, L.; Tellería, MT; Tretter, E.; Untereiner, WA; Urbina, H.; Vagvolgyi, C.; Vialle, A.; Vu, TD; Walther, G.; Wang, Q.-M.; Wang, Y.; Vertedero, BS; Weiss, M.; Blanco, MM; Xu, J.; Yahr, R.; Yang, ZL; Yurkov, A.; Zamora, J.-C.; Zhang, N.; Zhuang, W.-Y.; Schindel, D. (27 de marzo de 2012). "Región espaciadora transcrita interna ribosomal nuclear (ITS) como marcador de código de barras de ADN universal para hongos". Procedimientos de la Academia Nacional de Ciencias . 109 (16): 6241–6246. doi : 10.1073/pnas.1117018109 . PMC 3341068 . PMID  22454494. 
  59. ^ Hombre, SM; Kaakoush, NO; Octavia, S.; Mitchell, H. (26 de marzo de 2010). "La región espaciadora transcrita interna, una nueva herramienta para su uso en la diferenciación de especies y delimitación de relaciones sistemáticas dentro del género Campylobacter". Microbiología Aplicada y Ambiental . 76 (10): 3071–3081. Código Bib : 2010ApEnM..76.3071M. doi :10.1128/AEM.02551-09. PMC 2869123 . PMID  20348308. 
  60. ^ Ranjard, L.; Poli, F.; Lata, J.-C.; Mougel, C.; Thioulouse, J.; Nazaret, S. (1 de octubre de 2001). "Caracterización de comunidades de suelos bacterianos y fúngicos mediante análisis automatizado de huellas dactilares de espaciadores intergénicos ribosómicos: variabilidad biológica y metodológica". Microbiología Aplicada y Ambiental . 67 (10): 4479–4487. Código Bib : 2001 ApEnM..67.4479R. doi :10.1128/AEM.67.10.4479-4487.2001. PMC 93193 . PMID  11571146. 
  61. ^ Bidé, Philippe; Barbut, Federico; Lalande, Valérie; Burghoffer, Béatrice; Petit, Jean-Claude (junio de 1999). "Desarrollo de un nuevo método de ribotipado por PCR basado en la secuenciación de genes del ARN ribosómico". Cartas de microbiología FEMS . 175 (2): 261–266. doi : 10.1111/j.1574-6968.1999.tb13629.x . PMID  10386377.
  62. ^ Ala, Ugo; Piro, Rosario Michael; Grassi, Elena; Damasco, cristiano; Silengo, Lorenzo; Oti, Martín; Provero, Paolo; Di Cunto, Fernando; Tucker-Kellogg, Greg (28 de marzo de 2008). "Predicción de genes de enfermedades humanas mediante análisis de coexpresión conservada en ratón humano". PLOS Biología Computacional . 4 (3): e1000043. Código Bib : 2008PLSCB...4E0043A. doi : 10.1371/journal.pcbi.1000043 . PMC 2268251 . PMID  18369433. 
  63. ^ Pandey, UB; Nichols, CD (17 de marzo de 2011). "Modelos de enfermedades humanas en Drosophila melanogaster y el papel de la mosca en el descubrimiento de fármacos terapéuticos". Revisiones farmacológicas . 63 (2): 411–436. doi :10.1124/pr.110.003293. PMC 3082451 . PMID  21415126. 
  64. ^ Huang, Hui; Invierno, Eitan E; Wang, Huajun; Weinstock, Keith G; Xing, Heming; Goodstadt, Leo; Stenson, Peter D; Cooper, David N; Smith, Douglas; Alba, M Mar; Ponting, Chris P; Fechtel, Kim (2004). "Conservación evolutiva y selección de ortólogos de genes de enfermedades humanas en los genomas de rata y ratón". Biología del genoma . 5 (7): R47. doi : 10.1186/gb-2004-5-7-r47 . PMC 463309 . PMID  15239832. 
  65. ^ Ge, Dongliang; Fellay, Jacques; Thompson, Alejandro J.; Simón, Jason S.; Shianna, Kevin V.; Urbano, Thomas J.; Heinzen, Erin L.; Qiu, Ping; Bertelsen, Arthur H.; Muir, Andrew J.; Sulkowski, Mark; McHutchison, John G.; Goldstein, David B. (16 de agosto de 2009). "La variación genética en IL28B predice la eliminación viral inducida por el tratamiento de la hepatitis C". Naturaleza . 461 (7262): 399–401. Código Bib :2009Natur.461..399G. doi : 10.1038/naturaleza08309. PMID  19684573. S2CID  1707096.
  66. ^ Bertram, L. (2009). "Estudios de asociación de todo el genoma en la enfermedad de Alzheimer". Genética Molecular Humana . 18 (R2): R137–R145. doi :10.1093/hmg/ddp406. PMC 2758713 . PMID  19808789. 
  67. ^ Kellis, Manolis; Patterson, Nick; Endrizzi, Mateo; Birren, Bruce; Lander, Eric S. (15 de mayo de 2003). "Secuenciación y comparación de especies de levaduras para identificar genes y elementos reguladores". Naturaleza . 423 (6937): 241–254. Código Bib :2003Natur.423..241K. doi : 10.1038/naturaleza01644. PMID  12748633. S2CID  1530261.
  68. ^ Marchler-Bauer, A.; Lu, S.; Anderson, JB; Chitsaz, F.; Derbyshire, MK; DeWeese-Scott, C.; Fong, JH; Geer, LY; Geer, RC; González, NR; Gwadz, M.; Hurwitz, DI; Jackson, JD; Ke, Z.; Lanczycki, CJ; Lu, F.; Marchler, GH; Mullokandov, M.; Omelchenko, MV; Robertson, CL; Canción, JS; Gracias, N.; Yamashita, RA; Zhang, D.; Zhang, N.; Zheng, C.; Bryant, SH (24 de noviembre de 2010). "CDD: una base de datos de dominio conservado para la anotación funcional de proteínas". Investigación de ácidos nucleicos . 39 (Base de datos): D225 – D229. doi : 10.1093/nar/gkq1189. PMC 3013737 . PMID  21109532.