Secuencia conservada

En biología evolutiva , las secuencias conservadas son secuencias idénticas o similares en ácidos nucleicos ( ADN y ARN ) o proteínas entre especies ( secuencias ortólogas ), o dentro de un genoma ( secuencias parálogas ), o entre taxones donantes y receptores ( secuencias xenólogas ). La conservación indica que una secuencia se ha mantenido por selección natural .

Una secuencia altamente conservada es aquella que ha permanecido relativamente inalterada a lo largo del árbol filogenético y, por lo tanto, en tiempos geológicos lejanos . Entre los ejemplos de secuencias altamente conservadas se incluyen los componentes de ARN de los ribosomas presentes en todos los dominios de la vida, las secuencias homeobox extendidas entre los eucariotas y el ARNtm en las bacterias . El estudio de la conservación de secuencias se superpone con los campos de la genómica , la proteómica , la biología evolutiva , la filogenética , la bioinformática y las matemáticas .

Historia

El descubrimiento del papel del ADN en la herencia , y las observaciones de Frederick Sanger sobre la variación entre insulinas animales en 1949, ^[2] impulsaron a los primeros biólogos moleculares a estudiar la taxonomía desde una perspectiva molecular. ^[3]^[4] Los estudios en la década de 1960 utilizaron técnicas de hibridación de ADN y reactividad cruzada de proteínas para medir la similitud entre proteínas ortólogas conocidas , como la hemoglobina ^[5] y el citocromo c . ^[6] En 1965, Émile Zuckerkandl y Linus Pauling introdujeron el concepto de reloj molecular , ^[7] proponiendo que las tasas constantes de reemplazo de aminoácidos podrían usarse para estimar el tiempo desde que dos organismos divergieron . Si bien las filogenias iniciales coincidían estrechamente con el registro fósil , las observaciones de que algunos genes parecían evolucionar a diferentes ritmos llevaron al desarrollo de teorías de evolución molecular . ^[3]^[4] La comparación de secuencias de ferredoxina realizada por Margaret Dayhoff en 1966 mostró que la selección natural actuaría para conservar y optimizar las secuencias de proteínas esenciales para la vida. ^[8]

Mecanismos

A lo largo de muchas generaciones, las secuencias de ácidos nucleicos en el genoma de un linaje evolutivo pueden cambiar gradualmente con el tiempo debido a mutaciones y deleciones aleatorias . ^[9]^[10] Las secuencias también pueden recombinarse o eliminarse debido a reordenamientos cromosómicos . Las secuencias conservadas son secuencias que persisten en el genoma a pesar de tales fuerzas y tienen tasas de mutación más lentas que la tasa de mutación de fondo. ^[11]

La conservación puede ocurrir en secuencias de ácidos nucleicos codificantes y no codificantes . Se cree que las secuencias de ADN altamente conservadas tienen valor funcional, aunque el papel de muchas secuencias de ADN no codificantes altamente conservadas es poco conocido. ^[12]^[13] El grado de conservación de una secuencia puede verse afectado por presiones de selección variables , su robustez a la mutación, el tamaño de la población y la deriva genética . Muchas secuencias funcionales también son modulares y contienen regiones que pueden estar sujetas a presiones de selección independientes , como los dominios proteicos . ^[14]

Secuencia de codificación

En las secuencias codificantes, la secuencia de ácidos nucleicos y aminoácidos puede conservarse en diferentes grados, ya que la degeneración del código genético significa que las mutaciones sinónimas en una secuencia codificante no afectan la secuencia de aminoácidos de su producto proteico. ^[15]

Las secuencias de aminoácidos se pueden conservar para mantener la estructura o función de una proteína o dominio. Las proteínas conservadas sufren menos reemplazos de aminoácidos o tienen más probabilidades de sustituir aminoácidos con propiedades bioquímicas similares . ^[16] Dentro de una secuencia, los aminoácidos que son importantes para el plegamiento , la estabilidad estructural o que forman un sitio de unión pueden estar más conservados. ^[17]^[18]

La secuencia de ácidos nucleicos de un gen codificador de proteínas también puede conservarse por otras presiones selectivas. El sesgo en el uso de codones en algunos organismos puede restringir los tipos de mutaciones sinónimas en una secuencia. Las secuencias de ácidos nucleicos que causan una estructura secundaria en el ARNm de un gen codificador pueden ser seleccionadas en contra, ya que algunas estructuras pueden afectar negativamente la traducción, o conservarse donde el ARNm también actúa como un ARN no codificante funcional. ^[19]^[20]

Sin codificación

Las secuencias no codificantes importantes para la regulación génica , como los sitios de unión o reconocimiento de los ribosomas y los factores de transcripción , pueden conservarse dentro de un genoma. Por ejemplo, el promotor de un gen o un operón conservados también pueden conservarse. Al igual que con las proteínas, los ácidos nucleicos que son importantes para la estructura y la función del ARN no codificante (ARNnc) también pueden conservarse. Sin embargo, la conservación de secuencias en los ARNnc es generalmente deficiente en comparación con las secuencias codificantes de proteínas, y los pares de bases que contribuyen a la estructura o la función a menudo se conservan en su lugar. ^[21]^[22]

Identificación

Las secuencias conservadas se identifican normalmente mediante métodos bioinformáticos basados en la alineación de secuencias . Los avances en la secuenciación de ADN de alto rendimiento y la espectrometría de masas de proteínas han aumentado sustancialmente la disponibilidad de secuencias de proteínas y genomas completos para comparación desde principios de la década de 2000. ^[23]^[24]

Búsqueda de homología

Las secuencias conservadas pueden identificarse mediante búsqueda de homología , utilizando herramientas como BLAST , HMMER , OrthologR, ^[25] e Infernal. ^[26] Las herramientas de búsqueda de homología pueden tomar una secuencia de proteína o ácido nucleico individual como entrada, o utilizar modelos estadísticos generados a partir de múltiples alineaciones de secuencias relacionadas conocidas. Los modelos estadísticos como los HMM de perfil y los modelos de covarianza de ARN que también incorporan información estructural, ^[27] pueden ser útiles cuando se buscan secuencias más distantemente relacionadas. Las secuencias de entrada se alinean luego con una base de datos de secuencias de individuos relacionados u otras especies. Las alineaciones resultantes se califican en función del número de aminoácidos o bases coincidentes y el número de huecos o deleciones generadas por la alineación. Las sustituciones conservadoras aceptables pueden identificarse utilizando matrices de sustitución como PAM y BLOSUM . Se supone que las alineaciones con puntaje alto son de secuencias homólogas. La conservación de una secuencia puede entonces inferirse mediante la detección de homólogos altamente similares en un amplio rango filogenético. ^[28]

Alineación de secuencias múltiples

Se pueden utilizar alineaciones de secuencias múltiples para visualizar secuencias conservadas. El formato CLUSTAL incluye una clave de texto simple para anotar las columnas conservadas de la alineación, que denota secuencia conservada (*), mutaciones conservadoras (:), mutaciones semiconservadoras (.) y mutaciones no conservadoras ( ) ^[30] Los logotipos de secuencia también pueden mostrar secuencias conservadas al representar las proporciones de caracteres en cada punto de la alineación por altura. ^[29]

Alineación del genoma

Los alineamientos de genoma completo (WGAs, por sus siglas en inglés) también pueden utilizarse para identificar regiones altamente conservadas en distintas especies. Actualmente, la precisión y la escalabilidad de las herramientas WGA siguen siendo limitadas debido a la complejidad computacional que implica lidiar con reordenamientos, regiones repetidas y el gran tamaño de muchos genomas eucariotas. ^[32] Sin embargo, los WGAs de 30 o más bacterias estrechamente relacionadas (procariotas) son cada vez más factibles. ^[33]^[34]

Sistemas de puntuación

Otros enfoques utilizan mediciones de conservación basadas en pruebas estadísticas que intentan identificar secuencias que mutan de manera diferente a una tasa de mutación de fondo (neutral) esperada.

El marco GERP (Genomic Evolutionary Rate Profiling) puntúa la conservación de secuencias genéticas en distintas especies. Este enfoque estima la tasa de mutación neutral en un conjunto de especies a partir de una alineación de secuencias múltiples y luego identifica regiones de la secuencia que presentan menos mutaciones de las esperadas. A estas regiones se les asignan puntuaciones basadas en la diferencia entre la tasa de mutación observada y la tasa de mutación de fondo esperada. Una puntuación GERP alta indica entonces una secuencia altamente conservada. ^[35]^[36]

LIST ^[37]^[38] (Identidad local y taxones compartidos) se basa en el supuesto de que las variaciones observadas en especies estrechamente relacionadas con el ser humano son más significativas a la hora de evaluar la conservación en comparación con las de especies distantes. Por lo tanto, LIST utiliza la identidad de alineación local alrededor de cada posición para identificar secuencias relevantes en la alineación de secuencias múltiples (MSA) y luego estima la conservación en función de las distancias taxonómicas de estas secuencias con respecto al ser humano. A diferencia de otras herramientas, LIST ignora el recuento/frecuencia de las variaciones en la MSA.

Aminode ^[39] combina alineaciones múltiples con análisis filogenético para analizar cambios en proteínas homólogas y producir un gráfico que indica las tasas locales de cambios evolutivos. Este enfoque identifica las regiones evolutivamente restringidas en una proteína, que son segmentos que están sujetos a selección purificadora y que suelen ser críticos para el funcionamiento normal de la proteína.

Otros enfoques como PhyloP y PhyloHMM incorporan métodos filogenéticos estadísticos para comparar distribuciones de probabilidad de tasas de sustitución, lo que permite la detección tanto de conservación como de mutación acelerada. Primero, se genera una distribución de probabilidad de fondo del número de sustituciones que se espera que ocurran para una columna en una alineación de secuencias múltiples, con base en un árbol filogenético . Las relaciones evolutivas estimadas entre las especies de interés se utilizan para calcular la significancia de cualquier sustitución (es decir, una sustitución entre dos especies estrechamente relacionadas puede tener menos probabilidades de ocurrir que entre especies distantemente relacionadas y, por lo tanto, ser más significativa). Para detectar la conservación, se calcula una distribución de probabilidad para un subconjunto de la alineación de secuencias múltiples y se compara con la distribución de fondo utilizando una prueba estadística como una prueba de razón de verosimilitud o una prueba de puntuación . Los valores P generados a partir de la comparación de las dos distribuciones se utilizan luego para identificar regiones conservadas. PhyloHMM utiliza modelos ocultos de Markov para generar distribuciones de probabilidad. El paquete de software PhyloP compara distribuciones de probabilidad utilizando una prueba de razón de verosimilitud o una prueba de puntuación , así como utilizando un sistema de puntuación similar a GERP. ^[40]^[41]^[42]

Conservación extrema

Elementos ultraconservados

Los elementos ultraconservados o UCE son secuencias que son altamente similares o idénticas en múltiples agrupaciones taxonómicas . Estos se descubrieron por primera vez en vertebrados , ^[43] y posteriormente se han identificado dentro de taxones muy diferentes. ^[44] Si bien el origen y la función de los UCE son poco conocidos, ^[45] se han utilizado para investigar divergencias de tiempo profundo en amniotas , ^[46] insectos , ^[47] y entre animales y plantas . ^[48]

Genes conservados universalmente

Los genes más conservados son aquellos que se encuentran en todos los organismos. Estos consisten principalmente en los ARNnc y las proteínas necesarias para la transcripción y la traducción , que se supone que se han conservado desde el último ancestro común universal de toda la vida. ^[49]

Los genes o familias de genes que se han encontrado que están universalmente conservados incluyen factores de elongación de unión a GTP , metionina aminopeptidasa 2 , serina hidroximetiltransferasa y transportadores de ATP . ^[50] Los componentes de la maquinaria de transcripción, como la ARN polimerasa y las helicasas , y de la maquinaria de traducción, como los ARN ribosómicos , los ARNt y las proteínas ribosómicas también están universalmente conservados. ^[51]

Aplicaciones

Filogenética y taxonomía

Los conjuntos de secuencias conservadas se utilizan a menudo para generar árboles filogenéticos , ya que se puede suponer que los organismos con secuencias similares están estrechamente relacionados. ^[52] La elección de secuencias puede variar dependiendo del alcance taxonómico del estudio. Por ejemplo, los genes más altamente conservados, como el ARN 16S y otras secuencias ribosómicas, son útiles para reconstruir relaciones filogenéticas profundas e identificar filos bacterianos en estudios de metagenómica . ^[53]^[54] Las secuencias que se conservan dentro de un clado pero que sufren algunas mutaciones, como los genes de mantenimiento , se pueden utilizar para estudiar las relaciones entre especies. ^[55]^[56]^[57] La región espaciadora transcrita interna (ITS), que se requiere para espaciar los genes de ARNr conservados pero que experimenta una rápida evolución, se utiliza comúnmente para clasificar hongos y cepas de bacterias de rápida evolución. ^[58]^[59]^[60]^[61]

Investigación médica

Como las secuencias altamente conservadas a menudo tienen funciones biológicas importantes, pueden ser útiles como punto de partida para identificar la causa de las enfermedades genéticas . Muchos trastornos metabólicos congénitos y enfermedades de almacenamiento lisosomal son el resultado de cambios en genes conservados individuales, lo que da como resultado enzimas faltantes o defectuosas que son la causa subyacente de los síntomas de la enfermedad. Las enfermedades genéticas se pueden predecir identificando secuencias que se conservan entre humanos y organismos de laboratorio como ratones ^[62] o moscas de la fruta ^[63] y estudiando los efectos de la eliminación de estos genes. ^[64] Los estudios de asociación de todo el genoma también se pueden utilizar para identificar la variación en secuencias conservadas asociadas con enfermedades o resultados de salud. Se han descubierto más de dos docenas de nuevos loci de susceptibilidad potencial para la enfermedad de Alzheimer. ^[65]^[66]

Anotación funcional

La identificación de secuencias conservadas se puede utilizar para descubrir y predecir secuencias funcionales, como los genes. ^[67] Las secuencias conservadas con una función conocida, como los dominios proteicos, también se pueden utilizar para predecir la función de una secuencia. Las bases de datos de dominios proteicos conservados, como Pfam y la Base de datos de dominios conservados, se pueden utilizar para anotar dominios funcionales en genes codificadores de proteínas previstos. ^[68]

Véase también

Referencias

^ "Preguntas frecuentes sobre Clustal #Símbolos". Clustal . Archivado desde el original el 24 de octubre de 2016 . Consultado el 8 de diciembre de 2014 .
^ Sanger, F. (24 de septiembre de 1949). "Diferencias entre especies en las insulinas". Nature . 164 (4169): 529. Bibcode :1949Natur.164..529S. doi : 10.1038/164529a0 . PMID 18141620. S2CID 4067991.
^ ab Marmur, J; Falkow, S; Mandel, M (octubre de 1963). "Nuevos enfoques de la taxonomía bacteriana". Revisión anual de microbiología . 17 (1): 329–372. doi :10.1146/annurev.mi.17.100163.001553. PMID 14147455.
^ ab Pace, NR; Sapp, J.; Goldenfeld, N. (17 de enero de 2012). "Filogenia y más allá: significado científico, histórico y conceptual del primer árbol de la vida". Actas de la Academia Nacional de Ciencias . 109 (4): 1011–1018. Bibcode :2012PNAS..109.1011P. doi : 10.1073/pnas.1109716109 . PMC 3268332 . PMID 22308526.
^ Zuckerlandl, Emile ; Pauling, Linus B. (1962). "Enfermedad molecular, evolución y heterogeneidad genética". Horizons in Biochemistry : 189–225.
^ Margoliash, E (octubre de 1963). "Estructura primaria y evolución del citocromo C". Actas de la Academia Nacional de Ciencias . 50 (4): 672–679. Bibcode :1963PNAS...50..672M. doi : 10.1073/pnas.50.4.672 . PMC 221244 . PMID 14077496.
^ Zuckerkandl, E; Pauling, LB (1965). "Divergencia y convergencia evolutiva en proteínas". Genes y proteínas en evolución : 96-166. doi :10.1016/B978-1-4832-2734-4.50017-6. ISBN 9781483227344.
^ Eck, RV; Dayhoff, MO (15 de abril de 1966). "Evolución de la estructura de la ferredoxina basada en reliquias vivas de secuencias primitivas de aminoácidos". Science . 152 (3720): 363–366. Bibcode :1966Sci...152..363E. doi :10.1126/science.152.3720.363. PMID 17775169. S2CID 23208558.
^ Kimura, M (17 de febrero de 1968). "Tasa evolutiva a nivel molecular". Nature . 217 (5129): 624–626. Bibcode :1968Natur.217..624K. doi :10.1038/217624a0. PMID 5637732. S2CID 4161261.
^ King, JL; Jukes, TH (16 de mayo de 1969). "Evolución no darwiniana". Science . 164 (3881): 788–798. Bibcode :1969Sci...164..788L. doi :10.1126/science.164.3881.788. PMID 5767777.
^ Kimura, M; Ohta, T (1974). "Sobre algunos principios que rigen la evolución molecular". Proc Natl Acad Sci USA . 71 (7): 2848–2852. Código Bibliográfico :1974PNAS...71.2848K. doi : 10.1073/pnas.71.7.2848 . PMC 388569 . PMID 4527913.
^ Asthana, Saurabh; Roytberg, Mikhail; Stamatoyannopoulos, John; Sunyaev, Shamil (28 de diciembre de 2007). Brudno, Michael (ed.). "Análisis de la conservación de secuencias en la resolución de nucleótidos". PLOS Computational Biology . 3 (12): e254. Bibcode :2007PLSCB...3..254A. doi : 10.1371/journal.pcbi.0030254 . ISSN 1553-7358. PMC 2230682 . PMID 18166073.
^ Cooper, GM; Brown, CD (1 de febrero de 2008). "Calificación de la relación entre la conservación de secuencias y la función molecular". Genome Research . 18 (2): 201–205. doi : 10.1101/gr.7205808 . ISSN 1088-9051. PMID 18245453.
^ Gilson, Amy I.; Marshall-Christensen, Ahmee; Choi, Jeong-Mo; Shakhnovich, Eugene I. (2017). "El papel de la selección evolutiva en la dinámica de la evolución de la estructura de las proteínas". Biophysical Journal . 112 (7): 1350–1365. arXiv : 1606.05802 . Bibcode :2017BpJ...112.1350G. doi :10.1016/j.bpj.2017.02.029. PMC 5390048 . PMID 28402878.
^ Caza, Ryan C.; Simhadri, Vijaya L.; Iandoli, Mateo; Sauna, Zuben E.; Kimchi-Sarfaty, Chava (2014). "Exponiendo mutaciones sinónimas". Tendencias en Genética . 30 (7): 308–321. doi :10.1016/j.tig.2014.04.006. PMID 24954581.
^ Zhang, Jianzhi (2000). "Tasas de sustituciones de nucleótidos conservadoras y radicales no sinónimas en genes nucleares de mamíferos". Journal of Molecular Evolution . 50 (1): 56–68. Bibcode :2000JMolE..50...56Z. doi :10.1007/s002399910007. ISSN 0022-2844. PMID 10654260. S2CID 15248867.
^ Sousounis, Konstantinos; Haney, Carl E; Cao, Jin; Sunchu, Bharath; Tsonis, Panagiotis A (2012). "Conservación de la estructura tridimensional en proteínas no homólogas o no relacionadas". Genómica Humana . 6 (1): 10. doi : 10.1186/1479-7364-6-10 . ISSN 1479-7364. PMC 3500211 . PMID 23244440.
^ Kairys, Visvaldas; Fernandes, Miguel X. (2007). "SitCon: Visualización de la conservación de residuos en sitios de unión y herramienta de secuenciación de proteínas a función". Revista Internacional de Química Cuántica . 107 (11): 2100–2110. Bibcode :2007IJQC..107.2100K. doi :10.1002/qua.21396. hdl : 10400.13/5004 . ISSN 0020-7608.
^ Chamary, JV; Hurst, Laurence D (2005). "Evidencia de selección en mutaciones sinónimas que afectan la estabilidad de la estructura secundaria del ARNm en mamíferos". Genome Biology . 6 (9): R75. doi : 10.1186/gb-2005-6-9-r75 . PMC 1242210 . PMID 16168082.
^ Wadler, CS; Vanderpool, CK (27 de noviembre de 2007). "Una función dual para un ARN pequeño bacteriano: SgrS realiza una regulación dependiente del apareamiento de bases y codifica un polipéptido funcional". Actas de la Academia Nacional de Ciencias . 104 (51): 20454–20459. Bibcode :2007PNAS..10420454W. doi : 10.1073/pnas.0708102104 . PMC 2154452 . PMID 18042713.
^ Johnsson, por; Lipovich, Leonard; Grandér, Dan; Morris, Kevin V. (marzo de 2014). "Conservación evolutiva de ARN largos no codificantes; secuencia, estructura, función". Biochimica et Biophysica Acta (BBA) - Temas generales . 1840 (3): 1063-1071. doi :10.1016/j.bbagen.2013.10.035. PMC 3909678 . PMID 24184936.
^ Freyhult, EK; Bollback, JP; Gardner, PP (6 de diciembre de 2006). "Explorando la materia oscura genómica: una evaluación crítica del rendimiento de los métodos de búsqueda de homología en el ARN no codificante". Genome Research . 17 (1): 117–125. doi :10.1101/gr.5890907. PMC 1716261 . PMID 17151342.
^ Margulies, EH (1 de diciembre de 2003). "Identificación y caracterización de secuencias conservadas en múltiples especies". Genome Research . 13 (12): 2507–2518. doi :10.1101/gr.1602203. ISSN 1088-9051. PMC 403793 . PMID 14656959.
^ Edwards, John R.; Ruparel, Hameer; Ju, Jingyue (2005). "Secuenciación de ADN por espectrometría de masas". Mutation Research/Fundamental and Molecular Mechanisms of Mutagenesis . 573 (1–2): 3–12. doi :10.1016/j.mrfmmm.2004.07.021. PMID 15829234.
^ Drost, Hajk-Georg; Gabel, Alexander; Grosse, Ivo; Quint, Marcel (1 de mayo de 2015). "Evidencia de mantenimiento activo de patrones de reloj de arena filotranscriptivos en embriogénesis animal y vegetal". Biología molecular y evolución . 32 (5): 1221–1231. doi :10.1093/molbev/msv012. ISSN 0737-4038. PMC 4408408 . PMID 25631928.
^ Nawrocki, EP; Eddy, SR (4 de septiembre de 2013). "Infernal 1.1: búsquedas de homología de ARN 100 veces más rápidas". Bioinformática . 29 (22): 2933–2935. doi :10.1093/bioinformatics/btt509. PMC 3810854 . PMID 24008419.
^ Eddy, SR; Durbin, R (11 de junio de 1994). "Análisis de secuencias de ARN utilizando modelos de covarianza". Nucleic Acids Research . 22 (11): 2079–88. doi :10.1093/nar/22.11.2079. PMC 308124 . PMID 8029015.
^ Trivedi, Rakesh; Nagarajaram, Hampapathalu Adimurthy (2020). "Matrices de puntuación de sustitución para proteínas: una descripción general". Protein Science . 29 (11): 2150–2163. doi :10.1002/pro.3954. ISSN 0961-8368. PMC 7586916 . PMID 32954566.
^ ab "Weblogo". UC Berkeley . Consultado el 30 de diciembre de 2017 .
^ "Preguntas frecuentes sobre Clustal #Símbolos". Clustal . Archivado desde el original el 24 de octubre de 2016 . Consultado el 8 de diciembre de 2014 .
^ "Navegador ECR". Navegador ECR . Consultado el 9 de enero de 2018 .
^ Conde, Dent; Nguyen, Ngan; Hickey, Glenn; Harris, Robert S.; Fitzgerald, Stephen; Beal, Kathryn; Seledtsov, Igor; Molodtsov, Vladimir; Raney, Brian J.; Clawson, Hiram; Kim, Jaebum; Kemena, Carsten; Chang, Jia-Ming; Erb, Ionas; Poliakov, Alejandro; Hou, Minmei; Herrero, Javier; Kent, William James; Soloviev, Víctor; Querido, Aaron E.; Mamá, Jian; Notredame, Cedric; Brudno, Michael; Dubchak, Inna; Haussler, David; Paten, Benedict (diciembre de 2014). "Alignathon: una evaluación competitiva de métodos de alineación del genoma completo". Investigación del genoma . 24 (12): 2077–2089. doi :10.1101/gr.174920.114. PMC 4248324. PMID 25273068 .
^ Rouli, L.; Merhej, V.; Fournier, P.-E.; Raoult, D. (septiembre de 2015). "El pangenoma bacteriano como una nueva herramienta para analizar bacterias patógenas". Nuevos microbios y nuevas infecciones . 7 : 72–85. doi :10.1016/j.nmni.2015.06.005. PMC 4552756 . PMID 26442149.
^ Méric, Guillaume; Yahara, Koji; Mageiros, Leonardos; Pascoe, Ben; Maiden, Martin CJ; Jolley, Keith A.; Sheppard, Samuel K.; Bereswill, Stefan (27 de marzo de 2014). "Un enfoque pangenómico de referencia para la genómica bacteriana comparativa: identificación de nuevos marcadores epidemiológicos en Campylobacter patógeno". PLOS ONE . 9 (3): e92798. Bibcode :2014PLoSO...992798M. doi : 10.1371/journal.pone.0092798 . PMC 3968026 . PMID 24676150.
^ Cooper, GM (17 de junio de 2005). "Distribución e intensidad de la restricción en la secuencia genómica de los mamíferos". Genome Research . 15 (7): 901–913. doi :10.1101/gr.3577405. PMC 1172034 . PMID 15965027.
^ "Sidow Lab - GERP". Archivado desde el original el 14 de enero de 2017. Consultado el 23 de abril de 2016 .
^ Nawar Malhis; Steven JM Jones; Jörg Gsponer (2019). "Medidas mejoradas para la conservación evolutiva que explotan las distancias taxonómicas". Nature Communications . 10 (1): 1556. Bibcode :2019NatCo..10.1556M. doi :10.1038/s41467-019-09583-2. PMC 6450959 . PMID 30952844.
^ Nawar Malhis; Matthew Jacobson; Steven JM Jones; Jörg Gsponer (2020). "LIST-S2: Clasificación basada en taxonomía de mutaciones sin sentido deletéreas entre especies". Investigación de ácidos nucleicos . 48 (W1): W154–W161. doi : 10.1093/nar/gkaa288 . PMC 7319545 . PMID 32352516.
^ Chang KT, Guo J, di Ronza A, Sardiello M (enero de 2018). "Aminode: Identificación de restricciones evolutivas en el proteoma humano". Sci. Rep . 8 (1): 1357. Bibcode :2018NatSR...8.1357C. doi :10.1038/s41598-018-19744-w. PMC 5778061 . PMID 29358731.
^ Pollard, KS; Hubisz, MJ; Rosenbloom, KR; Siepel, A. (26 de octubre de 2009). "Detección de tasas de sustitución no neutrales en filogenias de mamíferos". Genome Research . 20 (1): 110–121. doi :10.1101/gr.097857.109. PMC 2798823 . PMID 19858363.
^ "PHAST: Inicio".
^ Fan, Xiaodan; Zhu, Jun; Schadt, Eric E; Liu, Jun S (2007). "Poder estadístico del filo-HMM para la detección de elementos conservados evolutivamente". BMC Bioinformatics . 8 (1): 374. doi : 10.1186/1471-2105-8-374 . PMC 2194792 . PMID 17919331.
^ Bejerano, G. (28 de mayo de 2004). "Elementos ultraconservados en el genoma humano". Science . 304 (5675): 1321–1325. Bibcode :2004Sci...304.1321B. CiteSeerX 10.1.1.380.9305 . doi :10.1126/science.1098119. PMID 15131266. S2CID 2790337.
^ Siepel, A. (1 de agosto de 2005). "Elementos conservados evolutivamente en genomas de vertebrados, insectos, gusanos y levaduras". Genome Research . 15 (8): 1034–1050. doi :10.1101/gr.3715005. PMC 1182216 . PMID 16024819.
^ Harmston, N.; Baresic, A.; Lenhard, B. (11 de noviembre de 2013). "El misterio de la conservación extrema no codificante". Philosophical Transactions of the Royal Society B: Biological Sciences . 368 (1632): 20130021. doi :10.1098/rstb.2013.0021. PMC 3826495 . PMID 24218634.
^ Faircloth, BC; McCormack, JE; Crawford, NG; Harvey, MG; Brumfield, RT; Glenn, TC (9 de enero de 2012). "Elementos ultraconservados anclan miles de marcadores genéticos que abarcan múltiples escalas de tiempo evolutivas". Biología sistemática . 61 (5): 717–726. doi : 10.1093/sysbio/sys004 . PMID 22232343.
^ Faircloth, Brant C.; Branstetter, Michael G.; White, Noor D.; Brady, Seán G. (mayo de 2015). "El enriquecimiento selectivo de elementos ultraconservados de artrópodos proporciona una perspectiva genómica sobre las relaciones entre los himenópteros". Recursos de ecología molecular . 15 (3): 489–501. doi :10.1111/1755-0998.12328. PMC 4407909 . PMID 25207863.
^ Reneker, J.; Lyons, E.; Conant, GC; Pires, JC; Freeling, M.; Shyu, C.-R.; Korkin, D. (10 de abril de 2012). "Elementos multiespecie idénticos largos en genomas de plantas y animales". Actas de la Academia Nacional de Ciencias . 109 (19): E1183–E1191. doi : 10.1073/pnas.1121356109 . PMC 3358895 . PMID 22496592.
^ Isenbarger, Thomas A.; Carr, Christopher E.; Johnson, Sarah Stewart; Finney, Michael; Church, George M.; Gilbert, Walter; Zuber, Maria T.; Ruvkun, Gary (14 de octubre de 2008). "Los segmentos del genoma más conservados para la detección de vida en la Tierra y otros planetas". Orígenes de la vida y evolución de las biosferas . 38 (6): 517–533. Bibcode :2008OLEB...38..517I. doi :10.1007/s11084-008-9148-z. PMID 18853276. S2CID 15707806.
^ Harris, JK (12 de febrero de 2003). "El núcleo genético del ancestro universal". Genome Research . 13 (3): 407–412. doi :10.1101/gr.652803. PMC 430263 . PMID 12618371.
^ Ban, Nenad; Beckmann, Roland; Cate, Jamie HD; Dinman, Jonathan D; Dragon, François; Ellis, Steven R; Lafontaine, Denis LJ; Lindahl, Lasse; Liljas, Anders; Lipton, Jeffrey M; McAlear, Michael A; Moore, Peter B; Noller, Harry F; Ortega, Joaquin; Panse, Vikram Govind; Ramakrishnan, V; Spahn, Christian MT; Steitz, Thomas A; Tchorzewski, Marek; Tollervey, David; Warren, Alan J; Williamson, James R; Wilson, Daniel; Yonath, Ada; Yusupov, Marat (febrero de 2014). "Un nuevo sistema para nombrar proteínas ribosómicas". Current Opinion in Structural Biology . 24 : 165–169. doi :10.1016/j.sbi.2014.01.002. PMC 4358319. PMID 24524803 .
^ Gadagkar, Sudhindra R.; Rosenberg, Michael S.; Kumar, Sudhir (15 de enero de 2005). "Inferir filogenias de especies a partir de múltiples genes: árbol de secuencias concatenadas versus árbol de genes de consenso". Journal of Experimental Zoology Part B: Molecular and Developmental Evolution . 304B (1): 64–74. Bibcode :2005JEZB..304...64G. doi : 10.1002/jez.b.21026 . PMID 15593277.
^ Ludwig, W; Schleifer, KH (octubre de 1994). "Filogenia bacteriana basada en el análisis de secuencias de ARNr 16S y 23S". FEMS Microbiology Reviews . 15 (2–3): 155–73. doi : 10.1111/j.1574-6976.1994.tb00132.x . PMID 7524576.
^ Hug, Laura A.; Baker, Brett J.; Anantharaman, Karthik; Brown, Christopher T.; Probst, Alexander J.; Castelle, Cindy J.; Butterfield, Cristina N.; Hernsdorf, Alex W.; Amano, Yuki; Ise, Kotaro; Suzuki, Yohey; Dudek, Natasha; Relman, David A.; Finstad, Kari M.; Amundson, Ronald; Thomas, Brian C.; Banfield, Jillian F. (11 de abril de 2016). "Una nueva visión del árbol de la vida". Nature Microbiology . 1 (5): 16048. doi : 10.1038/nmicrobiol.2016.48 . PMID 27572647.
^ Zhang, Liqing; Li, Wen-Hsiung (febrero de 2004). "Los genes de mantenimiento de los mamíferos evolucionan más lentamente que los genes específicos de los tejidos". Biología molecular y evolución . 21 (2): 236–239. doi : 10.1093/molbev/msh010 . PMID 14595094.
^ Clermont, O.; Bonacorsi, S.; Bingen, E. (1 de octubre de 2000). "Determinación rápida y sencilla del grupo filogenético de Escherichia coli". Microbiología aplicada y medioambiental . 66 (10): 4555–4558. Bibcode :2000ApEnM..66.4555C. doi :10.1128/AEM.66.10.4555-4558.2000. PMC 92342 . PMID 11010916.
^ Kullberg, Morgan; Nilsson, Maria A.; Arnason, Ulfur; Harley, Eric H.; Janke, Axel (agosto de 2006). "Genes de mantenimiento para el análisis filogenético de las relaciones euterios". Biología molecular y evolución . 23 (8): 1493–1503. doi : 10.1093/molbev/msl027 . PMID 16751257.
^ Schoch, CL; Seifert, KA; Huhndorf, S.; Roberto, V.; Spouge, JL; Levesque, California; Chen, W.; Bolchacova, E.; Voigt, K.; Crous, PW; Molinero, AN; Wingfield, MJ; Aimé, MC; An, K.-D.; Bai, F.-Y.; Barreto, RW; Begerow, D.; Bergeron, MJ; Blackwell, M.; Boekhout, T.; Bogale, M.; Boonyuen, N.; Burgaz, AR; Buyck, B.; Cai, L.; Cai, Q.; Cardinali, G.; Chaverri, P.; Coppins, BJ; Crespo, A.; Cubas, P.; Cummings, C.; Damm, U.; de Beer, ZW; de Hoog, GS; Del Prado, R.; Dentinger, B.; Diéguez-Uribeondo, J.; Divakar, PK; Douglas, B.; Dueñas, M.; Duong, TA; Eberhardt, U.; Edwards, JE; Elshahed, MS; Fliegerova, K.; Furtado, M.; García, MA; Ge, Z.-W.; Griffith, GW; Griffiths, K.; Groenewald, JZ; Groenewald, M.; Grube, M.; Gryzenhout, M.; Guo, L.-D.; Hagen, F.; Hambleton, S.; Hamelín, RC; Hansen, K.; Harrold, P.; Heller, G.; Herrera, C.; Hirayama, K.; Hirooka, Y.; Ho, H.-M.; Hoffmann, K.; Hofstetter, V.; Hognabba, F.; Hollingsworth, PM; Hong, S.-B.; Hosaka, K.; Houbraken, J.; Hughes, K.; Huhtinen, S.; Hyde, KD; James, T.; Johnson, EM; Johnson, JE; Johnston, relaciones públicas; Jones, EBG; Kelly, LJ; Kirk, primer ministro; Knapp, director general; Koljalg, U.; Kovacs, director general; Kurtzman, CP; Landvik, S.; Leavitt, SD; Liggenstoffer, AS; Liimatainen, K.; Lombardo, L.; Luangsa-ard, JJ; Lumbsch, HT; Maganti, H.; Maharachchikumbura, SSN; Martín, diputado; mayo, TW; McTaggart, AR; Methven, AS; Meyer, W.; Moncalvo, J.-M.; Mongkolsamrit, S.; Nagy, LG; Nilsson, RH; Niskanen, T.; Nyilasi, I.; Okada, G.; Okane, yo; Olariaga, I.; Otte, J.; Papp, T.; Parque, D.; Petkovits, T.; Pino-Bodas, R.; Quaedvlieg, W.; Raja, HA; Redecker, D.; Rintoul, TL; Ruibal, C.; Sarmiento-Ramírez, JM; Schmitt, I.; Schussler, A.; Esquilador, C.; Sotome, K.; Stefani, FOP; Stenroos, S.; Stielow, B.; Medias, H.; Suetrong, S.; Suh, S.-O.; Sung, GH; Suzuki, M.; Tanaka, K.; Tedersoo, L.; Tellería, MT; Tretter, E.; Untereiner, WA; Urbina, H.; Vagvolgyi, C.; Vialle, A.; Vu, TD; Walther, G.; Wang, Q.-M.; Wang, Y.; Weir, BS; Weiss, M.; White, MM; Xu, J.; Yahr, R.; Yang, ZL; Yurkov, A.; Zamora, J.-C.; Zhang, N.; Zhuang, W.-Y.; Schindel, D. (27 de marzo de 2012). "Región espaciadora interna transcrita (ITS) del ribosoma nuclear como marcador de código de barras de ADN universal para hongos". Actas de la Academia Nacional de Ciencias . 109 (16) : 6241–6246. doi : 10.1073/pnas.1117018109 . PMC 3341068 . PMID 22454494.
^ Man, SM; Kaakoush, NO; Octavia, S.; Mitchell, H. (26 de marzo de 2010). "La región espaciadora transcrita interna, una nueva herramienta para su uso en la diferenciación de especies y la delimitación de relaciones sistemáticas dentro del género Campylobacter". Microbiología aplicada y ambiental . 76 (10): 3071–3081. Bibcode :2010ApEnM..76.3071M. doi :10.1128/AEM.02551-09. PMC 2869123 . PMID 20348308.
^ Ranjard, L.; Poly, F.; Lata, J.-C.; Mougel, C.; Thioulouse, J.; Nazaret, S. (1 de octubre de 2001). "Caracterización de comunidades bacterianas y fúngicas del suelo mediante análisis automatizado de huellas dactilares de espaciadores intergénicos ribosómicos: variabilidad biológica y metodológica". Microbiología aplicada y ambiental . 67 (10): 4479–4487. Bibcode :2001ApEnM..67.4479R. doi :10.1128/AEM.67.10.4479-4487.2001. PMC 93193 . PMID 11571146.
^ Bidé, Philippe; Barbut, Federico; Lalande, Valérie; Burghoffer, Béatrice; Petit, Jean-Claude (junio de 1999). "Desarrollo de un nuevo método de ribotipado por PCR basado en la secuenciación de genes del ARN ribosómico". Cartas de microbiología FEMS . 175 (2): 261–266. doi : 10.1111/j.1574-6968.1999.tb13629.x . PMID 10386377.
^ Ala, Ugo; Piro, Rosario Michael; Grassi, Elena; Damasco, Christian; Silengo, Lorenzo; Oti, Martin; Provero, Paolo; Di Cunto, Ferdinando; Tucker-Kellogg, Greg (28 de marzo de 2008). "Predicción de genes de enfermedades humanas mediante análisis de coexpresión conservada entre humanos y ratones". PLOS Computational Biology . 4 (3): e1000043. Bibcode :2008PLSCB...4E0043A. doi : 10.1371/journal.pcbi.1000043 . PMC 2268251 . PMID 18369433.
^ Pandey, UB; Nichols, CD (17 de marzo de 2011). "Modelos de enfermedades humanas en Drosophila melanogaster y el papel de la mosca en el descubrimiento de fármacos terapéuticos". Pharmacological Reviews . 63 (2): 411–436. doi :10.1124/pr.110.003293. PMC 3082451 . PMID 21415126.
^ Huang, Hui; Winter, Eitan E; Wang, Huajun; Weinstock, Keith G; Xing, Heming; Goodstadt, Leo; Stenson, Peter D; Cooper, David N; Smith, Douglas; Albà, M Mar; Ponting, Chris P; Fechtel, Kim (2004). "Conservación evolutiva y selección de ortólogos de genes de enfermedades humanas en los genomas de ratas y ratones". Genome Biology . 5 (7): R47. doi : 10.1186/gb-2004-5-7-r47 . PMC 463309 . PMID 15239832.
^ Ge, Dongliang; Fellay, Jacques; Thompson, Alexander J.; Simon, Jason S.; Shianna, Kevin V.; Urban, Thomas J.; Heinzen, Erin L.; Qiu, Ping; Bertelsen, Arthur H.; Muir, Andrew J.; Sulkowski, Mark; McHutchison, John G.; Goldstein, David B. (16 de agosto de 2009). "La variación genética en IL28B predice la eliminación viral inducida por el tratamiento de la hepatitis C". Nature . 461 (7262): 399–401. Bibcode :2009Natur.461..399G. doi :10.1038/nature08309. PMID 19684573. S2CID 1707096.
^ Bertram, L. (2009). "Estudios de asociación de todo el genoma en la enfermedad de Alzheimer". Genética molecular humana . 18 (R2): R137–R145. doi :10.1093/hmg/ddp406. PMC 2758713. PMID 19808789.
^ Kellis, Manolis; Patterson, Nick; Endrizzi, Matthew; Birren, Bruce; Lander, Eric S. (15 de mayo de 2003). "Secuenciación y comparación de especies de levadura para identificar genes y elementos reguladores". Nature . 423 (6937): 241–254. Bibcode :2003Natur.423..241K. doi :10.1038/nature01644. PMID 12748633. S2CID 1530261.
^ Marchler-Bauer, A.; Lu, S.; Anderson, JB; Chitsaz, F.; Derbyshire, MK; DeWeese-Scott, C.; Fong, JH; Geer, LY; Geer, RC; Gonzales, NR; Gwadz, M.; Hurwitz, DI; Jackson, JD; Ke, Z.; Lanczycki, CJ; Lu, F.; Marchler, GH; Mullokandov, M.; Omelchenko, MV; Robertson, CL; Song, JS; Thanki, N.; Yamashita, RA; Zhang, D.; Zhang, N.; Zheng, C.; Bryant, SH (24 de noviembre de 2010). "CDD: una base de datos de dominios conservados para la anotación funcional de proteínas". Nucleic Acids Research . 39 (Base de datos): D225–D229. doi :10.1093/nar/gkq1189. Número de modelo : PMID 21109532 .