El descubrimiento del papel del ADN en la herencia y las observaciones realizadas por Frederick Sanger sobre la variación entre las insulinas animales en 1949 [2] impulsaron a los primeros biólogos moleculares a estudiar la taxonomía desde una perspectiva molecular. [3] [4] Los estudios realizados en la década de 1960 utilizaron técnicas de hibridación de ADN y reactividad cruzada de proteínas para medir la similitud entre proteínas ortólogas conocidas , como la hemoglobina [5] y el citocromo c . [6] En 1965, Émile Zuckerkandl y Linus Pauling introdujeron el concepto de reloj molecular , [7] proponiendo que se podrían utilizar tasas constantes de reemplazo de aminoácidos para estimar el tiempo transcurrido desde que dos organismos divergieron . Si bien las filogenias iniciales coincidían estrechamente con el registro fósil , las observaciones de que algunos genes parecían evolucionar a ritmos diferentes llevaron al desarrollo de teorías de la evolución molecular . [3] [4] La comparación de secuencias de ferredoxina realizada por Margaret Dayhoff en 1966 mostró que la selección natural actuaría para conservar y optimizar secuencias de proteínas esenciales para la vida. [8]
En las secuencias codificantes, la secuencia de ácidos nucleicos y aminoácidos puede conservarse en diferentes grados, ya que la degeneración del código genético significa que mutaciones sinónimas en una secuencia codificante no afectan la secuencia de aminoácidos de su producto proteico. [15]
La secuencia de ácido nucleico de un gen codificante de proteína también puede conservarse mediante otras presiones selectivas. El sesgo en el uso de codones en algunos organismos puede restringir los tipos de mutaciones sinónimas en una secuencia. Las secuencias de ácido nucleico que causan una estructura secundaria en el ARNm de un gen codificante pueden seleccionarse, ya que algunas estructuras pueden afectar negativamente a la traducción, o conservarse cuando el ARNm también actúa como un ARN no codificante funcional. [19] [20]
Sin codificación
Las secuencias no codificantes importantes para la regulación genética , como los sitios de unión o reconocimiento de los ribosomas y los factores de transcripción , pueden conservarse dentro de un genoma. Por ejemplo, también puede conservarse el promotor de un gen u operón conservado. Al igual que ocurre con las proteínas, también se pueden conservar los ácidos nucleicos que son importantes para la estructura y función del ARN no codificante (ARNnc). Sin embargo, la conservación de la secuencia en los ncRNA es generalmente deficiente en comparación con las secuencias que codifican proteínas, y en su lugar a menudo se conservan los pares de bases que contribuyen a la estructura o función. [21] [22]
Las secuencias conservadas pueden identificarse mediante búsqueda de homología , utilizando herramientas como BLAST , HMMER , OrthologR, [25] e Infernal. [26] Las herramientas de búsqueda de homología pueden tomar una secuencia de proteína o ácido nucleico individual como entrada, o utilizar modelos estadísticos generados a partir de múltiples alineamientos de secuencias relacionadas conocidas. Los modelos estadísticos como los HMM de perfil y los modelos de covarianza de ARN que también incorporan información estructural [27] pueden ser útiles cuando se buscan secuencias relacionadas más distantes. Luego, las secuencias de entrada se alinean con una base de datos de secuencias de individuos u otras especies relacionadas. Luego, los alineamientos resultantes se califican en función del número de aminoácidos o bases coincidentes y del número de espacios o deleciones generados por el alineamiento. Se pueden identificar sustituciones conservadoras aceptables utilizando matrices de sustitución como PAM y BLOSUM . Se supone que las alineaciones con puntuaciones altas provienen de secuencias homólogas. La conservación de una secuencia puede entonces inferirse mediante la detección de homólogos muy similares en un amplio rango filogenético. [28]
Alineación de secuencias múltiples
Se pueden utilizar múltiples alineamientos de secuencias para visualizar secuencias conservadas. El formato CLUSTAL incluye una clave de texto sin formato para anotar columnas conservadas de la alineación, que denota secuencia conservada (*), mutaciones conservadoras (:), mutaciones semiconservadoras (.) y mutaciones no conservativas () [30] Logotipos de secuencia También puede mostrar una secuencia conservada representando las proporciones de caracteres en cada punto de la alineación por altura. [29]
Alineación del genoma
Las alineaciones del genoma completo (WGA) también se pueden utilizar para identificar regiones altamente conservadas entre especies. Actualmente, la precisión y escalabilidad de las herramientas WGA siguen siendo limitadas debido a la complejidad computacional de lidiar con reordenamientos, regiones repetidas y el gran tamaño de muchos genomas eucariotas. [32] Sin embargo, los WGA de 30 o más bacterias estrechamente relacionadas (procariotas) son ahora cada vez más factibles. [33] [34]
Sistemas de puntuación
Otros enfoques utilizan mediciones de conservación basadas en pruebas estadísticas que intentan identificar secuencias que mutan de manera diferente a una tasa de mutación de fondo (neutral) esperada.
El marco GERP (Genomic Evolutionary Rate Profiling) puntúa la conservación de secuencias genéticas entre especies. Este enfoque estima la tasa de mutación neutra en un conjunto de especies a partir de un alineamiento de secuencias múltiples y luego identifica regiones de la secuencia que exhiben menos mutaciones de las esperadas. Luego, a estas regiones se les asignan puntuaciones basadas en la diferencia entre la tasa de mutación observada y la tasa de mutación de fondo esperada. Una puntuación GERP alta indica una secuencia altamente conservada. [35] [36]
La LISTA [37] [38] (Identidad local y taxones compartidos) se basa en el supuesto de que las variaciones observadas en especies estrechamente relacionadas con los humanos son más significativas al evaluar la conservación en comparación con las de especies lejanamente relacionadas. Por lo tanto, LIST utiliza la identidad de alineación local alrededor de cada posición para identificar secuencias relevantes en la alineación de secuencias múltiples (MSA) y luego estima la conservación en función de las distancias taxonómicas de estas secuencias a los humanos. A diferencia de otras herramientas, LIST ignora el recuento/frecuencia de variaciones en el MSA.
Aminode [39] combina múltiples alineamientos con análisis filogenético para analizar cambios en proteínas homólogas y producir un gráfico que indique las tasas locales de cambios evolutivos. Este enfoque identifica las regiones evolutivamente restringidas en una proteína, que son segmentos que están sujetos a una selección purificadora y que suelen ser críticos para la función normal de la proteína.
Otros enfoques como PhyloP y PhyloHMM incorporan métodos filogenéticos estadísticos para comparar distribuciones de probabilidad de tasas de sustitución, lo que permite la detección tanto de conservación como de mutación acelerada. Primero, se genera una distribución de probabilidad de fondo del número de sustituciones que se espera que ocurran para una columna en una alineación de secuencia múltiple, basada en un árbol filogenético . Las relaciones evolutivas estimadas entre las especies de interés se utilizan para calcular la importancia de cualquier sustitución (es decir, una sustitución entre dos especies estrechamente relacionadas puede ser menos probable que ocurra que entre especies distantes y, por lo tanto, más significativa). Para detectar la conservación, se calcula una distribución de probabilidad para un subconjunto del alineamiento de secuencias múltiples y se compara con la distribución de fondo mediante una prueba estadística como una prueba de razón de verosimilitud o una prueba de puntuación . Los valores P generados al comparar las dos distribuciones se utilizan luego para identificar regiones conservadas. PhyloHMM utiliza modelos ocultos de Markov para generar distribuciones de probabilidad. El paquete de software PhyloP compara distribuciones de probabilidad utilizando una prueba de índice de verosimilitud o una prueba de puntuación , además de utilizar un sistema de puntuación similar a GERP. [40] [41] [42]
Conservación extrema
Elementos ultraconservados
Los elementos ultraconservados o UCE son secuencias que son muy similares o idénticas en múltiples agrupaciones taxonómicas . Estos se descubrieron por primera vez en vertebrados , [43] y posteriormente se identificaron dentro de taxones muy diferentes. [44] Si bien el origen y la función de las UCE no se conocen bien, [45] se han utilizado para investigar divergencias en el tiempo profundo en amniotas , [46] insectos , [47] y entre animales y plantas . [48]
Genes universalmente conservados
Los genes mejor conservados son los que se pueden encontrar en todos los organismos. Estos consisten principalmente en los ncRNA y proteínas necesarios para la transcripción y la traducción , que se supone que se conservaron del último ancestro común universal de toda la vida. [49]
Sets of conserved sequences are often used for generating phylogenetic trees, as it can be assumed that organisms with similar sequences are closely related.[52] The choice of sequences may vary depending on the taxonomic scope of the study. For example, the most highly conserved genes such as the 16S RNA and other ribosomal sequences are useful for reconstructing deep phylogenetic relationships and identifying bacterial phyla in metagenomics studies.[53][54] Sequences that are conserved within a clade but undergo some mutations, such as housekeeping genes, can be used to study species relationships.[55][56][57] The internal transcribed spacer (ITS) region, which is required for spacing conserved rRNA genes but undergoes rapid evolution, is commonly used to classify fungi and strains of rapidly evolving bacteria.[58][59][60][61]
Medical research
As highly conserved sequences often have important biological functions, they can be useful a starting point for identifying the cause of genetic diseases. Many congenital metabolic disorders and Lysosomal storage diseases are the result of changes to individual conserved genes, resulting in missing or faulty enzymes that are the underlying cause of the symptoms of the disease. Genetic diseases may be predicted by identifying sequences that are conserved between humans and lab organisms such as mice[62] or fruit flies,[63] and studying the effects of knock-outs of these genes.[64]Genome-wide association studies can also be used to identify variation in conserved sequences associated with disease or health outcomes. More than two dozen novel potential susceptibility loci have been discovered for Alzehimer's disease.[65][66]
Functional annotation
La identificación de secuencias conservadas se puede utilizar para descubrir y predecir secuencias funcionales como genes. [67] Las secuencias conservadas con una función conocida, como dominios de proteínas, también se pueden utilizar para predecir la función de una secuencia. Las bases de datos de dominios de proteínas conservados, como Pfam y la base de datos de dominios conservados, se pueden utilizar para anotar dominios funcionales en genes codificantes de proteínas predichos. [68]
^ "Preguntas frecuentes sobre #Símbolos de Clustal". Clustal . Archivado desde el original el 24 de octubre de 2016 . Consultado el 8 de diciembre de 2014 .
^ Sanger, F. (24 de septiembre de 1949). "Diferencias entre especies en insulinas". Naturaleza . 164 (4169): 529. Bibcode :1949Natur.164..529S. doi : 10.1038/164529a0 . PMID 18141620. S2CID 4067991.
^ ab Marmur, J; Falkow, S; Mandel, M (octubre de 1963). "Nuevos enfoques de la taxonomía bacteriana". Revista Anual de Microbiología . 17 (1): 329–372. doi : 10.1146/annurev.mi.17.100163.001553. PMID 14147455.
^ ab Ritmo, NR; Sapp, J.; Goldenfeld, N. (17 de enero de 2012). "Filogenia y más allá: significado científico, histórico y conceptual del primer árbol de la vida". Procedimientos de la Academia Nacional de Ciencias . 109 (4): 1011–1018. Código Bib : 2012PNAS..109.1011P. doi : 10.1073/pnas.1109716109 . PMC 3268332 . PMID 22308526.
^ Zuckerlandl, Emilio ; Pauling, Linus B. (1962). "Enfermedad molecular, evolución y heterogeneidad genética". Horizontes en bioquímica : 189–225.
^ Margoliash, E (octubre de 1963). "Estructura primaria y evolución del citocromo C". Proc Natl Acad Sci Estados Unidos . 50 (4): 672–679. Código bibliográfico : 1963PNAS...50..672M. doi : 10.1073/pnas.50.4.672 . PMC 221244 . PMID 14077496.
^ Zuckerkandl, E; Pauling, LB (1965). Divergencia y convergencia evolutiva en proteínas . págs. 96-166. doi :10.1016/B978-1-4832-2734-4.50017-6. ISBN9781483227344. {{cite book}}: |journal=ignorado ( ayuda )
^ Eck, RV; Dayhoff, MO (15 de abril de 1966). "Evolución de la estructura de la ferredoxina basada en reliquias vivas de secuencias primitivas de aminoácidos". Ciencia . 152 (3720): 363–366. Código bibliográfico : 1966 Ciencia... 152..363E. doi : 10.1126/ciencia.152.3720.363. PMID 17775169. S2CID 23208558.
^ Kimura, M (17 de febrero de 1968). "Tasa de evolución a nivel molecular". Naturaleza . 217 (5129): 624–626. Código Bib :1968Natur.217..624K. doi :10.1038/217624a0. PMID 5637732. S2CID 4161261.
^ Rey, JL; Jukes, TH (16 de mayo de 1969). "Evolución no darwiniana". Ciencia . 164 (3881): 788–798. Código bibliográfico : 1969 Ciencia... 164..788L. doi : 10.1126/ciencia.164.3881.788. PMID 5767777.
^ Kimura, M; Ohta, T (1974). "Sobre algunos principios que gobiernan la evolución molecular". Proc Natl Acad Sci Estados Unidos . 71 (7): 2848–2852. Código bibliográfico : 1974PNAS...71.2848K. doi : 10.1073/pnas.71.7.2848 . PMC 388569 . PMID 4527913.
^ Asthana, Saurabh; Roytberg, Mijaíl; Stamatoyannopoulos, John; Sunyaev, Shamil (28 de diciembre de 2007). Brudno, Michael (ed.). "Análisis de conservación de secuencia en resolución de nucleótidos". PLOS Biología Computacional . 3 (12): e254. Código Bib : 2007PLSCB...3..254A. doi : 10.1371/journal.pcbi.0030254 . ISSN 1553-7358. PMC 2230682 . PMID 18166073.
^ Cooper, gerente general; Brown, CD (1 de febrero de 2008). "Calificar la relación entre conservación de secuencia y función molecular". Investigación del genoma . 18 (2): 201–205. doi : 10.1101/gr.7205808 . ISSN 1088-9051. PMID 18245453.
^ Gilson, Amy I.; Marshall-Christensen, Ahmee; Choi, Jeong-Mo; Shakhnovich, Eugenio I. (2017). "El papel de la selección evolutiva en la dinámica de la evolución de la estructura de las proteínas". Revista Biofísica . 112 (7): 1350-1365. arXiv : 1606.05802 . Código Bib : 2017BpJ...112.1350G. doi :10.1016/j.bpj.2017.02.029. PMC 5390048 . PMID 28402878.
^ Caza, Ryan C.; Simhadri, Vijaya L.; Iandoli, Mateo; Sauna, Zuben E.; Kimchi-Sarfaty, Chava (2014). "Exponiendo mutaciones sinónimas". Tendencias en Genética . 30 (7): 308–321. doi :10.1016/j.tig.2014.04.006. PMID 24954581.
^ Zhang, Jianzhi (2000). "Tasas de sustituciones de nucleótidos no sinónimos conservadoras y radicales en genes nucleares de mamíferos". Revista de evolución molecular . 50 (1): 56–68. Código Bib : 2000JMolE..50...56Z. doi :10.1007/s002399910007. ISSN 0022-2844. PMID 10654260. S2CID 15248867.
^ Sousounis, Konstantinos; Haney, Carl E; Cao, Jin; Sunchu, Bharat; Tsonis, Panagiotis A (2012). "Conservación de la estructura tridimensional en proteínas no homólogas o no relacionadas". Genómica humana . 6 (1): 10. doi : 10.1186/1479-7364-6-10 . ISSN 1479-7364. PMC 3500211 . PMID 23244440.
^ Kairys, Visvaldas; Fernández, Miguel X. (2007). "SitCon: herramienta de visualización de conservación de residuos del sitio de unión y relación de secuencia a función de proteínas". Revista Internacional de Química Cuántica . 107 (11): 2100–2110. Código Bib : 2007IJQC..107.2100K. doi :10.1002/qua.21396. hdl : 10400.13/5004 . ISSN 0020-7608.
^ Chamary, JV; Hurst, Laurence D (2005). "Evidencia de selección de mutaciones sinónimas que afectan la estabilidad de la estructura secundaria del ARNm en mamíferos". Biología del genoma . 6 (9): R75. doi : 10.1186/gb-2005-6-9-r75 . PMC 1242210 . PMID 16168082.
^ Wadler, CS; Vanderpool, CK (27 de noviembre de 2007). "Una función dual para un ARN pequeño bacteriano: SgrS realiza una regulación dependiente del emparejamiento de bases y codifica un polipéptido funcional". Procedimientos de la Academia Nacional de Ciencias . 104 (51): 20454–20459. Código Bib : 2007PNAS..10420454W. doi : 10.1073/pnas.0708102104 . PMC 2154452 . PMID 18042713.
^ Johnsson, por; Lipovich, Leonard; Grandér, Dan; Morris, Kevin V. (marzo de 2014). "Conservación evolutiva de ARN largos no codificantes; secuencia, estructura, función". Biochimica et Biophysica Acta (BBA) - Temas generales . 1840 (3): 1063-1071. doi :10.1016/j.bbagen.2013.10.035. PMC 3909678 . PMID 24184936.
^ Freyhult, EK; Bolback, JP; Gardner, PP (6 de diciembre de 2006). "Explorando la materia oscura genómica: una evaluación crítica del rendimiento de los métodos de búsqueda de homología en ARN no codificante". Investigación del genoma . 17 (1): 117–125. doi :10.1101/gr.5890907. PMC 1716261 . PMID 17151342.
^ Margulies, EH (1 de diciembre de 2003). "Identificación y caracterización de secuencias conservadas de múltiples especies". Investigación del genoma . 13 (12): 2507–2518. doi :10.1101/gr.1602203. ISSN 1088-9051. PMC 403793 . PMID 14656959.
^ Edwards, John R.; Ruparel, Hameer; Ju, Jingyue (2005). "Secuenciación de ADN por espectrometría de masas". Investigación de mutaciones/Mecanismos fundamentales y moleculares de la mutagénesis . 573 (1–2): 3–12. doi :10.1016/j.mrfmmm.2004.07.021. PMID 15829234.
^ Drost, Hajk-Georg; Gabel, Alejandro; Grosse, Ivo; Quint, Marcel (1 de mayo de 2015). "Evidencia del mantenimiento activo de patrones filotranscriptómicos en forma de reloj de arena en la embriogénesis de animales y plantas". Biología Molecular y Evolución . 32 (5): 1221-1231. doi :10.1093/molbev/msv012. ISSN 0737-4038. PMC 4408408 . PMID 25631928.
^ Nawrocki, EP; Eddy, SR (4 de septiembre de 2013). "Infernal 1.1: búsquedas de homología de ARN 100 veces más rápidas". Bioinformática . 29 (22): 2933–2935. doi : 10.1093/bioinformática/btt509. PMC 3810854 . PMID 24008419.
^ Eddy, SR; Durbin, R (11 de junio de 1994). "Análisis de secuencia de ARN mediante modelos de covarianza". Investigación de ácidos nucleicos . 22 (11): 2079–88. doi :10.1093/nar/22.11.2079. PMC 308124 . PMID 8029015.
^ Trivedi, Rakesh; Nagarajaram, Hampapathalu Adimurthy (2020). "Matrices de puntuación de sustitución para proteínas: descripción general". Ciencia de las proteínas . 29 (11): 2150–2163. doi :10.1002/pro.3954. ISSN 0961-8368. PMC 7586916 . PMID 32954566.
^ ab "Logotipo web". UC Berkeley . Consultado el 30 de diciembre de 2017 .
^ "Preguntas frecuentes sobre #Símbolos de Clustal". Clustal . Archivado desde el original el 24 de octubre de 2016 . Consultado el 8 de diciembre de 2014 .
^ "Navegador ECR". Navegador ECR . Consultado el 9 de enero de 2018 .
^ Conde, Dent; Nguyen, Ngan; Hickey, Glenn; Harris, Robert S.; Fitzgerald, Stephen; Beal, Kathryn; Seledtsov, Igor; Molodtsov, Vladimir; Raney, Brian J.; Clawson, Hiram; Kim, Jaebum; Kemena, Carsten; Chang, Jia-Ming; Erb, Ionas; Poliakov, Alejandro; Hou, Minmei; Herrero, Javier; Kent, William James; Soloviev, Víctor; Querido, Aaron E.; Mamá, Jian; Notredame, Cedric; Brudno, Michael; Dubchak, Inna; Haussler, David; Paten, Benedict (diciembre de 2014). "Alignathon: una evaluación competitiva de métodos de alineación del genoma completo". Investigación del genoma . 24 (12): 2077–2089. doi :10.1101/gr.174920.114. PMC 4248324 . PMID 25273068.
^ Rouli, L.; Merhej, V.; Fournier, P.-E.; Raoult, D. (septiembre de 2015). "El pangenoma bacteriano como nueva herramienta para el análisis de bacterias patógenas". Nuevos microbios y nuevas infecciones . 7 : 72–85. doi :10.1016/j.nmni.2015.06.005. PMC 4552756 . PMID 26442149.
^ Méric, Guillaume; Yahara, Koji; Mageiros, Leonardos; Pascoe, Ben; Doncella, Martín CJ; Jolley, Keith A.; Sheppard, Samuel K.; Bereswill, Stefan (27 de marzo de 2014). "Un enfoque pangenómico de referencia para la genómica bacteriana comparada: identificación de nuevos marcadores epidemiológicos en Campylobacter patógeno". MÁS UNO . 9 (3): e92798. Código Bib : 2014PLoSO...992798M. doi : 10.1371/journal.pone.0092798 . PMC 3968026 . PMID 24676150.
^ Cooper, GM (17 de junio de 2005). "Distribución e intensidad de restricción en la secuencia genómica de mamíferos". Investigación del genoma . 15 (7): 901–913. doi :10.1101/gr.3577405. PMC 1172034 . PMID 15965027.
^ "Laboratorio Sidow - GERP".
^ Nawar Malhis; Steven JM Jones; Jörg Gsponer (2019). "Medidas mejoradas para la conservación evolutiva que explotan las distancias taxonómicas". Comunicaciones de la naturaleza . 10 (1): 1556. Código bibliográfico : 2019NatCo..10.1556M. doi :10.1038/s41467-019-09583-2. PMC 6450959 . PMID 30952844.
^ Nawar Malhis; Mateo Jacobson; Steven JM Jones; Jörg Gsponer (2020). "LISTA-S2: Clasificación basada en taxonomía de mutaciones nocivas de sentido erróneo entre especies". Investigación de ácidos nucleicos . 48 (W1): W154-W161. doi : 10.1093/nar/gkaa288 . PMC 7319545 . PMID 32352516.
^ Chang KT, Guo J, di Ronza A, Sardiello M (enero de 2018). "Aminodo: identificación de limitaciones evolutivas en el proteoma humano". Ciencia. Representante . 8 (1): 1357. Código bibliográfico : 2018NatSR...8.1357C. doi :10.1038/s41598-018-19744-w. PMC 5778061 . PMID 29358731.
^ Pollard, KS; Hubisz, MJ; Rosenbloom, KR; Siepel, A. (26 de octubre de 2009). "Detección de tasas de sustitución no neutrales en filogenias de mamíferos". Investigación del genoma . 20 (1): 110-121. doi :10.1101/gr.097857.109. PMC 2798823 . PMID 19858363.
^ "PHAST: Inicio".
^ Fanático, Xiaodan; Zhu, junio; Schadt, Eric E; Liu, Jun S (2007). "Poder estadístico de phylo-HMM para la detección de elementos conservados evolutivamente". Bioinformática BMC . 8 (1): 374. doi : 10.1186/1471-2105-8-374 . PMC 2194792 . PMID 17919331.
^ Bejerano, G. (28 de mayo de 2004). "Elementos ultraconservados del genoma humano". Ciencia . 304 (5675): 1321–1325. Código bibliográfico : 2004 Ciencia... 304.1321B. CiteSeerX 10.1.1.380.9305 . doi : 10.1126/ciencia.1098119. PMID 15131266. S2CID 2790337.
^ Siepel, A. (1 de agosto de 2005). "Elementos evolutivamente conservados en genomas de vertebrados, insectos, gusanos y levaduras". Investigación del genoma . 15 (8): 1034-1050. doi :10.1101/gr.3715005. PMC 1182216 . PMID 16024819.
^ Harmston, N.; Barésic, A.; Lenhard, B. (11 de noviembre de 2013). "El misterio de la conservación extrema sin codificación". Transacciones Filosóficas de la Royal Society B: Ciencias Biológicas . 368 (1632): 20130021. doi :10.1098/rstb.2013.0021. PMC 3826495 . PMID 24218634.
^ Faircloth, antes de Cristo; McCormack, JE; Crawford, NG; Harvey, MG; Brumfield, RT; Glenn, TC (9 de enero de 2012). "Los elementos ultraconservados anclan miles de marcadores genéticos que abarcan múltiples escalas de tiempo evolutivas". Biología Sistemática . 61 (5): 717–726. doi : 10.1093/sysbio/sys004 . PMID 22232343.
^ Tela justa, Brant C.; Branstetter, Michael G.; Blanco, Noor D.; Brady, Seán G. (mayo de 2015). "El enriquecimiento objetivo de elementos ultraconservados de artrópodos proporciona una perspectiva genómica sobre las relaciones entre himenópteros". Recursos de ecología molecular . 15 (3): 489–501. doi :10.1111/1755-0998.12328. PMC 4407909 . PMID 25207863.
^ Reneker, J.; Lyon, E.; Conant, GC; Pires, JC; Freeling, M.; Shyu, CR; Korkin, D. (10 de abril de 2012). "Elementos multiespecies idénticos durante mucho tiempo en genomas de plantas y animales". Procedimientos de la Academia Nacional de Ciencias . 109 (19): E1183–E1191. doi : 10.1073/pnas.1121356109 . PMC 3358895 . PMID 22496592.
^ Isenbarger, Thomas A.; Carr, Christopher E.; Johnson, Sarah Stewart; Finney, Michael; Iglesia, George M.; Gilbert, Walter; Zuber, María T.; Ruvkun, Gary (14 de octubre de 2008). "Los segmentos del genoma más conservados para la detección de vida en la Tierra y otros planetas". Orígenes de la vida y evolución de las biosferas . 38 (6): 517–533. Código Bib : 2008OLEB...38..517I. doi :10.1007/s11084-008-9148-z. PMID 18853276. S2CID 15707806.
^ Harris, JK (12 de febrero de 2003). "El núcleo genético del antepasado universal". Investigación del genoma . 13 (3): 407–412. doi :10.1101/gr.652803. PMC 430263 . PMID 12618371.
^ Prohibición, Nenad; Beckmann, Roland; Cate, Jamie HD; Dinman, Jonathan D; Dragón, François; Ellis, Steven R; Lafontaine, Denis LJ; Lindahl, Lasse; Liljas, Anders; Lipton, Jeffrey M; McAlear, Michael A; Moore, Peter B; Noller, Harry F; Ortega, Joaquín; Panse, Vikram Govind; Ramakrishnan, V; Spahn, Christian MT; Steitz, Thomas A; Tchorzewski, Marek; Tollervey, David; Warren, Alan J; Williamson, James R; Wilson, Daniel; Yonath, Ada; Yusupov, Marat (febrero de 2014). "Un nuevo sistema para nombrar proteínas ribosómicas". Opinión actual en biología estructural . 24 : 165-169. doi :10.1016/j.sbi.2014.01.002. PMC 4358319 . PMID 24524803.
^ Gadagkar, Sudhindra R.; Rosenberg, Michael S.; Kumar, Sudhir (15 de enero de 2005). "Inferir filogenias de especies a partir de múltiples genes: árbol de secuencias concatenadas versus árbol de genes de consenso". Journal of Experimental Zoology Parte B: Evolución molecular y del desarrollo . 304B (1): 64–74. Código Bib : 2005JEZB..304...64G. doi : 10.1002/jez.b.21026 . PMID 15593277.
^ Luis, W; Schleifer, KH (octubre de 1994). "Filogenia bacteriana basada en análisis de secuencia de ARNr 16S y 23S". Reseñas de microbiología FEMS . 15 (2–3): 155–73. doi : 10.1111/j.1574-6976.1994.tb00132.x . PMID 7524576.
^ Abrazo, Laura A.; Panadero, Brett J.; Anantharaman, Karthik; Marrón, Christopher T.; Probst, Alejandro J.; Castelle, Cindy J.; Butterfield, Cristina N.; Hernsdorf, Alex W.; Amano, Yuki; Ise, Kotaro; Suzuki, Yohey; Dudek, Natasha; Relman, David A.; Finstad, Kari M.; Amundson, Ronald; Thomas, Brian C.; Banfield, Jillian F. (11 de abril de 2016). "Una nueva visión del árbol de la vida". Microbiología de la naturaleza . 1 (5): 16048. doi : 10.1038/nmicrobiol.2016.48 . PMID 27572647.
^ Zhang, Liqing; Li, Wen-Hsiung (febrero de 2004). "Los genes domésticos de los mamíferos evolucionan más lentamente que los genes específicos de tejidos". Biología Molecular y Evolución . 21 (2): 236–239. doi : 10.1093/molbev/msh010 . PMID 14595094.
^ Clermont, O.; Bonacorsi, S.; Bingen, E. (1 de octubre de 2000). "Determinación rápida y sencilla del grupo filogenético de Escherichia coli". Microbiología Aplicada y Ambiental . 66 (10): 4555–4558. Código Bib : 2000ApEnM..66.4555C. doi :10.1128/AEM.66.10.4555-4558.2000. PMC 92342 . PMID 11010916.
^ Kullberg, Morgan; Nilsson, María A.; Arnason, Ulfur; Harley, Eric H.; Janke, Axel (agosto de 2006). "Genes internos para el análisis filogenético de las relaciones euterianas". Biología Molecular y Evolución . 23 (8): 1493-1503. doi : 10.1093/molbev/msl027 . PMID 16751257.
^ Hombre, SM; Kaakoush, NO; Octavia, S.; Mitchell, H. (26 de marzo de 2010). "La región espaciadora transcrita interna, una nueva herramienta para su uso en la diferenciación de especies y delimitación de relaciones sistemáticas dentro del género Campylobacter". Microbiología Aplicada y Ambiental . 76 (10): 3071–3081. Código Bib : 2010ApEnM..76.3071M. doi :10.1128/AEM.02551-09. PMC 2869123 . PMID 20348308.
^ Ranjard, L.; Poli, F.; Lata, J.-C.; Mougel, C.; Thioulouse, J.; Nazaret, S. (1 de octubre de 2001). "Caracterización de comunidades de suelos bacterianos y fúngicos mediante análisis automatizado de huellas dactilares de espaciadores intergénicos ribosómicos: variabilidad biológica y metodológica". Microbiología Aplicada y Ambiental . 67 (10): 4479–4487. Código Bib : 2001 ApEnM..67.4479R. doi :10.1128/AEM.67.10.4479-4487.2001. PMC 93193 . PMID 11571146.
^ Bidé, Philippe; Barbut, Federico; Lalande, Valérie; Burghoffer, Béatrice; Petit, Jean-Claude (junio de 1999). "Desarrollo de un nuevo método de ribotipado por PCR basado en la secuenciación de genes del ARN ribosómico". Cartas de microbiología FEMS . 175 (2): 261–266. doi : 10.1111/j.1574-6968.1999.tb13629.x . PMID 10386377.
^ Ala, Ugo; Piro, Rosario Michael; Grassi, Elena; Damasco, cristiano; Silengo, Lorenzo; Oti, Martín; Provero, Paolo; Di Cunto, Fernando; Tucker-Kellogg, Greg (28 de marzo de 2008). "Predicción de genes de enfermedades humanas mediante análisis de coexpresión conservada en ratón humano". PLOS Biología Computacional . 4 (3): e1000043. Código Bib : 2008PLSCB...4E0043A. doi : 10.1371/journal.pcbi.1000043 . PMC 2268251 . PMID 18369433.
^ Pandey, UB; Nichols, CD (17 de marzo de 2011). "Modelos de enfermedades humanas en Drosophila melanogaster y el papel de la mosca en el descubrimiento de fármacos terapéuticos". Revisiones farmacológicas . 63 (2): 411–436. doi :10.1124/pr.110.003293. PMC 3082451 . PMID 21415126.
^ Huang, Hui; Invierno, Eitan E; Wang, Huajun; Weinstock, Keith G; Xing, Heming; Goodstadt, Leo; Stenson, Peter D; Cooper, David N; Smith, Douglas; Alba, M Mar; Ponting, Chris P; Fechtel, Kim (2004). "Conservación evolutiva y selección de ortólogos de genes de enfermedades humanas en los genomas de rata y ratón". Biología del genoma . 5 (7): R47. doi : 10.1186/gb-2004-5-7-r47 . PMC 463309 . PMID 15239832.
^ Ge, Dongliang; Fellay, Jacques; Thompson, Alejandro J.; Simón, Jason S.; Shianna, Kevin V.; Urbano, Thomas J.; Heinzen, Erin L.; Qiu, Ping; Bertelsen, Arthur H.; Muir, Andrew J.; Sulkowski, Mark; McHutchison, John G.; Goldstein, David B. (16 de agosto de 2009). "La variación genética en IL28B predice la eliminación viral inducida por el tratamiento de la hepatitis C". Naturaleza . 461 (7262): 399–401. Código Bib :2009Natur.461..399G. doi : 10.1038/naturaleza08309. PMID 19684573. S2CID 1707096.
^ Bertram, L. (2009). "Estudios de asociación de todo el genoma en la enfermedad de Alzheimer". Genética Molecular Humana . 18 (R2): R137–R145. doi :10.1093/hmg/ddp406. PMC 2758713 . PMID 19808789.
^ Kellis, Manolis; Patterson, Nick; Endrizzi, Mateo; Birren, Bruce; Lander, Eric S. (15 de mayo de 2003). "Secuenciación y comparación de especies de levaduras para identificar genes y elementos reguladores". Naturaleza . 423 (6937): 241–254. Código Bib :2003Natur.423..241K. doi : 10.1038/naturaleza01644. PMID 12748633. S2CID 1530261.
^ Marchler-Bauer, A.; Lu, S.; Anderson, JB; Chitsaz, F.; Derbyshire, MK; DeWeese-Scott, C.; Fong, JH; Geer, LY; Geer, RC; González, NR; Gwadz, M.; Hurwitz, DI; Jackson, JD; Ke, Z.; Lanczycki, CJ; Lu, F.; Marchler, GH; Mullokandov, M.; Omelchenko, MV; Robertson, CL; Canción, JS; Gracias, N.; Yamashita, RA; Zhang, D.; Zhang, N.; Zheng, C.; Bryant, SH (24 de noviembre de 2010). "CDD: una base de datos de dominio conservado para la anotación funcional de proteínas". Investigación de ácidos nucleicos . 39 (Base de datos): D225 – D229. doi : 10.1093/nar/gkq1189. PMC 3013737 . PMID 21109532.