Saturación genética

La saturación genética es el resultado de múltiples sustituciones en el mismo sitio en una secuencia, o sustituciones idénticas en diferentes secuencias, de modo que la tasa aparente de divergencia de la secuencia es menor que la divergencia real que ha ocurrido. ^[1] Al comparar dos o más secuencias genéticas que consisten en nucleótidos individuales, las diferencias en la secuencia observadas son solo diferencias en el estado final de la secuencia de nucleótidos. Los nucleótidos individuales que experimentan saturación genética cambian varias veces, a veces de nuevo a su nucleótido original o a un nucleótido común a la secuencia genética comparada. Sin información genética de taxones intermedios, es difícil saber cuánta saturación, o si alguna, ha ocurrido en una secuencia observada. ^[2] La saturación genética ocurre más rápidamente en secuencias de rápida evolución, como la región hipervariable del ADN mitocondrial, o en repeticiones cortas en tándem como en el cromosoma Y. ^[3]^[4]

En filogenética, los efectos de saturación dan como resultado una atracción de ramas largas , donde los linajes más distantes tienen longitudes de ramas engañosamente cortas. También disminuye la información filogenética contenida en las secuencias. ^[5]

Saturación filogenética

Sustituciones múltiples

Las sustituciones múltiples se producen cuando nucleótidos individuales sufren múltiples cambios antes de alcanzar su identidad nucleotídica final. Se dice que una secuencia está saturada porque la mutación ha actuado varias veces sobre los nucleótidos y el cambio observado en la secuencia es, de hecho, menor que el cambio histórico en la secuencia. ^[1]

Detección

Es posible estimar la cantidad de saturación que una secuencia podría haber experimentado estimando la tasa de sustitución de una secuencia genética y cuánto tiempo ha pasado desde la divergencia. Las tasas de divergencia se estiman a partir de una variedad de fuentes que incluyen ADN ancestral, registros fósiles y eventos biográficos. ^[6] Este uso de relojes moleculares para determinar la divergencia es controvertido debido a su potencial de inexactitud y suposiciones hechas en el modelo (como la tasa de mutación consistente para todas las ramas) y se utiliza principalmente como una herramienta de estimación. ^[6] La saturación genética también se puede estimar comparando el número de diferencias observadas en secuencias de nucleótidos entre múltiples pares de especies. El número de sustituciones observadas entre secuencias de diferentes especies se puede comparar con el número de sustituciones inferidas en función de la longitud de la rama para encontrar el punto aproximado donde el número de sustituciones inferidas supera el número de sustituciones observadas. ^[6]^[7] Este método puede dar a los investigadores una idea del nivel de saturación de un gen en particular, pero se cree que subestima la cantidad de saturación, especialmente para longitudes de ramas muy grandes. ^[2]

Impacto en la filogenética

En el campo de la filogenética molecular , las distancias y relaciones entre especies se investigan observando las secuencias de ADN, ARN o aminoácidos de un organismo. Cuando se construyen árboles filogenéticos sin considerar la posible saturación, la posibilidad de múltiples sustituciones puede hacer que la distancia entre taxones parezca mucho menor que la distancia real. El alineamiento de secuencias múltiples , una técnica común para construir filogenias, se basa en la comparación de secuencias homólogas. Puede confundirse fácilmente por la saturación genética porque los loci homólogos bajo investigación no muestran ninguna indicación de si más de una sustitución en cada nucleótido separa o no los taxones que se describen. ^[1] La sustitución disminuye la cantidad de información filogenética que puede estar contenida en las secuencias, especialmente cuando hay ramas profundas involucradas. Esto es particularmente evidente en estudios que examinan grupos de artrópodos. ^[8] Además, los efectos de saturación pueden conducir a una subestimación grave del tiempo de divergencia. Esto se debe principalmente a la aleatorización de la señal filogenética con el número de mutaciones y sustituciones de secuencias observadas. Los efectos de la saturación pueden enmascarar la verdadera cantidad de tiempo de divergencia, lo que genera árboles filogenéticos inexactos. ^[1]^[2]

El principio de parsimonia en el análisis de saturación genética

La parsimonia juega un papel fundamental en el análisis de la saturación genética. Este principio da preferencia a la explicación más simple que pueda explicar los datos. En lo que respecta a la saturación genética, la parsimonia significa que la relación hipotética es aquella que tiene el menor número de cambios de caracteres. El uso de la parsimonia para analizar la saturación genética puede generar conflictos a la hora de crear un árbol filogenético. ^[7] Cuando solo se utilizan datos de secuencia, es posible obtener numerosos árboles filogenéticos con la misma cantidad de parsimonia.

Atracción de rama larga

La saturación genética contribuye a la atracción de ramas largas en su capacidad de mezclar en gran medida el código genético sin cambios fenotípicos asociados fácilmente observables. La atracción de ramas largas ocurre cuando dos taxones relativamente fuera de grupo están aparentemente estrechamente vinculados. ^[1] Cuantas más mutaciones de sustitución, más probable es que secuencias previamente diferentes compartan nucleótidos y, como resultado, muestren homología en los cálculos del árbol filogenético. Se ha propuesto que la atracción de ramas largas debido a la saturación es la causa de los vínculos en las filogenias antiguas y pone en tela de juicio incluso algunas de las relaciones más tempranas entre eucariotas , arqueas y eubacterias . ^[2]

Otros usos de “Saturación” en genética

Mutagénesis por saturación del sitio genético

La mutagénesis por saturación del sitio genético (GSSM) es una técnica de mutagénesis de uno o más codones en un gen para crear una biblioteca de variantes que cubra todos los demás codones en esa posición. ^[9] Se utiliza en bioquímica e ingeniería de proteínas para explorar las funciones y características de secuencias de aminoácidos específicas. ^[9] Esta identificación sistemática de sustituciones de aminoácidos permite a los investigadores observar cada variante posible de cada posición. Esto proporcionará información estructural crucial sobre la proteína de interés e identificará secuencias de aminoácidos que son más vitales para la función de la proteína. ^[9]^[10]

Los investigadores suelen inclinarse por utilizar una PCR de un solo paso para explorar los efectos específicos de diferentes variaciones en un aminoácido de interés dentro de una proteína con GSSM. ^[11] Con un enfoque basado en PCR de un solo paso, los investigadores crean un cebador que tiene una secuencia correspondiente a la proteína de interés en sus dos extremos. Solo se sustituye un codón de una secuencia de aminoácidos de tres codones. ^[10]

El tipo de conjunto de codones determinará la cantidad de secuencias que se pueden derivar de GSSM. Para determinar qué conjunto de codones utilizar, los investigadores deberán verificar la calidad de la biblioteca a nivel de ADN, lo que significa que se necesitan datos de secuencias masivos. Si las 3 posiciones se pueden sustituir por cada uno de los cuatro nucleótidos diferentes, los investigadores pueden codificar los 20 aminoácidos. ^[10] Aunque es posible codificar los 20 aminoácidos, este no es el método más eficiente. El método más eficiente es utilizar una degeneración de codones NNK, también conocida como conjunto de codones limitado. ^[12] Este método dará como resultado solo 32 codones en lugar de 64. ^[10]

Ventajas de GSSM

En comparación con otras técnicas, GSSM puede ofrecer ventajas únicas como:

Un análisis completo de cada posición en un gen determinado, que puede ser útil para identificar posiciones críticas. Las posiciones críticas se identifican analizando la inmensidad de los efectos de la mutagénesis, tanto positivos como negativos. GSSM también puede identificar posiciones que son más flexibles, ya que GSSM en estas posiciones tendrá un impacto menor en el aminoácido. ^[9]
Un análisis específico de residuos, que permite a los investigadores crear una representación esquemática del aminoácido, lo que permite realizar investigaciones genéticas más complejas y detalladas en estudios posteriores. ^[9]
Capacidad de observar los efectos de varios aminoácidos sin conocer ninguna información estructural sobre la proteína. Los datos recopilados pueden proporcionar información valiosa en esta área. ^[9]
Plazos de entrega rápidos y rentabilidad. ^[9]

El GSSM abrió toda una frontera en la investigación genética, ya que revolucionó las creencias fundamentales sobre el ADN. Antes del GSSM, los investigadores mutaban el ADN mediante radiación o con diversos productos químicos. Ambos métodos son imprecisos. ^[13]

Referencias

^ abcde Philippe H, Brinkmann H, Lavrov DV, Littlewood DT, Manuel M, Wörheide G, Baurain D (marzo de 2011). "Resolución de cuestiones filogenéticas difíciles: por qué más secuencias no son suficientes". PLOS Biology . 9 (3): e1000602. doi : 10.1371/journal.pbio.1000602 . PMC 3057953 . PMID 21423652.
^ abcd Philippe H, Forterre P (octubre de 1999). "El enraizamiento del árbol universal de la vida no es fiable". Journal of Molecular Evolution . 49 (4): 509–23. Bibcode :1999JMolE..49..509P. doi :10.1007/PL00006573. PMID 10486008. S2CID 20350374.
^ Henn BM, Gignoux CR, Feldman MW, Mountain JL (enero de 2009). "Caracterización de la dependencia temporal de las estimaciones de la tasa de mutación del ADN mitocondrial humano". Biología molecular y evolución . 26 (1): 217–30. doi : 10.1093/molbev/msn244 . PMID 18984905.
^ Ho SY, Phillips MJ, Cooper A, Drummond AJ (julio de 2005). "Dependencia temporal de las estimaciones de la tasa molecular y sobreestimación sistemática de los tiempos de divergencia recientes". Biología molecular y evolución . 22 (7): 1561–8. doi : 10.1093/molbev/msi145 . PMID 15814826.
^ Abylgazieva NA (1 de enero de 2003). "[Caso de "diabetes renal"]". Zdravookhranenie Kirgizii . 26 (3): 49–51. doi :10.1016/S1055-7903(02)00326-3. PMID 7903.
^ abc van Tuinen M, Dyke GJ (enero de 2004). "Calibración de relojes moleculares galliformes utilizando múltiples fósiles y particiones genéticas". Filogenética molecular y evolución . 30 (1): 74–86. Bibcode :2004MolPE..30...74V. doi :10.1016/S1055-7903(03)00164-7. PMID 15022759.
^ ab Dávalos LM, Perkins SL (mayo de 2008). "El sesgo de saturación y composición de bases explica el conflicto filogenómico en Plasmodium". Genomics . 91 (5): 433–42. doi :10.1016/j.ygeno.2008.01.006. PMID 18313259.
^ Sanders KL, Lee MS (20 de abril de 2009). "Tiempos de divergencia molecular de los artrópodos y el origen cámbrico de los pentastómidos". Sistemática y Biodiversidad . 8 (1): 63–74. doi : 10.1080/14772000903562012 . S2CID 84880682.
^ abcdefg Zheng L, Baumann U, Reymond JL (agosto de 2004). "Un protocolo eficiente de mutagénesis dirigida al sitio y de saturación del sitio en un solo paso". Nucleic Acids Research . 32 (14): e115. doi :10.1093/nar/gnh110. PMC 514394 . PMID 15304544.
^ abcd Lopez P, Forterre P, Philippe H (octubre de 1999). "La raíz del árbol de la vida a la luz del modelo de covariación". Journal of Molecular Evolution . 49 (4): 496–508. Bibcode :1999JMolE..49..496L. doi :10.1007/pl00006572. PMID 10486007. S2CID 22835829.
^ Li A, Acevedo-Rocha CG, Reetz MT (julio de 2018). "Aumento de la eficiencia de la mutagénesis por saturación del sitio para un gen difícil de aleatorizar mediante una estrategia de PCR de dos pasos". Applied Microbiology and Biotechnology . 102 (14): 6095–6103. doi :10.1007/s00253-018-9041-2. PMC 6013526 . PMID 29785500.
^ Kretz KA, Richardson TH, Gray KA, Robertson DE, Tan X, Short JM (6 de agosto de 2004). "Mutagénesis por saturación del sitio genético: un enfoque de mutagénesis integral". Ingeniería de proteínas . Métodos en enzimología. Vol. 388. págs. 3–11. doi :10.1016/S0076-6879(04)88001-7. ISBN 9780121827939. Número de identificación personal 15289056.
^ Smith I, Payne J, Keay B. "Cómo Michael Smith puso a la comunidad de ciencias biológicas de BC en el mapa con un Premio Nobel hace 25 años". Vancouver Sun. Consultado el 24 de septiembre de 2018 .