La prueba de McDonald-Kreitman [1] es una prueba estadística que suelen utilizar los biólogos evolutivos y de poblaciones para detectar y medir la cantidad de evolución adaptativa dentro de una especie al determinar si se ha producido una evolución adaptativa y la proporción de sustituciones que resultaron de la selección positiva (también conocida como selección direccional ). Para ello, la prueba de McDonald-Kreitman compara la cantidad de variación dentro de una especie ( polimorfismo ) con la divergencia entre especies (sustituciones) en dos tipos de sitios, neutros y no neutros. Una sustitución se refiere a un nucleótido que está fijado dentro de una especie, pero un nucleótido diferente está fijado dentro de una segunda especie en el mismo par de bases de secuencias de ADN homólogas. [2] Un sitio es no neutro si es ventajoso o perjudicial. [3] Los dos tipos de sitios pueden ser sinónimos o no sinónimos dentro de una región codificante de proteínas. En una secuencia codificante de proteínas de ADN, un sitio es sinónimo si una mutación puntual en ese sitio no cambiaría el aminoácido, también conocida como mutación silenciosa . Debido a que la mutación no resultó en un cambio en el aminoácido que fue codificado originalmente por la secuencia codificante de proteínas, el fenotipo, o el rasgo observable, del organismo generalmente no cambia por la mutación silenciosa. [4] Un sitio en una secuencia codificante de proteínas de ADN no es sinónimo si una mutación puntual en ese sitio resulta en un cambio en el aminoácido, lo que resulta en un cambio en el fenotipo del organismo. [3] Por lo general, las mutaciones silenciosas en las regiones codificantes de proteínas se utilizan como "control" en la prueba de McDonald-Kreitman.
En 1991, John H. McDonald y Martin Kreitman derivaron la prueba de McDonald–Kreitman mientras realizaban un experimento con Drosophila (moscas de la fruta) y sus diferencias en la secuencia de aminoácidos del gen de la alcohol deshidrogenasa. McDonald y Kreitman propusieron este método para estimar la proporción de sustituciones que se fijan por selección positiva en lugar de por deriva genética . [5]
Para realizar la prueba de McDonald-Kreitman, primero debemos crear una tabla de contingencia de dos vías de nuestros datos sobre las especies que se están investigando, como se muestra a continuación:
Para cuantificar los valores de D s , D n , P s y P n , se cuenta el número de diferencias en la región codificante de proteínas para cada tipo de variable en la tabla de contingencia.
La hipótesis nula de la prueba de McDonald-Kreitman es que la razón entre variación no sinónima y sinónima dentro de una especie será igual a la razón entre variación no sinónima y sinónima entre especies (es decir, D n / D s = P n / P s ). Cuando la selección positiva o negativa (selección natural) influye en la variación no sinónima, las razones ya no serán iguales. La razón entre variación no sinónima y sinónima entre especies será menor que la razón entre variación no sinónima y sinónima dentro de las especies (es decir, D n / D s < P n / P s ) cuando la selección negativa está en acción y las mutaciones deletéreas afectan fuertemente al polimorfismo. La razón entre variación no sinónima y sinónima dentro de las especies es menor que la razón entre variación no sinónima y sinónima entre especies (es decir, D n / D s > P n / P s ) cuando observamos selección positiva. Dado que las mutaciones bajo selección positiva se propagan rápidamente a través de una población, no contribuyen al polimorfismo pero sí tienen un efecto sobre la divergencia. [6]
Utilizando una ecuación derivada de Smith y Eyre-Walker , podemos estimar la proporción de sustituciones de bases fijadas por la selección natural, α, [7] utilizando la siguiente fórmula:
Alfa representa la proporción de sustituciones impulsadas por la selección positiva. Alfa puede ser igual a cualquier número entre -∞ y 1. Los valores negativos de alfa se producen por error de muestreo o violaciones del modelo, como la segregación de mutaciones de aminoácidos ligeramente perjudiciales. [8] De manera similar a lo anterior, nuestra hipótesis nula aquí es que α=0, y esperamos que D n / D s sea igual a P n / P s . [5]
El índice de neutralidad (NI) cuantifica la dirección y el grado de desviación de la neutralidad (donde las razones P n / P s y D n / D s son iguales). Si asumimos que las mutaciones silenciosas son neutrales, un índice de neutralidad mayor que 1 (es decir, NI > 1) indica que está funcionando la selección negativa, lo que resulta en un exceso de polimorfismo de aminoácidos. Esto ocurre porque la selección natural favorece la selección purificadora y la eliminación de alelos deletéreos. [9] Debido a que las mutaciones silenciosas son neutrales, un índice de neutralidad menor que 1 (es decir, NI < 1) indica un exceso de divergencia no silenciosa, que ocurre cuando la selección positiva está funcionando en la población. Cuando la selección positiva está actuando sobre la especie, la selección natural favorece un fenotipo específico sobre otros fenotipos, y el fenotipo favorecido comienza a fijarse en la especie a medida que aumenta la frecuencia de alelos para ese fenotipo. [10] Para encontrar el índice de neutralidad, podemos utilizar la siguiente ecuación:
Una desventaja de realizar una prueba de McDonald-Kreitman es que la prueba es vulnerable a errores, como cualquier otra prueba estadística. Muchos factores pueden contribuir a errores en las estimaciones del nivel de evolución adaptativa, incluida la presencia de mutaciones ligeramente perjudiciales, la variación de las tasas de mutación a lo largo del genoma, la variación en las historias de coalescencia a lo largo del genoma y los cambios en el tamaño efectivo de la población. Todos estos factores dan como resultado una subestimación de α. [11] Sin embargo, según la investigación realizada por Charlesworth (2008), [3] Andolfatto (2008), [12] y Eyre-Walker (2006), [8] ninguno de estos factores es lo suficientemente significativo como para hacer que los científicos crean que la prueba de McDonald-Kreitman no es confiable, excepto por la presencia de mutaciones ligeramente perjudiciales en las especies.
En general, se suele pensar que la prueba de McDonald-Kreitman no es fiable debido a la gran tendencia que tiene a subestimar el grado de evolución adaptativa en presencia de mutaciones ligeramente perjudiciales. Una mutación ligeramente perjudicial puede definirse como una mutación sobre la que la selección negativa actúa muy débilmente, de modo que su destino está determinado tanto por la selección como por la deriva genética aleatoria. [3] Si las mutaciones ligeramente perjudiciales se segregan en la población, resulta difícil detectar la selección positiva y se subestima el grado de selección positiva. Las mutaciones débilmente perjudiciales tienen una mayor probabilidad de contribuir al polimorfismo que las mutaciones fuertemente perjudiciales, pero siguen teniendo bajas probabilidades de fijación. Esto crea un sesgo en la estimación de la prueba de McDonald-Kreitman del grado de evolución adaptativa, lo que da como resultado una estimación drásticamente menor de α. Por el contrario, dado que las mutaciones fuertemente perjudiciales no contribuyen ni al polimorfismo ni a la divergencia, las mutaciones fuertemente perjudiciales no sesgan las estimaciones de α. [13] La presencia de mutaciones ligeramente deletéreas está fuertemente vinculada a los genes que han experimentado la mayor reducción en el tamaño efectivo de la población. [14] Esto significa que poco después de que haya ocurrido una reducción reciente en el tamaño efectivo de la población en una especie, como un cuello de botella, observamos una mayor presencia de mutaciones ligeramente deletéreas en las regiones codificantes de proteínas. [15] Podemos hacer una conexión directa con el aumento en el número de mutaciones ligeramente deletéreas y la reciente disminución en el tamaño efectivo de la población. [14] Para obtener más información sobre por qué el tamaño de la población afecta la tendencia de las mutaciones ligeramente deletéreas a aumentar en frecuencia, consulte el artículo Teoría casi neutral de la evolución molecular .
Además, como en cualquier prueba estadística, siempre existe la posibilidad de tener un error de tipo I y un error de tipo II en la prueba de McDonald-Kreitman. Con las pruebas estadísticas, debemos esforzarnos más para tratar de evitar cometer errores de tipo I, para evitar rechazar la hipótesis nula, cuando de hecho es verdadera. [16] Sin embargo, la prueba de McDonald-Kreitman es muy vulnerable al error de tipo I, debido a los muchos factores que pueden llevar al rechazo accidental de la hipótesis nula verdadera. Dichos factores incluyen la variación en la tasa de recombinación, la demografía de no equilibrio, tamaños de muestra pequeños y en comparaciones que involucran especies que divergieron más recientemente. [14] Todos estos factores tienen la capacidad de influir en la capacidad de la prueba de McDonald-Kreitman para detectar la selección positiva, así como el nivel de selección positiva que actúa sobre una especie. Esta incapacidad para determinar correctamente el nivel de selección positiva que actúa sobre una especie a menudo conduce a un falso positivo y al rechazo incorrecto de la hipótesis nula.
Al realizar la prueba de McDonald-Kreitman, los científicos también deben evitar cometer demasiados errores de tipo II. De lo contrario, los resultados de la prueba pueden ser demasiado erróneos y se considerarán inútiles.
Se sigue experimentando con la prueba de McDonald-Kreitman y con la forma de mejorar su precisión. El error más importante que se debe corregir es el error de que α se subestima gravemente en presencia de mutaciones ligeramente perjudiciales, como se analizó en la sección anterior "Fuentes de error con la prueba de McDonald-Kreitman". Este posible ajuste de la prueba de McDonald-Kreitman incluye la eliminación de polimorfismos por debajo de un valor específico del conjunto de datos para mejorar y aumentar la cantidad de sustituciones que se produjeron debido a la evolución adaptativa. [3] Para minimizar el impacto de las mutaciones ligeramente perjudiciales, se ha propuesto excluir los polimorfismos que están por debajo de una cierta frecuencia de corte, como <8% o <5% (aún hay mucho debate sobre cuál debería ser el mejor valor de corte). Al no incluir polimorfismos por debajo de una cierta frecuencia, se puede reducir el sesgo creado por mutaciones ligeramente perjudiciales, ya que se contarán menos polimorfismos. Esto aumentará la estimación de α. Por lo tanto, el grado de evolución adaptativa estimado no será tan subestimado, lo que hace que la prueba de McDonald-Kreitman sea más confiable. [13]
Un ajuste necesario es controlar el error de tipo I en la prueba de McDonald-Kreitman, consulte la discusión de esto en la sección anterior "Fuentes de error con la prueba de McDonald-Kreitman". Un método para evitar errores de tipo I es evitar el uso de poblaciones que hayan sufrido un cuello de botella reciente, lo que significa que hayan sufrido recientemente una disminución reciente en el tamaño efectivo de la población. [14] Para que el análisis sea lo más preciso posible en la prueba de McDonald-Kreitman, es mejor utilizar tamaños de muestra grandes, pero aún hay debate sobre qué tan grande es "grande". [16] Otro método para controlar el error de tipo I de la prueba de McDonald-Kreitman en aplicaciones al ADN no codificante , Peter Andolfatto sugiere [12] establecer niveles de significancia mediante simulación coalescente con recombinación en exploraciones de todo el genoma para la selección en ADN no codificante. Al hacer esto, podrá mejorar la precisión de su prueba estadística y evitar cualquier prueba de falsos positivos. [12] Con todas estas formas posibles de evitar cometer errores de tipo I, los científicos deben elegir con cautela las poblaciones que están analizando, para evitar analizar poblaciones que conduzcan a resultados inexactos.