Inferencia de transferencia genética horizontal

Estos análisis se pueden dividir en dos grupos según el enfoque adoptado: métodos paramétricos y filogenéticos.

Los métodos filogenéticos examinan la historia evolutiva de los genes en diferentes especies e identifican filogenias incompatibles.

[6]​ Los métodos paramétricos utilizan marcadores genéticos, característicos de especies relacionadas o clados, para inferir la transferencia genómica horizontal.

La diferencia entre un fragmento del genoma y el marcador es un indicio de una posible transferencia horizontal.

[9]​ Para que estos métodos funcionen, los marcadores genéticos deben ser claramente reconocibles.

[11]​ Esta variabilidad intragenómica debe tomarse en cuenta para evitar marcar segmentos nativos como productos de transferencia genética horizontal.

[12]​ Es igualmente importante que los segmentos transferidos horizontalmente exhiban los marcadores genéticos de la especie donante.

[14]​ Sin embargo, un análisis posterior basado en métodos filogenéticos identificó varias TGH antiguas.

[37]​ Esta es la razón por la cual algunos métodos explícitos basados en modelos prueban muchos escenarios evolutivos y evalúan sus predicciones mediante criterios de parsimonia o probabilísticos.

Entre estos métodos se cuentan las pruebas de Kishino–Hasegawa (KH),[38]​ Shimodaira–Hasegawa (SH),[39]​ y Aproximadamente Imparcial (AU por su siglas en inglés Approximately Unbiased).

La transferencia genómica se infiere cuando las inconsistencias no pueden explicarse por otros efectos, como la pérdida o duplicación de genes.

Consisten en eliminar una rama en el árbol de referencia (poda) e injertarla en otro extremo.

[46]​ Cuando existen inconsistencias entre el árbol genético original y el árbol de referencia es posible obtener una topología consistente mediante una o más operaciones SPR aplicadas al árbol de referencia; esto permide identificar nodos que han experimentado transferencia genética, así como inferir los genomas de las especies donante y receptora.

[42]​[47]​ Para evitar falsos positivos debido a la incertidumbre de la topología del árbol genético, se pueden ignorar a priori los extremos poco probables,[48]​ o calcular un criterio de optimalidad tras los cómputos.

Por ejemplo, el algoritmo HorizStory reduce el problema primero eliminando los nodos consistentes;[53]​ las podas e injertos repetitivos reconcilian el árbol de referencia con el árbol genético y las ediciones óptimas son interpretadas como el resultado de transferencia genómica horizontal.

[54]​ Las reconciliaciones DTL posibles y su probabilidades relativas pueden ser explorados eficientemente mediante algortimos de programación dinámica.

[54]​[55]​[56]​ Algunos programas permiten refinar la topología del árbol genético en regiones donde es incierta para obtener un escenario evolutivo más probable un evento evolutivo, al igual que el alineamiento inicial de la secuencia genómica.

Aquí, una distancia inesperadamente corta o grande respecto a la secuencia de referencia puede indicar transferencia genómica horizontal.

Los métodos implícitos pueden fallar por la presencia de disparidades entre la filogenia correcta y las distancias evolutivas consideradas.

[9]​ La principal limitación de este método es que solo puede detectar transferencias genómicas relativamente recientes.

[66]​ La hipótesis del reloj molecular plantea que los genes homólogos en diferenctes especies evolucionan a una velocidad aproximadamente constante.

[71]​ La trasferencia genómica horizontal da lugar a distribuciones inusuales de los genes dentro del group.

[76]​[79]​ Normalmente se considera que la transferencia horizontal ocurre para genes enteros.

La existencia de diversos métodos para inferir transferencia genómica horizontal plantea la cuestión de cómo validar inferencias individuales y cómo comparar los resultados obtenidos con diferentes métodos.

Esto se refleja en la literatura científica, que tiende a favorecer los métodos filogenéticos como prueba estándar de transferencia genómica horizontal.

Existen varios métodos para validar las inferencias de transferencia genómica horizontal mediante análisis filogenéticos, consistentes en su mayoría en simulaciones.

[48]​ Es importante que las simulaciones sean lo suficientemente realistas para representar los datos reales y los modelos complejos son preferibles; por ejemplo, existe un modelo para simular árboles genéticos con procesos de substitución heterogénea además de la transferencia horizontal, y que toma en cuenta que la transferencia puede provenir de linajes extintos.

Al analizar las secuencias simuladas por diferentes métodos de interés es posible comparar su funcionamiento.

[95]​[96]​[97]​[98]​ Las secuencias de la especie donante pueden incorporar o no cambios para simular procesos evolutivos.

Contenido medio CG en regiones codificantes de varias especies de bacterias en comparación con el tamaño del genoma.