En filogenética , la reconciliación es un enfoque para conectar la historia de dos o más entidades biológicas coevolutivas . La idea general de la reconciliación es que un árbol filogenético que representa la evolución de una entidad (por ejemplo, genes homólogos o simbiontes ) puede dibujarse dentro de otro árbol filogenético que representa una entidad abarcadora (respectivamente, especies, huéspedes) para revelar su interdependencia y los eventos evolutivos que han marcado su historia compartida. El desarrollo de enfoques de reconciliación comenzó en la década de 1980, principalmente para representar la coevolución de un gen y un genoma, y de un huésped y un simbionte, que puede ser mutualista, comensalista o parásito. También se ha utilizado, por ejemplo, para detectar la transferencia horizontal de genes o comprender la dinámica de la evolución del genoma .
La reconciliación filogenética puede explicar una diversidad de trayectorias evolutivas de lo que constituye la historia de la vida, entrelazadas entre sí en todas las escalas que se puedan considerar, desde las moléculas hasta las poblaciones o las culturas. Un avatar reciente de la importancia de las interacciones entre niveles de organización es el concepto de holobionte , en el que un macroorganismo se considera una asociación compleja de diversas especies. Modelar la evolución de estas entidades complejas es una de las direcciones desafiantes y apasionantes de la investigación actual sobre la reconciliación.
Árboles filogenéticos como estructuras anidadas
Los árboles filogenéticos están entrelazados en todos los niveles de organización, integrando conflictos y dependencias dentro y entre niveles. Las poblaciones de macroorganismos migran entre continentes, sus simbiontes microbianos cambian entre poblaciones, los genes de sus simbiontes se transfieren entre especies de microbios y los dominios se intercambian entre genes. Esta lista de niveles de organización no es representativa ni exhaustiva, pero da una visión de los niveles en los que se han utilizado métodos de reconciliación. Como método genérico, la reconciliación podría tener en cuenta muchos otros niveles. Por ejemplo, podría considerar la organización sinténica de los genes, [1] la historia de interacción de los elementos transponibles y las especies, [2] la evolución de un complejo proteico a través de las especies. [3] La escala de eventos evolutivos considerados puede ir desde eventos poblacionales como la diversificación geográfica hasta niveles de nucleótidos dentro de los genes, [4] incluyendo, por ejemplo, eventos a nivel de cromosomas dentro de los genomas como la duplicación del genoma completo. [5]
Las filogenias se han utilizado para representar la diversificación de la vida en muchos niveles de organización : macroorganismos, [6] sus células a lo largo del desarrollo , [7] microorganismos a través de genes marcadores , [8] cromosomas , [9] proteínas , [10] dominios proteicos , [6] y también pueden ser útiles para comprender la evolución de elementos de la cultura humana como los idiomas [11] o los cuentos de hadas . [12]
En cada uno de estos niveles, los árboles filogenéticos describen diferentes historias hechas de eventos de diversificación específicos, que pueden o no ser compartidos entre niveles. Sin embargo, debido a que están anidados estructuralmente (similares a las muñecas matrioska ) o son funcionalmente dependientes, la evolución en un nivel particular está ligada a las de otros niveles.
La reconciliación filogenética es la identificación de los vínculos entre niveles a través de la comparación de al menos dos árboles asociados. Originalmente desarrollada para dos árboles, recientemente se han construido reconciliaciones para más de dos niveles (ver la sección Modelado explícito de tres o más niveles). Como tal, la reconciliación proporciona escenarios evolutivos que revelan conflicto y cooperación entre entidades en evolución. Estos vínculos pueden ser poco intuitivos, por ejemplo, los genes presentes en el mismo genoma pueden mostrar historias evolutivas no correlacionadas mientras que algunos genes presentes en el genoma de un simbionte pueden mostrar una fuerte señal de coevolución con la filogenia del anfitrión. Por lo tanto, la reconciliación puede ser una herramienta útil para comprender las restricciones y las estrategias evolutivas subyacentes al ensamblaje que forma un holobionte .
Como todos los niveles tratan esencialmente del mismo objeto, un árbol filogenético , los mismos modelos de reconciliación (en particular los basados en eventos de duplicación - transferencia - pérdida , que son centrales para este artículo) pueden transponerse, con ligeras modificaciones, a cualquier par de niveles conectados: [13] una entidad "interna", "inferior" o "asociada" (por ejemplo, gen, especie simbiótica, población) evoluciona dentro de una entidad "superior" o "anfitriona" (respectivamente, especie, anfitrión o área geográfica). Las entidades superiores e inferiores están parcialmente ligadas a la misma historia, lo que lleva a similitudes en sus árboles filogenéticos, pero las asociaciones pueden cambiar con el tiempo, volverse más o menos estrictas o cambiar a otros socios.
Historia
El principio de reconciliación filogenética se introdujo en 1979 [14] para explicar las diferencias entre los genes y las filogenias a nivel de especie. En un contexto parsimonioso, se invocaron dos eventos evolutivos, la duplicación y la pérdida de genes, para explicar las discrepancias entre un árbol genético y un árbol de especies. También se describió una puntuación en los árboles genéticos que conocían el árbol de especies y una secuencia alineada utilizando el número de duplicaciones, pérdidas y reemplazos de nucleótidos de genes para la evolución de la secuencia alineada, un enfoque que sigue siendo central hoy en día con nuevos modelos de reconciliación e inferencia de filogenia. [15]
El término reconciliación fue utilizado por Wayne Maddison en 1997, [16] como un concepto inverso de "discordia filogenética" resultante de eventos evolutivos a nivel genético.
Luego se desarrolló la reconciliación de manera conjunta para la coevolución del huésped y el simbionte y la diversificación geográfica de las especies . En ambos entornos, fue importante modelar un evento horizontal que implicara ramas paralelas del árbol del huésped: cambio de huésped para huésped y simbionte y dispersión de especies de un área a otra en biogeografía . A diferencia de los genes y genomas, la coevolución del huésped y el simbionte y la explicación de la diversificación de especies por geografía no siempre son la hipótesis nula . Una representación visual de las dos filogenias en un tanglegram puede ayudar a evaluar dicha coevolución, aunque no tiene una interpretación estadística obvia. [17]
Se propusieron métodos de caracteres, como el análisis de parsimonia de Brooks [18] , para probar la coevolución y reconstruir escenarios de coevolución. En estos métodos, se olvida uno de los árboles, excepto sus hojas, que luego se utilizan como un carácter que evoluciona en el segundo árbol. Los primeros modelos de reconciliación, que tienen en cuenta explícitamente las dos topologías y utilizan un enfoque mecanicista basado en eventos, se propusieron para el anfitrión y el simbionte y la biogeografía [19] [20] Luego siguieron debates, ya que los métodos aún no eran completamente sólidos pero integraban información útil en un nuevo marco [21] .
Luego se introdujeron los costos de cada evento y una técnica de programación dinámica que considera todos los pares de nodos de anfitrión y simbionte en un enfoque de anfitrión y simbionte, los cuales aún sustentan la mayoría de los métodos de conciliación actuales para anfitrión y simbionte, así como para especies y genes. [22]
La reconciliación volvió al marco en el que se introdujo, gen y especie. Después de que se consideraron los modelos de caracteres para la transferencia horizontal de genes, [23] un nuevo modelo de reconciliación, siguiendo y mejorando el enfoque de programación dinámica presentado para el huésped y el simbionte, introdujo de manera efectiva la transferencia horizontal de genes para la reconciliación de genes y especies sobre el modelo de duplicación y pérdida. [24]
El desarrollo progresivo de la reconciliación filogenética fue posible gracias a los intercambios entre múltiples comunidades de investigación que estudiaban filogenias a nivel de huésped y simbionte, gen y especie, o biogeografía. Esta historia y sus desarrollos modernos han sido analizados varias veces, centrándose generalmente en pares específicos de niveles, con unas pocas excepciones. [25] [13] Los nuevos desarrollos comienzan a unir los diferentes marcos con nuevos modelos integradores.
Tuzas y sus piojos masticadores: un ejemplo clásico
Las tuzas de bolsillo ( Geomyidae ) y sus piojos masticadores ( Trichodectidae ) forman un sistema bien estudiado de coevolución de hospedador y simbionte. [26] La filogenia del hospedador y el simbionte y la correspondencia de las hojas de sus árboles se representan a la izquierda. Para el hospedador, O. representa a Orthogeomys , G. a Geomys y T. a Thomomys ; para el simbionte, G. representa a Geomydoecus y T. a Thomoydoecus . Reconciliar los dos árboles significa dar un escenario con eventos evolutivos y correspondencia en los nodos ancestrales que representan la coevolución de los dos árboles. Los eventos considerados en este sistema son los eventos del modelo DTL: duplicación, transferencia (o cambio de hospedador), pérdida y coespeciación, el evento nulo de la coevolución. Se propusieron dos escenarios en dos estudios [27] [28], utilizando dos marcos diferentes que podrían considerarse como reconciliación DTL de preprogramación dinámica [29] . En los marcos de reconciliación DTL modernos, se asignan costos a los eventos. Luego se demostró que los dos escenarios corresponden a una reconciliación parsimoniosa máxima con diferentes asignaciones de costos. [22]
El escenario A utiliza 6 coespeciaciones, 2 duplicaciones, 3 pérdidas y 2 cambios de host para reconciliar los dos árboles, mientras que el escenario B utiliza 5 coespeciaciones, 3 duplicaciones, 3 pérdidas y 2 cambios de host. El costo de un escenario es la suma del costo de sus eventos. Por ejemplo, con un costo de 0 para la coespeciación, 2 para la duplicación, 1 para la pérdida y 3 para el cambio de host, el escenario A tiene un costo de y el escenario B de , y por lo tanto, según un principio parsimonioso, el escenario A se consideraría más probable (el escenario A sigue siendo más probable mientras el costo de la coespeciación sea menor que el costo de la duplicación).
Desarrollo de modelos de reconciliación filogenética
Los modelos y métodos utilizados hoy en día en filogenia son el resultado de varias décadas de investigación, progresivamente complejos, impulsados por la naturaleza de los datos y la búsqueda de realismo biológico por un lado, y los límites y progresos de los métodos matemáticos y algorítmicos por el otro.
Modelos pre-reconciliación: personajes en árboles
Los métodos de caracteres se pueden utilizar cuando no hay un árbol disponible para uno de los niveles, sino sólo valores para un carácter en las hojas de un árbol filogenético para el otro nivel. Un modelo define los eventos de cambio de valor de carácter, su tasa, probabilidades o costos. Por ejemplo, el carácter puede ser la presencia de un huésped en un árbol simbiótico, [18] la región geográfica en un árbol de especies, [31] el número de genes en un árbol genómico, [32] o nucleótidos en una secuencia. [4]
Por lo tanto, tales métodos apuntan a reconstruir caracteres ancestrales en nodos internos del árbol. [33]
Aunque estos métodos han producido resultados sobre la evolución del genoma, la utilidad de un segundo árbol aparece con ejemplos muy simples. Si un simbionte ha adquirido recientemente la capacidad de propagarse en un grupo de especies y, por lo tanto, está presente en la mayoría de ellas, los métodos de caracteres indicarán erróneamente que el ancestro común de los hospedadores ya tenía al simbionte. Por el contrario, una comparación de los árboles de simbionte y hospedador mostraría discrepancias que revelarían transferencias horizontales.
Los orígenes de la reconciliación: el modelo de pérdida por duplicación y el mapeo del Ancestro Común Más Bajo
La duplicación y la pérdida se invocaron primero para explicar la presencia de múltiples copias de un gen en un genoma o su ausencia en ciertas especies. [10] Es posible con esos dos eventos reconciliar dos árboles cualesquiera, [14] es decir, mapear los nodos y ramas de los árboles inferior y superior, o equivalentemente dar una lista de eventos evolutivos que expliquen las discrepancias entre el árbol superior y el árbol inferior. Una conciliación de Duplicación y Pérdida (DL) más parsimoniosa se calcula a través del mapeo del Ancestro Común Más Bajo (LCA): procediendo desde las hojas hasta la raíz , cada nodo interno se mapea al ancestro común más bajo del mapeo de sus dos hijos.
Un modelo markoviano para la reconciliación
El mapeo LCA en el modelo DL sigue un principio de parsimonia : no se debe invocar ningún evento si no es necesario. Sin embargo, el uso de este principio es debatido, [4] y se admite comúnmente que es más preciso en la evolución molecular ajustar un modelo probabilístico como un paseo aleatorio , que no necesariamente produce escenarios parsimoniosos. Un modelo markoviano de nacimiento y muerte es un modelo que puede generar un árbol inferior "dentro" de uno superior fijo desde la raíz hasta las hojas. [34] La inferencia estadística proporciona un marco para encontrar los escenarios más probables y, en ese caso, una reconciliación de máxima verosimilitud de dos árboles también es parsimoniosa. Además, es posible con un marco de este tipo muestrear escenarios o integrar varios escenarios posibles para probar diferentes hipótesis, por ejemplo, para explorar el espacio de árboles inferiores. Además, los modelos probabilísticos se pueden integrar en modelos más grandes, ya que las probabilidades simplemente se multiplican al asumir la independencia, por ejemplo, combinando la evolución de secuencias y la reconciliación DL. [35]
Introducción de la transferencia horizontal
El cambio de hospedador, es decir, la herencia de un simbionte de un linaje familiar, es un evento crucial en la evolución de las relaciones parasitarias o simbióticas entre especies. Esta transferencia horizontal también modela eventos de migración en biogeografía y se volvió de interés para la reconciliación de árboles de genes y especies cuando pareció que muchas discrepancias no podían explicarse simplemente por duplicación y pérdida y que la transferencia horizontal de genes (HGT) era un proceso evolutivo importante en la evolución de microorganismos. Este patrón de cambio, o transferencia horizontal, también puede modelar la mezcla o introgresión . [36]
Se considera en métodos de caracteres, sin información de la filogenia del simbionte. [18] [37]
Además del modelo DL, la transferencia horizontal permite escenarios de reconciliación nuevos y muy diferentes.
El enfoque de programación dinámica simple pero poderoso
El método de conciliación LCA produce una solución única, que ha demostrado ser óptima para el problema de minimizar el número ponderado de eventos, independientemente de los pesos relativos de la duplicación y la pérdida. [38] En contraste, con Duplicación, Transferencia horizontal y Pérdida (DTL), puede haber varias conciliaciones igualmente parsimoniosas. Por ejemplo, una sucesión de duplicaciones y pérdidas puede reemplazarse por una sola transferencia. Una de las primeras ideas para definir un problema computacional y abordar una resolución fue, en un marco de anfitrión/simbionte, maximizar el número de co-especiaciones con un algoritmo heurístico. [27]
Otra solución es dar costos relativos a los eventos y encontrar un escenario que minimice la suma de los costos de sus eventos. [22]
En los marcos de modelos probabilísticos, la tarea equivalente consiste en asignar tasas o probabilidades a los eventos y buscar escenarios de máxima verosimilitud, o escenarios de muestra según su verosimilitud. Todos estos problemas se resuelven con un enfoque de programación dinámica . Este método de programación dinámica implica recorrer los dos árboles en un orden posterior . A partir de las hojas y luego subiendo en los dos árboles, para cada par de nodos internos (uno para cada árbol), se calcula el costo de una conciliación DTL más parsimoniosa. [22]
En un marco de parsimonia, los costos de conciliar un subárbol inferior enraizado en con un subárbol superior enraizado en se inicializan para las hojas con su coincidencia:
Y luego, inductivamente, denotando los hijos de los hijos de los costos asociados con la especiación, duplicación, transferencia horizontal y pérdida, respectivamente (con frecuencia fijados en 0),
Los costos y , debido a que no dependen de , se pueden calcular de una vez para todos , logrando así una complejidad cuadrática para calcular para todas las parejas de y . El costo de las pérdidas solo aparece en asociación con otros eventos porque en parsimonia, una pérdida siempre se puede asociar con el evento anterior en el árbol.
La inducción detrás del uso de la programación dinámica se basa en progresar siempre en los árboles hacia las raíces. Sin embargo, algunas combinaciones de eventos que pueden suceder consecutivamente pueden hacer que esta inducción esté mal definida. Una de esas combinaciones consiste en una transferencia seguida inmediatamente por una pérdida en el linaje donante (TL). Restringir el uso de este evento TL repara la inducción. [39] Con un uso ilimitado, es necesario usar o agregar otros métodos conocidos para resolver sistemas de ecuaciones como métodos de punto fijo , [40] o resolución numérica de ecuaciones diferenciales. [41] En 2016, solo dos de los siete programas de reconciliación de parsimonia más utilizados manejaban eventos TL, [42] aunque su consideración puede cambiar drásticamente el resultado de una reconciliación. [43]
A diferencia del mapeo LCA, la conciliación DTL típicamente produce varios escenarios de costo mínimo, en algunos casos un número exponencial. La fortaleza del enfoque de programación dinámica es que permite calcular un costo mínimo de coevolución del árbol superior e inferior de entrada en tiempo cuadrático , [44] y obtener un escenario más parsimonioso a través de backtracking . También se puede transponer a un marco probabilístico para calcular la probabilidad de coevolución y obtener una conciliación más probable, reemplazando costos con tasas, mínimos por sumas y sumas por productos. [45]
Además, a través de múltiples backtracks, el enfoque es adecuado para enumerar todas las soluciones parsimoniosas o para muestrear escenarios, óptimos y subóptimos, de acuerdo con su probabilidad.
Estimación de costos y tarifas de eventos
La programación dinámica per se es sólo una solución parcial y no resuelve varios de los problemas que plantea la conciliación. Definir una conciliación DTL más parsimoniosa requiere asignar costos a los diferentes tipos de eventos (D, T y L). Diferentes asignaciones de costos pueden producir diferentes escenarios de conciliación, por lo que existe la necesidad de una forma de elegir esos costos. Existe una diversidad de enfoques para hacerlo. CoRe-PA [46] explora de manera recursiva el espacio de vectores de costos, buscando una buena coincidencia con las frecuencias de eventos en las conciliaciones. ALE [45] utiliza la misma idea en un marco probabilístico para estimar las tasas de eventos por máxima verosimilitud. Alternativamente, COALA [47] es un preproceso que utiliza computación bayesiana aproximada con Monte Carlo secuencial : simulación y rechazo estadístico o aceptación de parámetros con refinamiento sucesivo.
En el marco de la parsimonia, también es posible dividir el espacio de posibles costos de eventos en áreas de costos que conducen a la misma solución óptima de Pareto . [48]
Las conciliaciones óptimas de Pareto son tales que ninguna otra conciliación tiene un costo estrictamente inferior para un tipo de evento (duplicación, transferencia o pérdida), y menor o igual para los demás.
También es posible basarse en consideraciones externas para elegir los costos de los eventos. Por ejemplo, el software Angst [49] elige los costos que minimizan la variación del tamaño del genoma, en número de genes, entre especies progenitoras e hijas.
El problema de la viabilidad temporal
El método de programación dinámica funciona para árboles superiores fechados (los nodos internos están totalmente ordenados) o sin fecha. Sin embargo, con árboles sin fecha, existe un problema de viabilidad temporal. De hecho, una transferencia horizontal implica que el donante y el receptor son contemporáneos, lo que implica una restricción de tiempo en el árbol. En consecuencia, dos transferencias horizontales pueden ser incompatibles, porque implican restricciones de tiempo contradictorias. El enfoque de programación dinámica no puede verificar fácilmente tales incompatibilidades. Si el árbol superior no tiene fecha, encontrar una reconciliación más parsimoniosa factible temporalmente es NP-hard . [50] [51] [52] Es manejable con parámetros fijos , lo que significa que hay algoritmos que se ejecutan en el tiempo limitado por un exponencial del número de transferencias en los escenarios de salida. [51]
Algunas soluciones implican programación lineal entera [53] o exploración de ramificaciones y límites . [13]
Si el árbol superior tiene fecha, entonces no hay problema de incompatibilidad porque las transferencias horizontales se pueden restringir para que nunca retrocedan en el tiempo. La búsqueda de una conciliación óptima coherente se resuelve luego en tiempo polinomial [51] o con una aceleración en RASCAL, [54] [55] probando solo una fracción de las asignaciones de nodos.
La mayoría de los programas que toman árboles sin fechar no buscan la viabilidad temporal, excepto Jane, [56] que explora el espacio de órdenes totales a través de un algoritmo genético, o, en un proceso posterior, Notung, [57] y Eucalypt, [58] que buscan dentro del conjunto de soluciones óptimas soluciones consistentes en el tiempo. Otros métodos funcionan como capas complementarias a las conciliaciones, corrigiendo conciliaciones [59] o devolviendo un subconjunto de transferencias factibles, [60] que se pueden usar para datar un árbol de especies. [60] [61]
Expansión de filogenias: transferencias desde los muertos
En la filogenética en general, es importante tener en cuenta que las especies existentes y ancestrales que están representadas en cualquier filogenia son solo una muestra dispersa de las especies que existen actualmente o alguna vez han existido. Es por esto que uno puede asumir con seguridad que todas las transferencias que pueden detectarse utilizando métodos filogenéticos se han originado en linajes que, estrictamente hablando, están ausentes de una filogenia estudiada. [62] Tener en cuenta la biodiversidad extinta o no muestreada en los estudios filogenéticos puede brindar una mejor comprensión de estos procesos. [63] Originalmente, los métodos de reconciliación DTL no reconocían este fenómeno y solo permitían la transferencia entre ramas contemporáneas del árbol, ignorando así la mayoría de las soluciones plausibles. Sin embargo, los métodos que funcionan en árboles superiores sin fecha pueden verse como que manejan implícitamente la diversidad desconocida al permitir transferencias "al futuro" desde el punto de vista de una filogenia, es decir, el donante es más antiguo que el receptor. Una transferencia al futuro puede traducirse en una especiación a especies desconocidas, seguida de una transferencia desde especies desconocidas. ALE [62] en su versión fechada tiene en cuenta explícitamente la diversidad desconocida añadiendo un proceso Moran de especiación/extinción de especies al modelo fechado de nacimiento/muerte de la evolución genética. Las transferencias desde los muertos también se manejan en un entorno parsimonioso por Tera y ecceTERA, [64] [42] mostrando que considerar estas transferencias mejora la capacidad de reconstruir árboles genéticos utilizando la reconciliación, y con un modelo más explícito [65] y en un entorno probabilístico, en ALE sin fecha. [66]
La especificidad de la biogeografía: una estructura arborizada para la “evolución” de áreas
En biogeografía, algunas aplicaciones de los enfoques de reconciliación consideran como árbol superior un cladograma de áreas con nodos ancestrales definidos. Por ejemplo, la raíz puede ser Pangea y los nodos continentes contemporáneos . A veces, los nodos internos no son áreas ancestrales sino las uniones de las áreas de sus hijos, para dar cuenta de la posibilidad de que las especies evolucionen a lo largo del árbol inferior para habitar una o varias áreas. En este caso, los eventos evolutivos son la migración, donde una especie coloniza una nueva área, la especiación alopátrica o la vicarianza, equivalente a la co-especiación en las comparaciones huésped/simbionte. Aunque este enfoque no siempre da un árbol (si existen las uniones AB y BC de las hojas A, B, C, un hijo puede tener varios padres), y esta estructura no está asociada con el tiempo (es posible que una especie pase de A a AB por migración, así como de AB a A por extinción), los métodos de reconciliación —con eventos y programación dinámica— pueden inferir escenarios evolutivos entre la estructura geográfica superior y el árbol de especies inferior. Diva [67] y Lagrange [68] [41] son dos modelos de reconciliación que construyen una estructura similar a un árbol y luego aplican la reconciliación, el primero con un principio de parsimonia, el segundo en un marco probabilístico. Además, BioGeoBEARS [69] es un paquete de inferencia de biogeografía que reimplementó los modelos DIVA y Lagrange y permite nuevas opciones, como transferencias dependientes distantes [70] y discusión sobre la selección de modelos estadísticos. [69]
Salida gráfica
Con dos árboles y múltiples eventos evolutivos que los vinculan para representarlos, visualizar los árboles reconciliados es una cuestión desafiante pero necesaria para hacer que los estudios de reconciliación sean más accesibles. Algunos programas de reconciliación incluyen la anotación de los eventos evolutivos en los árboles inferiores, [57] mientras que otros, [56] [71] [58] [46] y paquetes específicos, en DL [72] o DTL, [73] rastrean el árbol inferior incrustado en el superior. Una dificultad en este sentido es la variedad de formatos de salida para los diferentes programas de reconciliación. Se ha establecido un estándar común, recphyloxml, [74] y ha sido respaldado por parte de la comunidad, y hay disponible un visor capaz de mostrar la reconciliación en sistemas de múltiples niveles. [75]
Consideraciones prácticas adicionales
La aplicación de la conciliación DTL a los datos biológicos plantea varios problemas relacionados con la incertidumbre y los niveles de confianza de los datos de entrada y salida. En lo que respecta a la salida, la incertidumbre de la respuesta exige una exploración de todo el espacio de soluciones. En lo que respecta a la entrada, la conciliación filogenética tiene que manejar las incertidumbres en la resolución o el enraizamiento de los árboles superiores o inferiores, o incluso proponer raíces o resoluciones de acuerdo con su confianza.
Explorando el espacio de las reconciliaciones
La programación dinámica permite muestrear conciliaciones, uniformemente entre las óptimas [76] o según su probabilidad. También es posible enumerarlas en un tiempo proporcional al número de soluciones, [58] un número que puede volverse rápidamente intratable (incluso solo para las óptimas). Encontrar y presentar la estructura entre la multitud de posibles conciliaciones ha estado en el centro de los desarrollos metodológicos recientes, especialmente para los métodos dirigidos al anfitrión y al simbionte. Varios trabajos se han centrado en representar un conjunto de conciliaciones de forma compacta, a partir de una muestra uniforme de óptimas [76] o construyendo un gráfico que resuma las soluciones óptimas. [77] Esto se puede lograr dando valores de soporte a eventos específicos basados en todas las conciliaciones óptimas (o subóptimas), [78] o con el uso de un árbol de consenso reconciliado. [79] [59] En un modelo DL, es posible definir una conciliación mediana, basada en eventos compartidos y calcularla en tiempo polinomial. [80]
EMPRess [71] puede agrupar conciliaciones similares a través de clusterización, [81] con todas las distancias por pares entre conciliaciones computables en tiempo polinomial (independientemente del número de conciliaciones más parsimoniosas). [82] Con el mismo objetivo, Capybara [83] define clases de equivalencia entre conciliaciones, calculando eficientemente representantes para todas las clases y genera con retraso lineal un número dado de conciliaciones (primero las óptimas, luego las subóptimas). El espacio de conciliación más parsimoniosa se puede expandir o reducir al aumentar o disminuir la distancia de transferencia horizontal permitida, [58] lo que se hace fácilmente mediante programación dinámica.
Inferir árboles filogenéticos con reconciliación
Conciliación e incertidumbre de entrada
La reconciliación funciona con dos árboles fijos, uno inferior y otro superior, ambos asumidos como correctos y con raíces. Sin embargo, esos árboles no son datos de primera mano. Los datos más frecuentemente utilizados para la filogenética consisten en secuencias proteicas o nucleotídicas alineadas. La extracción de ADN, la secuenciación, el ensamblaje y la anotación de genomas, el reconocimiento de relaciones de homología entre genes y la producción de múltiples alineaciones para la reconstrucción filogenética son todos procesos complejos en los que los errores pueden afectar en última instancia al árbol reconstruido. [84]
Cualquier error de topología o de raíz puede ser malinterpretado y causar sesgo sistemático. Por ejemplo, en las reconciliaciones DL, los errores en el árbol inferior sesgan la reconciliación hacia más eventos de duplicación más cerca de la raíz y más pérdidas más cerca de las hojas. [85]
Por otra parte, la reconciliación, como modelo macroevolutivo, puede funcionar como una capa suplementaria al modelo microevolutivo de evolución de secuencias, resolviendo politomías (nodos con más de dos hijos) o árboles de enraizamiento, o entrelazarse con él a través de modelos integrativos para obtener mejores filogenias.
La mayoría de los trabajos en esta dirección se centran en las reconciliaciones genes/especie, sin embargo se han dado algunos primeros pasos en la relación huésped/simbionte, como considerar árboles simbiontes sin raíces [86] o abordar politomías en Jane. [56]
Explorando el espacio de los árboles inferiores con reconciliación
La reconciliación puede tomar fácilmente árboles inferiores sin raíz como entrada, lo que es una característica que se utiliza con frecuencia porque los árboles inferidos a partir de datos moleculares normalmente no tienen raíz. Es posible probar todas las raíces posibles, o un recorrido triple bien pensado del árbol sin raíz permite hacerlo sin complejidad de tiempo adicional. [39] En un modelo de pérdida de duplicación, el conjunto de raíces que minimizan los costos se encuentran cerca unas de otras, formando una "meseta", [87] una propiedad que no se generaliza a DTL. [86] [79]
La reconciliación también puede tomar como entrada árboles no binarios , es decir, con nodos internos con más de dos hijos. Dichos árboles se pueden obtener, por ejemplo, contrayendo ramas con bajo soporte estadístico. Inferir un árbol binario a partir de un árbol no binario según las puntuaciones de reconciliación se resuelve en DL con métodos eficientes. [57] [88] [89] [90] [91] En DTL, el problema es NP hard . [92] Las heurísticas [93] y los algoritmos exactos manejables con parámetros fijos [92] [94] [95] son posibles soluciones.
Otra forma de manejar la incertidumbre en los árboles inferiores es tomar como entrada una muestra de árboles inferiores alternativos en lugar de uno solo. Por ejemplo, en el artículo que le dio a la reconciliación su nombre, [14] se propuso considerar todos los árboles inferiores más probables y elegir de estos árboles el mejor de acuerdo con sus costos de DL, un principio también utilizado por TreeFix-DTL. [96]
La muestra de árboles inferiores puede reflejar de manera similar su probabilidad de acuerdo con las secuencias alineadas, como se obtiene a partir de los métodos de Monte Carlo de cadena de Markov bayesianos implementados, por ejemplo, en Phylobayes. [97] AngST, [49] ALE [40] y ecceTERA [64] utilizan "amalgamación", una extensión de la programación dinámica DTL que puede recorrer de manera eficiente un conjunto de árboles inferiores alternativos en lugar de un solo árbol.
En Phyldog se logra una búsqueda local en el espacio de los árboles inferiores guiada por una probabilidad conjunta, por un lado a partir de múltiples alineaciones de secuencias y por otro lado a partir de la reconciliación con el árbol superior, con un modelo DL [98] y en GeneRax con DTL. [15] En un modelo DL con evolución de secuencias y reloj molecular relajado , el espacio del árbol inferior se puede explorar con un MCMC. [99] MowgliNNI [100] puede modificar el árbol genético de entrada en nodos con poco soporte para aumentar la puntuación DTL, mientras que TreeSolve resuelve las multifurcaciones agregadas al colapsar los nodos con poco soporte. [101]
Finalmente, los modelos integrativos (que mezclan la evolución de secuencias y la reconciliación) pueden calcular una probabilidad conjunta a través de programación dinámica (tanto para la reconciliación como para la evolución de secuencias genéticas), [40] utilizan la técnica Monte Carlo de cadena de Markov para incluir un reloj molecular para estimar las longitudes de las ramas, en un modelo DL [34] o con un reloj molecular relajado, [99] y en un modelo DTL. [102] Estos modelos se han aplicado en marcos de genes/especies, pero aún no en contextos de hospedador/simbionte o biogeografía.
Inferir árboles superiores mediante la reconciliación
Inferir un árbol superior a partir de un conjunto de árboles inferiores es una pregunta de larga data relacionada con el problema del superárbol . [103] Es particularmente interesante en el caso de la reconciliación de genes/especies donde muchos (típicamente miles de) árboles genéticos están disponibles a partir de secuencias completas del genoma . Los métodos de superárbol intentan ensamblar un árbol de especies basado en conjuntos de árboles que pueden diferir en términos de conjuntos de especies contemporáneas y topología, pero generalmente sin considerar el proceso biológico que explica estas diferencias. Sin embargo, algunos enfoques de superárbol son estadísticamente consistentes para la reconstrucción del árbol de especies si los árboles genéticos se simulan bajo un modelo DL. Esto significa que si el número de árboles inferiores de entrada generados a partir del árbol superior verdadero a través del modelo DL crece hacia el infinito, dado que no hay errores adicionales, el árbol superior de salida converge casi con seguridad al verdadero. Esto se ha demostrado en el caso de una distancia de cuarteto , [104] y con una distancia multicopia de Robinson Foulds generalizada, [105] [106] con un mejor tiempo de ejecución pero asumiendo que los árboles genéticos no contienen biparticiones que contradigan el árbol de especies, lo que parece raro en un modelo DL.
La reconciliación también se puede utilizar para la inferencia de árboles superiores. Este es un problema computacionalmente difícil: resolver politomías en un árbol superior no binario con uno inferior binario (minimizando una puntuación de reconciliación de DL) es NP-hard. [91] En particular, reconstruir el árbol de especies que da el mejor costo de DL para varios árboles genéticos es NP-hard y 2-aproximable. [107] Se llama el problema de duplicación de genes o, de manera más general, parsimonia del árbol genético. El problema fue visto como una forma de detectar paralogía para obtener una mejor reconstrucción del árbol de especies. [108] [109] Es NP-hard, con resultados interesantes sobre la complejidad del problema [91] [110] y el comportamiento del modelo con diferentes tamaños de entrada, estructura y presencia de ILS. [111] Existen múltiples soluciones, con ILP [112] o heurísticas, [113] [114] y con la posibilidad de una puntuación de coalescencia profunda. [115]
ODTL [45] toma como entrada árboles genéticos y busca un árbol de especies de máxima verosimilitud según un modelo DTL, con una búsqueda en pendiente . El enfoque produce un árbol de especies con nodos internos ordenados en el tiempo, asegurando una compatibilidad temporal para los escenarios de transferencia entre árboles inferiores {sección de enlaces|El problema de la viabilidad temporal}.
Para abordar un problema más general, Phyldog [98] busca el árbol de especies de máxima verosimilitud, los árboles genéticos y los parámetros DL de múltiples alineaciones familiares mediante múltiples rondas de búsqueda local. De este modo, realiza la exploración de los árboles superiores e inferiores al mismo tiempo. MixTreEM [116] presenta una solución más rápida.
Límites del modelo DTL de dos niveles
Un límite a la programación dinámica: la evolución no independiente de los linajes de los hijos
El marco de programación dinámica, al igual que los modelos habituales de nacimiento y muerte, funciona bajo la hipótesis de la evolución independiente de los linajes de los hijos en el árbol inferior. Sin embargo, esta hipótesis no se sostiene si el modelo se complementa con varios otros eventos evolutivos documentados, como la transferencia horizontal con reemplazo de un gen homólogo en el linaje receptor o la conversión génica . La transferencia horizontal con reemplazo suele modelarse mediante un reordenamiento del árbol superior, llamado poda y reinjerto de subárbol (SPR). La reconciliación bajo SPR es NP-hard, incluso en árboles fechados, y manejable con parámetros fijos en lo que respecta al tamaño de salida. [117] [118]
Otra forma de modelar e inferir transferencias horizontales de reemplazo es a través de un bosque de acuerdo máximo , donde se cortan ramas en los árboles superior e inferior para obtener dos bosques superior e inferior idénticos (o estadísticamente indistinguibles [119] ). El problema es NP-hard, [120] pero se han propuesto varias aproximaciones. [121]
Las transferencias de reemplazo se pueden considerar sobre la base del modelo DL. [122] En la misma línea, la conversión genética se puede ver como una "duplicación de reemplazo". En este último caso, un algoritmo polinomial que no utiliza programación dinámica y es una extensión del método LCA puede encontrar todas las soluciones óptimas, incluidas las conversiones genéticas. [118]
Integración de niveles de población: falta de divergencia y ordenamiento incompleto de linaje
En los marcos de referencia de hospedador/simbionte, una sola especie de simbionte a veces se asocia a varias especies hospedadoras. Esto significa que, si bien se ha observado una especiación o diversificación en el hospedador, las poblaciones son indistinguibles en el simbionte. Esto se maneja, por ejemplo, mediante politomías adicionales en el árbol simbionte, lo que posiblemente lleve a problemas de inferencia intratables , porque las politomías deben resolverse. También se modela mediante un evento evolutivo adicional, "el fracaso en divergir" (Jane, [56] Amocoala [123] ). El fracaso en divergir puede ser una forma de permitir un cambio de hospedador "libre" en una población, un flujo de simbiontes entre hospedadores estrechamente relacionados. Siguiendo esa visión, el cambio de hospedador permitido solo para hospedadores cercanos se considera en Eucalypt. [58] Esta idea de flujo horizontal entre poblaciones cercanas también se puede aplicar a los marcos de referencia de genes/especies, con una definición de especie basada en un gradiente de flujo genético entre poblaciones. [124]
La falta de divergencia es una forma de introducir la dinámica de poblaciones en la reconciliación, un marco principalmente adaptado al nivel de múltiples especies, donde se supone que las poblaciones están bien diferenciadas. Hay otros fenómenos poblacionales que limitan este marco, uno de ellos es la coalescencia profunda de linajes, que conduce a la clasificación incompleta de linajes (ILS), que no es manejada por el modelo DTL. [88] [125] La coalescencia de múltiples especies es un modelo clásico de evolución de alelos a lo largo de un árbol de especies, con nacimiento de alelos y clasificación de alelos en las especiaciones, que tiene en cuenta los tamaños de población y abarca naturalmente ILS. [126] [127] [111] [128] [129]
En un contexto de reconciliación, se han realizado varios intentos para explicar ILS sin la integración compleja de un modelo de población. Por ejemplo, ILS puede verse como un posible patrón evolutivo para el árbol genético. En ese caso, los linajes de los hijos no son independientes entre sí, lo que conduce a resultados de intratabilidad. El ILS solo se puede manejar con LCA, pero la conciliación ILS + DL es muy difícil, incluso sin transferencias. [130]
Notung [88] maneja ILS colapsando ramas cortas del árbol de especies en politomías y permitiendo ILS como una diversificación libre de árboles genéticos en esas politomías. ecceTERA [131] vincula el tamaño máximo de partes conectadas del árbol de especies donde puede ocurrir ILS, proponiendo un algoritmo manejable con parámetros fijos en ese parámetro.
Los ILS y DL pueden considerarse en una red superior en lugar de un árbol. Esto modela en particular la introgresión, con la posibilidad de estimar los parámetros del modelo. [132]
Se han propuesto modelos de reconciliación más integradores que dan cuenta de los ILS, incluidos tanto los DL como los coalescentes multiespecie, [133] con DLCoal. Es un modelo probabilístico con una traducción de parsimonia, [134] proponiendo dos heurísticas secuenciales de tipo LCA manejadas a través de un árbol de locus intermedio entre el gen y la especie. Sin embargo, fuera del marco de reconciliación gen/especie, los ILS parecen, sin ninguna razón en particular, nunca considerarse en el hospedador/simbionte, ni en la biogeografía.
Cofilogenia con más de dos niveles
Un aspecto llamativo de la reconciliación es la metodología común que maneja diferentes niveles de organización: se utiliza para comparar árboles de dominios y proteínas, árboles de genes y especies, árboles de hospedadores y simbiontes, árboles poblacionales y geográficos. Sin embargo, ahora que los científicos tienden a considerar que los modelos multinivel de funcionamiento biológico aportan una visión novedosa y revolucionaria de los organismos y su entorno, [136] la pregunta es cómo utilizar la reconciliación para llevar la filogenética a esta era holobionte.
La coevolución de entidades en diferentes escalas de evolución es la base de la idea del holobionte: los macroorganismos, los microorganismos y sus genes tienen todos una historia diferente ligada a un funcionamiento común en un único ecosistema. Los sistemas biológicos como el entrelazamiento de hospedadores, simbiontes y sus genes implican dependencias funcionales y evolutivas entre más de dos niveles.
Ejemplos de sistemas multinivel con interdependencias evolutivas complejas
Los genes coevolucionan más allá de los límites del genoma
El concepto de holobionte [137] enfatiza la posibilidad de que genes de diferentes genomas cooperen y coevolucionen. [138] [139] [140] Por ejemplo, ciertos genes en el genoma de un simbionte pueden proporcionar una función a su anfitrión, como la producción de un compuesto vital ausente de las fuentes de alimentación disponibles. Un ejemplo icónico es el caso de los insectos que se alimentan de sangre o de savia, que a menudo dependen de uno o varios simbiontes bacterianos para prosperar en un recurso que es abundante en azúcar, pero carece de aminoácidos esenciales o vitaminas. [141] Otro ejemplo es la asociación de Fabaceae con bacterias fijadoras de nitrógeno . El compuesto beneficiario para el anfitrión es producido típicamente por un conjunto de genes codificados en el genoma del simbionte, que a lo largo de la evolución, puede transferirse a otros simbiontes, y/o dentro y fuera del genoma del anfitrión. Los métodos de reconciliación tienen el potencial de revelar vínculos evolutivos entre porciones de genomas de diferentes especies. Una búsqueda de genes coevolutivos más allá de los límites de los genomas en los que están codificados pondría de relieve la base de la asociación de organismos en el holobionte.
Las rutas de transferencia horizontal de genes dependen de múltiples niveles
En sistemas de insectos simbiontes mutualistas intracelulares , se han identificado múltiples casos de transferencias horizontales de genes, ya sea de huésped a simbionte, de simbionte a huésped o de simbionte a simbionte. [142]
Se ha demostrado que las transferencias de genes endosimbiontes involucrados en vías de nutrición beneficiarias al huésped insecto ocurren preferentemente si los linajes donante y receptor comparten el mismo huésped. [143] [144] [145] Este también es el caso en insectos con simbiontes bacterianos que proporcionan proteína defensiva [146] o en simbiontes bacterianos de nódulos foliares obligados asociados con plantas. [147] En el huésped humano, se ha demostrado que la transferencia de genes ocurre preferentemente entre simbiontes hospedados en los mismos órganos. [148]
Una revisión de las transferencias horizontales de genes en sistemas hospedador/simbionte [149] destaca la importancia de respaldar las transferencias horizontales de genes con evidencia múltiple. En particular, se sostiene que las transferencias deberían considerarse mejor respaldadas cuando involucran simbiontes que comparten un hábitat, un área geográfica o el mismo hospedador. Sin embargo, se debe tener en cuenta que la mayor parte de la diversidad de hospedadores y simbiontes es desconocida y que las transferencias pueden haber ocurrido en especies, hospedadores o simbiontes estrechamente relacionados que no fueron muestreados.
La idea de que la transferencia de genes en simbiontes está limitada por el huésped también se puede utilizar para investigar la historia filogenética del huésped. Por ejemplo, con base en estudios filogeográficos, ahora se acepta que la bacteria Helicobacter pylori ha estado asociada con poblaciones humanas desde los orígenes de la especie humana . [150] [151] Un análisis de los genomas de Helicobacter pylori en Europa sugiere que provienen de una recombinación entre Helicobacter pylori africano y asiático . Esto implica fuertemente contactos tempranos entre las poblaciones humanas correspondientes.
De manera similar, un análisis de HGT en coronavirus de diferentes especies de mamíferos utilizando métodos de reconciliación ha revelado un contacto frecuente entre linajes virales, lo que puede interpretarse como cambios frecuentes de hospedador. [152]
Evolución cultural
La evolución de elementos de la cultura humana , como por ejemplo los idiomas y los cuentos populares , en asociación con la genética de las poblaciones humanas , se ha estudiado utilizando conceptos de la filogenética. Aunque la reconciliación nunca se ha utilizado en este marco, algunos de estos estudios abarcan múltiples niveles de organización, cada uno representado por un árbol o la evolución de un personaje, con un enfoque en la coevolución de estos niveles.
Los árboles lingüísticos pueden compararse con los árboles de población para revelar cuentos populares transmitidos verticalmente, a través de un modelo de personajes en este árbol lingüístico. [153] Las variantes en la familia, los idiomas, la diversidad genética, las poblaciones y la geografía de cada cuento popular pueden compararse de dos en dos, para vincular la diversificación de los cuentos populares con los idiomas por un lado y con la geografía por el otro. [154] Al igual que en la genética con simbiontes que comparten hospedadores que promueven HGT, las barreras lingüísticas pueden impedir la transmisión de cuentos populares o elementos del lenguaje. [155]
Investigación de sistemas de tres niveles mediante la conciliación de dos niveles
La reconciliación multinivel no está tan desarrollada como la reconciliación de dos niveles. Una forma de abordar las dependencias evolutivas entre más de dos niveles de organización es intentar utilizar los métodos estándar de dos niveles disponibles para obtener una primera visión de la complejidad de un sistema biológico.
Múltiples linajes genéticos pueden experimentar eventos conjuntos como duplicación, transferencia o pérdida segmentaria, o incluso duplicación del genoma completo.
La conciliación puede ayudar a identificar autopistas de transferencias e hibridaciones.
Se pueden conciliar tres niveles entre sí, de forma secuencial: el intermedio en el superior antes de añadir el inferior, o bien intentando encontrar un escenario conjunto más parsimonioso para las dos conciliaciones.
Con más de dos niveles, la conciliación de los niveles inferior e intermedio se puede comparar con la conciliación de los niveles inferior y superior.
Eventos multigénicos: consideración implícita de un nivel intermedio
En el nivel de árbol de genes/especies, uno normalmente trata con muchos árboles de genes diferentes. En este caso, la hipótesis de que diferentes familias de genes evolucionan independientemente se hace implícitamente. Sin embargo, esto no tiene por qué ser así. Por ejemplo, la duplicación, transferencia y pérdida pueden ocurrir para segmentos de un genoma que abarcan un número arbitrario de genes contiguos. Es posible considerar tales eventos multigénicos utilizando una guía intermedia para árboles inferiores dentro del superior. Por ejemplo, uno puede calcular la probabilidad conjunta de múltiples conciliaciones de árboles genéticos con un árbol de especies fechado con duplicación, pérdida y duplicación del genoma completo [5] o en un entorno parsimonioso, [156] [157] [158] [159] y una definición del problema es NP-hard. [160] De manera similar, el marco DL puede enriquecerse con duplicación y pérdida de segmentos cromosómicos en lugar de un solo gen. Sin embargo, la conciliación DL se vuelve intratable con esa nueva posibilidad. [161]
El vínculo entre dos genes consecutivos también puede modelarse como un carácter evolutivo, sujeto a ganancia, pérdida, origen, ruptura, duplicación y transferencia. [1] La evolución de este vínculo aparece como un nivel adicional a los árboles de especies y genes, en parte limitado por la reconciliación del árbol gen/especie, en parte evolucionando por sí mismo, de acuerdo con la organización del genoma. Por lo tanto, modela la sintenia , o proximidad entre genes. A otra escala, también puede modelar la evolución de dos dominios pertenecientes a una proteína.
La detección de "autopistas de transferencias", la adquisición preferencial de grupos de genes de un donante específico, es otro ejemplo de no independencia de las historias genéticas. [162] De manera similar, se pueden detectar transferencias de múltiples genes. [163] También ha llevado a desarrollos metodológicos como las reconciliaciones utilizando redes filogenéticas , vistas como un árbol aumentado con bordes de transferencia, que se pueden usar para restringir las transferencias en un modelo DTL. [164] Las redes también se pueden usar para modelar la introgresión y la clasificación de linaje incompleta . [165] [166] [36]
Detección de coevolución en múltiples pares de niveles
Para comprender la evolución de un holobionte es fundamental conocer cuáles son los niveles que coevolucionan entre sí, por ejemplo, entre especies hospedadoras, genes hospedadores, simbiontes y genes simbiontes. Es posible abordar las múltiples interdependencias entre todos los niveles de evolución mediante múltiples comparaciones por pares de dos entidades en evolución.
La conciliación del huésped y el simbionte por un lado y la geografía y el simbionte por el otro también puede ayudar a identificar patrones de diversificación del huésped y el simbionte que reflejan coevolución o patrones que pueden explicarse por una diversificación geográfica común. [167] [168] [169] [170]
De manera similar, un estudio utilizó métodos de conciliación para diferenciar el efecto de la evolución de la dieta y la inercia filogenética en la composición de los microbiomas intestinales de los mamíferos . Al reconstruir las dietas ancestrales y la composición del microbioma en una filogenia de mamíferos, el estudio reveló que ambos efectos contribuyen, pero en diferentes escalas de tiempo. [171]
Modelado explícito de tres o más niveles
En un modelo de un sistema multinivel como huésped/simbionte/genes, las transferencias horizontales de genes deberían ser más probables entre dos simbiontes de un mismo huésped. Esto es invisible para un árbol genético/árbol de especies de dos niveles o una conciliación huésped/simbionte: en algunos casos, observar cualquier combinación de dos niveles puede llevar a pasar por alto un escenario evolutivo que solo puede ser el más probable si se considera la información de los tres árboles en conjunto.
Para hacer frente a las limitaciones de estos usos de las conciliaciones estándar de dos niveles con sistemas que implican interdependencias en múltiples niveles, en la última década se ha llevado a cabo un esfuerzo metodológico para construir y utilizar modelos multinivel. Esto requiere la identificación de al menos un nivel "intermedio" entre el superior y el inferior.
Se pueden conciliar dos niveles con la restricción de uno superior, por ejemplo, huésped y simbionte con geografía.
Los personajes pueden evolucionar en filogenias reconciliadas, como la sintenia genética en una reconciliación gen/especie.
Las transferencias pueden ser dependientes superiores, lo que es más probable entre dos entidades intermedias que pertenecen a un mismo superior.
Con modelos de reconciliación de tres niveles, el árbol intermedio se puede inferir de los árboles inferior y superior.
Pre-reconciliación: personajes sobre árboles reconciliados
Un primer paso hacia modelos integrados de tres niveles es considerar árboles filogenéticos en dos niveles y otro nivel representado solo con caracteres en las hojas de uno de los árboles.
Por ejemplo, una conciliación de las filogenias de hospedadores y simbiontes puede ser informada por datos geográficos. [172] Las ubicaciones geográficas ancestrales de las especies hospedadoras y simbiontes obtenidas a través de un método de inferencia de caracteres pueden entonces usarse para limitar la conciliación hospedador/simbionte: los hospedadores y simbiontes ancestrales solo pueden asociarse si pertenecen a la misma ubicación geográfica.
En otra escala, la evolución a nivel de subgenes puede abordarse con un método de caracteres. [173] Aquí, partes de genes (por ejemplo, la secuencia que codifica dominios proteicos) se concilian según un modelo DL con un árbol de especies, y los genes a los que pertenecen se mencionan como caracteres de estas partes. Los genes ancestrales se reconstruyen luego a posteriori mediante la fusión y división de partes de genes.
Conciliaciones de dos niveles informadas por un tercer nivel
Como lo señalan varios estudios mencionados en § Transferencia horizontal en múltiples niveles, un nivel superior puede informar una conciliación entre uno intermedio y uno inferior, en particular para las transferencias horizontales.
Los modelos de tres niveles pueden tener en cuenta estos supuestos para guiar las conciliaciones entre un árbol intermedio y niveles inferiores con el conocimiento de un árbol superior. El modelo puede, por ejemplo, dar mayores probabilidades a los escenarios de conciliación donde las transferencias horizontales de genes ocurren entre entidades que comparten el mismo hábitat . Esto se ha logrado por primera vez con conciliaciones de genes/especies DTL anidadas con un dominio de genes DTL y una conciliación de genes. [174] Los diferentes costos para las transferencias inter e intra dependen de si las transferencias ocurren o no entre genes de los mismos genomas.
Obsérvese que este modelo considera explícitamente tres niveles y tres árboles, pero aún no define una verdadera conciliación de tres niveles, con una probabilidad o puntuación asociada. [174] Se basa en una operación secuencial, donde la segunda conciliación está informada por el resultado de la primera.
El problema de la conciliación en los modelos multinivel
El siguiente paso es definir la puntuación de una conciliación que consta de tres árboles anidados y calcular, dados los tres árboles, conciliaciones de tres niveles según su puntuación. Esto se ha logrado con un sistema especie/gen/dominio, donde los genes evolucionan dentro del árbol de especies con un modelo DL y los dominios evolucionan dentro del sistema gen/especie con un modelo DTL, prohibiendo las transferencias de dominio entre genes de dos especies diferentes. [175] La inferencia implica escenarios candidatos con puntuaciones conjuntas. Calcular el escenario de puntuación mínima es NP-hard, pero la programación dinámica o la programación lineal entera pueden ofrecer heurísticas. [175] [176] Hay disponibles variaciones del problema considerando múltiples dominios [177] , y también un marco de simulación. [178]
Inferir el árbol intermedio utilizando modelos de conciliación de 3 niveles inferior/intermedio/superior
Así como la reconciliación de dos niveles se puede utilizar para mejorar las filogenias inferiores o superiores, o para ayudar a construirlas a partir de secuencias alineadas, los modelos de reconciliación conjunta se pueden utilizar de la misma manera.
En este sentido, un modelo acoplado de DL de genes/especies, DL de genes de dominio y evolución de secuencias de genes en un marco bayesiano mejora la reconstrucción de árboles genéticos. [179]
Software
Se han desarrollado múltiples programas informáticos para implementar los diversos modelos de reconciliación. La siguiente tabla no pretende ser exhaustiva, pero presenta una serie de herramientas de software destinadas a reconciliar árboles para inferir escenarios de reconciliación o para usos relacionados, como corregir o inferir árboles o probar la coevolución. La sección de niveles de interés detalla los niveles para los que se implementó el software, aunque es totalmente posible, por ejemplo, utilizar un software creado para la reconciliación de especies y genes para reconciliar hospedadores y simbiontes. [180] La parsimonia o probabilidad es el modelo subyacente que se utiliza para la reconciliación.
Referencias
Este artículo fue adaptado de la siguiente fuente bajo licencia CC BY 4.0 (2022): Hugo Menet; Vincent Daubin; Eric Tannier (3 de noviembre de 2022). "Reconciliación filogenética". PLOS Computational Biology . 18 (11): e1010621. doi : 10.1371/JOURNAL.PCBI.1010621 . ISSN 1553-734X. Wikidata Q115175616.
^ ab Duchemin, W.; Anselmetti, Y.; Patterson, M.; Ponty, Y.; Bérard, S.; Chauve, C.; Scornavacca, C.; Daubin, V.; Tannier, E. (2017). "DeCoSTAR: Reconstrucción de la organización ancestral de genes o genomas utilizando filogenias reconciliadas". Genome Biology and Evolution . 9 (5): 1312–1319. doi :10.1093/gbe/evx069. PMC 5441342 . PMID 28402423.
^ Loreto, EL; Carareto, CM; Capy, P. (2008). "Revisitando la transferencia horizontal de elementos transponibles en Drosophila". Heredity . 100 (6): 545–554. doi : 10.1038/sj.hdy.6801094 . PMID 18431403. S2CID 32424144.
^ Denise, R.; Abby, SS; Rocha EPC (2019). "Diversificación de la superfamilia de filamentos tipo IV en máquinas de adhesión, secreción de proteínas, captación de ADN y motilidad". PLOS Biology . 17 (7): e3000390. doi : 10.1371/journal.pbio.3000390 . PMC 6668835 . PMID 31323028.
^ abc Felsenstein J (2004) Inferencia de filogenias. Oxford University Press
^ ab Zwaenepoel, A.; Van De Peer, Y. (2019). "Inferencia de duplicaciones antiguas de todo el genoma y evolución de las tasas de duplicación y pérdida de genes". Biología molecular y evolución . 36 (7): 1384–1404. doi :10.1093/molbev/msz088. hdl : 1854/LU-8612728 . PMID 31004147.
^ ab Bagowski, CP; Bruins, W.; Te Velthuis, AJ (2010). "La naturaleza de la evolución del dominio proteico: modelando la red de interacción". Current Genomics . 11 (5): 368–376. doi :10.2174/138920210791616725. PMC 2945003 . PMID 21286315.
^ Nair, NU; Lin, Y.; Manasovska, A.; Antic, J.; Grnarova, P.; Sahu, AD; Bucher, P.; Moret, BM (2014). "Estudio de la diferenciación celular mediante análisis filogenético utilizando datos de modificación de histonas". BMC Bioinformatics . 15 (1): 269. doi : 10.1186/1471-2105-15-269 . PMC 4138389 . PMID 25104072.
^ Woese, CR; Kandler, O.; Wheelis, ML (1990). "Hacia un sistema natural de organismos: Propuesta para los dominios Archaea, Bacteria y Eucarya". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 87 (12): 4576–4579. Bibcode :1990PNAS...87.4576W. doi : 10.1073/pnas.87.12.4576 . PMC 54159 . PMID 2112744.
^ Dobzhansky, T.; Sturtevant, AH (1938). "Inversiones en los cromosomas de Drosophila Pseudoobscura". Genética . 23 (1): 28–64. doi :10.1093/genetics/23.1.28. PMC 1209001 . PMID 17246876.
^ ab Zuckerkandl, E.; Pauling, L. (1965). "Las moléculas como documentos de la historia evolutiva". Revista de biología teórica . 8 (2): 357–366. Bibcode :1965JThBi...8..357Z. doi :10.1016/0022-5193(65)90083-4. PMID 5876245.
^ Gray, RD; Bryant, D.; Greenhill, SJ (2010). "Sobre la forma y el tejido de la historia humana". Philosophical Transactions of the Royal Society of London. Serie B, Ciencias Biológicas . 365 (1559): 3923–3933. doi :10.1098/rstb.2010.0162. PMC 2981918 . PMID 21041216.
^ Tehrani, JJ (2013). "La filogenia de Caperucita Roja". PLOS ONE . 8 (11): e78871. Bibcode :2013PLoSO...878871T. doi : 10.1371/journal.pone.0078871 . PMC 3827309 . PMID 24236061.
^ abc Wieseke, Nicolas; Bernt, Matthias; Middendorf, Martin (30 de julio de 2013). "Reconciliación de árboles parsimoniosos unificadores". arXiv : 1307.7831 [q-bio.QM].
^ abc Goodman, Morris; Czelusniak, John; Moore, G. William; Romero-Herrera, AE; Matsuda, Genji (1979). "Encajar el linaje genético en su linaje de especies, una estrategia de parsimonia ilustrada por cladogramas construidos a partir de secuencias de globina". Zoología sistemática . 28 (2): 132–163. doi :10.2307/2412519. JSTOR 2412519.
^ ab Morel, B.; Kozlov, AM; Stamatakis, A.; Szöllősi, GJ (2020). "GeneRax: una herramienta para la inferencia de árboles genealógicos de genes basada en máxima verosimilitud y consciente del árbol de especies en condiciones de duplicación, transferencia y pérdida de genes". Biología molecular y evolución . 37 (9): 2763–2774. doi :10.1093/molbev/msaa141. PMC 8312565 . PMID 32502238.
^ Wayne P. Maddison (1997) Árboles genéticos en árboles de especies, Biología Sistemática, 46(3) 523-536.
^ De Vienne, DM (2019). "Los tanglegramas son engañosos para la evaluación visual de la congruencia de los árboles". Biología molecular y evolución . 36 (1): 174–176. doi :10.1093/molbev/msy196. PMID 30351416.
^ abc Brooks, Daniel R. (1981). "El método parasitológico de Hennig: una solución propuesta". Zoología sistemática . 30 (3): 229–249. doi :10.2307/2413247. JSTOR 2413247.
^ Sneath, PHA (1982). "Trabajo revisado: Sistemática y biogeografía: cladística y vicarianza. II., Gareth Nelson, Norman Platnick". Zoología sistemática . 31 (2): 208–217. doi :10.2307/2413040. JSTOR 2413040.
^ Ronquist, Fredrik; Nylin, Soren (1990). "Proceso y patrón en la evolución de las asociaciones de especies". Zoología sistemática . 39 (4): 323–344. doi :10.2307/2992354. JSTOR 2992354.
^ abcd Charleston, MA (1998). "Jungles: Una nueva solución al problema de reconciliación de la filogenia huésped/parásito". Ciencias biológicas matemáticas . 149 (2): 191–223. doi :10.1016/s0025-5564(97)10012-8. PMID 9621683.
^ Hein, Jotun (1993). "Un método heurístico para reconstruir la historia de secuencias sujetas a recombinación". Journal of Molecular Evolution . 36 (4): 396. Bibcode :1993JMolE..36..396H. doi :10.1007/BF00182187. S2CID 16346458.
^ Hallett, MT; Lagergren, J. (2001). "Algoritmos eficientes para problemas de transferencia lateral de genes". Actas de la quinta conferencia internacional anual sobre biología computacional - RECOMB '01 . págs. 149-156. doi :10.1145/369133.369188. ISBN .1581133537. Número de identificación del sujeto 5804061.
^ Page, RDM (1994). "Mapas entre árboles y análisis cladístico de asociaciones históricas entre genes, organismos y áreas". Biología sistemática . 43 : 58–77. doi :10.1093/sysbio/43.1.58.
^ Hafner, MS; Nadler, SA (1988). "Los árboles filogenéticos apoyan la coevolución de los parásitos y sus hospedadores". Nature . 332 (6161): 258–259. Bibcode :1988Natur.332..258H. doi :10.1038/332258a0. PMID 3347269. S2CID 4236760.
^ ab Page, Roderic DM (junio de 1994). "Filogenias paralelas: reconstrucción de la historia de los ensamblajes huésped-parásito". Cladistics . 10 (2): 155–173. doi : 10.1111/j.1096-0031.1994.tb00170.x .
^ Ronquist, F. (1995). "Reconstrucción de la historia de las asociaciones huésped-parásito utilizando parsimonia generalizada". Cladistics . 11 (1): 73–89. doi : 10.1111/j.1096-0031.1995.tb00005.x . PMID 34920597. S2CID 86298930.
^ DTL significa "Duplicación, transferencia horizontal y pérdida".
^ Esta tabla pretende servir como ilustración de la sección de reconciliación de 2 niveles de Menet et al. (2022) Phylogenetic reconciliation. PLoS Comput Biol 18(11): e1010621.doi:10.1371/journal.pcbi.1010621 y se puede leer junto con ella. La adición del evento de transferencia horizontal agrega soluciones nuevas y más parsimoniosas en comparación con el modelo DL anterior (A). Con este nuevo evento, se deben asignar costos a los eventos D, T y L, y diferentes costos dan diferentes soluciones (B). No todos los escenarios que incluyen transferencias son factibles en el tiempo. Algunos pueden incluir restricciones de tiempo incompatibles con el árbol superior (C). La transferencia puede ir de una especie a uno de sus descendientes a través de linajes hermanos que se extinguieron (D). En biogeografía, se puede construir una estructura similar a un árbol para dar cuenta de las posibles migraciones entre diferentes áreas geográficas (E). En algunos casos, un número exponencial de escenarios puede ser más parsimonioso, por ejemplo, cuando dos patrones equivalentes tienen el mismo costo (F). El árbol inferior puede no tener raíz (G), ser multifurcante (H) o darse como una muestra de árboles potenciales (I) y la reconciliación se puede utilizar para resolver esas incertidumbres para obtener un árbol inferior con raíz binaria. La puntuación de reconciliación también se puede utilizar para ayudar a construir un árbol superior (J). La programación dinámica está limitada por el hecho de que supone la independencia entre linajes hermanos, lo que hace que no pueda considerar transferencias de reemplazo o conversión de genes (K), así como la falla en la divergencia (L) y la clasificación de linaje incompleta (M), dos eventos a nivel de población.
^ Wiley, EO (1988). "Análisis de parsimonia y biogeografía de vicarianza". Zoología sistemática . 37 (3): 271–290. doi :10.2307/2992373. JSTOR 2992373.
^ Csurös, M.; Miklós, I. (2009). "Racionalización y grandes genomas ancestrales en Archaea inferidos con un modelo filogenético de nacimiento y muerte". Biología molecular y evolución . 26 (9): 2087–2095. doi :10.1093/molbev/msp123. PMC 2726834 . PMID 19570746.
^ Groussin, M.; Daubin, V.; Gouy, M.; Tannier, E. (2016). "Reconstrucción Ancestral: Teoría y Práctica". Enciclopedia de biología evolutiva (PDF) . págs. 70–77. doi :10.1016/B978-0-12-800049-6.00166-9. ISBN9780128004265.
^ ab Arvestad, L.; Berglund, AC; Lagergren, J.; Sennblad, B. (2003). "Reconciliación de árboles de genes/especies bayesianos y análisis de ortología utilizando MCMC". Bioinformática . 19 (Supl 1): i7-15. doi :10.1093/bioinformatics/btg1000. PMID 12855432.
^ Arvestad, Lars; Berglund, Ann-Charlotte; Lagergren, Jens; Sennblad, Bengt (2004). "Reconstrucción del árbol genético y análisis de ortología basado en un modelo integrado para duplicaciones y evolución de secuencias". Actas de la octava conferencia internacional anual sobre biología molecular computacional - RECOMB '04 . págs. 326–335. doi :10.1145/974614.974657. ISBN1581137559.S2CID 12364792 .
^ ab Yu, Y.; Dong, J.; Liu, KJ; Nakhleh, L. (2014). "Inferencia de máxima verosimilitud de historias evolutivas reticuladas". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 111 (46): 16448–16453. Bibcode :2014PNAS..11116448Y. doi : 10.1073/pnas.1407950111 . PMC 4246314 . PMID 25368173.
^ Csurös, M. (2010). "Count: análisis evolutivo de perfiles filogenéticos con parsimonia y verosimilitud". Bioinformática . 26 (15): 1910–1912. doi : 10.1093/bioinformatics/btq315 . PMID 20551134.
^ Chauve C y El-Mabrouk N (2009) Nuevas perspectivas sobre la evolución de las familias de genes: pérdidas en la reconciliación y un vínculo con los superárboles. RECOMB 5541:46-58
^ ab Doyon J, Scornavacca C, Gorbunov K, Szöllősi G, Ranwez V et al. (2010) Un algoritmo eficiente para la conciliación parsimoniosa de árboles de genes/especies con pérdidas, duplicaciones y transferencias. RECOMB-CG
^ abc Szöllõsi, GJ; Rosikiewicz, W.; Boussau, B.; Tannier, E.; Daubin, V. (2013). "Exploración eficiente del espacio de árboles genéticos reconciliados". Biología sistemática . 62 (6): 901–912. doi :10.1093/sysbio/syt054. PMC 3797637 . PMID 23925510.
^ ab Ree, RH; Smith, SA (2008). "Inferencia de máxima verosimilitud de la evolución del rango geográfico por dispersión, extinción local y cladogénesis". Biología sistemática . 57 (1): 4–14. doi : 10.1080/10635150701883881 . PMID 18253896. S2CID 14205291.
^ ab Jacox, E.; Chauve, C.; Szöllősi, GJ; Ponty, Y.; Scornavacca, C. (2016). "EcceTERA: Reconciliación integral de árboles genéticos y árboles de especies mediante parsimonia". Bioinformática . 32 (13): 2056–2058. doi : 10.1093/bioinformatics/btw105 . PMID 27153713.
^ Doyon, JP; Ranwez, V.; Daubin, V.; Berry, V. (2011). "Modelos, algoritmos y programas para la reconciliación de filogenia". Briefings in Bioinformatics . 12 (5): 392–400. doi : 10.1093/bib/bbr045 . PMID 21949266.
^ Bansal, MS; Alm, EJ; Kellis, M. (2012). "Algoritmos eficientes para el problema de reconciliación con duplicación de genes, transferencia horizontal y pérdida". Bioinformática . 28 (12): i283-91. doi :10.1093/bioinformatics/bts225. PMC 3371857 . PMID 22689773.
^ abc Szöllosi, GJ; Boussau, B.; Abby, SS; Tannier, E.; Daubin, V. (2012). "El modelado filogenético de la transferencia lateral de genes reconstruye el patrón y el momento relativo de las especiaciones". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 109 (43): 17513–17518. Bibcode :2012PNAS..10917513S. doi : 10.1073/pnas.1202997109 . PMC 3491530 . PMID 23043116.
^ ab Merkle, D.; Middendorf, M.; Wieseke, N. (2010). "Un enfoque de programación dinámica adaptativa a parámetros para inferir cofilogenias". BMC Bioinformatics . 11 (Supl 1): S60. doi : 10.1186/1471-2105-11-S1-S60 . PMC 3009534 . PMID 20122236.
^ Baudet, C.; Donati, B.; Sinaimeri, B.; Crescenzi, P.; Gautier, C.; Matias, C.; Sagot, MF (2015). "Reconstrucción de la cofilogenia mediante un cálculo bayesiano aproximado". Biología sistemática . 64 (3): 416–431. doi :10.1093/sysbio/syu129. PMC 4395844 . PMID 25540454.
^ Libeskind-Hadas, R.; Wu, YC; Bansal, MS; Kellis, M. (2014). "Reconciliación del árbol filogenético óptimo de Pareto". Bioinformática . 30 (12): i87-95. doi :10.1093/bioinformatics/btu289. PMC 4058917 . PMID 24932009.
^ ab David, LA; Alm, EJ (2011). "Innovación evolutiva rápida durante una expansión genética arqueana". Nature . 469 (7328): 93–96. Bibcode :2011Natur.469...93D. doi :10.1038/nature09649. hdl : 1721.1/61263 . PMID 21170026. S2CID 4420725.
^ Hallett, MT; Lagergren, J. (2001). "Algoritmos eficientes para problemas de transferencia lateral de genes". Actas de la quinta conferencia internacional anual sobre biología computacional . págs. 149-156. doi :10.1145/369133.369188. ISBN .1581133537. Número de identificación del sujeto 5804061.
^ abc Tofigh, A.; Hallett, M.; Lagergren, J. (2011). "Identificación simultánea de duplicaciones y transferencias laterales de genes". IEEE/ACM Transactions on Computational Biology and Bioinformatics . 8 (2): 517–535. doi :10.1109/TCBB.2010.14. PMID 21233529. S2CID 16462428.
^ Ovadia, Y.; Fielder, D.; Conow, C.; Libeskind-Hadas, R. (2011). "El problema de reconstrucción de la cofilogenia es NP-completo". Journal of Computational Biology . 18 (1): 59–65. doi :10.1089/cmb.2009.0240. PMID 20715926.
^ Wieseke, N.; Hartmann, T.; Bernt, M.; Middendorf, M. (2015). "Reconciliación cofilogenética con ILP". Transacciones IEEE/ACM sobre biología computacional y bioinformática . 12 (6): 1227–1235. doi :10.1109/TCBB.2015.2430336. PMID 26671795. S2CID 2291208.
^ Drinkwater, Benjamin; Charleston, Michael A. (2 de enero de 2014). "Un algoritmo de mapeo de nodos mejorado para el problema de reconstrucción de cofilogenia". Coevolución . 2 (1): 1–17. doi : 10.1080/23256214.2014.906070 .
^ ab Drinkwater, B.; Charleston, MA (2016). "RASCAL: un enfoque aleatorio para el análisis coevolutivo". Revista de biología computacional . 23 (3): 218–227. doi :10.1089/cmb.2015.0111. PMID 26828619.
^ abcd Conow, C.; Fielder, D.; Ovadia, Y.; Libeskind-Hadas, R. (2010). "Jane: Una nueva herramienta para el problema de reconstrucción de cofilogenia". Algorithms for Molecular Biology . 5 : 16. doi : 10.1186/1748-7188-5-16 . PMC 2830923 . PMID 20181081.
^ abc Durand, D.; Halldórsson, B. V.; Vernot, B. (2006). "Un enfoque híbrido micro-macroevolutivo para la reconstrucción del árbol genético". Journal of Computational Biology . 13 (2): 320–335. doi :10.1089/cmb.2006.13.320. PMID 16597243.
^ abcde Donati, B.; Baudet, C.; Sinaimeri, B.; Crescenzi, P.; Sagot, MF (2015). "EUCALIPTO: Enumerador eficiente de reconciliación de árboles". Algoritmos para biología molecular . 10 (1): 3. doi : 10.1186/s13015-014-0031-3 . PMC 4310143 . PMID 25648467.
^ ab Ma, W.; Smirnov, D.; Forman, J.; Schweickart, A.; Slocum, C.; Srinivasan, S.; Libeskind-Hadas, R. (2018). "DTL-RNB: algoritmos y herramientas para resumir el espacio de conciliaciones DTL". Transacciones IEEE/ACM sobre biología computacional y bioinformática . 15 (2): 411–421. doi : 10.1109/TCBB.2016.2537319 . PMID 26955051. S2CID 4566350.
^ ab Chauve, Cédric; Rafiey, Akbar; Davín, Adrián A.; Scornavacca, Celine; Veber, Philippe; Boussau, Bastien; Szöllősi, Gergely J.; Daubin, Vincent; Tannier, Eric (14 de abril de 2017). "MaxTiC: Clasificación rápida de un árbol filogenético por consistencia temporal máxima con transferencias laterales de genes". doi :10.1101/127548. S2CID 21910535.{{cite journal}}: Requiere citar revista |journal=( ayuda )
^ Davín, AA; Tannier, E.; Williams, TA; Boussau, B.; Daubin, V.; Szöllősi, GJ (2018). "Las transferencias genéticas pueden datar el árbol de la vida". Nature Ecology & Evolution . 2 (5): 904–909. Bibcode :2018NatEE...2..904D. doi :10.1038/s41559-018-0525-3. PMC 5912509 . PMID 29610471.
^ ab Szöllosi, GJ; Tannier, E.; Lartillot, N.; Daubin, V. (2013). "Transferencia lateral de genes desde los muertos". Biología sistemática . 62 (3): 386–397. doi :10.1093/sysbio/syt003. PMC 3622898 . PMID 23355531.
^ Davín, AA; Tricou, T.; Tannier, E.; De Vienne, DM; Szöllősi, GJ (2020). "Zombi: un simulador filogenético de árboles, genomas y secuencias que explica linajes muertos". Bioinformática . 36 (4): 1286–1288. doi :10.1093/bioinformatics/btz710. PMC 7031779 . PMID 31566657.
^ ab Scornavacca, C.; Jacox, E.; Szöllősi, GJ (2015). "Amalgamación conjunta de los árboles genéticos reconciliados más parsimoniosos". Bioinformática . 31 (6): 841–848. doi :10.1093/bioinformatics/btu728. PMC 4380024 . PMID 25380957.
^ Weiner, Samson; Bansal, Mukul S. (5 de agosto de 2021). "Mejora de la conciliación de duplicación-transferencia-pérdida con linajes extintos y no muestreados". Algorithms . 14 (8): 231. doi : 10.3390/a14080231 .
^ Szöllősi, GJ; Davín, AA; Tannier, E.; Daubin, V.; Boussau, B. (2015). "El análisis filogenético a escala genómica descubre una amplia transferencia de genes entre hongos". Philosophical Transactions of the Royal Society of London. Serie B, Ciencias Biológicas . 370 (1678). doi :10.1098/rstb.2014.0335. PMC 4571573 . PMID 26323765.
^ Ronquist F (1997) Enfoques filogenéticos en coevolución y biogeografía. Zoologica Scripta 26:313--322
^ Ree, RH; Moore, BR; Webb, CO; Donoghue, MJ (2005). "Un marco de verosimilitud para inferir la evolución del rango geográfico en árboles filogenéticos". Evolución; Revista Internacional de Evolución Orgánica . 59 (11): 2299–2511. doi : 10.1111/j.0014-3820.2005.tb00940.x . PMID 16396171. S2CID 23245573.
^ ab Matzke, NJ (2014). "La selección de modelos en la biogeografía histórica revela que la especiación por evento fundador es un proceso crucial en los clados insulares". Biología sistemática . 63 (6): 951–970. doi : 10.1093/sysbio/syu056 . PMID 25123369.
^ Van Dam, Matthew H.; Matzke, Nicholas J. (2016). "Evaluación de la influencia de la conectividad y la distancia en los patrones biogeográficos en los desiertos del suroeste de América del Norte". Revista de biogeografía . 43 (8): 1514–1532. Código Bibliográfico :2016JBiog..43.1514V. doi :10.1111/jbi.12727. S2CID 87276317.
^ ab Santichaivekin, S.; Yang, Q.; Liu, J.; Mawhorter, R.; Jiang, J.; Wesley, T.; Wu, YC; Libeskind-Hadas, R. (2021). "EMPRess: una herramienta sistemática de reconciliación de cofilogenia". Bioinformática . 37 (16): 2481–2482. doi : 10.1093/bioinformatics/btaa978 . PMID 33216126.
^ Sennblad, B.; Schreil, E.; Berglund Sonnhammer, AC; Lagergren, J.; Arvestad, L. (2007). "Primetv: un visualizador para árboles reconciliados". BMC Bioinformatics . 8 : 148. doi : 10.1186/1471-2105-8-148 . PMC 1891116 . PMID 17484781.
^ Chevenet, F.; Doyon, JP; Scornavacca, C.; Jacox, E.; Jousselin, E.; Berry, V. (2016). "SylvX: un visualizador para conciliaciones de árboles filogenéticos". Bioinformática . 32 (4): 608–610. doi : 10.1093/bioinformatics/btv625 . PMID 26515823.
^ Penel, S.; Menet, H.; Tricou, T.; Daubin, V.; Tannier, E. (2022). "Tercer tipo: visualización de encuentros filogenéticos más allá de la reconciliación de dos niveles". Bioinformática . 38 (8): 2350–2352. doi :10.1093/bioinformatics/btac062. PMID 35139153.
^ ab Bansal, MS; Alm, EJ; Kellis, M. (2013). "Reconciliación revisada: manejo de múltiples óptimos al conciliar con duplicación, transferencia y pérdida". Journal of Computational Biology . 20 (10): 738–754. doi :10.1089/cmb.2013.0073. PMC 3791060 . PMID 24033262.
^ Scornavacca, C.; Paprotny, W.; Berry, V.; Ranwez, V. (2013). "Representación de un conjunto de conciliaciones de forma compacta" (PDF) . Revista de bioinformática y biología computacional . 11 (2). doi :10.1142/S0219720012500254. PMID 23600816. S2CID 17688742.
^ Nguyen, TH; Ranwez, V.; Berry, V.; Scornavacca, C. (2013). "Medidas de apoyo para estimar la fiabilidad de los eventos evolutivos predichos por métodos de reconciliación". PLOS ONE . 8 (10): e73667. Bibcode :2013PLoSO...873667N. doi : 10.1371/journal.pone.0073667 . PMC 3790797 . PMID 24124449.
^ ab Kundu, S.; Bansal, MS (2018). "Sobre el impacto del enraizamiento incierto del árbol genético en la reconciliación de duplicación-transferencia-pérdida". BMC Bioinformatics . 19 (Suppl 9): 290. doi : 10.1186/s12859-018-2269-0 . PMC 6101088 . PMID 30367593.
^ Huber K, Moulton V, Sagot MF, Sinaimeri B (2018) Medianas geométricas en espacios de reconciliación de árboles filogenéticos. Information Processing Letter. 136: 96–101
^ Mawhorter, R.; Libeskind-Hadas, R. (2019). "Agrupamiento jerárquico de conciliaciones de máxima parsimonia". BMC Bioinformatics . 20 (1): 612. doi : 10.1186/s12859-019-3223-5 . PMC 6882150 . PMID 31775628.
^ Santichaivekin, S.; Mawhorter, R.; Libeskind-Hadas, R. (2019). "Un algoritmo exacto eficiente para calcular todas las distancias por pares entre conciliaciones en el modelo de pérdida de transferencia de duplicación". BMC Bioinformatics . 20 (Suppl 20): 636. doi : 10.1186/s12859-019-3203-9 . PMC 6915856 . PMID 31842734.
^ Wang, Y.; Mary, A.; Sagot, MF; Sinaimeri, B. (2020). "Carpincho: enumeración de clases de equivalencia de reconciliaciones basadas en eventos de cofilogenia". Bioinformática . 36 (14): 4197–4199. doi : 10.1093/bioinformatics/btaa498 . PMID 32556075.
^ Boussau, B.; Daubin, V. (2010). "Los genomas como documentos de la historia evolutiva". Tendencias en ecología y evolución . 25 (4): 224–232. Bibcode :2010TEcoE..25..224B. doi :10.1016/j.tree.2009.09.007. PMID 19880211.
^ Hahn, MW (2007). "Sesgo en los métodos de reconciliación de árboles filogenéticos: implicaciones para la evolución del genoma de vertebrados". Genome Biology . 8 (7): R141. doi : 10.1186/gb-2007-8-7-r141 . PMC 2323230 . PMID 17634151.
^ ab Urbini, L.; Sinaimeri, B.; Matias, C.; Sagot, MF (2018). "Explorando la robustez del método de reconciliación parsimoniosa en la cofilogenia huésped-simbionte" (PDF) . Transacciones IEEE/ACM sobre biología computacional y bioinformática . 16 (3): 738–748. doi :10.1109/TCBB.2018.2838667. PMID 29993554. S2CID 51613681.
^ Górecki, P.; Eulenstein, O.; Tiuryn, J. (2013). "Reconciliación de árboles sin raíz: un enfoque unificado". Transacciones IEEE/ACM sobre biología computacional y bioinformática . 10 (2): 522–536. doi :10.1109/TCBB.2013.22. PMID 23929875. S2CID 13416908.
^ abc Stolzer, M.; Lai, H.; Xu, M.; Sathaye, D.; Vernot, B.; Durand, D. (2012). "Inferir duplicaciones, pérdidas, transferencias y ordenamiento incompleto de linajes con árboles de especies no binarios". Bioinformática . 28 (18): i409–i415. doi :10.1093/bioinformatics/bts386. PMC 3436813 . PMID 22962460.
^ Lafond M y Noutahi E y El-Mabrouk N (2016) Resolución eficiente de árboles genéticos no binarios con costo de conciliación ponderado. 27.° Simposio anual sobre emparejamiento de patrones combinatorios (CPM 2016) 14:1--14:12
^ Comte, N.; Morel, B.; Hasić, D.; Guéguen, L.; Boussau, B.; Daubin, V.; Penel, S.; Scornavacca, C.; Gouy, M.; Stamatakis, A.; Tannier, E.; Parsons, DP (2020). "Treerecs: una herramienta filogenética integrada, desde secuencias hasta reconciliaciones". Bioinformática . 36 (18): 4822–4824. doi : 10.1093/bioinformática/btaa615 . PMID 33085745.
^ abc Zheng, Yu; Wu, Taoyang; Zhang, Louxin (2012). "Reconciliación de árboles genéticos y de especies con politomías". arXiv : 1201.3995 [q-bio.PE].
^ ab Kordi, M.; Bansal, MS (2017). "Sobre la complejidad de la conciliación de duplicación-transferencia-pérdida con árboles genéticos no binarios". Transacciones IEEE/ACM sobre biología computacional y bioinformática . 14 (3): 587–599. doi :10.1109/TCBB.2015.2511761. PMID 28055898. S2CID 4458502.
^ Lai, Han; Stolzer, Maureen; Durand, Dannie (2017). "Heurísticas rápidas para resolver ramas con soporte débil mediante duplicación, transferencias y pérdidas". Comparative Genomics . Apuntes de clase en informática. Vol. 10562. págs. 298–320. doi :10.1007/978-3-319-67979-2_16. ISBN978-3-319-67978-5.
^ Jacox, E.; Weller, M.; Tannier, E.; Scornavacca, C. (2017). "Resolución y reconciliación de árboles genéticos no binarios con transferencias, duplicaciones y pérdidas". Bioinformática . 33 (7): 980–987. doi : 10.1093/bioinformatics/btw778 . PMID 28073758.
^ Kordi, M.; Bansal, MS (2019). "Algoritmos exactos para la conciliación de pérdida-transferencia-duplicación con árboles genéticos no binarios". Transacciones IEEE/ACM sobre biología computacional y bioinformática . 16 (4): 1077–1090. doi : 10.1109/TCBB.2017.2710342 . PMID 28622673. S2CID 54606569.
^ Bansal, MS; Wu, YC; Alm, EJ; Kellis, M. (2015). "Mejora de la corrección de errores del árbol genético en presencia de transferencia horizontal de genes". Bioinformática . 31 (8): 1211–1218. doi :10.1093/bioinformatics/btu806. PMC 4393519 . PMID 25481006.
^ Lartillot, N.; Philippe, H. (2004). "Un modelo de mezcla bayesiano para heterogeneidades entre sitios en el proceso de reemplazo de aminoácidos". Biología molecular y evolución . 21 (6): 1095–1109. doi : 10.1093/molbev/msh112 . PMID 15014145.
^ ab Boussau, B.; Szöllosi, GJ; Duret, L.; Gouy, M.; Tannier, E.; Daubin, V. (2013). "Coestimación a escala del genoma de especies y árboles genéticos". Investigación del genoma . 23 (2): 323–330. doi :10.1101/gr.141978.112. PMC 3561873 . PMID 23132911.
^ ab Akerborg, O.; Sennblad, B.; Arvestad, L.; Lagergren, J. (2009). "Reconstrucción y reconciliación simultánea de árboles genéticos bayesianos". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 106 (14): 5714–5719. Bibcode :2009PNAS..106.5714A. doi : 10.1073/pnas.0806251106 . PMC 2667006 . PMID 19299507.
^ Nguyen, TH; Ranwez, V.; Pointet, S.; Chifolleau, AM; Doyon, JP; Berry, V. (2013). "La reconciliación y el reordenamiento del árbol genético local pueden ser de beneficio mutuo". Algoritmos para la biología molecular . 8 (1): 12. doi : 10.1186/1748-7188-8-12 . PMC 3871789 . PMID 23566548.
^ Kordi, Misagh; Bansal, Mukul S. (2020). "Tree Solve : corrección rápida de errores de árboles genéticos microbianos". Algoritmos para biología computacional . Apuntes de clase en informática. Vol. 12099. págs. 125–139. doi :10.1007/978-3-030-42266-0_10. ISBN978-3-030-42265-3. Número de identificación del sujeto 210171366.
^ Sjöstrand, J.; Tofigh, A.; Daubin, V.; Arvestad, L.; Sennblad, B.; Lagergren, J. (2014). "Un método bayesiano para analizar la transferencia lateral de genes". Biología sistemática . 63 (3): 409–420. doi : 10.1093/sysbio/syu007 . PMID 24562812.
^ Warnow, Tandy (2018). "Construcción de superárboles: oportunidades y desafíos". arXiv : 1805.03530 [q-bio.PE].
^ Legried, B.; Molloy, EK; Warnow, T.; Roch, S. (2021). "Estimación estadística en tiempo polinomial de árboles de especies bajo duplicación y pérdida de genes". Revista de biología computacional . 28 (5): 452–468. doi :10.1089/cmb.2020.0424. PMID 33325781.
^ Molloy, EK; Warnow, T. (2020). "FastMulRFS: estimación rápida y precisa de árboles de especies bajo modelos genéricos de duplicación y pérdida de genes". Bioinformática . 36 (Suppl_1): i57–i65. doi :10.1093/bioinformatics/btaa444. PMC 7355287 . PMID 32657396.
^ Chaudhary, R.; Burleigh, JG; Fernández-Baca, D. (2013). "Inferir árboles de especies a partir de árboles genéticos multicopia incongruentes utilizando la distancia de Robinson-Foulds". Algoritmos para la biología molecular . 8 (1): 28. doi : 10.1186/1748-7188-8-28 . PMC 3874668 . PMID 24180377.
^ Ma B y Li M y Zhang L (2000) De árboles genéticos a árboles de especies. SIAM J. Comput., mayo, 729–752 24
^ Guigo, Roderic; Muchnik, Ilya; Smith, Temple F. (1 de octubre de 1996). "Reconstrucción de la filogenia molecular antigua". Filogenética molecular y evolución . 6 (2): 189–213. Bibcode :1996MolPE...6..189G. doi : 10.1006/mpev.1996.0071 . ISSN 1055-7903. PMID 8899723.
^ Page, Roderic DM (1 de enero de 2000). "Extracción de árboles de especies a partir de árboles genéticos complejos: árboles reconciliados y filogenia de vertebrados". Filogenética molecular y evolución . 14 (1): 89–106. Bibcode :2000MolPE..14...89P. doi :10.1006/mpev.1999.0676. ISSN 1055-7903. PMID 10631044 . Consultado el 17 de diciembre de 2022 .
^ Bansal, MS; Shamir, R. (2011). "Una nota sobre la manejabilidad de parámetros fijos del problema de duplicación génica". Transacciones IEEE/ACM sobre biología computacional y bioinformática . 8 (3): 848–850. doi :10.1109/TCBB.2010.74. PMID 20733245. S2CID 7086924.
^ ab Maddison, WP; Knowles, LL (2006). "Inferir filogenia a pesar de una clasificación de linaje incompleta". Biología sistemática . 55 (1): 21–30. doi : 10.1080/10635150500354928 . PMID 16507521. S2CID 13453831.
^ Chang, WC; Burleigh, GJ; Fernández-Baca, DF; Eulenstein, O. (2011). "Una solución ILP para el problema de la duplicación génica". BMC Bioinformatics . 12 (Suppl 1): S14. doi : 10.1186/1471-2105-12-S1-S14 . PMC 3044268 . PMID 21342543.
^ Page, RD (1998). "GeneTree: Comparación de filogenias de genes y especies mediante árboles reconciliados". Bioinformática . 14 (9): 819–820. doi : 10.1093/bioinformatics/14.9.819 . PMID 9918954.
^ Wehe, A.; Bansal, MS; Burleigh, JG; Eulenstein, O. (2008). "DupTree: Un programa para análisis filogenéticos a gran escala utilizando parsimonia de árboles genéticos". Bioinformática . 24 (13): 1540–1541. doi : 10.1093/bioinformatics/btn230 . PMID 18474508.
^ Chaudhary, R.; Bansal, MS; Wehe, A.; Fernández-Baca, D.; Eulenstein, O. (2010). "IGTP: Un paquete de software para el análisis de parsimonia de árboles genéticos a gran escala". BMC Bioinformatics . 11 : 574. doi : 10.1186/1471-2105-11-574 . PMC 3002902 . PMID 21092314.
^ Ullah, I.; Parviainen, P.; Lagergren, J. (2015). "Inferencia de árboles de especies utilizando un modelo de mezcla". Biología molecular y evolución . 32 (9): 2469–2482. doi : 10.1093/molbev/msv115 . PMID 25963975.
^ Bordewich W y Semple C (2005) Sobre la complejidad computacional de la distancia de poda y reinjerto de subárboles enraizados. Annals of Combinatoris 8: 409-423
^ ab Hasić, D.; Tannier, E. (2019). "Reconciliación de especies de árboles genéticos con conversión génica". Revista de biología matemática . 78 (6): 1981–2014. arXiv : 1703.08950 . doi :10.1007/s00285-019-01331-w. PMID 30767052. S2CID 8476555.
^ Abby, SS; Tannier, E.; Gouy, M.; Daubin, V. (2010). "Detección de transferencias laterales de genes mediante la conciliación estadística de bosques filogenéticos". BMC Bioinformatics . 11 : 324. doi : 10.1186/1471-2105-11-324 . PMC 2905365 . PMID 20550700.
^ Hein J, Jiang T, Wang L, Zhang K (1996) Sobre la complejidad de comparar árboles evolutivos. Matemáticas Aplicadas Discretas 71:153--169
^ Rodrigues, Estela M.; Sagot, Marie-France; Wakabayashi, Yoshiko (abril de 2007). "El problema del bosque de máxima concordancia: algoritmos de aproximación y experimentos computacionales". Ciencias de la Computación Teórica . 374 (1–3): 91–110. doi :10.1016/j.tcs.2006.12.011. S2CID 16479722.
^ Kordi M (2019) Inferencia de la evolución de familias de genes microbianos mediante la reconciliación de duplicación-transferencia-pérdida: algoritmos y complejidad. Tesis doctorales. 2101.
^ Urbini L (2017) Modelos y algoritmos para estudiar la historia evolutiva común de hospedadores y simbiontes. Tesis doctoral, Université de Lyon
^ Marin, J.; Achaz, G.; Crombach, A.; Lambert, A. (2020). "La visión genómica de la diversificación". Revista de biología evolutiva . 33 (10): 1387–1404. doi :10.1111/jeb.13677. PMID 32654283. S2CID 91543153.
^ Szöllősi, GJ; Tannier, E.; Daubin, V.; Boussau, B. (2015). "La inferencia de árboles genéticos con árboles de especies". Biología Sistemática . 64 (1): e42-62. doi :10.1093/sysbio/syu048. PMC 4265139 . PMID 25070970.
^ Rannala, B.; Yang, Z. (2003). "Estimación bayesiana de los tiempos de divergencia de las especies y los tamaños de las poblaciones ancestrales utilizando secuencias de ADN de múltiples loci". Genética . 164 (4): 1645–1656. doi :10.1093/genetics/164.4.1645. PMC 1462670 . PMID 12930768.
^ Degnan, JH; Salter, LA (2005). "Distribuciones de árboles genéticos bajo el proceso coalescente". Evolución; Revista Internacional de Evolución Orgánica . 59 (1): 24–37. doi :10.1111/j.0014-3820.2005.tb00891.x. PMID 15792224.
^ Liu, L.; Pearl, DK (2007). "Árboles de especies a partir de árboles genéticos: reconstrucción de distribuciones posteriores bayesianas de una filogenia de especies utilizando distribuciones estimadas de árboles genéticos". Biología sistemática . 56 (3): 504–514. doi : 10.1080/10635150701429982 . PMID 17562474.
^ Rannala B y Edwards S y Leaché A y Yang Z (2020) Filogenética en la era genómica, 3.3:1--3.3:21
^ Bork, D.; Cheng, R.; Wang, J.; Sung, J.; Libeskind-Hadas, R. (2017). "Sobre la complejidad computacional del problema de reconciliación de máxima parsimonia en el modelo de duplicación-pérdida-coalescencia". Algorithms for Molecular Biology . 12 : 6. doi : 10.1186/s13015-017-0098-8 . PMC 5349084 . PMID 28316640.
^ Chan, YB; Ranwez, V.; Scornavacca, C. (2017). "Inferir ordenamiento incompleto de linajes, duplicaciones, transferencias y pérdidas con reconciliaciones" (PDF) . Revista de Biología Teórica . 432 : 1–13. Bibcode :2017JThBi.432....1C. doi :10.1016/j.jtbi.2017.08.008. PMID 28801222. S2CID 7854827.
^ Du P y Ogilvie HA y Nakhleh L (2019) Unificación de la duplicación, pérdida y coalescencia de genes en redes filogenéticas. Investigación y aplicaciones en bioinformática. ISBRA 2019. Apuntes de clase en informática, vol. 11490. Springer, Cham.
^ Rasmussen, MD; Kellis, M. (2012). "Modelado unificado de duplicación, pérdida y coalescencia de genes utilizando un árbol de locus". Genome Research . 22 (4): 755–765. doi :10.1101/gr.123901.111. PMC 3317157 . PMID 22271778.
^ Wu, YC; Rasmussen, MD; Bansal, MS; Kellis, M. (2014). "Reconciliación más parsimoniosa en presencia de duplicación, pérdida y coalescencia profunda de genes utilizando árboles coalescentes etiquetados". Genome Research . 24 (3): 475–486. doi :10.1101/gr.161968.113. PMC 3941112 . PMID 24310000.
^ Esta tabla pretende servir como ilustración de la sección de reconciliación de 3 niveles de Menet et al. (2022) Phylogenetic reconciliation. PLoS Comput Biol 18(11): e1010621.doi:10.1371/journal.pcbi.1010621 y se puede leer junto con ella. Los colores corresponden a los diferentes niveles (colores similares pero diferentes si hay varios árboles en el mismo nivel). La leyenda da un ejemplo de todos estos colores y códigos de forma. Múltiples linajes genéticos pueden experimentar eventos conjuntos como la duplicación del genoma completo (A) o eventos segmentarios (B), algunos eventos pueden ser más probables que otros, como transferencias horizontales específicas con autopista de transferencias o hibridación (C). Los patrones cofilogenéticos se pueden comparar, para ver, por ejemplo, si el patrón común de un huésped y un simbionte no es solo el patrón común del simbionte y la geografía (D). Los caracteres pueden evolucionar sobre una filogenia reconciliada, como la sintenia génica (E), o se pueden reconciliar dos niveles con la restricción de uno superior (F). Las transferencias pueden ser dependientes de un nivel superior, lo que es más probable entre dos entidades intermedias que pertenecen a un mismo nivel superior (G). Se pueden reconciliar tres niveles juntos, secuencialmente: el intermedio y el superior antes de añadir el inferior, o tratando de encontrar un escenario conjunto más parsimonioso para las dos reconciliaciones (H). Estos modelos multinivel también se pueden utilizar para reconstruir una filogenia intermedia (I).
^ Theis, KR; Dheilly, NM; Klassen, JL; Brucker, RM; Baines, JF; Bosch, TC; Cryan, JF; Gilbert, SF; Goodnight, CJ; Lloyd, EA; Sapp, J.; Vandenkoornhuyse, P.; Zilber-Rosenberg, I.; Rosenberg, E.; Bordenstein, SR (2016). "Cómo entender correctamente el concepto de hologenoma: un marco ecoevolutivo para los huéspedes y sus microbiomas". mSystems . 1 (2). doi :10.1128/mSystems.00028-16. PMC 5069740 . PMID 27822520.
^ Margulis, LS; Fester, R. (1991). La simbiosis como fuente de innovación evolutiva: especiación y morfogénesis . Cambridge, Mass.: MIT Press. ISBN9780262132695.
^ Bordenstein, SR; Theis, KR (2015). "Biología del huésped a la luz del microbioma: diez principios de holobiontes y hologenomas". PLOS Biology . 13 (8): e1002226. doi : 10.1371/journal.pbio.1002226 . PMC 4540581 . PMID 26284777.
^ Rosenberg, E.; Koren, O.; Reshef, L.; Efrony, R.; Zilber-Rosenberg, I. (2007). "El papel de los microorganismos en la salud, la enfermedad y la evolución de los corales". Nature Reviews. Microbiología . 5 (5): 355–362. doi :10.1038/nrmicro1635. PMID 17384666. S2CID 2967190.
^ Zilber-Rosenberg, I.; Rosenberg, E. (2008). "El papel de los microorganismos en la evolución de animales y plantas: la teoría hologenómica de la evolución". FEMS Microbiology Reviews . 32 (5): 723–735. doi : 10.1111/j.1574-6976.2008.00123.x . PMID 18549407.
^ Moran, NA; McCutcheon, JP; Nakabachi, A. (2008). "Genómica y evolución de simbiontes bacterianos hereditarios". Revisión anual de genética . 42 : 165–190. doi :10.1146/annurev.genet.41.110306.130119. PMID 18983256.
^ López-Madrigal, S.; Gil, R. (2017). "Et tu, Brute? Ni siquiera los simbiontes mutualistas intracelulares escapan a la transferencia horizontal de genes". Genes . 8 (10): 247. doi : 10.3390/genes8100247 . PMC 5664097 . PMID 28961177.
^ Penz, T.; Schmitz-Esser, S.; Kelly, SE; Cass, BN; Müller, A.; Woyke, T.; Malfatti, SA; Hunter, MS; Horn, M. (2012). "La genómica comparativa sugiere un origen independiente de la incompatibilidad citoplasmática en Cardinium hertigii". PLOS Genetics . 8 (10): e1003012. doi : 10.1371/journal.pgen.1003012 . PMC 3486910 . PMID 23133394.
^ Nikoh, N.; Hosokawa, T.; Moriyama, M.; Oshima, K.; Hattori, M.; Fukatsu, T. (2014). "Origen evolutivo del mutualismo nutricional entre insectos y Wolbachia". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 111 (28): 10257–10262. Bibcode :2014PNAS..11110257N. doi : 10.1073/pnas.1409284111 . PMC 4104916 . PMID 24982177.
^ Manzano-Marín, A.; Coeur d'Acier, A.; Clamens, AL; Orvain, C.; Cruaud, C.; Barbe, V.; Jousselin, E. (2020). "La transferencia horizontal en serie de genes biosintéticos de vitaminas permite el establecimiento de nuevos simbiontes nutricionales en los sistemas disimbióticos de los pulgones". La Revista ISME . 14 (1): 259–273. Código Bib : 2020ISMEJ..14..259M. doi :10.1038/s41396-019-0533-6. PMC 6908640 . PMID 31624345.
^ Nakabachi, A.; Ueoka, R.; Oshima, K.; Teta, R.; Mangoni, A.; Gurgui, M.; Oldham, NJ; Van Echten-Deckert, G.; Okamura, K.; Yamamoto, K.; Inoue, H.; Ohkuma, M.; Hongoh, Y.; Miyagishima, SY; Hattori, M.; Piel, J.; Fukatsu, T. (2013). "Simbionte bacterioma defensivo con un genoma drásticamente reducido". Current Biology . 23 (15): 1478–1484. Bibcode :2013CBio...23.1478N. doi : 10.1016/j.cub.2013.06.027 . PMID 23850282. S2CID 1637956.
^ Pinto-Carbó, M.; Sieber, S.; Dessein, S.; Mimbre, T.; Verstraete, B.; Gademann, K.; Eberl, L.; Carlier, A. (2016). "Evidencia de transferencia horizontal de genes entre simbiontes de nódulos foliares obligados". La Revista ISME . 10 (9): 2092-2105. Código Bib : 2016ISMEJ..10.2092P. doi :10.1038/ismej.2016.27. PMC 4989318 . PMID 26978165.
^ Jeong, H.; Arif, B.; Caetano-Anollés, G.; Kim, KM; Nasir, A. (2019). "Transferencia horizontal de genes en microorganismos asociados a humanos inferida por reconstrucción y reconciliación filogenética". Scientific Reports . 9 (1): 5953. Bibcode :2019NatSR...9.5953J. doi :10.1038/s41598-019-42227-5. PMC 6459891 . PMID 30976019.
^ Wijayawardena, BK; Minchella, DJ; Dewoody, JA (2013). "Huéspedes, parásitos y transferencia horizontal de genes". Tendencias en parasitología . 29 (7): 329–338. doi :10.1016/j.pt.2013.05.001. PMID 23759418.
^ Moodley, Y.; Linz, B.; Vínculo, RP; Nieuwoudt, M.; Soodyall, H.; Schlebusch, CM; Bernhöft, S.; Hale, J.; Suerbaum, S.; Mugisha, L.; Van Der Merwe, SO; Achtman, M. (2012). "Edad de la asociación entre Helicobacter pylori y el hombre". Más patógenos . 8 (5): e1002693. doi : 10.1371/journal.ppat.1002693 . PMC 3349757 . PMID 22589724.
^ Achtman, M. (2016). "¿Qué edad tienen los patógenos bacterianos?". Actas. Ciencias Biológicas . 283 (1836). doi :10.1098/rspb.2016.0990. PMC 5013766 . PMID 27534956.
^ Fu, Yiran; Pistolozzi, Marco; Yang, Xiaofeng; Lin, Zhanglin (2020). "Una clasificación completa de coronavirus y transmisiones inferidas entre hosts". bioRxiv 10.1101/2020.08.11.232520 .
^ Da Silva, SG; Tehrani, JJ (2016). "Análisis filogenéticos comparativos descubren las antiguas raíces de los cuentos populares indoeuropeos". Royal Society Open Science . 3 (1): 150645. Bibcode :2016RSOS....350645D. doi :10.1098/rsos.150645. PMC 4736946 . PMID 26909191.
^ Ross, RM; Greenhill, SJ; Atkinson, QD (2013). "Estructura de la población y geografía cultural de un cuento popular en Europa". Actas. Ciencias Biológicas . 280 (1756). doi :10.1098/rspb.2012.3065. PMC 3574383. PMID 23390109 .
^ Bortolini, E.; Pagani, L.; Crema, ER; Sarno, S.; Barbieri, C.; Boattini, A.; Sazzini, M.; Da Silva, SG; Martini, G.; Metspalu, M.; Pettener, D.; Luiselli, D.; Teherani, JJ (2017). "Inferir patrones de difusión de cuentos populares utilizando datos genómicos". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 114 (34): 9140–9145. Código Bib : 2017PNAS..114.9140B. doi : 10.1073/pnas.1614395114 . PMC 5576778 . PMID 28784786.
^ Guigó, R.; Muchnik, I.; Smith, TF (1996). "Reconstrucción de la filogenia molecular antigua". Filogenética molecular y evolución . 6 (2): 189–213. Bibcode :1996MolPE...6..189G. doi : 10.1006/mpev.1996.0071 . PMID 8899723.
^ Page, RD; Cotton, JA (2002). "Filogenómica de vertebrados: árboles reconciliados y duplicaciones de genes". Simposio del Pacífico sobre Bioinformática. Simposio del Pacífico sobre Bioinformática : 536–547. doi :10.1142/9789812799623_0050. ISBN978-981-02-4777-5. Número de identificación personal 11928506. Número de identificación personal 5638166.
^ Burleigh, JG; Bansal, MS; Wehe, A.; Eulenstein, O. (2009). "Localización de eventos de duplicación de genes a gran escala a través de árboles reconciliados: implicaciones para la identificación de eventos de poliploidía antiguos en plantas". Journal of Computational Biology . 16 (8): 1071–1083. doi :10.1089/cmb.2009.0139. PMID 19689214.
^ Bansal, MS; Eulenstein, O. (2008). "El problema de la duplicación múltiple de genes revisitado". Bioinformática . 24 (13): i132-8. doi :10.1093/bioinformatics/btn150. PMC 2718628 . PMID 18586705.
^ Michael R. Fellows, Michael T. Hallet y Ulrike Stege. 1998. On the Multiple Gene Duplication Problem. En Actas del 9º Simposio Internacional sobre Algoritmos y Computación (ISAAC '98). Springer-Verlag, Berlín, Heidelberg, 347–356.
^ Dondi, R.; Lafond, M.; Scornavacca, C. (2019). "Reconciliación de árboles de genes múltiples a través de duplicaciones y pérdidas segmentarias". Algoritmos para biología molecular . 14 : 7. doi : 10.1186/s13015-019-0139-6 . PMC 6425616 . PMID 30930955.
^ Bansal, MS; Banay, G.; Gogarten, JP; Shamir, R. (2011). "Detección de autopistas de transferencia horizontal de genes". Revista de Biología Computacional . 18 (9): 1087–1114. doi :10.1089/cmb.2011.0066. hdl : 1721.1/69855 . PMID 21899418.
^ Kloub, L.; Gosselin, S.; Fullmer, M.; Graf, J.; Gogarten, JP; Bansal, MS (2021). "Detección sistemática de transferencia horizontal multigénica a gran escala en procariotas". Biología molecular y evolución . 38 (6): 2639–2659. doi :10.1093/molbev/msab043. PMC 8136488 . PMID 33565580.
^ Scornavacca, C.; Mayol JCP; Cardona, G. (2017). "Algoritmo rápido para la reconciliación de árboles genéticos y redes LGT" (PDF) . Journal of Theoretical Biology . 418 : 129–137. Bibcode :2017JThBi.418..129S. doi :10.1016/j.jtbi.2017.01.024. PMID 28111320. S2CID 37447907.
^ Yu, Y.; Ristic, N.; Nakhleh, L. (2013). "Algoritmos rápidos y heurísticas para filogenómica bajo ILS e hibridación". BMC Bioinformatics . 14 (Supl 15): S6. doi : 10.1186/1471-2105-14-S15-S6 . PMC 3852049 . PMID 24564257.
^ Yu, Y.; Barnett, RM; Nakhleh, L. (2013). "Inferencia parsimoniosa de hibridación en presencia de clasificación de linaje incompleta". Biología sistemática . 62 (5): 738–751. doi :10.1093/sysbio/syt037. PMC 3739885 . PMID 23736104.
^ Nieberding, CM; Durette-Desset, MC; Vanderpoorten, A.; Casanova, JC; Ribas, A.; Deffontaine, V.; Feliu, C.; Morand, S.; Libois, R.; Michaux, JR (2008). "La geografía y la biogeografía del hospedador son importantes para comprender la filogeografía de un parásito". Filogenética molecular y evolución . 47 (2): 538–554. Bibcode :2008MolPE..47..538N. doi :10.1016/j.ympev.2008.01.028. hdl : 2268/9909 . PMID 18346916.
^ Martínez-Aquino, A.; Ceccarelli, FS; Eguiarte, LE; Vázquez-Domínguez, E.; De León, GP (2014). "¿La biogeografía histórica y la historia evolutiva de la digenea Margotrema SPP. En todo el centro de México reflejan las de sus peces huéspedes de agua dulce (Goodeinae)?". MÁS UNO . 9 (7): e101700. Código Bib : 2014PLoSO...9j1700M. doi : 10.1371/journal.pone.0101700 . PMC 4084993 . PMID 24999998.
^ Weckstein, JD (2004). "La biogeografía explica los patrones cofilogenéticos en los piojos masticadores del tucán". Biología sistemática . 53 (1): 154–164. doi : 10.1080/10635150490265085 . PMID 14965910.
^ Fountain, ED; Pauli, JN; Mendoza, JE; Carlson, J.; Peery, MZ (2017). "La cofilogenética y la biogeografía revelan una relación coevolutiva entre los perezosos y sus algas simbiontes". Filogenética molecular y evolución . 110 : 73–80. Bibcode :2017MolPE.110...73F. doi : 10.1016/j.ympev.2017.03.003 . PMID 28288943.
^ Groussin, M.; Mazel, F.; Sanders, JG; Smillie, CS; Lavergne, S.; Thuiller, W.; Alm, EJ (2017). "Descifrando los procesos que moldean los microbiomas intestinales de los mamíferos a lo largo del tiempo evolutivo". Nature Communications . 8 : 14319. Bibcode :2017NatCo...814319G. doi :10.1038/ncomms14319. PMC 5331214 . PMID 28230052.
^ Berry, V.; Chevenet, F.; Doyon, JP; Jousselin, E. (2018). "Un método de reconciliación que tiene en cuenta la geografía para investigar los patrones de diversificación en las interacciones huésped/parásito". Recursos de ecología molecular . 18 (5): 1173–1184. doi :10.1111/1755-0998.12897. PMID 29697894. S2CID 25758856.
^ Wu, YC; Rasmussen, MD; Kellis, M. (2012). "Evolución a nivel de subgen: reordenamientos de dominios en la filogenia de Drosophila". Biología molecular y evolución . 29 (2): 689–705. doi :10.1093/molbev/msr222. PMC 3258039 . PMID 21900599.
^ ab Stolzer, M.; Siewert, K.; Lai, H.; Xu, M.; Durand, D. (2015). "Inferencia de eventos en familias multidominio con reconciliación filogenética". BMC Bioinformatics . 16 (Supl 14): S8. doi : 10.1186/1471-2105-16-S14-S8 . PMC 4610023 . PMID 26451642.
^ ab Li, L.; Bansal, MS (2019). "Un marco de reconciliación integrado para la evolución a nivel de dominio, gen y especie". Transacciones IEEE/ACM sobre biología computacional y bioinformática . 16 (1): 63–76. doi : 10.1109/TCBB.2018.2846253 . PMID 29994126. S2CID 51614715.
^ Li, Lei; Bansal, Mukul S. (2018). "Una solución de programación lineal entera para el problema de reconciliación dominio-gen-especie". Actas de la Conferencia internacional ACM de 2018 sobre bioinformática, biología computacional e informática de la salud . págs. 386–397. doi :10.1145/3233547.3233603. ISBN9781450357944.S2CID 49426403 .
^ Li, Lei; Bansal, Mukul S. (2019). "Reconciliación simultánea de múltiples dominios y múltiples genes según el modelo de reconciliación de dominios, genes y especies". Investigación y aplicaciones en bioinformática . Apuntes de clase en informática. Vol. 11490. págs. 73–86. doi :10.1007/978-3-030-20242-2_7. ISBN978-3-030-20241-5.S2CID85507475 .
^ Kundu, S.; Bansal, MS (2019). "SaGePhy: Un marco de simulación filogenética mejorado para la evolución de genes y subgenes". Bioinformática . 35 (18): 3496–3498. doi :10.1093/bioinformatics/btz081. PMID 30715213.
^ Muhammad, Sayyed Auwn; Sennblad, Bengt; Lagergren, Jens (2018). "Reconstrucción simultánea de la evolución de genes y dominios teniendo en cuenta el árbol de especies". doi :10.1101/336453. S2CID 90627553.{{cite journal}}: Requiere citar revista |journal=( ayuda )
^ Bailly-Bechet, M.; Martins-Simões, P.; Szöllosi, GJ; Mialdea, G.; Sagot, MF; Charlat, S. (2017). "¿Cuánto tiempo permanece Wolbachia a bordo?". Biología molecular y evolución . 34 (5): 1183–1193. doi : 10.1093/molbev/msx073 . PMID 28201740.
^ "Diva". 26 de abril de 2013. Consultado el 21 de noviembre de 2022 .
^ "Lagrange" . Consultado el 21 de noviembre de 2022 .
^ "BioGeoBEARS" . Consultado el 21 de noviembre de 2022 .
^ "Jane" . Consultado el 21 de noviembre de 2022 .
^ "eMPRess" . Consultado el 21 de noviembre de 2022 .
^ "Eucalipto". 28 de julio de 2014. Consultado el 21 de noviembre de 2022 .
^ "Carpincho" . Consultado el 21 de noviembre de 2022 .
^ "Coala". 28 de julio de 2014. Consultado el 21 de noviembre de 2022 .
^ "RANGER-DTL". 31 de mayo de 2018. Consultado el 21 de noviembre de 2022 .
^ "Notung" . Consultado el 21 de noviembre de 2022 .
^ "Mowgli" . Consultado el 21 de noviembre de 2022 .
^ "Sylvx" . Consultado el 21 de noviembre de 2022 .
^ "AnGST" . Consultado el 21 de noviembre de 2022 .
^ Código disponible en Github
^ "ecceTERA". GitHub . 21 de septiembre de 2021 . Consultado el 21 de noviembre de 2022 .
^ "ALE". GitHub . 4 de octubre de 2022 . Consultado el 21 de noviembre de 2022 .
^ "Treerecs: conciliación filogenética rápida, versátil y fácil de usar" . Consultado el 20 de diciembre de 2022 .
^ "GeneRax". GitHub . 8 de septiembre de 2022 . Consultado el 20 de diciembre de 2022 .
^ "PHYLDOG: reconstrucción conjunta de filogenias de especies y genes". pbil.univ-lyon1.fr (en francés) . Consultado el 20 de diciembre de 2022 .
^ "Universidad de Leipzig - Facultad de Matemáticas e Informática - Grupo de Inteligencia de Enjambre y Sistemas Complejos". pacosy.informatik.uni-leipzig.de . Consultado el 20 de diciembre de 2022 .
^ "Universität Leipzig - Fakultät für Mathematik und Informatik - Professur für Schwarmintelligenz und Komplexe Systeme". pacosy.informatik.uni-leipzig.de . Consultado el 20 de diciembre de 2022 .
^ Arvestad, Lars (6 de septiembre de 2021). "Acerca de JPrimE". GitHub . Consultado el 20 de diciembre de 2022 .
^ Orlando, Echevarría (31 de mayo de 2018). «SEADOG | Laboratorio de investigación en biología computacional». compbio.engr.uconn.edu . Consultado el 20 de diciembre de 2022 .
^ "iGTP Home". Laboratorio de Biología Computacional . Consultado el 20 de diciembre de 2022 .
^ Mukul, Bansal (26 de noviembre de 2018). "TreeSolve | Laboratorio de investigación en biología computacional". compbio.engr.uconn.edu .
^ "TreeFix". www.cs.hmc.edu . Consultado el 20 de diciembre de 2022 .
^ "TreeFix-DTL". www.cs.hmc.edu . Consultado el 20 de diciembre de 2022 .
^ Mukul, Bansal (26 de noviembre de 2018). "ARTra: Inferencia de transferencia aditiva y de reemplazo | Laboratorio de investigación en biología computacional". compbio.engr.uconn.edu . Consultado el 20 de diciembre de 2022 .
^ "DLCoal: Modelado de duplicaciones, pérdidas y coalescencia de genes". compbio.mit.edu . Consultado el 20 de diciembre de 2022 .
^ "Inicio · Wiki de simonpenel/thirdkind". GitHub . Consultado el 20 de diciembre de 2022 .
Enlaces externos
Scholia tiene un perfil de reconciliación filogenética (Q107328955).
Medios relacionados con Reconciliación filogenética en Wikimedia Commons