stringtranslate.com

Inferencia bayesiana en filogenia

La inferencia bayesiana de filogenia combina la información en la probabilidad anterior y de los datos para crear la llamada probabilidad posterior de los árboles, que es la probabilidad de que el árbol sea correcto dados los datos, el modelo anterior y el de probabilidad. La inferencia bayesiana fue introducida en la filogenética molecular en la década de 1990 por tres grupos independientes: Bruce Rannala y Ziheng Yang en Berkeley, [1] [2] Bob Mau en Madison, [3] y Shuying Li en la Universidad de Iowa, [4] el último dos de ellos eran estudiantes de doctorado en ese momento. El enfoque se ha vuelto muy popular desde el lanzamiento del software MrBayes en 2001, [5] y ahora es uno de los métodos más populares en filogenética molecular.

Inferencia bayesiana de antecedentes y bases de la filogenia.

Teorema de Bayes
Metáfora que ilustra los pasos del método MCMC

La inferencia bayesiana se refiere a un método probabilístico desarrollado por el reverendo Thomas Bayes basado en el teorema de Bayes . Publicado póstumamente en 1763, fue la primera expresión de probabilidad inversa y la base de la inferencia bayesiana. De forma independiente, sin conocer el trabajo de Bayes, Pierre-Simon Laplace desarrolló el teorema de Bayes en 1774. [6]

La inferencia bayesiana o el método de probabilidad inversa fue el enfoque estándar en el pensamiento estadístico hasta principios del siglo XX, antes de que RA Fisher desarrollara lo que ahora se conoce como la inferencia clásica/frecuentista/Fisheriana. Las dificultades computacionales y las objeciones filosóficas habían impedido la adopción generalizada del enfoque bayesiano hasta la década de 1990, cuando los algoritmos Markov Chain Monte Carlo (MCMC) revolucionaron la computación bayesiana.

El enfoque bayesiano de la reconstrucción filogenética combina la probabilidad previa de un árbol P(A) con la probabilidad de que los datos (B) produzcan una distribución de probabilidad posterior en los árboles P(A|B). [7] La ​​probabilidad posterior de un árbol será la probabilidad de que el árbol sea correcto, dado el anterior, los datos y la corrección del modelo de probabilidad.

Los métodos MCMC se pueden describir en tres pasos: primero, utilizando un mecanismo estocástico, se propone un nuevo estado para la cadena de Markov . En segundo lugar, se calcula la probabilidad de que este nuevo estado sea correcto. En tercer lugar, se propone una nueva variable aleatoria (0,1). Si este nuevo valor es menor que la probabilidad de aceptación, se acepta el nuevo estado y se actualiza el estado de la cadena. Este proceso se ejecuta miles o millones de veces. El número de veces que se visita un árbol durante el transcurso de la cadena es una aproximación de su probabilidad posterior. Algunos de los algoritmos más comunes utilizados en los métodos MCMC incluyen los algoritmos Metropolis-Hastings, Metropolis-Coupling MCMC (MC³) y el algoritmo LOCAL de Larget y Simon.

Algoritmo de Metrópolis-Hastings

Uno de los métodos MCMC más comunes utilizados es el algoritmo Metropolis-Hastings , [8] una versión modificada del algoritmo Metropolis original. [9] Es un método ampliamente utilizado para tomar muestras aleatorias de probabilidades de distribución complicadas y multidimensionales. El algoritmo Metropolis se describe en los siguientes pasos: [10] [11]

  1. Se selecciona aleatoriamente un árbol inicial, Ti .
  2. Se selecciona un árbol vecino, Tj , de la colección de árboles.
  3. La relación, R, de las probabilidades (o funciones de densidad de probabilidad) de T j y Ti se calcula de la siguiente manera: R = f(T j )/f(T i )
  4. Si R ≥ 1, se acepta T j como el árbol actual.
  5. Si R < 1, se acepta T j como el árbol actual con probabilidad R; de lo contrario, se mantiene Ti .
  6. En este punto se repite el proceso desde el Paso 2 N veces.

El algoritmo continúa ejecutándose hasta que alcanza una distribución de equilibrio. También supone que la probabilidad de proponer un nuevo árbol T j cuando estamos en el estado del árbol antiguo T i es la misma probabilidad de proponer T i cuando estamos en T j . Cuando este no es el caso, se aplican las correcciones de Hastings. El objetivo del algoritmo de Metropolis-Hastings es producir una colección de estados con una distribución determinada hasta que el proceso de Markov alcance una distribución estacionaria. El algoritmo tiene dos componentes:

  1. Una transición potencial de un estado a otro (i → j) utilizando una función de probabilidad de transición q i,j
  2. Movimiento de la cadena al estado j con probabilidad α i,j y permanece en i con probabilidad 1 – α i,j . [2]

MCMC acoplado a Metropolis

El algoritmo MCMC acoplado a Metropolis (MC³) [12] se ha propuesto para resolver un problema práctico de que la cadena de Markov se mueva a través de picos cuando la distribución objetivo tiene múltiples picos locales, separados por valles bajos, que se sabe que existen en el espacio del árbol. Este es el caso durante la búsqueda de árbol heurístico bajo los criterios de máxima parsimonia (MP), máxima verosimilitud (ML) y mínima evolución (ME), y se puede esperar lo mismo para la búsqueda de árbol estocástico utilizando MCMC. Este problema dará como resultado que las muestras no se aproximan correctamente a la densidad posterior. El (MC³) mejora la mezcla de cadenas de Markov en presencia de múltiples picos locales en la densidad posterior. Ejecuta múltiples (m) cadenas en paralelo, cada una durante n iteraciones y con diferentes distribuciones estacionarias , donde la primera es la densidad objetivo, mientras que se eligen para mejorar la mezcla. Por ejemplo, se puede elegir calentamiento incremental de la forma:

de modo que la primera cadena sea la cadena de frío con la densidad objetivo correcta, mientras que las cadenas son cadenas calentadas. Tenga en cuenta que aumentar la densidad a la potencia tiene el efecto de aplanar la distribución, similar a calentar un metal. En tal distribución, es más fácil atravesar entre picos (separados por valles) que en la distribución original. Después de cada iteración, se propone un intercambio de estados entre dos cadenas elegidas aleatoriamente mediante un paso tipo Metropolis. Sea el estado actual en la cadena ,. Se acepta un intercambio entre los estados de las cadenas y con probabilidad:

Al final del proceso, se utilizan únicamente los productos de la cadena de frío, mientras que los de las cadenas calientes se descartan. Heurísticamente, las cadenas calientes visitarán los picos locales con bastante facilidad, y el intercambio de estados entre cadenas permitirá que la cadena fría salte valles ocasionalmente, lo que conducirá a una mejor mezcla. Sin embargo, si es inestable, rara vez se aceptarán los cambios propuestos. Ésta es la razón por la que se utilizan varias cadenas que se diferencian sólo de forma incremental.

Una desventaja obvia del algoritmo es que se ejecutan cadenas y solo se utiliza una cadena para la inferencia. Por esta razón, es ideal para su implementación en máquinas paralelas, ya que cada cadena generalmente requerirá la misma cantidad de cálculo por iteración.

Algoritmo LOCAL de Larget y Simon

Los algoritmos LOCAL [13] ofrecen una ventaja computacional sobre los métodos anteriores y demuestran que un enfoque bayesiano es capaz de evaluar la incertidumbre de manera computacional práctica en árboles más grandes. El algoritmo LOCAL es una mejora del algoritmo GLOBAL presentado en Mau, Newton y Larget (1999) [14] en el que todas las longitudes de las ramas cambian en cada ciclo. El algoritmo LOCAL modifica el árbol seleccionando una rama interna del árbol al azar. Los nodos en los extremos de esta rama están conectados cada uno a otras dos ramas. Se elige uno de cada par al azar. Imagine tomar estos tres bordes seleccionados y encadenarlos como un tendedero de izquierda a derecha, donde la dirección (izquierda/derecha) también se selecciona al azar. Los dos puntos finales de la primera rama seleccionada tendrán un subárbol colgando como una prenda de vestir atada a la línea. El algoritmo procede multiplicando las tres ramas seleccionadas por una cantidad aleatoria común, similar a estirar o encoger el tendedero. Finalmente, el extremo izquierdo de los dos subárboles colgantes se desconecta y se vuelve a unir al tendedero en una ubicación seleccionada uniformemente al azar. Este sería el árbol candidato.

Supongamos que comenzamos seleccionando la rama interna con longitud que separa a los taxones del resto. Supongamos también que hemos seleccionado (al azar) ramas con longitudes y de cada lado, y que orientamos estas ramas. Sea , la longitud actual del tendedero. Seleccionamos la nueva longitud como , donde hay una variable aleatoria uniforme en . Luego, para el algoritmo LOCAL, la probabilidad de aceptación se puede calcular como:

Evaluación de la convergencia

Para estimar la longitud de una rama de un árbol de 2 taxones bajo JC, en el que los sitios no varían y son variables, suponga una distribución previa exponencial con tasa . La densidad es . Las probabilidades de los posibles patrones de sitio son:

para sitios invariables, y

Por tanto, la distribución posterior no normalizada es:

o, alternativamente,

Actualice la longitud de la rama eligiendo un nuevo valor uniformemente al azar desde una ventana de medio ancho centrada en el valor actual:

donde se distribuye uniformemente entre y . La probabilidad de aceptación es:

Ejemplo: , . Compararemos los resultados de dos valores de , y . En cada caso, comenzaremos con una duración inicial de y actualizaremos los tiempos de duración.

Máxima parsimonia y máxima verosimilitud

Relaciones filogenéticas del tigre, valores de arranque mostrados en ramas.
Ejemplo de atracción de rama larga . Las ramas más largas (A y C) parecen estar más estrechamente relacionadas. 

Hay muchos enfoques para reconstruir árboles filogenéticos, cada uno con ventajas y desventajas, y no existe una respuesta sencilla a "¿cuál es el mejor método?". La máxima parsimonia (MP) y la máxima verosimilitud (ML) son métodos tradicionales ampliamente utilizados para la estimación de filogenias y ambos utilizan información de caracteres directamente, como lo hacen los métodos bayesianos.

La Máxima Parsimonia recupera uno o más árboles óptimos en base a una matriz de caracteres discretos para un determinado grupo de taxones y no requiere un modelo de cambio evolutivo. MP ofrece la explicación más simple para un conjunto de datos determinado, reconstruyendo un árbol filogenético que incluye la menor cantidad posible de cambios en las secuencias. El soporte de las ramas de los árboles está representado por el porcentaje de arranque . Por la misma razón que ha sido ampliamente utilizado, su simplicidad, MP también ha recibido críticas y ha sido relegado a un segundo plano por los métodos ML y Bayesianos. MP presenta varios problemas y limitaciones. Como lo muestra Felsenstein (1978), MP podría ser estadísticamente inconsistente, [15] lo que significa que a medida que se acumulan más y más datos (por ejemplo, longitud de secuencia), los resultados pueden converger en un árbol incorrecto y conducir a una atracción de ramas largas , un fenómeno filogenético donde Los taxones con ramas largas (numerosos cambios de estado de carácter) tienden a parecer más estrechamente relacionados en la filogenia de lo que realmente están. Para los datos morfológicos, estudios de simulación recientes sugieren que la parsimonia puede ser menos precisa que los árboles construidos utilizando enfoques bayesianos, [16] potencialmente debido a una sobreprecisión, [17] aunque esto ha sido cuestionado. [18] Los estudios que utilizan nuevos métodos de simulación han demostrado que las diferencias entre los métodos de inferencia resultan de la estrategia de búsqueda y el método de consenso empleados, más que de la optimización utilizada. [19]

Como ocurre con la máxima parsimonia, la máxima probabilidad evaluará árboles alternativos. Sin embargo, considera la probabilidad de que cada árbol explique los datos dados en función de un modelo de evolución. En este caso, se elige el árbol con mayor probabilidad de explicar los datos sobre los demás. [20] En otras palabras, compara cómo diferentes árboles predicen los datos observados. La introducción de un modelo de evolución en los análisis de ML presenta una ventaja sobre MP ya que se tienen en cuenta la probabilidad de sustituciones de nucleótidos y las tasas de estas sustituciones, explicando las relaciones filogenéticas de los taxones de una manera más realista. Una consideración importante de este método es la longitud de la rama, que la parsimonia ignora, siendo más probable que se produzcan cambios en las ramas largas que en las cortas. Este enfoque podría eliminar la atracción de ramas largas y explicar la mayor consistencia de ML sobre MP. Aunque muchos lo consideran el mejor enfoque para inferir filogenias desde un punto de vista teórico, el ML requiere un uso computacional intensivo y es casi imposible explorar todos los árboles porque hay demasiados. La inferencia bayesiana también incorpora un modelo de evolución y las principales ventajas sobre MP y ML son que es computacionalmente más eficiente que los métodos tradicionales, cuantifica y aborda la fuente de incertidumbre y es capaz de incorporar modelos complejos de evolución.

Escollos y controversias

software MrBayes

MrBayes es una herramienta de software gratuita que realiza la inferencia bayesiana de la filogenia. Fue escrito originalmente por John P. Huelsenbeck y Frederik Ronquist en 2001. [28] A medida que los métodos bayesianos aumentaron en popularidad, MrBayes se convirtió en uno de los software elegidos por muchos filogenetistas moleculares. Se ofrece para los sistemas operativos Macintosh, Windows y UNIX y tiene una interfaz de línea de comandos. El programa utiliza el algoritmo MCMC estándar, así como la variante MCMC acoplada a Metropolis. MrBayes lee matrices alineadas de secuencias (ADN o aminoácidos) en el formato estándar NEXUS . [29]

MrBayes utiliza MCMC para aproximar las probabilidades posteriores de los árboles. [9] El usuario puede cambiar los supuestos del modelo de sustitución, los antecedentes y los detalles del análisis MC³. También permite al usuario eliminar y agregar taxones y caracteres al análisis. El programa incluye, entre varios modelos de nucleótidos, el modelo más estándar de sustitución de ADN, el 4x4, también llamado JC69, que supone que los cambios entre nucleótidos ocurren con la misma probabilidad. [30] También implementa una serie de modelos 20x20 de sustitución de aminoácidos y modelos de codones de sustitución de ADN. Ofrece diferentes métodos para relajar la suposición de tasas de sustitución iguales entre sitios de nucleótidos. [31] MrBayes también es capaz de inferir estados ancestrales que se adaptan a la incertidumbre del árbol filogenético y los parámetros del modelo.

MrBayes 3 [32] fue una versión completamente reorganizada y reestructurada del MrBayes original. La principal novedad fue la capacidad del software para adaptarse a la heterogeneidad de conjuntos de datos. Este nuevo marco permite al usuario mezclar modelos y aprovechar la eficiencia del análisis MCMC bayesiano cuando se trata de diferentes tipos de datos (por ejemplo, proteínas, nucleótidos y morfológicos). Utiliza el MCMC Metropolis-Coupling de forma predeterminada.

MrBayes 3.2 se lanzó en 2012 [33] La nueva versión permite a los usuarios ejecutar múltiples análisis en paralelo. También proporciona cálculos de probabilidad más rápidos y permite delegar estos cálculos a unidades de procesamiento de gráficos (GPU). La versión 3.2 proporciona opciones de salida más amplias compatibles con FigTree y otros visores de árboles.

Lista de software de filogenética

Esta tabla incluye algunos de los programas filogenéticos más comunes utilizados para inferir filogenias bajo un marco bayesiano. Algunos de ellos no utilizan métodos exclusivamente bayesianos.

Aplicaciones

La inferencia bayesiana ha sido ampliamente utilizada por los filogenetistas moleculares para una gran cantidad de aplicaciones. Algunos de estos incluyen:

Cronograma obtenido a partir del análisis de reloj molecular utilizando BEAST. El gráfico circular en cada nodo indica las posibles distribuciones ancestrales inferidas del análisis MCMC binario bayesiano (BBM)

Referencias

  1. ^ Rannala, Bruce; Yang, Ziheng (septiembre de 1996). "Distribución de probabilidad de árboles evolutivos moleculares: un nuevo método de inferencia filogenética". Revista de evolución molecular . 43 (3): 304–311. Código Bib : 1996JMolE..43..304R. doi :10.1007/BF02338839. PMID  8703097. S2CID  8269826.
  2. ^ ab Yang, Z.; Rannala, B. (1 de julio de 1997). "Inferencia filogenética bayesiana utilizando secuencias de ADN: un método Monte Carlo de cadena de Markov". Biología Molecular y Evolución . 14 (7): 717–724. doi : 10.1093/oxfordjournals.molbev.a025811 . PMID  9214744.
  3. ^ Mau, Bob; Newton, Michael A.; Larget, Bret (marzo de 1999). "Inferencia filogenética bayesiana mediante métodos de Monte Carlo de cadena de Markov". Biometría . 55 (1): 1–12. doi : 10.1111/j.0006-341x.1999.00001.x . JSTOR  2533889. PMID  11318142. S2CID  932887.
  4. ^ Li, Shuying; Perla, Dennis K.; Doss, Hani (junio de 2000). "Construcción de árboles filogenéticos utilizando la cadena de Markov Monte Carlo". Revista de la Asociación Estadounidense de Estadística . 95 (450): 493–508. doi :10.1080/01621459.2000.10474227. JSTOR  2669394. S2CID  122459537.
  5. ^ Huelsenbeck, JP; Ronquist, F. (1 de agosto de 2001). "MRBAYES: inferencia bayesiana de árboles filogenéticos". Bioinformática . 17 (8): 754–755. doi : 10.1093/bioinformática/17.8.754 . PMID  11524383.
  6. ^ Laplace P (1774). "Memoire sur la Probabilité des Causes par les Evenements". L'Académie Royale des Sciences . 6 : 621–656. NAID  10010866843.Traducción al inglés de Stigler SM (1986). "Memoria sobre la probabilidad de las causas de los acontecimientos". Ciencia estadística . 1 (3): 359–378. doi : 10.1214/ss/1177013620 .
  7. ^ Nascimento, Fabricia F.; Reis, Mario dos; Yang, Ziheng (octubre de 2017). "Una guía del biólogo para el análisis filogenético bayesiano". Ecología y evolución de la naturaleza . 1 (10): 1446-1454. Código Bib : 2017NatEE...1.1446N. doi :10.1038/s41559-017-0280-x. PMC 5624502 . PMID  28983516. 
  8. ^ Hastings WK (abril de 1970). "Métodos de muestreo de Monte Carlo utilizando cadenas de Markov y sus aplicaciones". Biometrika . 57 (1): 97-109. Código bibliográfico : 1970Bimka..57...97H. doi :10.1093/biomet/57.1.97.
  9. ^ ab Metropolis N, Rosenbluth AW, Rosenbluth MN, Teller AH, Teller E (junio de 1953). "Cálculos de ecuaciones de estado mediante máquinas informáticas rápidas". La Revista de Física Química . 21 (6): 1087–92. Código bibliográfico : 1953JChPh..21.1087M. doi :10.1063/1.1699114. OSTI  4390578. S2CID  1046577.
  10. ^ Felsenstein J (2004). Inferir filogenias . Sunderland, Massachusetts: Sinauer Associates.
  11. ^ Yang Z (2014). Evolución molecular: un enfoque estadístico . Oxford, Inglaterra: Oxford University Press.
  12. ^ Geyer CJ (1991). "Máxima probabilidad de la cadena de Markov Montecarlo". En Keramidas EM, Kaufman SM (eds.). Ciencias de la Computación y Estadística: Actas del 23º Simposio sobre la Interfaz . Estación Fairfax: Fundación Interface. págs. 156-163. OCLC  26603816.
  13. ^ Larget B, Simon DL (junio de 1999). "Algoritmos de Monte Carlo de la cadena de Markov para el análisis bayesiano de árboles filogenéticos". Biología Molecular y Evolución . 16 (6): 750–9. doi : 10.1093/oxfordjournals.molbev.a026160 .
  14. ^ Mau B, Newton MA, Larget B (marzo de 1999). "Inferencia filogenética bayesiana mediante métodos de Monte Carlo de la cadena de Markov". Biometría . 55 (1): 1–12. doi : 10.1111/j.0006-341x.1999.00001.x . PMID  11318142. S2CID  932887.
  15. ^ Felsenstein J (diciembre de 1978). "Casos en los que los métodos de parsimonia o compatibilidad serán positivamente engañosos". Zoología Sistemática . 27 (4): 401–10. doi : 10.1093/sysbio/27.4.401.
  16. ^ Castorani MC, Reed DC, Raimondi PT, Alberto F, Bell TW, Cavanaugh KC y col. (Enero de 2017). "Las fluctuaciones en la fecundidad de la población impulsan la variación en la conectividad demográfica y la dinámica de la metapoblación". Actas. Ciencias Biologicas . 284 (1847): 20162086. doi :10.1098/rspb.2016.2086. PMC 5310032 . PMID  28123088. 
  17. ^ O'Reilly JE, Puttick MN, Parry L, Tanner AR, Tarver JE, Fleming J, Pisani D, Donoghue PC (abril de 2016). "Los métodos bayesianos superan a la parsimonia pero a expensas de la precisión en la estimación de la filogenia a partir de datos morfológicos discretos". Cartas de biología . 12 (4): 20160081. doi :10.1098/rsbl.2016.0081. PMC 4881353 . PMID  27095266. 
  18. ^ Goloboff PA, Torres A, Arias JS (2018). "La parsimonia ponderada supera a otros métodos de inferencia filogenética bajo modelos apropiados para la morfología". Cladística . 34 (4): 407–437. doi : 10.1111/cla.12205 . ISSN  0748-3007. PMID  34649370.
  19. ^ Keating JN, Sansom RS, Sutton MD, Knight CG, Garwood RJ (febrero de 2020). "Filogenética morfológica evaluada mediante novedosas simulaciones evolutivas". Biología Sistemática . 69 (5): 897–912. doi : 10.1093/sysbio/syaa012 . PMC 7440746 . PMID  32073641. 
  20. ^ Swofford DL, Olsen GJ, Waddell PJ, Hillis DM (1996). "Inferencia filogenética". En Hillis DM, Moritz C, Mable BK (eds.). Sistemática Molecular, 2ª edición . Sunderland, MA: Sinauer. págs. 407–514. ISBN 9780878932825.
  21. ^ ab Suzuki Y, Glazko GV, Nei M (diciembre de 2002). "Sobrecredibilidad de las filogenias moleculares obtenidas por la filogenética bayesiana". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 99 (25): 16138–43. Código bibliográfico : 2002PNAS...9916138S. doi : 10.1073/pnas.212646199 . PMC 138578 . PMID  12451182. 
  22. ^ Alfaro ME, Zoller S, Lutzoni F (febrero de 2003). "¿Bayes o bootstrap? Un estudio de simulación que compara el rendimiento del muestreo Monte Carlo de la cadena bayesiana de Markov y el bootstrapping en la evaluación de la confianza filogenética". Biología Molecular y Evolución . 20 (2): 255–66. doi : 10.1093/molbev/msg028 . PMID  12598693.
  23. ^ Douady CJ, Delsuc F, Boucher Y, Doolittle WF, Douzery EJ (febrero de 2003). "Comparación de medidas de arranque bayesianas y de máxima probabilidad de confiabilidad filogenética". Biología Molecular y Evolución . 20 (2): 248–54. doi : 10.1093/molbev/msg042 . PMID  12598692.
  24. García-Sandoval R (enero de 2014). "Por qué algunos clados tienen frecuencias de arranque bajas y probabilidades posteriores bayesianas altas". Revista Israel de Ecología y Evolución . 60 (1): 41–4. doi :10.1080/15659801.2014.937900.
  25. ^ Yang, Z. (18 de abril de 2007). "Paradoja del equilibrio justo, paradoja del árbol estrella y filogenética bayesiana". Biología Molecular y Evolución . 24 (8): 1639-1655. doi : 10.1093/molbev/msm081 . PMID  17488737.
  26. ^ Yang, Ziheng; Zhu, Tianqi (20 de febrero de 2018). "La selección bayesiana de modelos mal especificados es demasiado segura y puede causar probabilidades posteriores falsas en árboles filogenéticos". Procedimientos de la Academia Nacional de Ciencias . 115 (8): 1854–1859. Código Bib : 2018PNAS..115.1854Y. doi : 10.1073/pnas.1712673115 . PMC 5828583 . PMID  29432193. 
  27. ^ Erixon P, Svennblad B, Britton T, Oxelman B (octubre de 2003). "Fiabilidad de las probabilidades posteriores bayesianas y frecuencias de arranque en filogenética". Biología Sistemática . 52 (5): 665–73. doi : 10.1080/10635150390235485 . PMID  14530133.
  28. ^ Huelsenbeck JP, Ronquist F (agosto de 2001). "MRBAYES: inferencia bayesiana de árboles filogenéticos". Bioinformática . Oxford, Inglaterra. 17 (8): 754–5. doi : 10.1093/bioinformática/17.8.754 . PMID  11524383.
  29. ^ Maddison DR, Swofford DL, Maddison WP (diciembre de 1997). "NEXUS: un formato de archivo extensible para información sistemática". Biología Sistemática . 46 (4): 590–621. doi : 10.1093/sysbio/46.4.590 . PMID  11975335.
  30. ^ Jukes TH, Cantor CR (1969). Evolución de las Moléculas de Proteínas . Nueva York: Academic Press. págs. 21-132.
  31. ^ Yang Z (noviembre de 1993). "Estimación de máxima verosimilitud de la filogenia a partir de secuencias de ADN cuando las tasas de sustitución difieren según los sitios". Biología Molecular y Evolución . 10 (6): 1396–401. doi : 10.1093/oxfordjournals.molbev.a040082 . PMID  8277861.
  32. ^ Ronquist F, Huelsenbeck JP (agosto de 2003). "MrBayes 3: inferencia filogenética bayesiana bajo modelos mixtos". Bioinformática . Oxford, Inglaterra. 19 (12): 1572–4. doi : 10.1093/bioinformática/btg180 . PMID  12912839.
  33. ^ Ronquist F, Teslenko M, van der Mark P, Ayres DL, Darling A, Höhna S, Larget B, Liu L, Suchard MA, Huelsenbeck JP (mayo de 2012). "MrBayes 3.2: inferencia filogenética bayesiana eficiente y elección de modelo en un gran espacio modelo". Biología Sistemática . 61 (3): 539–42. doi :10.1093/sysbio/sys029. PMC 3329765 . PMID  22357727. 
  34. ^ Drummond AJ, Suchard MA, Xie D, Rambaut A (agosto de 2012). "Filogenética bayesiana con BEAUti y BEAST 1.7". Biología Molecular y Evolución . 29 (8): 1969–73. doi :10.1093/molbev/mss075. PMC 3408070 . PMID  22367748. 
  35. ^ Bouckaert R, Heled J, Kühnert D, Vaughan T, Wu CH, Xie D, Suchard MA, Rambaut A, Drummond AJ (abril de 2014). "BEAST 2: una plataforma de software para análisis evolutivo bayesiano". PLOS Biología Computacional . 10 (4): e1003537. Código Bib : 2014PLSCB..10E3537B. doi : 10.1371/journal.pcbi.1003537 . PMC 3985171 . PMID  24722319. 
  36. ^ Lartillot N, Philippe H (junio de 2004). "Un modelo de mezcla bayesiana para heterogeneidades entre sitios en el proceso de reemplazo de aminoácidos". Biología Molecular y Evolución . 21 (6): 1095–109. doi : 10.1093/molbev/msh112 . PMID  15014145.
  37. ^ Suchard MA, Redelings BD (agosto de 2006). "BAli-Phy: inferencia bayesiana simultánea de alineación y filogenia". Bioinformática . 22 (16): 2047–8. doi : 10.1093/bioinformática/btl175 . PMID  16679334.
  38. ^ Ané C , Larget B, Baum DA, Smith SD, Rokas A (febrero de 2007). "Estimación bayesiana de la concordancia entre árboles genéticos". Biología Molecular y Evolución . 24 (2): 412–26. doi : 10.1093/molbev/msl170 . PMID  17095535.
  39. ^ Wilson IJ, Weale ME, Balding DJ (junio de 2003). "Inferencias a partir de datos de ADN: historias de poblaciones, procesos evolutivos y probabilidades de coincidencia forense". Revista de la Royal Statistical Society, Serie A (Estadística en la sociedad) . 166 (2): 155–88. doi : 10.1111/1467-985X.00264 .
  40. ^ Pagel M, Meade A (junio de 2006). "Análisis bayesiano de la evolución correlacionada de caracteres discretos mediante la cadena de Markov de salto reversible Monte Carlo". El naturalista americano . 167 (6): 808–25. doi :10.1086/503444. PMID  16685633. S2CID  205984494.
  41. ^ Lord E, Leclercq M, Boc A, Diallo AB, Makarenkov V (2012). "Armadillo 1.1: una plataforma de flujo de trabajo original para diseñar y realizar simulaciones y análisis filogenéticos". MÁS UNO . 7 (1): e29903. Código Bib : 2012PLoSO...729903L. doi : 10.1371/journal.pone.0029903 . PMC 3256230 . PMID  22253821. 
  42. ^ Milne I, Lindner D, Bayer M, Husmeier D, McGuire G, Marshall DF, Wright F (enero de 2009). "TOPALi v2: una interfaz gráfica enriquecida para análisis evolutivos de múltiples alineaciones en clústeres HPC y escritorios multinúcleo". Bioinformática . 25 (1): 126–7. doi : 10.1093/bioinformática/btn575. PMC 2638937 . PMID  18984599. 
  43. ^ Alonso R, Crawford AJ, Bermingham E (marzo de 2012). "Filogenia molecular de una radiación endémica de sapos cubanos (Bufonidae: Peltophryne) basada en genes mitocondriales y nucleares". Revista de Biogeografía . 39 (3): 434–51. Código Bib : 2012JBiog..39..434A. doi :10.1111/j.1365-2699.2011.02594.x. S2CID  4152245.
  44. Antonelli A, Sanmartín I (octubre de 2011). "¿Extinción masiva, enfriamiento gradual o radiación rápida? Reconstrucción de la evolución espaciotemporal del antiguo género de angiospermas Hedyosmum (Chloranthaceae) utilizando enfoques empíricos y simulados". Biología Sistemática . 60 (5): 596–615. doi : 10.1093/sysbio/syr062 . hdl : 10261/34829 . PMID  21856636.
  45. ^ de Villemereuil P, Wells JA, Edwards RD, Blomberg SP (junio de 2012). "Modelos bayesianos para análisis comparativo que integran la incertidumbre filogenética". Biología Evolutiva del BMC . 12 (1): 102. Código bibliográfico : 2012BMCEE..12..102V. doi : 10.1186/1471-2148-12-102 . PMC 3582467 . PMID  22741602. 
  46. ^ Ronquist F (septiembre de 2004). "Inferencia bayesiana de la evolución del carácter". Tendencias en ecología y evolución . 19 (9): 475–81. doi :10.1016/j.tree.2004.07.002. PMID  16701310.
  47. ^ Schäffer S, Koblmüller S, Pfingstl T, Sturmbauer C, Krisper G (agosto de 2010). "La reconstrucción del estado ancestral revela múltiples evoluciones independientes de caracteres morfológicos diagnósticos en el" Alto Oribatida "(Acari), en conflicto con los esquemas de clasificación actuales". Biología Evolutiva del BMC . 10 (1): 246. Código bibliográfico : 2010BMCEE..10..246S. doi : 10.1186/1471-2148-10-246 . PMC 2930640 . PMID  20701742. 
  48. ^ Filipowicz N, Renner SS (julio de 2012). "Brunfelsia (Solanaceae): un género dividido equitativamente entre América del Sur y las radiaciones en Cuba y otras islas de las Antillas". Filogenética molecular y evolución . 64 (1): 1–11. doi :10.1016/j.ympev.2012.02.026. PMID  22425729.
  49. ^ Bacon CD, Baker WJ, Simmons MP (mayo de 2012). "La dispersión del Mioceno impulsa las radiaciones insulares en la tribu de las palmeras Trachycarpeae (Arecaceae)". Biología Sistemática . 61 (3): 426–42. doi : 10.1093/sysbio/syr123 . PMID  22223444.
  50. ^ Särkinen T, Bohs L, Olmstead RG, Knapp S (septiembre de 2013). "Un marco filogenético para el estudio evolutivo de las solanáceas (Solanaceae): un árbol fechado de 1000 puntas". Biología Evolutiva del BMC . 13 (1): 214. Código bibliográfico : 2013BMCEE..13..214S. doi : 10.1186/1471-2148-13-214 . PMC 3850475 . PMID  24283922. 
  51. ^ Silvestro D, Schnitzler J, Liow LH, Antonelli A, Salamin N (mayo de 2014). "Estimación bayesiana de especiación y extinción a partir de datos incompletos de ocurrencia de fósiles". Biología Sistemática . 63 (3): 349–67. doi : 10.1093/sysbio/syu006. PMC 4361715 . PMID  24510972. 
  52. ^ Lemey P, Rambaut A, Drummond AJ, Suchard MA (septiembre de 2009). "La filogeografía bayesiana encuentra sus raíces". PLOS Biología Computacional . 5 (9): e1000520. Código Bib : 2009PLSCB...5E0520L. doi : 10.1371/journal.pcbi.1000520 . PMC 2740835 . PMID  19779555. 
  53. ^ Cybis G, Sinsheimer J, Bedford T, Mather A, Lemey P, Suchard MA (2015). "Evaluación de la correlación fenotípica a través del modelo multivariado de responsabilidad latente filogenética". Los anales de la estadística aplicada . 9 (2): 969–991. doi :10.1214/15-AOAS821. ISSN  1932-6157. PMC 4820077 . PMID  27053974. 
  54. ^ Tolkoff M, Alfaro M, Baele G, Lemey P, Suchard MA (2018). "Análisis de factores filogenéticos". Biología Sistemática . 67 (3): 384–399. doi :10.1093/sysbio/syx066. ISSN  1063-5157. PMC 5920329 . PMID  28950376. 

enlaces externos