Árbol filogenético

Un árbol filogenético , filogenia o árbol evolutivo es una representación gráfica que muestra la historia evolutiva entre un conjunto de especies o taxones durante un tiempo específico. ^[1]^[2] En otras palabras, es un diagrama de ramificación o un árbol que muestra las relaciones evolutivas entre varias especies biológicas u otras entidades basadas en similitudes y diferencias en sus características físicas o genéticas. En biología evolutiva, toda la vida en la Tierra es teóricamente parte de un solo árbol filogenético, lo que indica una ascendencia común . La filogenética es el estudio de los árboles filogenéticos. El principal desafío es encontrar un árbol filogenético que represente la ascendencia evolutiva óptima entre un conjunto de especies o taxones. La filogenética computacional (también inferencia de filogenia) se centra en los algoritmos involucrados en la búsqueda del árbol filogenético óptimo en el panorama filogenético. ^[1]^[2]

Los árboles filogenéticos pueden tener raíces o no. En un árbol filogenético con raíces , cada nodo con descendientes representa el ancestro común más reciente inferido de esos descendientes, ^[3] y las longitudes de los bordes en algunos árboles pueden interpretarse como estimaciones de tiempo. Cada nodo se denomina unidad taxonómica. Los nodos internos generalmente se denominan unidades taxonómicas hipotéticas, ya que no se pueden observar directamente. Los árboles son útiles en campos de la biología como la bioinformática , la sistemática y la filogenética . Los árboles sin raíces ilustran solo la relación de los nodos de las hojas y no requieren que se conozca o infiera la raíz ancestral.

Historia

La idea de un árbol de la vida surgió de nociones antiguas de una progresión en forma de escalera desde formas de vida inferiores a superiores (como en la Gran Cadena del Ser ). Las primeras representaciones de árboles filogenéticos "ramificados" incluyen un "diagrama paleontológico" que muestra las relaciones geológicas entre plantas y animales en el libro Geología elemental , de Edward Hitchcock (primera edición: 1840).

Charles Darwin presentó un "árbol" evolutivo esquemático en su libro El origen de las especies de 1859. Más de un siglo después, los biólogos evolucionistas todavía utilizan diagramas de árbol para representar la evolución porque estos diagramas transmiten eficazmente el concepto de que la especiación se produce a través de la división adaptativa y semialeatoria de linajes.

El término filogenético , o filogenia , deriva de las dos palabras griegas antiguas φῦλον ( phûlon ), que significa "raza, linaje", y γένεσις ( génesis ), que significa "origen, fuente". ^[4]^[5]

Propiedades

Árbol enraizado

Un árbol filogenético enraizado (ver los dos gráficos en la parte superior) es un árbol dirigido con un nodo único —la raíz— que corresponde al ancestro común más reciente (generalmente imputado ) de todas las entidades en las hojas del árbol. El nodo raíz no tiene un nodo padre, pero sirve como padre de todos los demás nodos del árbol. Por lo tanto, la raíz es un nodo de grado 2, mientras que otros nodos internos tienen un grado mínimo de 3 (donde "grado" aquí se refiere al número total de aristas entrantes y salientes). ^{[ cita requerida ]}

El método más común para enraizar árboles es el uso de un grupo externo no controvertido : lo suficientemente cercano como para permitir la inferencia a partir de datos de rasgos o secuenciación molecular, pero lo suficientemente lejano como para ser un grupo externo claro. Otro método es el enraizamiento de punto medio, o un árbol también puede enraizarse utilizando un modelo de sustitución no estacionaria . ^[6]

Árbol sin raíz

Un árbol filogenético sin raíz para la miosina , una superfamilia de proteínas ^[7]

Los árboles sin raíz ilustran la relación de los nodos de las hojas sin hacer suposiciones sobre la ascendencia. No requieren que se conozca o infiera la raíz ancestral. ^[8] Los árboles sin raíz siempre se pueden generar a partir de árboles con raíz simplemente omitiendo la raíz. Por el contrario, inferir la raíz de un árbol sin raíz requiere algún medio para identificar la ascendencia. Esto normalmente se hace incluyendo un grupo externo en los datos de entrada de modo que la raíz esté necesariamente entre el grupo externo y el resto de los taxones en el árbol, o introduciendo suposiciones adicionales sobre las tasas relativas de evolución en cada rama, como una aplicación de la hipótesis del reloj molecular . ^[9]

Bifurcación versus multifurcación

Tanto los árboles con raíz como los que no la tienen pueden ser bifurcadores o multifurcadores. Un árbol bifurcador con raíz tiene exactamente dos descendientes que surgen de cada nodo interior (es decir, forma un árbol binario ), y un árbol bifurcador sin raíz toma la forma de un árbol binario sin raíz , un árbol libre con exactamente tres vecinos en cada nodo interno. Por el contrario, un árbol multifurcador con raíz puede tener más de dos hijos en algunos nodos y un árbol multifurcador sin raíz puede tener más de tres vecinos en algunos nodos. ^{[ cita requerida ]}

Etiquetado versus no etiquetado

Tanto los árboles con raíces como los que no las tienen pueden estar etiquetados o no etiquetados. Un árbol etiquetado tiene valores específicos asignados a sus hojas, mientras que un árbol sin etiquetas, a veces llamado forma de árbol, define solo una topología. Algunos árboles basados en secuencias construidos a partir de un pequeño locus genómico, como Phylotree, ^[10] presentan nodos internos etiquetados con haplotipos ancestrales inferidos.

Enumeración de árboles

La cantidad de árboles posibles para una cantidad dada de nodos de hojas depende del tipo específico de árbol, pero siempre hay más árboles etiquetados que no etiquetados, más árboles multifurcantes que bifurcantes y más árboles enraizados que no enraizados. La última distinción es la más relevante biológicamente; surge porque hay muchos lugares en un árbol no enraizado donde poner la raíz. Para los árboles etiquetados bifurcantes, la cantidad total de árboles enraizados es:

(2n-3)!!={\frac {(2n-3)!}{2^{n-2}(n-2)!}}

para , representa el número de nodos de hoja. ^[11]

n\geq 2

n

Para árboles etiquetados bifurcados, el número total de árboles sin raíz es: ^[11]

(2n-5)!!={\frac {(2n-5)!}{2^{n-3}(n-3)!}}

para .

n\geq 3

Entre los árboles bifurcados etiquetados, el número de árboles sin raíces con hojas es igual al número de árboles con raíces con hojas. ^[2] $n$ $n-1$

El número de árboles enraizados crece rápidamente en función del número de puntas. Para 10 puntas, hay más que posibles árboles bifurcadores, y el número de árboles multifurcadores aumenta más rápido, con aproximadamente 7 veces más de estos últimos que de los primeros. $34\times 10^{6}$

Tipos especiales de árboles

Dendrograma

Un dendrograma es un nombre general para un árbol, ya sea filogenético o no, y por lo tanto también para la representación diagramática de un árbol filogenético. ^[12]

Cladograma

Un cladograma sólo representa un patrón de ramificación; es decir, las longitudes de sus ramas no representan el tiempo o la cantidad relativa de cambio de carácter, y sus nodos internos no representan ancestros. ^[13]

Filograma

Un filograma es un árbol filogenético que tiene longitudes de ramas proporcionales a la cantidad de cambio de caracteres. ^[14]

Cronograma

Un cronograma es un árbol filogenético que representa explícitamente el tiempo a través de la longitud de sus ramas. ^[15]

Dahlgrenograma

Un dahlgrenograma es un diagrama que representa una sección transversal de un árbol filogenético. ^{[ cita requerida ]}

Red filogenética

Una red filogenética no es, en sentido estricto, un árbol, sino un grafo más general , o un grafo acíclico dirigido en el caso de las redes enraizadas. Se utilizan para superar algunas de las limitaciones inherentes a los árboles.

Diagrama de husillo

Un diagrama de husos, o diagrama de burbujas, a menudo se denomina romerograma, después de su popularización por el paleontólogo estadounidense Alfred Romer . ^[17] Representa la diversidad taxonómica (ancho horizontal) contra el tiempo geológico (eje vertical) para reflejar la variación de la abundancia de varios taxones a través del tiempo. Un diagrama de husos no es un árbol evolutivo: ^[18] los husos taxonómicos oscurecen las relaciones reales del taxón padre con el taxón hijo ^[17] y tienen la desventaja de involucrar la parafilia del grupo parental. ^[19] Este tipo de diagrama ya no se usa en la forma propuesta originalmente. ^[19]

Coral de vida

Darwin ^[20] también mencionó que el coral puede ser una metáfora más adecuada que el árbol . De hecho, los corales filogenéticos son útiles para representar la vida pasada y presente, y tienen algunas ventajas sobre los árboles ( permiten anastomosis , etc.). ^[19]

Construcción

Los árboles filogenéticos compuestos con un número no trivial de secuencias de entrada se construyen utilizando métodos de filogenética computacional . Los métodos de matriz de distancia como neighbor-joining o UPGMA , que calculan la distancia genética a partir de múltiples alineaciones de secuencias , son los más simples de implementar, pero no invocan un modelo evolutivo. Muchos métodos de alineamiento de secuencias como ClustalW también crean árboles utilizando los algoritmos más simples (es decir, los basados en la distancia) de construcción de árboles. La parsimonia máxima es otro método simple para estimar árboles filogenéticos, pero implica un modelo implícito de evolución (es decir, parsimonia). Los métodos más avanzados utilizan el criterio de optimalidad de máxima verosimilitud , a menudo dentro de un marco bayesiano , y aplican un modelo explícito de evolución a la estimación del árbol filogenético. ^[2] Identificar el árbol óptimo utilizando muchas de estas técnicas es NP-hard , ^[2] por lo que se utilizan métodos de búsqueda y optimización heurística en combinación con funciones de puntuación de árboles para identificar un árbol razonablemente bueno que se ajuste a los datos.

Los métodos de construcción de árboles se pueden evaluar sobre la base de varios criterios: ^[21]

eficiencia (¿cuánto tiempo lleva calcular la respuesta, cuánta memoria necesita?)
Poder (¿Hace buen uso de los datos o se desperdicia información?)
consistencia (¿convergerá a la misma respuesta repetidamente, si cada vez se dan datos diferentes para el mismo problema modelo?)
robustez (¿resuelve bien las violaciones de los supuestos del modelo subyacente?)
falsabilidad (¿nos alerta cuando no es bueno usarlo, es decir cuando se violan los supuestos?)

Las técnicas de construcción de árboles también han llamado la atención de los matemáticos. Los árboles también pueden construirse utilizando la teoría T. ^[22]

Formatos de archivos

Los árboles se pueden codificar en varios formatos diferentes, todos los cuales deben representar la estructura anidada de un árbol. Pueden codificar o no longitudes de ramas y otras características. Los formatos estandarizados son fundamentales para distribuir y compartir árboles sin depender de una salida gráfica que es difícil de importar al software existente. Los formatos más utilizados son

Limitaciones del análisis filogenético

Aunque los árboles filogenéticos producidos sobre la base de genes secuenciados o datos genómicos en diferentes especies pueden proporcionar una visión evolutiva, estos análisis tienen limitaciones importantes. Lo más importante es que los árboles que generan no son necesariamente correctos: no necesariamente representan con precisión la historia evolutiva de los taxones incluidos. Como ocurre con cualquier resultado científico, están sujetos a falsificación por estudios posteriores (por ejemplo, recopilación de datos adicionales, análisis de los datos existentes con métodos mejorados). Los datos en los que se basan pueden ser ruidosos ; ^[23] el análisis puede verse confundido por la recombinación genética , ^[24] la transferencia horizontal de genes , ^[25] la hibridación entre especies que no eran vecinas más cercanas en el árbol antes de que se produjera la hibridación y las secuencias conservadas .

Además, existen problemas al basar un análisis en un solo tipo de carácter, como un solo gen o proteína o solo en un análisis morfológico, porque dichos árboles construidos a partir de otra fuente de datos no relacionada a menudo difieren del primero y, por lo tanto, se necesita mucho cuidado al inferir relaciones filogenéticas entre especies. Esto es más cierto en el caso del material genético que está sujeto a transferencia lateral de genes y recombinación , donde diferentes bloques de haplotipos pueden tener diferentes historias. En estos tipos de análisis, el árbol de salida de un análisis filogenético de un solo gen es una estimación de la filogenia del gen (es decir, un árbol genético) y no la filogenia de los taxones (es decir, el árbol de especies) de los que se tomaron muestras de estos caracteres, aunque idealmente, ambos deberían ser muy cercanos. Por esta razón, los estudios filogenéticos serios generalmente utilizan una combinación de genes que provienen de diferentes fuentes genómicas (por ejemplo, de genomas mitocondriales o plastídicos vs. nucleares), ^[26] o genes que se esperaría que evolucionaran bajo diferentes regímenes selectivos, de modo que sería poco probable que la homoplasia (falsa homología ) fuera el resultado de la selección natural.

Cuando se incluyen especies extintas como nodos terminales en un análisis (en lugar de, por ejemplo, limitar los nodos internos), se considera que no representan ancestros directos de ninguna especie actual. Las especies extintas no suelen contener ADN de alta calidad .

La gama de materiales de ADN útiles se ha ampliado con los avances en las tecnologías de extracción y secuenciación. El desarrollo de tecnologías capaces de inferir secuencias a partir de fragmentos más pequeños o de patrones espaciales de productos de degradación del ADN ampliaría aún más la gama de ADN considerado útil.

Los árboles filogenéticos también pueden inferirse a partir de una variedad de otros tipos de datos, incluida la morfología, la presencia o ausencia de tipos particulares de genes, eventos de inserción y eliminación, y cualquier otra observación que se considere que contiene una señal evolutiva.

Las redes filogenéticas se utilizan cuando los árboles bifurcados no son adecuados, debido a estas complicaciones que sugieren una historia evolutiva más reticulada de los organismos muestreados.

Véase también

Clado
Cladística
Filogenética computacional
Biología evolutiva
Taxonomía evolutiva
Alineación generalizada de árboles
Lista de programas de filogenética
Lista de software de visualización de árboles filogenéticos
PANDIT , una base de datos biológica que cubre dominios proteicos
Métodos comparativos filogenéticos
Reconciliación filogenética
Rango taxonómico
Tocogenia

Referencias

^ ab Khalafvand, Tyler (2015). Encontrar estructura en el espacio de búsqueda de filogenia. Universidad de Dalhousie.
^ abcde Felsenstein J. (2004). Inferir filogenias Sinauer Associates: Sunderland, MA.
^ Kinene, T.; Wainaina, J.; Maina, S.; Boykin, L. (21 de abril de 2016). "Enraizamiento de árboles, métodos para". Enciclopedia de biología evolutiva : 489–493. doi :10.1016/B978-0-12-800049-6.00215-8. ISBN 9780128004265. Número de pieza 7149615 .
^ Bailly, Anatole (1 de enero de 1981). Abrégé du dictionnaire grec français . París: Hachette. ISBN 978-2010035289.OCLC 461974285 .
^ Bailly, Anatole. «Diccionario griego-francés en línea». www.tabularium.be . Archivado desde el original el 21 de abril de 2014. Consultado el 2 de marzo de 2018 .
^ Dang, Cuong Cao; Minh, Bui Quang; McShea, Hanon; Masel, Joanna; James, Jennifer Eleanor; Vinh, Le Sy; Lanfear, Robert (9 de febrero de 2022). "nQMaker: Estimación de modelos de sustitución de aminoácidos no reversibles en el tiempo". Biología sistemática . 71 (5): 1110–1123. doi :10.1093/sysbio/syac007. PMC 9366462 . PMID 35139203.
^ Hodge T, Cope M (1 de octubre de 2000). "Un árbol genealógico de la miosina". J Cell Sci . 113 (19): 3353–4. doi :10.1242/jcs.113.19.3353. PMID 10984423. Archivado desde el original el 30 de septiembre de 2007.
^ "Datos sobre los "árboles": árboles con raíces y árboles sin raíces". Archivado desde el original el 14 de abril de 2014. Consultado el 26 de mayo de 2014 .
^ W. Ford Doolittle (2002). "Desarraigando el árbol de la vida". Scientific American . 282 (2): 90–95. Bibcode :2000SciAm.282b..90D. doi :10.1038/scientificamerican0200-90. PMID 10710791. No hay resumen disponible
^ van Oven, Mannis; Kayser, Manfred (2009). "Árbol filogenético completo actualizado de la variación global del ADN mitocondrial humano". Human Mutation . 30 (2): E386–E394. doi : 10.1002/humu.20921 . PMID 18853457. S2CID 27566749.
^ abc Felsenstein, Joseph (1 de marzo de 1978). "El número de árboles evolutivos". Biología sistemática . 27 (1): 27–33. doi :10.2307/2412810. ISSN 1063-5157. JSTOR 2412810.
^ Fox, Emily. "El dendrograma". coursea . Archivado desde el original el 28 de septiembre de 2017 . Consultado el 28 de septiembre de 2017 .
^ Mayr, Ernst (1974) "¿Análisis cladístico o clasificación cladística?". Revista de Sistemática Zoológica e Investigación Evolutiva. 12: 94–128. doi:10.1111/j.1439-0469.1974.tb00160.x.
^ Soares, Antonio; Râbelo, Ricardo; Delbem, Alexandre (2017). "Optimización basada en análisis de filogramas". Sistemas expertos con aplicaciones . 78 : 32–50. doi :10.1016/j.eswa.2017.02.012. ISSN 0957-4174.
^ Santamaria, R.; Theron, R. (26 de mayo de 2009). "Treevolution: análisis visual de árboles filogenéticos". Bioinformática . 25 (15): 1970–1971. doi : 10.1093/bioinformatics/btp333 . PMID 19470585.
^ Labandeira, CC; Dilcher, DL; Davis, DR; Wagner, DL (6 de diciembre de 1994). "Noventa y siete millones de años de asociación entre angiospermas e insectos: perspectivas paleobiológicas sobre el significado de la coevolución". Actas de la Academia Nacional de Ciencias . 91 (25): 12278–12282. Bibcode :1994PNAS...9112278L. doi : 10.1073/pnas.91.25.12278 . ISSN 0027-8424. PMC 45420 . PMID 11607501.
^ ab "Sistemática evolutiva: Diagramas de huso". Palaeos.com . 2014-11-10 . Consultado el 2019-11-07 .
^ "Árboles, burbujas y pezuñas". Un cerebro de mono de tres libras — Biología, programación, lingüística, filogenia, sistemática... 2007-11-21 . Consultado el 2019-11-07 .
^ abc Podani, János (1 de junio de 2019). "El coral de la vida". Biología evolutiva . 46 (2): 123–144. Bibcode :2019EvBio..46..123P. doi : 10.1007/s11692-019-09474-w . hdl : 10831/46308 . ISSN 1934-2845.
^ Darwin, Charles (1837). Cuaderno B. pág. 25.
^ Penny, D.; Hendy, MD; Steel, MA (1992). "Progreso con métodos para construir árboles evolutivos". Tendencias en ecología y evolución . 7 (3): 73–79. doi :10.1016/0169-5347(92)90244-6. PMID 21235960.
^ A. Dress, KT Huber y V. Moulton. 2001. Espacios métricos en matemáticas puras y aplicadas. Documenta Mathematica LSU 2001 : 121-139
^ Townsend JP, Su Z, Tekle Y (2012). "Señal filogenética y ruido: predicción del poder de un conjunto de datos para resolver la filogenia". Genética . 61 (5): 835–849. doi :10.1093/sysbio/sys036. PMID 22389443.
^ Arenas M, Posada D (2010). "El efecto de la recombinación en la reconstrucción de secuencias ancestrales". Genética . 184 (4): 1133–1139. doi :10.1534/genetics.109.113423. PMC 2865913 . PMID 20124027.
^ Woese C (2002). "Sobre la evolución de las células". Proc Natl Acad Sci USA . 99 (13): 8742–7. Bibcode :2002PNAS...99.8742W. doi : 10.1073/pnas.132266999 . PMC 124369 . PMID 12077305.
^ Parhi, J.; Tripathy, PS; Priyadarshi, H.; Mandal, SC; Pandey, PK (2019). "Diagnóstico del mitogenoma para una filogenia robusta: un caso del grupo de peces Cypriniformes". Gene . 713 : 143967. doi :10.1016/j.gene.2019.143967. PMID 31279710. S2CID 195828782.

Lectura adicional

Schuh, RT y AVZ Brower. 2009. Sistemática biológica: principios y aplicaciones (2.ª ed.) ISBN 978-0-8014-4799-0
Manuel Lima , El libro de los árboles: visualizando las ramas del conocimiento , 2014, Princeton Architectural Press, Nueva York.
MEGA , un software libre para dibujar árboles filogenéticos.
Gontier, N. 2011. "Representando el árbol de la vida: las raíces filosóficas e históricas de los diagramas de árboles evolutivos". Evolución, educación, divulgación 4: 515–538.
Jan Sapp , Los nuevos fundamentos de la evolución: Sobre el árbol de la vida , 2009, Oxford University Press, Nueva York.

Enlaces externos

Wikimedia Commons alberga una categoría multimedia sobre Árboles filogenéticos .

Imágenes

Árbol filogenético del cromosoma Y humano 2002
iTOL: El árbol de la vida interactivo
Árbol filogenético de organismos artificiales desarrollados en computadoras Archivado el 22 de febrero de 2016 en Wayback Machine
Filograma de mamíferos euterios de Miyamoto y Goodman

General

En Page, RDM (2011) se puede consultar una descripción general de los diferentes métodos de visualización de árboles . "Espacio, tiempo, forma: visualización del árbol de la vida". Tendencias en ecología y evolución . 27 (2): 113–120. doi :10.1016/j.tree.2011.12.002. PMID 22209094.
OneZoom: El árbol de la vida: todas las especies vivas como un explorador fractal intuitivo y ampliable (diseño responsivo)
Descubra la vida Un árbol interactivo basado en el proyecto Assembling the Tree of Life de la Fundación Nacional de Ciencias de EE. UU.
Código filogenético
Alineamiento múltiple de 139 secuencias de miosina y un árbol filogenético
Proyecto web del árbol de la vida
Inferencia filogenética en el servidor T-REX
Base de datos de taxonomía del NCBI [1]
ETE: Un entorno Python para la exploración de árboles Esta es una biblioteca de programación para analizar, manipular y visualizar árboles filogenéticos. Ref.
Un árbol de la vida (secuenciado) actualizado diariamente Fang, H.; Oates, ME; Pethica, RB; Greenwood, JM; Sardar, AJ; Rackham, OJL; Donoghue, PCJ; Stamatakis, A.; De Lima Morais, DA; Gough, J. (2013). "Un árbol de la vida (secuenciado) actualizado diariamente como referencia para la investigación del genoma". Scientific Reports . 3 : 2015. Bibcode :2013NatSR...3E2015F. doi :10.1038/srep02015. PMC 6504836 . PMID 23778980.