Cladograma

Un cladograma (del griego clados "rama" y gramma "carácter") es un diagrama utilizado en cladística para mostrar relaciones entre organismos. Sin embargo, un cladograma no es un árbol evolutivo porque no muestra cómo se relacionan los antepasados con los descendientes, ni muestra cuánto han cambiado, por lo que muchos árboles evolutivos diferentes pueden ser consistentes con el mismo cladograma. ^[1]^[2]^[3]^[4]^[5] Un cladograma utiliza líneas que se ramifican en diferentes direcciones y terminan en un clado , un grupo de organismos con un último ancestro común . Hay muchas formas de cladogramas, pero todos tienen líneas que se ramifican de otras líneas. Las líneas se pueden rastrear hasta donde se ramifican. Estos puntos de ramificación representan un ancestro hipotético (no una entidad real) del que se puede inferir que exhibe los rasgos compartidos entre los taxones terminales por encima de él. ^[4]^[6] Este ancestro hipotético podría entonces proporcionar pistas sobre el orden de evolución de diversas características, adaptación y otras narrativas evolutivas sobre los ancestros. Aunque tradicionalmente tales cladogramas se generaban en gran medida sobre la base de caracteres morfológicos, los datos de secuenciación de ADN y ARN y la filogenética computacional se utilizan ahora muy comúnmente en la generación de cladogramas, ya sea por sí solos o en combinación con la morfología.

Generando un cladograma

Datos moleculares versus datos morfológicos

Las características utilizadas para crear un cladograma se pueden clasificar aproximadamente como morfológicas (cráneo sinápsido, sangre caliente, notocorda , unicelular, etc.) o moleculares (ADN, ARN u otra información genética). ^[7] Antes de la llegada de la secuenciación del ADN, el análisis cladístico utilizaba principalmente datos morfológicos. También se pueden utilizar datos de comportamiento (para animales). ^[8]

A medida que la secuenciación de ADN se ha vuelto más barata y sencilla, la sistemática molecular se ha convertido en una forma cada vez más popular de inferir hipótesis filogenéticas. ^[9] El uso de un criterio de parsimonia es solo uno de varios métodos para inferir una filogenia a partir de datos moleculares. Enfoques como la máxima verosimilitud , que incorporan modelos explícitos de evolución de secuencias, son formas no hennigianas de evaluar datos de secuencias. Otro método poderoso para reconstruir filogenias es el uso de marcadores de retrotransposones genómicos , que se cree que son menos propensos al problema de reversión que afecta a los datos de secuencias. También se supone generalmente que tienen una baja incidencia de homoplasias porque alguna vez se pensó que su integración en el genoma era completamente aleatoria; sin embargo, esto parece no ser así al menos a veces.

Apomorfía en cladística. Este diagrama indica "A" y "C" como estados ancestrales, y "B", "D" y "E" como estados que están presentes en taxones terminales. Nótese que en la práctica, las condiciones ancestrales no se conocen *a priori* (como se muestra en este ejemplo heurístico), sino que deben inferirse a partir del patrón de estados compartidos observados en los terminales. Dado que cada terminal en este ejemplo tiene un estado único, en realidad no podríamos inferir nada concluyente sobre los estados ancestrales (¡aparte del hecho de que la existencia de estados no observados "A" y "C" serían inferencias poco parsimoniosas!)

Plesiomorfías y sinapomorfías

Los investigadores deben decidir qué estados de carácter son "ancestrales" ( plesiomorfias ) y cuáles son derivados ( sinapomorfias ), porque solo los estados de carácter sinapomórficos proporcionan evidencia de agrupamiento. ^[10] Esta determinación se realiza generalmente por comparación con los estados de carácter de uno o más grupos externos . Los estados compartidos entre el grupo externo y algunos miembros del grupo interno son simplesiomorfias; los estados que están presentes solo en un subconjunto del grupo interno son sinapomorfias. Tenga en cuenta que los estados de carácter exclusivos de una sola terminal (autapomorfias) no proporcionan evidencia de agrupamiento. La elección de un grupo externo es un paso crucial en el análisis cladístico porque diferentes grupos externos pueden producir árboles con topologías profundamente diferentes.

Homoplasias

Una homoplasia es un estado de carácter compartido por dos o más taxones debido a alguna causa distinta a la ascendencia común. ^[11] Los dos tipos principales de homoplasia son la convergencia (evolución del "mismo" carácter en al menos dos linajes distintos) y la reversión (el retorno a un estado de carácter ancestral). Los caracteres que son obviamente homoplásicos, como el pelaje blanco en diferentes linajes de mamíferos árticos, no deberían incluirse como un carácter en un análisis filogenético ya que no contribuyen en nada a nuestra comprensión de las relaciones. Sin embargo, la homoplasia a menudo no es evidente a partir de la inspección del carácter en sí (como en la secuencia de ADN, por ejemplo), y luego se detecta por su incongruencia (distribución no parsimoniosa) en un cladograma más parsimonioso. Tenga en cuenta que los caracteres que son homoplásicos aún pueden contener una señal filogenética . ^[12]

Un ejemplo bien conocido de homoplasia debida a la evolución convergente sería el carácter "presencia de alas". Aunque las alas de las aves, los murciélagos y los insectos cumplen la misma función, cada una evolucionó de forma independiente, como se puede ver en su anatomía . Si se puntuara un ave, un murciélago y un insecto alado por el carácter "presencia de alas", se introduciría una homoplasia en el conjunto de datos, y esto podría confundir potencialmente el análisis, posiblemente dando como resultado una hipótesis falsa de relaciones. Por supuesto, la única razón por la que una homoplasia es reconocible en primer lugar es porque hay otros caracteres que implican un patrón de relaciones que revelan su distribución homoplástica.

¿Qué no es un cladograma?

Un cladograma es el resultado diagramático de un análisis que agrupa taxones basándose únicamente en sinapomorfías. Existen muchos otros algoritmos filogenéticos que tratan los datos de forma algo diferente y dan como resultado árboles filogenéticos que parecen cladogramas pero no lo son. Por ejemplo, los algoritmos fenéticos, como UPGMA y Neighbor-Joining, agrupan por similitud general y tratan tanto las sinapomorfías como las simplesiomorfías como evidencia de agrupamiento. Los diagramas resultantes son fenogramas, no cladogramas. De manera similar, los resultados de los métodos basados en modelos (enfoques de máxima verosimilitud o bayesianos) que tienen en cuenta tanto el orden de ramificación como la "longitud de la rama", cuentan tanto las sinapomorfías como las autapomorfías como evidencia a favor o en contra del agrupamiento. Los diagramas resultantes de ese tipo de análisis tampoco son cladogramas. ^[13]

Selección de cladogramas

Existen varios algoritmos disponibles para identificar el "mejor" cladograma. ^[14] La mayoría de los algoritmos utilizan una métrica para medir la coherencia de un cladograma candidato con los datos. La mayoría de los algoritmos de cladogramas utilizan técnicas matemáticas de optimización y minimización.

En general, los algoritmos de generación de cladogramas deben implementarse como programas de computadora, aunque algunos algoritmos pueden realizarse manualmente cuando los conjuntos de datos son modestos (por ejemplo, solo unas pocas especies y un par de características).

Algunos algoritmos son útiles sólo cuando los datos característicos son moleculares (ADN, ARN); otros algoritmos son útiles sólo cuando los datos característicos son morfológicos. Otros algoritmos pueden utilizarse cuando los datos característicos incluyen tanto datos moleculares como morfológicos.

Los algoritmos para cladogramas u otros tipos de árboles filogenéticos incluyen mínimos cuadrados , unión de vecinos , parsimonia , máxima verosimilitud e inferencia bayesiana .

Los biólogos a veces utilizan el término parsimonia para un tipo específico de algoritmo de generación de cladogramas y a veces como un término general para todos los algoritmos filogenéticos. ^[15]

Los algoritmos que realizan tareas de optimización (como la construcción de cladogramas) pueden ser sensibles al orden en el que se presentan los datos de entrada (la lista de especies y sus características). Ingresar los datos en distintos órdenes puede provocar que el mismo algoritmo produzca distintos "mejores" cladogramas. En estas situaciones, el usuario debe ingresar los datos en distintos órdenes y comparar los resultados.

El uso de diferentes algoritmos en un único conjunto de datos a veces puede producir diferentes cladogramas "mejores", porque cada algoritmo puede tener una definición única de lo que es "mejor".

Debido a la cantidad astronómica de cladogramas posibles, los algoritmos no pueden garantizar que la solución sea la mejor solución general. Se seleccionará un cladograma no óptimo si el programa se establece en un mínimo local en lugar del mínimo global deseado. ^[16] Para ayudar a resolver este problema, muchos algoritmos de cladogramas utilizan un enfoque de recocido simulado para aumentar la probabilidad de que el cladograma seleccionado sea el óptimo. ^[17]

La posición basal es la dirección de la base (o raíz) de un árbol filogenético enraizado o cladograma. Un clado basal es el clado más antiguo (de un rango taxonómico determinado[a]) en ramificarse dentro de un clado más grande.

Estadística

Prueba de diferencia de longitud por incongruencia (o prueba de homogeneidad de partición)

La prueba de diferencia de longitud de incongruencia (ILD) es una medición de cómo la combinación de diferentes conjuntos de datos (por ejemplo, genes morfológicos y moleculares, plástidos y nucleares) contribuye a un árbol más largo. Se mide calculando primero la longitud total del árbol de cada partición y sumándolas. Luego se hacen réplicas creando particiones ensambladas aleatoriamente que consisten en las particiones originales. Las longitudes se suman. Se obtiene un valor p de 0,01 para 100 réplicas si 99 réplicas tienen longitudes de árbol combinadas más largas.

Medición de la homoplasia

Algunas medidas intentan medir la cantidad de homoplasia en un conjunto de datos con referencia a un árbol, ^[18] aunque no está necesariamente claro con precisión qué propiedad estas medidas pretenden cuantificar ^[19].

Índice de consistencia

El índice de consistencia (CI) mide la consistencia de un árbol con un conjunto de datos: una medida de la cantidad mínima de homoplasia implícita en el árbol. ^[20] Se calcula contando el número mínimo de cambios en un conjunto de datos y dividiéndolo por el número real de cambios necesarios para el cladograma. ^[20] También se puede calcular un índice de consistencia para un carácter individual i , denotado c _i .

Además de reflejar la cantidad de homoplasia, la métrica también refleja la cantidad de taxones en el conjunto de datos, ^[21] (en menor medida) la cantidad de caracteres en un conjunto de datos, ^[22] el grado en que cada carácter lleva información filogenética, ^[23] y la forma en que se codifican los caracteres aditivos, lo que lo hace inadecuado para el propósito. ^[24]

c _i ocupa un rango de 1 a 1/[ n.taxa /2] en caracteres binarios con una distribución de estados uniforme; su valor mínimo es mayor cuando los estados no están distribuidos uniformemente. ^[23]^[18] En general, para un carácter binario o no binario con , c _i ocupa un rango de 1 a . ^[23] $n.states$ $(n.states-1)/(n.taxa-\lceil n.taxa/n.states\rceil )$

Índice de retención

El índice de retención (IR) se propuso como una mejora del IC "para ciertas aplicaciones" ^[25]. Esta métrica también pretende medir la cantidad de homoplasia, pero también mide qué tan bien las sinapomorfias explican el árbol. Se calcula tomando el (número máximo de cambios en un árbol menos el número de cambios en el árbol) y dividiéndolo por el (número máximo de cambios en el árbol menos el número mínimo de cambios en el conjunto de datos).

El índice de consistencia reescalado (RC) se obtiene multiplicando el IC por el IR; en efecto, esto extiende el rango del IC de tal manera que su valor mínimo teóricamente alcanzable se reescala a 0, y su máximo permanece en 1. ^[18]^[25] El índice de homoplasia (HI) es simplemente 1 − IC.

Relación de exceso de homoplasia

Esto mide la cantidad de homoplasia observada en un árbol en relación con la cantidad máxima de homoplasia que podría estar presente teóricamente – 1 − (exceso de homoplasia observado) / (exceso de homoplasia máximo). ^[22] Un valor de 1 indica que no hay homoplasia; 0 representa tanta homoplasia como habría en un conjunto de datos completamente aleatorio, y los valores negativos indican aún más homoplasia (y tienden a ocurrir solo en ejemplos artificiales). ^[22] El HER se presenta como la mejor medida de homoplasia actualmente disponible. ^[18]^[26]

Véase también

Referencias

^ Mayr, Ernst (2009). "¿Análisis cladístico o clasificación cladística?". Revista de Sistemática Zoológica e Investigación Evolutiva . 12 : 94–128. doi : 10.1111/j.1439-0469.1974.tb00160.x .
^ Foote, Mike (primavera de 1996). "Sobre la probabilidad de ancestros en el registro fósil". Paleobiología . 22 (2): 141–51. doi :10.1017/S0094837300016146. JSTOR 2401114. S2CID 89032582.
^ Dayrat, Benoît (verano de 2005). "Relaciones entre ancestros y descendientes y la reconstrucción del árbol de la vida". Paleobiología . 31 (3): 347–53. doi :10.1666/0094-8373(2005)031[0347:aratro]2.0.co;2. JSTOR 4096939. S2CID 54988538.
^ ab Posada, David; Crandall, Keith A. (2001). "Genealogías de genes intraespecíficos: árboles injertados en redes". Tendencias en ecología y evolución . 16 (1): 37–45. doi :10.1016/S0169-5347(00)02026-7. PMID 11146143.
^ Podani, János (2013). "Pensamiento arbóreo, tiempo y topología: Comentarios sobre la interpretación de diagramas arbóreos en sistemática evolutiva/filogenética" (PDF) . Cladistics . 29 (3): 315–327. doi :10.1111/j.1096-0031.2012.00423.x. PMID 34818822. S2CID 53357985. Archivado (PDF) desde el original el 21 de septiembre de 2017.
^ Schuh, Randall T. (2000). Sistemática biológica: principios y aplicaciones . ISBN 978-0-8014-3675-8.^{[ página necesaria ]}
^ DeSalle, Rob (2002). Técnicas en sistemática molecular y evolución . Birkhauser. ISBN 978-3-7643-6257-7.^{[ página necesaria ]}
^ Wenzel, John W. (1992). "Homología conductual y filogenia". Annu. Rev. Ecol. Syst . 23 : 361–381. doi :10.1146/annurev.es.23.110192.002045.
^ Hillis, David (1996). Sistemática molecular . Sinaur. ISBN 978-0-87893-282-5.^{[ página necesaria ]}
^ Hennig, Willi (1966). Sistemática filogenética . Prensa de la Universidad de Illinois.
^ West-Eberhard, Mary Jane (2003). Plasticidad del desarrollo y evolución . Oxford Univ. Press. pp. 353–376. ISBN. 978-0-19-512235-0.
^ Kalersjo, Mari; Albert, Victor A.; Farris, James S. (1999). "La homoplasia aumenta la estructura filogenética". Cladistics . 15 : 91–93. doi :10.1111/j.1096-0031.1999.tb00400.x. S2CID 85905559.
^ Brower, Andrew VZ (2016). "¿Qué es un cladograma y qué no lo es?". Cladistics . 32 (5): 573–576. doi : 10.1111/cla.12144 . PMID 34740305. S2CID 85725091.
^ Kitching, Ian (1998). Cladística: teoría y práctica del análisis de parsimonia . Oxford University Press. ISBN 978-0-19-850138-1.^{[ página necesaria ]}
^ Stewart, Caro-Beth (1993). "Los poderes y las trampas de la parsimonia". Nature . 361 (6413): 603–7. Bibcode :1993Natur.361..603S. doi :10.1038/361603a0. PMID 8437621. S2CID 4350103.
^ Foley, Peter (1993). Cladística: un curso práctico de sistemática. Oxford Univ. Press. pág. 66. ISBN 978-0-19-857766-9.
^ Nixon, Kevin C. (1999). "El trinquete de parsimonia, un nuevo método para el análisis rápido de parsimonia". Cladistics . 15 (4): 407–414. doi :10.1111/j.1096-0031.1999.tb00277.x. PMID 34902938. S2CID 85720264.
^ abcd revisado en Archie, James W. (1996). "Medidas de homoplasia". En Sanderson, Michael J.; Hufford, Larry (eds.). Homoplasia . págs. 153–188. doi :10.1016/B978-012618030-5/50008-3. ISBN 9780126180305.
^ Chang, Joseph T.; Kim, Junhyong (1996). "La medición de la homoplasia: una visión estocástica". Homoplasia . págs. 189–203. doi :10.1016/b978-012618030-5/50009-5. ISBN 9780126180305.
^ ab Kluge, AG; Farris, JS (1969). "Filética cuantitativa y la evolución de los anuros". Zoología sistemática . 18 (1): 1–32. doi :10.2307/2412407. JSTOR 2412407.
^ Archie, JW; Felsenstein, J. (1993). "El número de pasos evolutivos en árboles aleatorios y de longitud mínima para datos evolutivos aleatorios". Biología de poblaciones teórica . 43 : 52–79. doi :10.1006/tpbi.1993.1003.
^ abc Archie, JW (1989). "Razones de exceso de homoplasia: nuevos índices para medir los niveles de homoplasia en la sistemática filogenética y una crítica del índice de consistencia". Zoología sistemática . 38 (3): 253–269. doi :10.2307/2992286. JSTOR 2992286.
^ abc Hoyal Cuthill, Jennifer F.; Braddy, Simon J.; Donoghue, Philip CJ (2010). "Una fórmula para el máximo de pasos posibles en caracteres multiestado: aislamiento de los efectos de los parámetros de la matriz en las medidas de convergencia evolutiva". Cladistics . 26 (1): 98–102. doi : 10.1111/j.1096-0031.2009.00270.x . PMID 34875753. S2CID 53320612.
^ Sanderson, MJ; Donoghue, MJ (1989). "Patrones de variaciones en los niveles de homoplasia". Evolución . 43 (8): 1781–1795. doi :10.2307/2409392. JSTOR 2409392. PMID 28564338.
^ ab Farris, JS (1989). "El índice de retención y el índice de consistencia reescalado". Cladistics . 5 (4): 417–419. doi :10.1111/j.1096-0031.1989.tb00573.x. PMID 34933481. S2CID 84287895.
^ Hoyal Cuthill, Jennifer (2015). "El tamaño del espacio de estados de caracteres afecta la ocurrencia y detección de homoplasia: modelado de la probabilidad de incompatibilidad para caracteres filogenéticos no ordenados". Journal of Theoretical Biology . 366 : 24–32. Bibcode :2015JThBi.366...24H. doi :10.1016/j.jtbi.2014.10.033. PMID 25451518.

Enlaces externos

Medios relacionados con Cladogramas en Wikimedia Commons