Filogenia perfecta

La filogenia perfecta es un término utilizado en la filogenética computacional para denotar un árbol filogenético en el que todos los nodos internos pueden etiquetarse de manera que todos los caracteres evolucionen hacia abajo en el árbol sin homoplasia . Es decir, las características no se mantienen en la convergencia evolutiva y no tienen estructuras análogas . Estadísticamente, esto se puede representar como un ancestro que tiene el estado "0" en todas las características, donde 0 representa la falta de esa característica. Cada una de estas características cambia de 0 a 1 exactamente una vez y nunca vuelve al estado 0. Es raro que los datos reales se adhieran al concepto de filogenia perfecta. ^[1]^[2]

Edificio

En general, se utilizan dos tipos de datos diferentes en la construcción de un árbol filogenético. En los cálculos basados en la distancia, se crea un árbol filogenético analizando las relaciones entre la distancia entre especies y las longitudes de los bordes de un árbol correspondiente. El uso de un enfoque basado en caracteres emplea estados de caracteres en todas las especies como entrada en un intento de encontrar el árbol filogenético más "perfecto". ^[3]^[4]

Los componentes estadísticos de un árbol filogenético perfecto se pueden describir mejor de la siguiente manera: ^[3]

Una filogenia perfecta para una matriz de estados de caracteres n x m M es un árbol enraizado T con n hojas que satisface:

i. Cada fila de M etiqueta exactamente una hoja de T
ii. Cada columna de M etiqueta exactamente una arista de T
iii. Cada arista interior de T está etiquetada por al menos una columna de M
iv. Los caracteres asociados con los bordes a lo largo de la ruta única desde la raíz hasta una hoja v especifican exactamente el vector de caracteres de v , es decir, el vector de caracteres tiene una entrada 1 en todas las columnas correspondientes a los caracteres asociados con los bordes de la ruta y una entrada 0 en caso contrario.

Cabe señalar que es muy raro encontrar datos filogenéticos reales que se ajusten a los conceptos y limitaciones que se detallan aquí. Por lo tanto, a menudo los investigadores se ven obligados a hacer concesiones desarrollando árboles que simplemente intentan minimizar la homoplasia, encontrando un conjunto de caracteres compatibles con la máxima cardinalidad o construyendo filogenias que coincidan lo más posible con las particiones implicadas por los caracteres.

Ejemplo

Ambos conjuntos de datos ilustran ejemplos de matrices de estados de caracteres . Utilizando la matriz M' ₁ se puede observar que el árbol filogenético resultante se puede crear de manera que cada uno de los caracteres etiquete exactamente un borde del árbol. Por el contrario, al observar la matriz M' ₂ , se puede ver que no hay forma de configurar el árbol filogenético de manera que cada carácter etiquete solo una longitud de borde. ^[3] Si las muestras provienen de datos de frecuencia alélica variante (VAF) de una población de células en estudio, las entradas en la matriz de caracteres son frecuencias de mutaciones y toman un valor entre 0 y 1. Es decir, si representa una posición en el genoma, entonces la entrada correspondiente a una muestra contendrá las frecuencias de los genomas en la muestra con una mutación en la posición . ^[5]^[6]^[7]^[8]^[9] $Estilo de visualización c_{i}}$ $Estilo de visualización c_{i}}$ $estilo de visualización s_ {j}}$ $estilo de visualización s_ {j}}$ $Estilo de visualización c_{i}}$

Matrices de estados de caracteres
Un ejemplo de una matriz de caracteres que puede representarse como una filogenia perfecta

Uso

La filogenia perfecta es un marco teórico que también se puede utilizar en métodos más prácticos. Un ejemplo de ello es la filogenia perfecta dirigida incompleta. Este concepto implica utilizar filogenias perfectas con conjuntos de datos reales y, por lo tanto, incompletos e imperfectos. Este método utiliza SINE para determinar la similitud evolutiva. Estos elementos intercalados cortos están presentes en muchos genomas y se pueden identificar por sus secuencias flanqueantes. Los SINE proporcionan información sobre la herencia de ciertos rasgos en diferentes especies. Desafortunadamente, si falta un SINE, es difícil saber si esos SINE estaban presentes antes de la eliminación. Al utilizar algoritmos derivados de datos de filogenia perfecta, podemos intentar reconstruir un árbol filogenético a pesar de estas limitaciones. ^[10]

La filogenia perfecta también se utiliza en la construcción de mapas de haplotipos . Al utilizar los conceptos y algoritmos descritos en la filogenia perfecta, se puede determinar información sobre datos de haplotipos faltantes y no disponibles. ^[11] Al suponer que el conjunto de haplotipos que resultan del mapeo de genotipos corresponde y se adhiere al concepto de filogenia perfecta (así como otras suposiciones como la herencia mendeliana perfecta y el hecho de que solo hay una mutación por SNP), se pueden inferir datos de haplotipos faltantes. ^[12]^[13]^[14]^[15]

Inferir una filogenia a partir de datos VAF ruidosos con el PPM es un problema difícil. ^[5] La mayoría de las herramientas de inferencia incluyen algún paso heurístico para que la inferencia sea computacionalmente manejable. Ejemplos de herramientas que infieren filogenias a partir de datos VAF ruidosos incluyen AncesTree, Canopy, CITUP, EXACT y PhyloWGS. ^[5]^[6]^[7]^[8]^[9] En particular, EXACT realiza una inferencia exacta mediante el uso de GPU para calcular una probabilidad posterior en todos los árboles posibles para problemas de tamaño pequeño. Se han realizado extensiones al PPM con herramientas que lo acompañan. ^[16]^[17] Por ejemplo, herramientas como MEDICC, TuMult y FISHtrees permiten que el número de copias de un elemento genético dado, o ploidía, aumente o disminuya, lo que permite efectivamente la eliminación de mutaciones. ^[18]^[19]^[20]

Véase también

Lista de programas de filogenética

Referencias

^ Fernandez-Baca D. "El problema de la filogenia perfecta" (PDF) . Kluwer Academic Publishers . Consultado el 30 de septiembre de 2012 .
^ Nakhleh L, Ringe D, Warnow T. "Redes filogenéticas perfectas: una nueva metodología para reconstruir la historia evolutiva de las lenguas naturales" (PDF) . Consultado el 1 de octubre de 2012 .
^ abc Uhler C . "Encontrar una filogenia perfecta" (PDF) . Archivado desde el original (PDF) el 4 de marzo de 2016 . Consultado el 29 de septiembre de 2012 .
^ Nikaido M, Rooney AP, Okada N (agosto de 1999). "Relaciones filogenéticas entre cetartiodáctilos basadas en inserciones de elementos cortos y largos intercalados: los hipopótamos son los parientes actuales más cercanos de las ballenas". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 96 (18): 10261–6. Bibcode :1999PNAS...9610261N. doi : 10.1073/pnas.96.18.10261 . PMC 17876 . PMID 10468596.
^ abc El-Kebir M, Oesper L, Acheson-Field H, Raphael BJ (junio de 2015). "Reconstrucción de árboles clonales y composición tumoral a partir de datos de secuenciación de múltiples muestras". Bioinformática . 31 (12): i62-70. doi :10.1093/bioinformatics/btv261. PMC 4542783 . PMID 26072510.
^ ab Satas G, Raphael BJ (julio de 2017). "Inferencia de filogenia tumoral mediante muestreo de importancia restringido por árboles". Bioinformática . 33 (14): i152–i160. doi :10.1093/bioinformatics/btx270. PMC 5870673 . PMID 28882002.
^ ab Malikic S, McPherson AW, Donmez N, Sahinalp CS (mayo de 2015). "Inferencia de clonalidad en múltiples muestras tumorales mediante filogenia". Bioinformática . 31 (9): 1349–56. doi : 10.1093/bioinformatics/btv003 . PMID 25568283.
^ ab Ray S, Jia B, Safavi S, van Opijnen T, Isberg R, Rosch J, Bento J (22 de agosto de 2019). "Inferencia exacta bajo el modelo de filogenia perfecta". arXiv : 1908.08623 [q-bio.QM].
^ ab Deshwar AG, Vembu S, Yung CK, Jang GH, Stein L, Morris Q (febrero de 2015). "PhyloWGS: reconstrucción de la composición subclonal y la evolución a partir de la secuenciación del genoma completo de tumores". Genome Biology . 16 (1): 35. doi : 10.1186/s13059-015-0602-8 . PMC 4359439 . PMID 25786235.
^ Pe'er I, Pupko T, Shamir R, Sharan R. "Filogenia perfecta dirigida incompleta". Universidad de Tel Aviv. Archivado desde el original el 20 de octubre de 2013. Consultado el 30 de octubre de 2012 .{{cite web}}: CS1 maint: bot: estado de URL original desconocido ( enlace )
^ Eskin E, Halperin E, Karp RM (abril de 2003). "Reconstrucción eficiente de la estructura del haplotipo mediante una filogenia perfecta" (PDF) . Journal of Bioinformatics and Computational Biology . 1 (1). University of California, Berkeley: 1–20. doi :10.1142/S0219720003000174. PMID 15290779. Consultado el 30 de octubre de 2012 .
^ Gusfield D. "An Overview of Computational Methods for Haplotype Inference" (PDF) . Universidad de California, Davis . Consultado el 18 de noviembre de 2012 .
^ Ding Z, Filkov V, Gusfield D. "Un algoritmo de tiempo lineal para el problema de haplotipado de filogenia perfecta". Universidad de California, Davis . Consultado el 18 de noviembre de 2012 .
^ Bafna V, Gusfield D, Lancia G, Yooseph S (2003). "Haplotipificación como filogenia perfecta: un enfoque directo". Journal of Computational Biology . 10 (3–4): 323–40. doi :10.1089/10665270360688048. PMID 12935331.
^ Seyalioglu H. "Haplotyping as Perfect Phylogeny" (PDF) . Archivado desde el original (PDF) el 30 de septiembre de 2011. Consultado el 30 de octubre de 2012 .
^ Bonizzoni P, Carrieri AP, Della Vedova G, Trucco G (octubre de 2014). "Explicación de la evolución a través de una filogenia perfecta persistente restringida". BMC Genomics . 15 Suppl 6 (S6): S10. doi : 10.1186/1471-2164-15-S6-S10 . PMC 4240218 . PMID 25572381.
^ Hajirasouliha I, Raphael BJ (2014), Brown D, Morgenstern B (eds.), "Reconstrucción de la historia mutacional en tumores de muestreo múltiple utilizando mezclas de filogenia perfectas", Algorithms in Bioinformatics , Lecture Notes in Computer Science, vol. 8701, Springer Berlin Heidelberg, págs. 354–367, doi :10.1007/978-3-662-44753-6_27, ISBN 9783662447529
^ Schwarz RF, Trinh A, Sipos B, Brenton JD, Goldman N, Markowetz F (abril de 2014). Beerenwinkel N (ed.). "Cuantificación filogenética de la heterogeneidad intratumoral". PLOS Computational Biology . 10 (4): e1003535. arXiv : 1306.1685 . Bibcode :2014PLSCB..10E3535S. doi : 10.1371/journal.pcbi.1003535 . PMC 3990475 . PMID 24743184.
^ Letouzé E, Allory Y, Bollet MA, Radvanyi F, Guyon F (2010). "El análisis de los perfiles de número de copias de varias muestras tumorales del mismo paciente revela los pasos sucesivos en la tumorigénesis". Genome Biology . 11 (7): R76. doi : 10.1186/gb-2010-11-7-r76 . PMC 2926787 . PMID 20649963.
^ Gertz EM, Chowdhury SA, Lee WJ, Wangsa D, Heselmeyer-Haddad K, Ried T, et al. (30 de junio de 2016). "FISHtrees 3.0: Filogenética tumoral mediante una sonda de ploidía". PLOS ONE . 11 (6): e0158569. Bibcode :2016PLoSO..1158569G. doi : 10.1371/journal.pone.0158569 . PMC 4928784 . PMID 27362268.

Enlaces externos

Uno de los varios programas disponibles para el análisis y creación de árboles filogenéticos.
Otro programa de este tipo para el análisis de árboles filogenéticos
Programa adicional para el análisis de árboles Archivado el 14 de marzo de 2018 en Wayback Machine.
Un artículo que detalla un ejemplo de cómo se puede utilizar la filogenia perfecta fuera del campo de la genética, como en la asociación del lenguaje.
Github para "Algoritmo para la reconstrucción de árboles clonales a partir de datos de secuenciación de cáncer de múltiples muestras" (AncesTree)
Github para "Acceso a la heterogeneidad intratumoral y seguimiento del historial evolutivo clonal longitudinal y espacial mediante secuenciación de próxima generación" (Canopy)
Github para "Inferencia de clonalidad en tumores usando filogenia" (CITUP)
Github para "Inferencia exacta bajo el modelo de filogenia perfecta" (EXACT)
Github para "Reconstrucción de la composición subclonal y la evolución a partir de la secuenciación del genoma completo de tumores" (PhyloWGS)