stringtranslate.com

Filogenia perfecta

Filogenia perfecta es un término utilizado en filogenética computacional para denotar un árbol filogenético en el que todos los nodos internos pueden etiquetarse de manera que todos los caracteres evolucionen hacia abajo en el árbol sin homoplasia . Es decir, las características no se ajustan a la convergencia evolutiva y no tienen estructuras análogas . Estadísticamente, esto se puede representar como un antepasado que tiene el estado "0" en todas las características, donde 0 representa la falta de esa característica. Cada una de estas características cambia de 0 a 1 exactamente una vez y nunca vuelve al estado 0. Es raro que los datos reales se adhieran al concepto de filogenia perfecta. [1] [2]

Edificio

En general, existen dos tipos de datos diferentes que se utilizan en la construcción de un árbol filogenético. En los cálculos basados ​​en distancias, se crea un árbol filogenético analizando las relaciones entre la distancia entre especies y las longitudes de los bordes de un árbol correspondiente. El uso de un enfoque basado en caracteres emplea estados de caracteres entre especies como entrada en un intento de encontrar el árbol filogenético más "perfecto". [3] [4]

Los componentes estadísticos de un árbol filogenético perfecto se pueden describir mejor de la siguiente manera: [3]

Una filogenia perfecta para una matriz de estados de caracteres M de n x m es un árbol enraizado T con n hojas que satisfacen:


i. Cada fila de M etiqueta exactamente una hoja de T
ii. Cada columna de M etiqueta exactamente un borde de T
iii. Cada borde interior de T está etiquetado por al menos una columna de M

IV. Los caracteres asociados con los bordes a lo largo de la ruta única desde la raíz hasta una hoja v especifican exactamente el vector de caracteres de v , es decir, el vector de caracteres tiene una entrada 1 en todas las columnas correspondientes a los caracteres asociados a los bordes de la ruta y una entrada 0 en caso contrario.

Vale la pena señalar que es muy raro encontrar datos filogenéticos reales que se adhieran a los conceptos y limitaciones aquí detallados. Por lo tanto, a menudo ocurre que los investigadores se ven obligados a hacer concesiones desarrollando árboles que simplemente intentan minimizar la homoplasia, encontrando un conjunto de caracteres compatibles con cardinalidad máxima o construyendo filogenias que coincidan lo más posible con las particiones implicadas por los caracteres.

Ejemplo

Ambos conjuntos de datos ilustran ejemplos de matrices de estados de caracteres . Usando la matriz M' 1 se puede observar que el árbol filogenético resultante se puede crear de modo que cada uno de los caracteres etiquete exactamente un borde del árbol. Por el contrario, al observar la matriz M' 2 , se puede ver que no hay manera de configurar el árbol filogenético de modo que cada carácter etiquete sólo una longitud de borde. [3] Si las muestras provienen de datos de frecuencia alélica variante (VAF) de una población de células bajo estudio, las entradas en la matriz de caracteres son frecuencias de mutaciones y toman un valor entre 0 y 1. Es decir, si representa una posición en el genoma, entonces la entrada correspondiente a una muestra contendrá las frecuencias de los genomas en la muestra con una mutación en posición . [5] [6] [7] [8] [9]

Uso

La filogenia perfecta es un marco teórico que también se puede utilizar en métodos más prácticos. Un ejemplo de ello es el de la filogenia perfecta dirigida incompleta. Este concepto implica la utilización de filogenias perfectas con conjuntos de datos reales y, por lo tanto, incompletos e imperfectos. Este método utiliza SINE para determinar la similitud evolutiva. Estos elementos cortos intercalados están presentes en muchos genomas y pueden identificarse por sus secuencias flanqueantes. Los SINE proporcionan información sobre la herencia de ciertos rasgos entre diferentes especies. Desafortunadamente, si falta un SINE, es difícil saber si esos SINE estaban presentes antes de la eliminación. Al utilizar algoritmos derivados de datos de filogenia perfectos, podemos intentar reconstruir un árbol filogenético a pesar de estas limitaciones. [10]

La filogenia perfecta también se utiliza en la construcción de mapas de haplotipos . Al utilizar los conceptos y algoritmos descritos en la filogenia perfecta, se puede determinar información sobre los datos de haplotipos faltantes o no disponibles. [11] Al suponer que el conjunto de haplotipos que resultan del mapeo de genotipo corresponde y se adhiere al concepto de filogenia perfecta (así como a otros supuestos como la herencia mendeliana perfecta y el hecho de que solo hay una mutación por SNP), uno es capaz de inferir datos de haplotipos faltantes. [12] [13] [14] [15]

Inferir una filogenia a partir de datos VAF ruidosos bajo el PPM es un problema difícil. [5] La mayoría de las herramientas de inferencia incluyen algún paso heurístico para hacer que la inferencia sea computacionalmente manejable. Ejemplos de herramientas que infieren filogenias a partir de datos VAF ruidosos incluyen AncesTree, Canopy, CITUP, EXACT y PhyloWGS. [5] [6] [7] [8] [9] En particular, EXACT realiza inferencia exacta mediante el uso de GPU para calcular una probabilidad posterior en todos los árboles posibles para problemas de tamaño pequeño. Se han realizado ampliaciones del PPM con las herramientas que lo acompañan. [16] [17] Por ejemplo, herramientas como MEDICC, TuMult y FISHtrees permiten que el número de copias de un elemento genético determinado, o ploidía, aumente o disminuya, lo que permite efectivamente la eliminación de mutaciones. [18] [19] [20]

enlaces externos

Referencias

  1. ^ Fernández-Baca D. "El problema de la filogenia perfecta" (PDF) . Editores académicos de Kluwer . Consultado el 30 de septiembre de 2012 .
  2. ^ Nakhleh L, Ringe D, Warnow T. "Redes filogenéticas perfectas: una nueva metodología para reconstruir la historia evolutiva de los lenguajes naturales" (PDF) . Consultado el 1 de octubre de 2012 .
  3. ^ abc Uhler C. "Encontrar una filogenia perfecta" (PDF) . Archivado desde el original (PDF) el 4 de marzo de 2016 . Consultado el 29 de septiembre de 2012 .
  4. ^ Nikaido M, Rooney AP, Okada N (agosto de 1999). "Relaciones filogenéticas entre cetartiodáctilos basadas en inserciones de elementos intercalados cortos y largos: los hipopótamos son los parientes más cercanos de las ballenas". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 96 (18): 10261–6. Código bibliográfico : 1999PNAS...9610261N. doi : 10.1073/pnas.96.18.10261 . PMC 17876 . PMID  10468596. 
  5. ^ abc El-Kebir M, Oesper L, Acheson-Field H, Raphael BJ (junio de 2015). "Reconstrucción de árboles clonales y composición tumoral a partir de datos de secuenciación de múltiples muestras". Bioinformática . 31 (12): i62-70. doi : 10.1093/bioinformática/btv261. PMC 4542783 . PMID  26072510. 
  6. ^ ab Satas G, Raphael BJ (julio de 2017). "Inferencia de la filogenia del tumor mediante muestreo de importancia restringido por árboles". Bioinformática . 33 (14): i152-i160. doi : 10.1093/bioinformática/btx270. PMC 5870673 . PMID  28882002. 
  7. ^ ab Malikic S, McPherson AW, Donmez N, Sahinalp CS (mayo de 2015). "Inferencia de clonalidad en múltiples muestras de tumores mediante filogenia". Bioinformática . 31 (9): 1349–56. doi : 10.1093/bioinformática/btv003 . PMID  25568283.
  8. ^ ab Ray S, Jia B, Safavi S, van Opijnen T, Isberg R, Rosch J, Bento J (22 de agosto de 2019). "Inferencia exacta bajo el modelo de filogenia perfecta". arXiv : 1908.08623 [q-bio.QM].
  9. ^ ab Deshwar AG, Vembu S, Yung CK, Jang GH, Stein L, Morris Q (febrero de 2015). "PhyloWGS: reconstrucción de la composición subclonal y evolución a partir de la secuenciación del genoma completo de tumores". Biología del genoma . 16 (1): 35. doi : 10.1186/s13059-015-0602-8 . PMC 4359439 . PMID  25786235. 
  10. ^ Pe'er I, Pupko T, Shamir R, Sharan R. "Filogenia perfecta dirigida incompleta". Universidad de Tel Aviv. Archivado desde el original el 20 de octubre de 2013 . Consultado el 30 de octubre de 2012 .{{cite web}}: Mantenimiento CS1: bot: estado de la URL original desconocido ( enlace )
  11. ^ Eskin E, Halperin E, Karp RM (abril de 2003). "Reconstrucción eficiente de la estructura del haplotipo mediante una filogenia perfecta" (PDF) . Revista de Bioinformática y Biología Computacional . 1 (1). Universidad de California, Berkeley: 1–20. doi :10.1142/S0219720003000174. PMID  15290779 . Consultado el 30 de octubre de 2012 .
  12. ^ Gusfield D. "Una descripción general de los métodos computacionales para la inferencia de haplotipos" (PDF) . Universidad de California, Davis . Consultado el 18 de noviembre de 2012 .
  13. ^ Ding Z, Filkov V, Gusfield D. "Un algoritmo de tiempo lineal para el problema de haplotipado de filogenia perfecta". Universidad de California, Davis . Consultado el 18 de noviembre de 2012 .
  14. ^ Bafna V, Gusfield D, Lancia G, Yooseph S (2003). "Haplotipado como filogenia perfecta: un enfoque directo". Revista de biología computacional . 10 (3–4): 323–40. doi :10.1089/10665270360688048. PMID  12935331.
  15. ^ Seyalioglu H. "Haplotipado como filogenia perfecta" (PDF) . Archivado desde el original (PDF) el 30 de septiembre de 2011 . Consultado el 30 de octubre de 2012 .
  16. ^ Bonizzoni P, Carrieri AP, Della Vedova G, Trucco G (octubre de 2014). "Explicar la evolución a través de una filogenia perfecta persistente restringida". Genómica BMC . 15 Suplemento 6 (T6): S10. doi : 10.1186/1471-2164-15-S6-S10 . PMC 4240218 . PMID  25572381. 
  17. ^ Hajirasouliha I, Raphael BJ (2014), Brown D, Morgenstern B (eds.), "Reconstrucción de la historia mutacional en tumores de muestras múltiples utilizando mezclas de filogenia perfecta", Algoritmos en bioinformática , Apuntes de conferencias en informática, vol. 8701, Springer Berlin Heidelberg, págs. 354–367, doi :10.1007/978-3-662-44753-6_27, ISBN 9783662447529
  18. ^ Schwarz RF, Trinh A, Sipos B, Brenton JD, Goldman N, Markowetz F (abril de 2014). Beerenwinkel N (ed.). "Cuantificación filogenética de la heterogeneidad intratumoral". PLOS Biología Computacional . 10 (4): e1003535. arXiv : 1306.1685 . Código Bib : 2014PLSCB..10E3535S. doi : 10.1371/journal.pcbi.1003535 . PMC 3990475 . PMID  24743184. 
  19. ^ Letouzé E, Allory Y, Bollet MA, Radvanyi F, Guyon F (2010). "El análisis de los perfiles del número de copias de varias muestras de tumores del mismo paciente revela los pasos sucesivos en la tumorigénesis". Biología del genoma . 11 (7): R76. doi : 10.1186/gb-2010-11-7-r76 . PMC 2926787 . PMID  20649963. 
  20. ^ Gertz EM, Chowdhury SA, Lee WJ, Wangsa D, Heselmeyer-Haddad K, Ried T, et al. (30 de junio de 2016). "FISHtrees 3.0: filogenética tumoral mediante una sonda de ploidía". MÁS UNO . 11 (6): e0158569. Código Bib : 2016PLoSO..1158569G. doi : 10.1371/journal.pone.0158569 . PMC 4928784 . PMID  27362268.