stringtranslate.com

Integración multiómica de una sola celda

Esquema de las diferentes estrategias de integración multiómica unicelular. Adaptado de Adossa et al., 2021 [1]

La integración multiómica unicelular describe un conjunto de métodos computacionales utilizados para armonizar información de múltiples " omes " para analizar conjuntamente fenómenos biológicos. [2] [3] [4] [5] Este enfoque permite a los investigadores descubrir relaciones intrincadas entre diferentes modalidades físico-químicas al establecer asociaciones entre varias capas moleculares simultáneamente. Los enfoques de integración multiómica se pueden clasificar en cuatro categorías amplias: integración temprana, integración intermedia y métodos de integración tardía. [6] La integración multiómica puede mejorar la solidez experimental al proporcionar fuentes independientes de evidencia para abordar hipótesis, aprovechar las fortalezas específicas de la modalidad para compensar las debilidades de otra mediante la imputación y ofrecer agrupaciones de tipos de células y visualizaciones que están más alineadas con la realidad [2 ] [3]

Fondo

La aparición de tecnologías de secuenciación unicelular ha revolucionado nuestra comprensión de la heterogeneidad celular, descubriendo un panorama matizado de tipos de células y sus asociaciones con procesos biológicos. Las tecnologías ómicas unicelulares se han extendido más allá del transcriptoma para perfilar diversas propiedades físico-químicas con resolución unicelular, incluidos genomas / exomas completos , metilación del ADN , accesibilidad a la cromatina , modificaciones de histonas , epitranscriptoma (p. ej., ARNm, microARN, ARNt, ARNnc) , proteoma , fosfoproteoma , metaboloma y más. [4] [7] [8] De hecho, existe un repositorio en expansión de conjuntos de datos unicelulares disponibles públicamente, ejemplificado por bases de datos en crecimiento como el Proyecto Atlas de Células Humanas (HCA) , el Atlas del Genoma del Cáncer (TCGA) y el Proyecto CODIFICAR . [9] [10] [11] [12] [13] Con la creciente diversidad tanto en los conjuntos de datos como en los tipos de datos disponibles, la integración de datos multiómicos y el análisis de datos multimodales representan trayectorias fundamentales para el futuro de la biología de sistemas .

La integración multiómica unicelular puede revelar relaciones subestimadas entre modalidades físico-químicas, ampliar nuestra definición de estados celulares más allá de los perfiles de características de una sola modalidad y proporcionar evidencia independiente durante el análisis para respaldar las pruebas de hipótesis biológicas. Sin embargo, la alta dimensionalidad (características> observaciones), el alto grado de variabilidad técnica y biológica estocástica y la escasez de datos unicelulares (baja eficiencia de recuperación de moléculas) hacen que la integración computacional sea un problema desafiante. [14] [15] [16] [17] Además, se encuentran disponibles diferentes soluciones para la integración multiómica dependiendo de factores como si los datos coinciden (mediciones simultáneas derivadas de la misma celda) o no coincidentes (mediciones derivadas de diferentes celdas). ), si hay anotaciones de tipo de celda disponibles o si la conversión de características de modalidad está disponible, con diferentes implementaciones adaptadas para adaptarse al caso de uso específico. [2] Como tal, existen múltiples enfoques para la integración de datos de una sola celda, cada uno con un caso de uso distinto y cada uno con su propio conjunto de ventajas y desventajas. [2] [6] [18]

Enfoques para la integración multiómica

Integración temprana

La integración temprana es un método que concatena (vinculando filas y columnas) dos o más conjuntos de datos ómicos en una única matriz de datos. [19] [20] Algunas ventajas de la integración temprana son que el enfoque es simple, altamente interpretable y capaz de capturar relaciones entre características de diferentes modalidades. La integración temprana se emplea principalmente para fusionar conjuntos de datos del mismo tipo de datos (por ejemplo, integrar dos conjuntos de datos de scRNA-seq distintos). Esto se debe a que la integración de conjuntos de datos de diferentes modalidades puede conducir a un conjunto de características combinado con rangos de valores de características variables. Por ejemplo, los datos de expresión suelen abarcar un rango más amplio en comparación con los datos de accesibilidad, que normalmente oscilan entre valores de 0 y 2.

Los enfoques de integración temprana producen matrices de datos con mayor dimensionalidad en comparación con la matriz original. Como tal, los métodos de reducción de dimensionalidad , como la selección y extracción de características , suelen ser pasos necesarios para el análisis posterior. La selección de características implica retener solo las variables importantes de las capas ómicas originales, mientras que la extracción de características transforma las características de entrada originales en combinaciones de las características originales. La proyección de datos de alta dimensión en un espacio de menor dimensión reduce el ruido y simplifica el conjunto de datos, lo que facilita el manejo de los datos.

Integración intermedia

La integración intermedia describe una clase de enfoques que tienen como objetivo analizar múltiples conjuntos de datos ómicos simultáneamente sin la necesidad de una transformación previa de los datos (como ocurre durante la integración de datos). [19] [20] Varios ejemplos de integración intermedia incluyen la integración basada en similitudes, la reducción de dimensiones conjuntas y el modelado estadístico.

Integración basada en similitudes

La integración basada en similitudes tiene como objetivo identificar patrones en conjuntos de datos multiómicos mediante el uso de agrupación espectral (por ejemplo, Spectrum [21] y PC-MSC [22] ). Agrupación espectral de células agrupadas basadas en matrices de similitud derivadas de un conjunto de datos multiómicos o algoritmos de fusión de gráficos (por ejemplo, Seurat4) que construyen gráficos a partir de capas ómicas individuales y los fusionan en un solo gráfico. [23]

Reducción de la dimensión conjunta

La reducción de dimensiones conjuntas tiene como objetivo reducir la complejidad de los datos multiómicos proyectando observaciones en un espacio latente de dimensiones inferiores, de modo que las diferentes capas ómicas puedan analizarse juntas. [24] El análisis de correlación canónica (CCA) , la factorización matricial no negativa (NMF) y la alineación múltiple son enfoques populares para la reducción de la dimensionalidad conjunta. Las herramientas que utilizan CCA o su CCA disperso derivado, como Seurat3 [25] y bindSC [26] identifican relaciones lineales entre conjuntos de datos mediante la identificación de combinaciones lineales de variables que maximizan la correlación de características. Las herramientas que utilizan NMF (por ejemplo, LIGER [27] y CoupledNMF [28] ) extraen representaciones de baja dimensión de datos de alta dimensión, de modo que se puedan identificar factores tanto compartidos como específicos del conjunto de datos en los múltiples conjuntos de datos ómicos. La alineación múltiple (p. ej., MATCHER [29] y MAGAN [30] ) se refiere a un enfoque en el que las representaciones de baja dimensión de varios conjuntos de datos multiómicos se calculan individualmente y luego se representan como un espacio latente común.

Modelado estadístico

Se pueden utilizar varios enfoques estadísticos, incluido el marco de modelado bayesiano probabilístico (que permite la incorporación de conocimientos previos e incertidumbres en el análisis), para integrar conjuntos de datos multiómicos. Por ejemplo, BREM-SC [31] emplea un marco de agrupación bayesiano para agrupar conjuntamente conjuntos de datos multiómicos, mientras que otras herramientas como clonealign utilizan métodos bayesianos para integrar la expresión genética y los perfiles de número de copias para estudiar clones de cáncer.

Integración tardía

La integración tardía tiene como objetivo preprocesar y modelar las modalidades ómicas por separado y luego combinar los dos modelos al final. [19] [20] La ventaja de la integración tardía es que se pueden aplicar herramientas personalizadas para cada modalidad ómica por modalidad. Si bien los enfoques de integración tardía se utilizan comúnmente en el contexto de estudios multiómicos masivos (p. ej., análisis de conglomerados de conglomerados [32] y agrupamiento integrador de aprendizaje de kernel [33] ), los enfoques de integración tardía para la integración de una sola célula siguen siendo novedosos. campo. Por ejemplo, las técnicas de aprendizaje conjunto , como la agrupación en conjuntos (p. ej., agrupación SAME, [34] Sc-GPE, [35] EC-PGMGR [36] ), han demostrado potencial para agregar resultados de agrupación de diferentes fuentes. Estos métodos combinan los resultados de agrupación de diferentes conjuntos de datos ómicos para crear una agrupación de consenso que modela las relaciones entre los resultados de agrupación individuales para encontrar una solución de agrupación global mejorada en las diferentes modalidades.

Como la integración tardía implica analizar cada capa ómica individual por separado antes de integrar los resultados en un resultado de consenso, es posible que no capture las interacciones y relaciones entre diferentes modalidades ómicas. Como tal, algunos grupos argumentan que la integración tardía representa múltiples análisis monoómicos paralelos realizados en múltiples tipos de datos, en lugar de cumplir el "verdadero objetivo" de la integración multiómicos, que es descubrir relaciones interómicas presentes en datos multiómicos. . [20]

Consideraciones para la integración de datos multiómicos

Ruido

Dado que los datos unicelulares son propensos al ruido de fuentes tanto biológicas como técnicas, puede ser necesario desarrollar métodos sólidos de eliminación de ruido para mitigarlo. [47] En el contexto de experimentos unicelulares, la variación biológica que surge de factores como explosiones transcripcionales , diferencias en el ciclo celular y el microambiente celular puede introducir ruido en el conjunto de datos. Además, también se debe abordar la variabilidad técnica resultante de factores como la mala calidad de la secuencia, la cobertura desigual de la secuencia y la contaminación de la muestra.

Compatibilidad de conjuntos de datos

La integración de diferentes modalidades ómicas puede resultar un desafío debido a las diferencias en la estructura de los diferentes conjuntos de datos. [48] ​​Por ejemplo, las características de scRNA-seq se expresan en una escala continua, mientras que los datos de accesibilidad de la cromatina (es decir, scATAC-seq) existen entre 0 y 2 (dos copias de cada región por célula). Como tal, la integración de diferentes modalidades puede requerir pasos adicionales para transformar los conjuntos de datos en un espacio latente común. Incluso entonces, las estrategias de integración, como la integración temprana, aún pueden ser propensas a problemas de sesgo si la matriz resultante está representada de manera desproporcionada por características de una modalidad específica.

Dimensionalidad

El análisis de conjuntos de datos multiómicos unicelulares a gran escala puede requerir un uso computacional intensivo debido a la alta dimensionalidad de los conjuntos de datos. [1] [2] Por lo tanto, las herramientas empleadas para integrar conjuntos de datos deben ser computacionalmente eficientes, o se deben utilizar métodos computacionales inicialmente para reducir la dimensionalidad de los conjuntos de datos (consulte la reducción de dimensionalidad).

Interpretabilidad y validación.

Muchos métodos de integración se centran en asociaciones estadísticas en lugar de modelos causales detallados. Como tal, interpretar y validar los resultados puede resultar particularmente desafiante, especialmente si se utilizó una red neuronal, ya que estos métodos son cajas negras . [20] La utilidad y validación de los métodos de integración deben evaluarse en función de aplicaciones prácticas, como la identificación precisa de relaciones multiómicas biológicamente relevantes.

Datos coincidentes y no coincidentes

La integración de datos multiómicos de una sola celda presenta diferentes desafíos dependiendo de si los conjuntos de datos coinciden o no. [48] ​​Los conjuntos de datos coincidentes se refieren a múltiples capas ómicas que se miden a partir de la misma celda individual, mientras que los datos no coincidentes se refieren a conjuntos de datos que se miden a partir de un conjunto diferente de celdas. Si bien los conjuntos de datos coincidentes permiten comparaciones directas entre las diferentes capas ómicas dentro de la misma celda, es posible que no estén tan disponibles como los conjuntos de datos no coincidentes. Por otro lado, si bien los conjuntos de datos incomparables permiten la integración de diferentes fuentes y condiciones, requieren consideraciones sobre posibles sesgos y factores de confusión. (p. ej., diferencias en poblaciones celulares, condiciones experimentales o métodos de preparación de muestras entre diferentes conjuntos de datos). Varios enfoques para la integración multiómica de datos no coincidentes incluyen la coincidencia por grupo de células (requiere anotaciones de tipo de celda), la coincidencia por características compartidas o enfoques estadísticos como NMF. [2]

Aplicaciones y usos

Si bien los conjuntos de datos de una sola modalidad han demostrado ser un pilar de la biología de sistemas, la combinación de información biológica en múltiples modalidades tiene el potencial de abordar cuestiones biológicas que no pueden inferirse mediante un solo tipo de datos.

Modelado de redes biológicas.

Por ejemplo, la integración del transcriptoma y la accesibilidad del ADN ha permitido el desarrollo de herramientas bioinformáticas para inferir redes reguladoras de genes específicas de cada tipo de célula . [49] [50] [51] Esto se logra aprovechando el factor de transcripción y la expresión del gen objetivo junto con información reguladora cis para imputar factores de transcripción relevantes y sus socios reguladores.

Ampliación de las definiciones del estado celular

Otra aplicación de la integración multiómica es ampliar las definiciones de estados celulares que incorporan características observadas en múltiples modalidades. Por ejemplo, la integración de la detección de marcadores de proteínas con el perfil del transcriptoma utilizando una tecnología de secuenciación multiómica como CITE-seq puede resolver firmas del estado celular basadas en la expresión conjunta de marcadores de superficie y reguladores de genes. [52] Esto permite inferencias más sólidas con respecto a los fenotipos celulares, que son similares y directamente comparables con los resultados de la citometría de flujo clásica . Además, definir los estados celulares basándose en el análisis de agrupamiento dentro de un espacio latente integrado puede ofrecer estimaciones más estables de los fenotipos celulares en comparación con el análisis dentro de un espacio latente de modalidad única. [2]

Imputación

Además, la integración multiómica puede superar las limitaciones específicas de la modalidad mediante la imputación . Por ejemplo, la mayoría de las tecnologías de secuenciación transcriptómica espacial adolecen de una resolución espacial limitada (los píxeles comprenden una mezcla de células locales) y una baja complejidad de características. [53] La integración de la transcriptómica espacial con scRNAseq puede ayudar a superar estas limitaciones al respaldar la deconvolución espacial de lecturas de baja resolución y estimar las frecuencias de cada tipo de célula [54] [55]

Referencias

  1. ^ ab Adossa, Nigatu; Khan, Sofía; Rytkönen, Kalle T.; Elo, Laura L. (2021). "Estrategias computacionales para la integración multiómica unicelular". Revista de Biotecnología Computacional y Estructural . 19 : 2588–2596. doi :10.1016/j.csbj.2021.04.060. ISSN  2001-0370. PMC  8114078 . PMID  34025945.
  2. ^ abcdefg Miao, Zhen; Humphreys, Benjamín D; McMahon, Andrew P; Kim, Junhyong (2021). "Integración multiómica en la era de un millón de datos unicelulares". Nat Rev Nephrol . 17 (11): 710–724. doi :10.1038/s41581-021-00463-x. PMC 9191639 . PMID  34417589. 
  3. ^ ab Subramanian, Indhupriya (2020). "Integración, interpretación y aplicación de datos multiómicos". Bioinformar Biol Insights . 14 . doi :10.1177/1177932219899051. PMC 7003173 . PMID  32076369. 
  4. ^ ab Estuardo, Tim; Sajita, Rahul (2019). "Análisis integrativo unicelular". Nat Rev Genet . 20 (5): 257–272. doi :10.1038/s41576-019-0093-7. PMID  30696980. S2CID  59409752.
  5. ^ Li, Yunjin; Mamá, Lu; Wu, Duojiao; Chen, Geng (2021). "Avances en enfoques multiómicos unicelulares y masivos para biología de sistemas y medicina de precisión". Breve Bioinformación . 22 (5). doi : 10.1093/bib/bbab024. PMID  33778867.
  6. ^ ab Adossa, Nigatu; Khan, Sofía; Rytkönen, Kalle T; Elo, Laura L (2021). "Estrategias computacionales para la integración multiómica unicelular". Comput Struct Biotechnol J. 19 : 2588–2596. doi :10.1016/j.csbj.2021.04.060. PMC 8114078 . PMID  34025945. 
  7. ^ Baysoy, Alev; Bai, Zhiliang; Satija, Rahul; Fan, Rong (2024). "El panorama tecnológico y las aplicaciones de la multiómica unicelular". Nat Rev Mol Cell Biol . 24 (10): 695–713. doi :10.1038/s41580-023-00615-w. PMC 10242609 . PMID  37280296. 
  8. ^ Macaulay, Iain C; Ponting, Chris P; Voet, Thierry (2017). "Multiómica unicelular: múltiples mediciones de células individuales". Tendencias Genet . 33 (2): 155-168. doi :10.1016/j.tig.2016.12.003. PMC 5303816 . PMID  28089370. 
  9. ^ Regev, Aviv; Teichmann, Sarah A; Lander, Eric S; Amit, ido; Benoist, Christophe; Birney, Ewan; Bodenmiller, Bernd; Campbell, Pedro; Carninci, Piero; Digno de clamor, Menna; Inteligentes, Hans; Deplancke, Bart; Dunham, Ian; Eberwine, James; Eils, Roland; Enard, Wolfgang; Granjero, Andrés; Fugger, Lars; Göttgens, Berthold; Hacohen, Nir; Haniffa, Muzlifa; Hemberg, Martín; Kim, Seung; Klenerman, Paul; Kriegstein, Arnold; Leín, Ed; Linnarsson, Sten; Lundberg, Emma; Lundeberg, Joakim; Majumder, Partha; Marioni, Juan C; Merad, Miriam; Mhlanga, Musa; Nawijn, Martijn; Netea, Mihai; Nolan, Garry; Pe'er, Dana; Phillipakis, Anthony; Ponting, Chris P; Terremoto, Stephen; Reik, Lobo; Rozenblatt-Rosen, Orit; Sanes, Josué; Satjia, Rahul; Schumacher, Ton N; Shalek, Alex; Shapiro, Aod; Sharma, Padmanee; Shin, Jay W; Stegle, Oliver; Stratton, Michael; Stubbington, Michael JT; Theis, Fabián J; Uhlen, Matías; Van Oudenaarden, Alejandro; Wagner, Allon; Watt, Fiona; Weissman, Jonathan; Mundo, Bárbara; Xavier, Ramnik; Yosef, Nir (2017). "El Atlas de las células humanas". eVida . 6 . doi : 10.7554/eLife.27041 . PMC 5762154 . PMID  29206104. 
  10. ^ Lindeboom, Rik GH; Regev, Aviv; Teichmann, Sarah A (2021). "Hacia un atlas de células humanas: tomando notas del pasado". Tendencias Genet . 37 (7): 625–630. doi : 10.1016/j.tig.2021.03.007 . PMID  33879355.
  11. ^ Weinstein, John N; Collisson, Eric A; Molinos, Gordon B; Shaw, Kenna R Mills; Ozenberger, Brad A; Ellrott, Kyle; Shmulevich, Ilya; Lijadora, Chris; Stuart, Josué M (2013). "Proyecto de análisis Pan-Cancer del Atlas del genoma del cáncer". Nat Genet . 45 (10): 1113-1120. doi :10.1038/ng.2764. PMC 3919969 . PMID  24071849. 
  12. ^ El Consorcio del Proyecto ENCODE (2012). "Una enciclopedia integrada de elementos del ADN en el genoma humano". Naturaleza . 489 (7414): 57–74. Código Bib :2012Natur.489...57T. doi : 10.1038/naturaleza11247. PMC 3439153 . PMID  22955616. 
  13. ^ El Consorcio del Proyecto ENCODE (2020). "Enciclopedias ampliadas de elementos de ADN en los genomas humano y de ratón". Naturaleza . 583 (7818): 699–710. Código Bib :2020Natur.583..699E. doi :10.1038/s41586-020-2493-4. PMC 7410828 . PMID  32728249. 
  14. ^ Lähnemann, David; Köster, Johannes; Szczurek, Ewa; McCarthy, Davis J; Hicks, Stephanie C; Robinson, Mark D; Vallejos, Catalina A; Campbell, Kieran R; Beerenwinkel, Niko; Mahfouz, Ahmed; Pinello, Luca; Skums, Pavel; Stamatakis, Alexandros; Attolini, Camille Stephan-Otto; Aparicio, Samuel; Baaijens, Jasmijn; Balvert, Marleen; Barbanson, compra De; Capuchio, Antonio; Corleone, Giacomo; Dutilh, Bas E; Florescu, María; Guryev, Víctor; Holmer, Rens; Jahn, Katharina; Lobo, Thamar Jessurun; Keizer, Emma M; Khatri, indio; Kielbasa, Szymon M; Korbel, Jan O; Kozlov, Alexey M; Kuo, Tzu-Hao; Lelieveldt, Boudewijn PF; Mandoiu, Ión I; Marioni, Juan C; Marschall, Tobías; Mölder, Félix; Niknejad, Amir; Rączkowska, Alicja; Reinders, Marcel; Ridder, Jeroen De; Saliba, Antoine-Emmanuel; Somarakis, Antonios; Stegle, Oliver; Theis, Fabián J; Yang, Huan; Zelikovsky, Alex; McHardy, Alice C; Rafael, Benjamín J; Shah, Sohrab P; Schönhuth, Alejandro (2020). "Once grandes desafíos en la ciencia de datos unicelulares". Genoma Biol . 21 (1): 31. doi : 10.1186/s13059-020-1926-6 . PMC 7007675 . PMID  32033589. 
  15. ^ Santiago-Rodríguez, Tasha M; Hollister, Emily B (2021). "Integración de datos multiómicos: una revisión de conceptos, consideraciones y enfoques". Semín Perinatol . 45 (6). doi :10.1016/j.semperi.2021.151456. PMID  34256961. S2CID  235822759.
  16. ^ Yuan, Guo-Cheng; Cai, largo; Elowitz, Michael; Enver, Tariq; Fan, Guoping; Guo, Guoji; Irizarry, Rafael; Kharchenko, Peter; Kim, Junhyong; Orkin, Estuardo; Quackenbush, John; Saadatpour, Assieh; Schroeder, Timm; Shivdasani, Ramesh; Tirosh, Italia (2017). "Desafíos y direcciones emergentes en el análisis unicelular". Genoma Biol . 18 (1): 84. doi : 10.1186/s13059-017-1218-y . PMC 5421338 . PMID  28482897. 
  17. ^ Argelaguet, RICARD; Cuomo, Anna SE; Stegle, Oliver; Marioni, John C (2021). "Principios computacionales y desafíos en la integración de datos unicelulares". Nat Biotecnología . 39 (10): 1202-1215. doi :10.1038/s41587-021-00895-7. PMID  33941931. S2CID  233722751.
  18. ^ Wu, Yan; Zhang, Kun (2020). "Herramientas para el análisis de datos de secuenciación de ARN unicelular de alta dimensión". Nat Rev Nephrol . 16 (7): 408–421. doi :10.1038/s41581-020-0262-0. PMID  32221477. S2CID  214672522.
  19. ^ abc Adossa, Nigatu; Khan, Sofía; Rytkönen, Kalle T.; Elo, Laura L. (2021). "Estrategias computacionales para la integración multiómica unicelular". Revista de Biotecnología Computacional y Estructural . 19 : 2588–2596. doi :10.1016/j.csbj.2021.04.060. PMC 8114078 . PMID  34025945. 
  20. ^ abcde Picard, Milán; Scott-Boyer, Marie-Pier; Bodein, Antoine; Perin, Olivier; Derecho, Arnaud (2021). "Estrategias de integración de datos multiómicos para análisis de aprendizaje automático". Revista de Biotecnología Computacional y Estructural . 19 : 3735–3746. doi :10.1016/j.csbj.2021.06.030. ISSN  2001-0370. PMC 8258788 . PMID  34285775. 
  21. ^ ab John, Christopher R; Watson, David; Barnes, Michael R; Pitzalis, Costantino; Lewis, Myles J (10 de septiembre de 2019). "Espectro: agrupamiento espectral rápido consciente de la densidad para datos únicos y multiómicos". Bioinformática . 36 (4): 1159-1166. doi : 10.1093/bioinformática/btz704. ISSN  1367-4803. PMC 7703791 . PMID  31501851. 
  22. ^ Kumar, Abhishek; Rai, Piyush; Daume, Hal (2011). "Agrupación espectral de vistas múltiples co-regularizada". Avances en los sistemas de procesamiento de información neuronal . 24 . Curran asociados, Inc.
  23. ^ Wang, Bo; Mezlini, Aziz M; Demir, Feyyaz; Fiume, Marc; Tu, Zhuowen; Brudno, Michael; Haibe-Kains, Benjamín; Goldenberg, Anna (marzo de 2014). "Fusión de redes de similitud para agregar tipos de datos a escala genómica". Métodos de la naturaleza . 11 (3): 333–337. doi :10.1038/nmeth.2810. ISSN  1548-7091. PMID  24464287. S2CID  9033318.
  24. ^ Cantini, Laura; Zakeri, Pooya; Hernández, Celine; Naldi, Aurelien; Ladrón, Denis; Rémy, Isabel; Baudot, Anaïs (5 de enero de 2021). "Evaluación comparativa de enfoques conjuntos de reducción de dimensionalidad multiómica para el estudio del cáncer". Comunicaciones de la naturaleza . 12 (1): 124. Bibcode : 2021NatCo..12..124C. doi :10.1038/s41467-020-20430-7. ISSN  2041-1723. PMC 7785750 . PMID  33402734. 
  25. ^ ab Estuardo, Tim; Mayordomo, Andrés; Hoffman, Pablo; Hafemeister, Christoph; Papalexi, Eftimia; Mauck, William M.; Hao, Yuhan; Stoeckius, Marlon; Smibert, Peter; Satija, Rahul (junio de 2019). "Integración integral de datos unicelulares". Celúla . 177 (7): 1888–1902.e21. doi :10.1016/j.cell.2019.05.031. ISSN  0092-8674. PMC 6687398 . PMID  31178118. 
  26. ^ ab Dou, Jinzhuang; Liang, Shaoheng; Mohanty, Vakul; Miao, Qi; Huang, Yuefan; Liang, Qingnan; Cheng, Xuesen; Kim, Sangbae; Choi, Jongsu; Li, Yumei; Li, Li; Daher, mayo; Basar, Rafet; Rezvani, Katayoun; Chen, Rui (9 de mayo de 2022). "Integración multimodal biorden de datos unicelulares". Biología del genoma . 23 (1): 112. doi : 10.1186/s13059-022-02679-x . ISSN  1474-760X. PMC 9082907 . PMID  35534898. 
  27. ^ ab Welch, Joshua D.; Kozareva, Velina; Ferreira, Ashley; Vanderburg, Charles; Martín, Carly; Macosko, Evan Z. (junio de 2019). "La integración multiómica unicelular compara y contrasta las características de la identidad de las células cerebrales". Celúla . 177 (7): 1873–1887.e17. doi : 10.1016/j.cell.2019.05.006. ISSN  0092-8674. PMC 6716797 . PMID  31178122. 
  28. ^ ab Duren, Zhana; Chen, Xi; Zamanighomi, Mahdi; Zeng, Wanwen; Satpatía, Ansuman T.; Chang, Howard Y.; Wang, Yong; Wong, ala colgada (24 de julio de 2018). "Análisis integrativo de datos de genómica unicelular mediante factorizaciones de matrices no negativas acopladas". Procedimientos de la Academia Nacional de Ciencias . 115 (30): 7723–7728. Código Bib : 2018PNAS..115.7723D. doi : 10.1073/pnas.1805681115 . ISSN  0027-8424. PMC 6065048 . PMID  29987051. 
  29. ^ Welch, Josué D.; Hartemink, Alexander J.; Prins, Jan F. (24 de julio de 2017). "MATCHER: la alineación múltiple revela la correspondencia entre el transcriptoma unicelular y la dinámica del epigenoma". Biología del genoma . 18 (1): 138. doi : 10.1186/s13059-017-1269-0 . ISSN  1474-760X. PMC 5525279 . PMID  28738873. 
  30. ^ ab Amodio, Mateo; Krishnaswamy, Smita (9 de febrero de 2018), MAGAN: Alineación de colectores biológicos , arXiv : 1803.00385
  31. ^ ab Wang, Xinjun; Sol, Zhe; Zhang, Yanfu; Xu, Zhongli; Xin, Hongyi; Huang, Heng; Duerr, Richard H; Chen, Kong; Ding, Ying; Chen, Wei (7 de mayo de 2020). "BREM-SC: un modelo de mezcla de efectos aleatorios bayesianos para agrupación conjunta de datos multiómicos de una sola célula". Investigación de ácidos nucleicos . 48 (11): 5814–5824. doi : 10.1093/nar/gkaa314. ISSN  0305-1048. PMC 7293045 . PMID  32379315. 
  32. ^ OSBREAC; Aure, Miriam Ragle; Vitelli, Valeria; Jernstrom, Sandra; Kumar, Surendra; Krohn, Marit; Debido, Eldri U.; Haukaas, Tonje Husby; Leivonen, Suvi-Katri; Vollan, Hans Kristian Moen; Lüders, Torben; Rodland, Einar; Vaske, Charles J.; Zhao, Wei; Møller, Elen K. (diciembre de 2017). "La agrupación integrativa revela una nueva división en el subtipo luminal A de cáncer de mama con impacto en el resultado". Investigación del cáncer de mama . 19 (1): 44. doi : 10.1186/s13058-017-0812-y . ISSN  1465-542X. PMC 5372339 . PMID  28356166. 
  33. ^ Cabassi, Alessandra; Kirk, Paul D (27 de junio de 2020). "Aprendizaje de múltiples núcleos para la agrupación por consenso integrador de conjuntos de datos ómicos". Bioinformática . 36 (18): 4789–4796. doi : 10.1093/bioinformática/btaa593. PMC 7750932 . PMID  32592464 . Consultado el 22 de febrero de 2024 . 
  34. ^ Eh, Rut; Yang, Yuchen; Jiang, Yuchao; Shen, Yin; Li, Yun (2020). "Agrupación MISMA: agrupación agregada unicelular mediante conjunto de modelos de mezcla". Investigación de ácidos nucleicos . 48 (1): 86–95. doi : 10.1093/nar/gkz959. PMC 6943136 . PMID  31777938 . Consultado el 22 de febrero de 2024 . 
  35. ^ Zhu, Xiaoshu; Li, Jian; Li, Hong-Dong; Xie, Miao; Wang, Jianxin (15 de diciembre de 2020). "Sc-GPE: un método de conjunto de clústeres basado en partición de gráficos para una sola celda". Fronteras en genética . 11 . doi : 10.3389/fgene.2020.604790 . ISSN  1664-8021. PMC 7770236 . PMID  33384718. 
  36. ^ Zhu, Yuan; Zhang, De-Xin; Zhang, Xiao-Fei; Yi, Ming; Ou-Yang, Le; Wu, Mengyun (2020). "EC-PGMGR: agrupación de conjuntos basada en un modelo gráfico de probabilidad con regularización de gráficos para datos de RNA-seq unicelulares". Fronteras en genética . 11 . doi : 10.3389/fgene.2020.572242 . ISSN  1664-8021. PMC 7673820 . PMID  33329710. 
  37. ^ Kim, Hani Jieun; Lin, Yingxin; Geddes, Thomas A.; Yang, Jean Yee Hwa; Yang, Pengyi (2020). "CiteFuse permite el análisis multimodal de datos CITE-seq". Bioinformática . 36 (14): 4137–4143. doi : 10.1093/bioinformática/btaa282. PMID  32353146 . Consultado el 22 de febrero de 2024 .
  38. ^ Campbell, Kieran R.; Steif, Adi; Laks, Emma; Zahn, Hans; Lai, Daniel; McPherson, Andrés; Farahani, Hossein; Kabeer, Farhia; O'Flanagan, Ciara; Biele, Justina; Brimhall, Jazmín; Wang, Beixi; Walters, Pascale; Consorcio, IMAXT; Bouchard-Côté, Alexandre (12 de marzo de 2019). "clonealign: integración estadística de datos de secuenciación de ADN y ARN unicelulares independientes de cánceres humanos". Biología del genoma . 20 (1): 54. doi : 10.1186/s13059-019-1645-z . ISSN  1474-760X. PMC 6417140 . PMID  30866997. 
  39. ^ Liu, Jie; Huang, Yuanhao; Singh, Ritambhara; Vert, Jean-Philippe; Noble, William Stafford (2019). "Incrustación conjunta de múltiples mediciones ómicas unicelulares". Algoritmos en Bioinformática: ... Taller Internacional, Wabi ..., Actas. Wabi (Taller) . 143 . Katharina T. Huber, Dan Gusfield. Schloss Dagstuhl – Leibniz-Zentrum für Informatik: 13 páginas, 3000894 bytes. doi : 10.4230/LIPICS.WABI.2019.10 . ISSN  1868-8969. PMC 8496402 . PMID  34632462. 
  40. ^ Argelaguet, Ricard; Arnol, Damián; Bredikhin, Danila; Deloro, Yonatan; Velten, Britta; Marioni, John C.; Stegle, Oliver (11 de mayo de 2020). "MOFA +: un marco estadístico para la integración integral de datos unicelulares multimodales". Biología del genoma . 21 (1): 111. doi : 10.1186/s13059-020-02015-1 . ISSN  1474-760X. PMC 7212577 . PMID  32393329. 
  41. ^ Singh, Rohit; Hola, Brian L.; Narayan, Ashwin; Berger, Bonnie (3 de mayo de 2021). "Esquema: el aprendizaje métrico permite la síntesis interpretable de modalidades unicelulares heterogéneas". Biología del genoma . 22 (1): 131. doi : 10.1186/s13059-021-02313-2 . ISSN  1474-760X. PMC 8091541 . PMID  33941239. 
  42. ^ Zuo, Chunman; Chen, Luonan (17 de noviembre de 2020). "Modelo de análisis de aprendizaje conjunto profundo de transcriptoma unicelular y datos de accesibilidad de cromatina abierta". Sesiones informativas en Bioinformática . 22 (4). doi : 10.1093/bib/bbaa287. ISSN  1467-5463. PMC 8293818 . PMID  33200787. 
  43. ^ Hao, Yuhan; Hao, Stephanie; Andersen-Nissen, Erica; Mauck, William M.; Zheng, Shiwei; Mayordomo, Andrés; Lee, Maddie J.; Wilk, Aaron J.; Darby, Charlotte; Zager, Michael; Hoffman, Pablo; Stoeckius, Marlon; Papalexi, Eftimia; Mimitou, Eleni P.; Jain, Jaison (junio de 2021). "Análisis integrado de datos unicelulares multimodales". Celúla . 184 (13): 3573–3587.e29. doi : 10.1016/j.cell.2021.04.048. ISSN  0092-8674. PMC 8238499 . PMID  34062119. 
  44. ^ Hao, Yuhan; Estuardo, Tim; Kowalski, Madeline H.; Choudhary, Saket; Hoffman, Pablo; Hartman, Austin; Srivastava, Avi; Molla, Gesmira; Madad, Shaista; Fernández-Granda, Carlos; Satija, Rahul (febrero de 2024). "Aprendizaje de diccionarios para análisis unicelular integrador, multimodal y escalable". Biotecnología de la Naturaleza . 42 (2): 293–304. doi :10.1038/s41587-023-01767-y. ISSN  1546-1696. PMC 10928517 . PMID  37231261. 
  45. ^ Gayoso, Adán; Steier, Zoë; López, Romain; Regier, Jeffrey; Nazor, Kristopher L.; Calles, Aarón; Yosef, Nir (marzo de 2021). "Modelado probabilístico conjunto de datos multiómicos unicelulares con totalVI". Métodos de la naturaleza . 18 (3): 272–282. doi :10.1038/s41592-020-01050-x. ISSN  1548-7105. PMC 7954949 . PMID  33589839. 
  46. ^ Cao, Kai; Bai, Xiangqi; Hong, Yiguang; Wan, Lin (1 de julio de 2020). "Alineación topológica no supervisada para la integración multiómica unicelular". Bioinformática . 36 (Suplemento_1): i48 – i56. doi : 10.1093/bioinformática/btaa443. ISSN  1367-4803. PMC 7355262 . PMID  32657382. 
  47. ^ Janssen, Philipp; Kliesmete, Zane; Vieth, Beate; Adiconis, Xian; Simmons, Sean; Marshall, Jamie; McCabe, Cristina; Hola, Holger; Levin, Josué Z.; Enard, Wolfgang; Hellmann, Inés (19 de junio de 2023). "El efecto del ruido de fondo y su eliminación en el análisis de datos de expresión unicelular". Biología del genoma . 24 (1): 140. doi : 10.1186/s13059-023-02978-x . ISSN  1474-760X. PMC 10278251 . PMID  37337297. 
  48. ^ ab Argelaguet, Ricard; Cuomo, Anna SE; Stegle, Oliver; Marioni, John C. (octubre de 2021). "Principios computacionales y desafíos en la integración de datos unicelulares". Biotecnología de la Naturaleza . 39 (10): 1202-1215. doi :10.1038/s41587-021-00895-7. ISSN  1546-1696. PMID  33941931. S2CID  233722751.
  49. ^ Kim, Daniel; Tran, Andy; Kim, Hani Jieun; Lin, Yingxin; Yang, Jean Yee Hwa; Yang, Pengyi (2023). "Reconstrucción de la red reguladora de genes: aprovechar el poder de los datos multiómicos unicelulares". npj Syst Biol Appl . 9 (1): 51. doi :10.1038/s41540-023-00312-6. PMC 10587078 . PMID  37857632. 
  50. ^ Bravo González-Blas, Carmen; De invierno, Seppe; Hulselmans, Gert; Hecker, Nikolai; Matetovici, Irina; Christiaens, Valerie; Poovathingal, Suresh; Wouters, Jasper; Aibar, Sara; Aerts, Stein (2023). "SCENIC+: inferencia multiómica unicelular de potenciadores y redes reguladoras de genes". Métodos Nat . 20 (9): 1355-1367. doi :10.1038/s41592-023-01938-4. PMC 10482700 . PMID  37443338. 
  51. ^ Fleck, Jonas Simon; Jansen, Sophie Martina Johanna; Totalmente, Damián; Zenk, Agencia Fides; Seimiya, Makiko; Jainista, Akanksha; Okamoto, Ryoko; Santel, Malgorzata; Él, Zhisong; Campamento, J. Gray; Treutlein, Bárbara (2023). "Inferir y perturbar los regulomas del destino celular en organoides del cerebro humano". Naturaleza . 621 (7978): 365–372. Código Bib :2023Natur.621..365F. doi :10.1038/s41586-022-05279-8. PMC 10499607 . PMID  36198796. 
  52. ^ Stoeckius, Marlon; Hafemeister, Christoph; Stephenson, William; Houck-Loomis, Brian; Chattopadhyay, Pratip K; Swerdlow, Harold; Sajita, Rahul; Smibert, Peter (2017). "Medición simultánea de epítopo y transcriptoma en células individuales". Métodos Nat . 14 (9): 865–868. doi :10.1038/nmeth.4380. PMC 5669064 . PMID  28759029. 
  53. ^ Atta, Lyla; Fan, Jean (2021). "Desafíos y oportunidades computacionales en el análisis de datos transcriptómicos resueltos espacialmente". Comuna Nacional . 12 (1): 5283. Bibcode : 2021NatCo..12.5283A. doi :10.1038/s41467-021-25557-9. PMC 8421472 . PMID  34489425. 
  54. ^ Andersson, Alma; Bergenstråhle, Joseph; Áspid, Michaela; Jurek, Alexandra; Fernández Navarro, José; Lundeberg, Joakim (2020). "La transcriptómica espacial y unicelular permite la inferencia probabilística de la topografía del tipo celular". Biol Común . 3 (1): 565. doi :10.1038/s42003-020-01247-y. PMC 7547664 . PMID  33037292. 
  55. ^ Mamá, Ying; Zhou, Xiang (2022). "Deconvolución de tipo celular espacialmente informada para transcriptómica espacial". Nat Biotecnología . 40 (9): 1349-1359. doi :10.1038/s41587-022-01273-7. PMC 9464662 . PMID  35501392.