stringtranslate.com

Transcriptómica de células individuales

La transcriptómica unicelular examina el nivel de expresión génica de células individuales en una población dada midiendo simultáneamente la concentración de ARN (convencionalmente solo ARN mensajero (ARNm)) de cientos a miles de genes. [1] La transcriptómica unicelular permite desentrañar poblaciones celulares heterogéneas , reconstruir vías de desarrollo celular y modelar dinámicas transcripcionales, todo lo cual antes estaba enmascarado en la secuenciación masiva de ARN. [2]

Fondo

El desarrollo de la secuenciación de ARN de alto rendimiento (RNA-seq) y de los microarrays ha convertido el análisis de la expresión génica en una rutina. Anteriormente, el análisis de ARN se limitaba al seguimiento de transcripciones individuales mediante transferencia Northern o PCR cuantitativa . Un mayor rendimiento y velocidad permiten a los investigadores caracterizar con frecuencia los perfiles de expresión de poblaciones de miles de células. Los datos de los ensayos en masa han permitido identificar genes expresados ​​de forma diferencial en distintas poblaciones de células y descubrir biomarcadores . [3]

Estos estudios son limitados, ya que proporcionan mediciones para tejidos completos y, como resultado, muestran un perfil de expresión promedio para todas las células constituyentes. Esto tiene un par de desventajas. En primer lugar, diferentes tipos de células dentro del mismo tejido pueden tener roles distintos en organismos multicelulares. A menudo forman subpoblaciones con perfiles transcripcionales únicos. Las correlaciones en la expresión génica de las subpoblaciones a menudo se pueden pasar por alto debido a la falta de identificación de la subpoblación. [1] En segundo lugar, los ensayos en masa no reconocen si un cambio en el perfil de expresión se debe a un cambio en la regulación o composición, por ejemplo, si un tipo de célula surge para dominar la población. Por último, cuando su objetivo es estudiar la progresión celular a través de la diferenciación , los perfiles de expresión promedio solo pueden ordenar las células por tiempo en lugar de por etapa de desarrollo. En consecuencia, no pueden mostrar tendencias en los niveles de expresión génica específicos de ciertas etapas. [4]

Los recientes avances en biotecnología permiten medir la expresión génica en cientos o miles de células individuales simultáneamente. Si bien estos avances en las tecnologías transcriptómicas han permitido generar datos transcriptómicos de células individuales, también han presentado nuevos desafíos computacionales y analíticos. Los bioinformáticos pueden utilizar técnicas de secuenciación masiva de ARN para datos de células individuales. Aun así, se han tenido que diseñar muchos nuevos enfoques computacionales para este tipo de datos a fin de facilitar un estudio completo y detallado de los perfiles de expresión de células individuales. [5]

Pasos experimentales

Hasta el momento no existe una técnica estandarizada para generar datos de células individuales: todos los métodos deben incluir el aislamiento de células de la población, la formación de lisados , la amplificación mediante transcripción inversa y la cuantificación de los niveles de expresión. Las técnicas comunes para medir la expresión son la PCR cuantitativa o la secuenciación de ARN [6] .

Aislamiento de células individuales

Flujo de trabajo de clasificación celular asistida por fluorescencia (FACS)

Existen varios métodos disponibles para aislar y amplificar células para el análisis de células individuales. Las técnicas de bajo rendimiento permiten aislar cientos de células, son lentas y permiten la selección. Estos métodos incluyen:

Los métodos de alto rendimiento permiten aislar rápidamente de cientos a decenas de miles de células. [7] Las técnicas comunes incluyen:

La combinación de FACS con scRNA-seq ha producido protocolos optimizados como SORT-seq. [8] Aquí se puede encontrar una lista de estudios que utilizaron SORT-seq. [9] Además, la combinación de dispositivos microfluídicos con scRNA-seq se ha optimizado en los protocolos de 10x Genomics. [10]

PCR cuantitativa (qPCR)

Para medir el nivel de expresión de cada transcripción se puede aplicar la qPCR. Se utilizan cebadores específicos de genes para amplificar el gen correspondiente como con la PCR regular y, como resultado, los datos generalmente solo se obtienen para tamaños de muestra de menos de 100 genes. La inclusión de genes de mantenimiento , cuya expresión debe ser constante bajo las condiciones, se utiliza para la normalización. Los genes de mantenimiento más comúnmente utilizados incluyen GAPDH y α- actina , aunque la confiabilidad de la normalización a través de este proceso es cuestionable ya que existe evidencia de que el nivel de expresión puede variar significativamente. [11] Los tintes fluorescentes se utilizan como moléculas indicadoras para detectar el producto de PCR y monitorear el progreso de la amplificación: el aumento en la intensidad de la fluorescencia es proporcional a la concentración de amplicón . Se realiza un gráfico de fluorescencia vs. número de ciclo y se utiliza un nivel de fluorescencia umbral para encontrar el número de ciclo en el que el gráfico alcanza este valor. El número de ciclo en este punto se conoce como ciclo umbral (C t ) y se mide para cada gen. [12]

Secuenciación de ARN de una sola célula

Experimento de secuenciación de ARN

La técnica de secuenciación de ARN de una sola célula convierte una población de ARN en una biblioteca de fragmentos de ADNc . Estos fragmentos se secuencian mediante técnicas de secuenciación de última generación de alto rendimiento y las lecturas se asignan nuevamente al genoma de referencia, lo que proporciona un recuento del número de lecturas asociadas con cada gen. [13]

La normalización de los datos de secuenciación de ARN explica la variación de célula a célula en la eficiencia de la formación y secuenciación de la biblioteca de ADNc. Un método se basa en el uso de ARN extrínsecos (secuencias de ARN de secuencia y cantidad conocidas) que se agregan en cantidades iguales a cada lisado celular y se utilizan para normalizar el recuento de lecturas por el número de lecturas asignadas al ARNm de la secuencia . [14]

Otro control utiliza identificadores moleculares únicos (UMI), secuencias cortas de ADN (6–10 nt) que se añaden a cada ADNc antes de la amplificación y actúan como un código de barras para cada molécula de ADNc. La normalización se logra utilizando el número de UMI únicos asociados con cada gen para tener en cuenta las diferencias en la eficiencia de la amplificación. [15]

Se ha combinado una técnica de spike-ins, UMI y otros enfoques para lograr una normalización más precisa.

Consideraciones

Un problema asociado con los datos de células individuales se presenta en forma de distribuciones de expresión génica infladas a cero, conocidas como abandonos técnicos, que son comunes debido a bajas concentraciones de ARNm de genes menos expresados ​​que no se capturan en el proceso de transcripción inversa. El porcentaje de moléculas de ARNm en el lisado celular que se detectan es a menudo solo del 10 al 20 %. [16]

Cuando se utilizan secuencias de ARN para la normalización, se supone que las eficiencias de amplificación y secuenciación para el ARN endógeno y el secuenciado son las mismas. La evidencia sugiere que este no es el caso, dadas las diferencias fundamentales en tamaño y características, como la falta de una cola poliadenilada en las secuencias de ARN y, por lo tanto, una longitud más corta. [17] Además, la normalización mediante UMI supone que la biblioteca de ADNc está secuenciada hasta la saturación, lo que no siempre es el caso. [15 ]

Análisis de datos

Los conocimientos basados ​​en el análisis de datos de células individuales suponen que la entrada es una matriz de recuentos de expresión genética normalizada, generada mediante los enfoques delineados anteriormente, y pueden brindar oportunidades que no se pueden obtener en forma masiva.

Se obtuvieron tres conclusiones principales: [18]

  1. Identificación y caracterización de tipos celulares y su organización espacial en el tiempo
  2. Inferencia de redes reguladoras de genes y su fuerza en células individuales
  3. Clasificación del componente estocástico de la transcripción

Las técnicas descritas han sido diseñadas para ayudar a visualizar y explorar patrones en los datos con el fin de facilitar la revelación de estas tres características.

Agrupamiento

Datos gaussianos de K-Means
Dendrograma del iris elaborado mediante un algoritmo de agrupamiento jerárquico

La agrupación permite la formación de subgrupos en la población celular. Las células se pueden agrupar por su perfil transcriptómico para analizar la estructura de la subpoblación e identificar tipos o subtipos celulares raros. Alternativamente, los genes se pueden agrupar por sus estados de expresión para identificar genes covariantes. Se ha utilizado una combinación de ambos enfoques de agrupación, conocida como biclustering , para agrupar simultáneamente por genes y células para encontrar genes que se comporten de manera similar dentro de los grupos de células. [19]

Los métodos de agrupamiento aplicados pueden ser agrupamiento K-medias , formando grupos disjuntos, o agrupamiento jerárquico , formando particiones anidadas.

Biclustering

La biagrupación ofrece varias ventajas al mejorar la resolución de la agrupación. Los genes que solo son informativos para un subconjunto de células y, por lo tanto, solo se expresan allí, se pueden identificar mediante la biagrupación. Además, se pueden identificar genes de comportamiento similar que diferencian un grupo de células de otro utilizando este método. [20]

Reducción de dimensionalidad

Ejemplo de PCA de frecuencias del haplogrupo del cromosoma Y de poblaciones guineanas y de otras poblaciones africanas

Los algoritmos de reducción de dimensionalidad, como el análisis de componentes principales (PCA) y el t-SNE, se pueden utilizar para simplificar los datos para la visualización y la detección de patrones mediante la transformación de las células de un espacio de alta dimensión a uno de menor dimensión . El resultado de este método produce gráficos con cada célula como un punto en un espacio bidimensional o tridimensional. La reducción de dimensionalidad se utiliza con frecuencia antes de la agrupación, ya que las células en altas dimensiones pueden parecer cercanas de forma errónea debido a que las métricas de distancia se comportan de forma no intuitiva. [21]

Análisis de componentes principales

La técnica más utilizada es el PCA, que identifica las direcciones de los componentes principales de mayor varianza y transforma los datos de modo que el primer componente principal tenga la mayor varianza posible y los componentes principales sucesivos tengan a su vez la mayor varianza posible, sin dejar de ser ortogonales a los componentes anteriores. La contribución que cada gen hace a cada componente se utiliza para inferir qué genes contribuyen más a la varianza en la población y están involucrados en la diferenciación de diferentes subpoblaciones. [22]

Expresión diferencial

Para detectar diferencias en el nivel de expresión génica entre dos poblaciones se utilizan datos transcriptómicos tanto de células individuales como en masa. Se han diseñado métodos especializados para datos de células individuales que tienen en cuenta características de las células individuales, como las pérdidas técnicas y la forma de la distribución, por ejemplo, bimodal frente a unimodal . [23]

Enriquecimiento de la ontología genética

Los términos de ontología genética describen las funciones de los genes y las relaciones entre esas funciones en tres clases:

  1. Función molecular
  2. Componente celular
  3. Proceso biológico

El enriquecimiento de términos de ontología genética (GO) es una técnica que se utiliza para identificar qué términos de GO están sobrerrepresentados o subrepresentados en un conjunto determinado de genes. En el análisis de células individuales, se puede seleccionar una lista de entrada de genes de interés en función de los genes expresados ​​de forma diferencial o de los grupos de genes generados a partir de la biagrupación. La cantidad de genes anotados en un término de GO en la lista de entrada se normaliza en comparación con la cantidad de genes anotados en un término de GO en el conjunto de antecedentes de todos los genes del genoma para determinar la significación estadística. [24]

Ordenamiento pseudotemporal

Gráfico con árbol de expansión mínimo

El ordenamiento pseudotemporal (o inferencia de trayectoria) es una técnica que tiene como objetivo inferir la dinámica de la expresión génica a partir de datos de células individuales. El método intenta ordenar las células de tal manera que las células similares estén posicionadas cerca unas de otras. Esta trayectoria de células puede ser lineal, pero también puede bifurcarse o seguir estructuras gráficas más complejas. La trayectoria, por lo tanto, permite la inferencia de la dinámica de la expresión génica y el ordenamiento de las células por su progresión a través de la diferenciación o la respuesta a estímulos externos. El método se basa en los supuestos de que las células siguen el mismo camino a través del proceso de interés y que su estado transcripcional se correlaciona con su progresión. El algoritmo se puede aplicar tanto a poblaciones mixtas como a muestras temporales.

Se han desarrollado más de 50 métodos para el ordenamiento pseudotemporal, y cada uno tiene sus propios requisitos de información previa (como celdas iniciales o datos de curso temporal), topologías detectables y metodología. [25] Un ejemplo de algoritmo es el algoritmo Monocle [26] que lleva a cabo la reducción de dimensionalidad de los datos, construye un árbol de expansión mínimo utilizando los datos transformados, ordena las celdas en pseudotiempo siguiendo la ruta conectada más larga del árbol y, en consecuencia, etiqueta las celdas por tipo. Otro ejemplo es el algoritmo de pseudotiempo de difusión (DPT), [24] que utiliza un mapa de difusión y un proceso de difusión. Otra clase de métodos como MARGARET [27] emplean la partición de grafos para capturar topologías de trayectoria complejas como trayectorias desconectadas y multifurcadas.

Inferencia de red

La inferencia de redes de regulación genética es una técnica que tiene como objetivo construir una red, mostrada como un gráfico, en el que los nodos representan los genes y los bordes indican interacciones correguladoras. El método se basa en el supuesto de que una fuerte relación estadística entre la expresión de los genes es una indicación de una posible relación funcional. [28] El método más comúnmente utilizado para medir la fuerza de una relación estadística es la correlación . Sin embargo, la correlación no logra identificar relaciones no lineales y se utiliza la información mutua como alternativa. Los grupos de genes vinculados en una red significan genes que experimentan cambios coordinados en la expresión. [29]

Integración

La presencia o fuerza de los efectos técnicos y los tipos de células observados a menudo difieren en los conjuntos de datos transcriptómicos de células individuales generados utilizando diferentes protocolos experimentales y bajo diferentes condiciones. Esta diferencia da como resultado fuertes efectos de lote que pueden sesgar los hallazgos de los métodos estadísticos aplicados en los lotes, particularmente en presencia de factores de confusión . [30] Como resultado de las propiedades antes mencionadas de los datos transcriptómicos de células individuales, se observó que los métodos de corrección de lotes desarrollados para datos de secuenciación en masa tenían un rendimiento deficiente. En consecuencia, los investigadores desarrollaron métodos estadísticos para corregir los efectos de lotes que son robustos a las propiedades de los datos transcriptómicos de células individuales para integrar datos de diferentes fuentes o lotes experimentales. Laleh Haghverdi realizó un trabajo fundamental al formular el uso de vecinos mutuos más cercanos entre cada lote para definir vectores de corrección de lotes. [31] Con estos vectores, puede fusionar conjuntos de datos que incluyan al menos un tipo de célula compartida. Un enfoque ortogonal implica la proyección de cada conjunto de datos en un espacio compartido de baja dimensión utilizando el análisis de correlación canónica . [32] Los vecinos más próximos mutuos y el análisis de correlación canónica también se han combinado para definir "anclajes" de integración que comprenden celdas de referencia en un conjunto de datos, a los cuales se normalizan las celdas de consulta en otro conjunto de datos. [33] Otra clase de métodos (por ejemplo, scDREAMER [34] ) utiliza modelos generativos profundos como autocodificadores variacionales para aprender representaciones celulares latentes invariantes por lotes que se pueden utilizar para tareas posteriores como agrupamiento de tipos de células, eliminación de ruido de vectores de expresión génica de células individuales e inferencia de trayectorias. [27]

Véase también

Referencias

  1. ^ ab Kanter, Itamar; Kalisky, Tomer (2015). "Transcriptómica de células individuales: métodos y aplicaciones". Frontiers in Oncology . 5 : 53. doi : 10.3389/fonc.2015.00053 . ISSN  2234-943X. PMC  4354386 . PMID  25806353.
  2. ^ Liu, Serena; Trapnell, Cole (2016). "Secuenciación del transcriptoma de una sola célula: avances recientes y desafíos pendientes". F1000Research . 5 : F1000 Faculty Rev–182. doi : 10.12688/f1000research.7223.1 . ISSN  2046-1402. PMC 4758375 . PMID  26949524. 
  3. ^ Szabo, David T. (2014). "Capítulo 62 - Biomarcadores transcriptómicos en la evaluación de riesgos y seguridad de las sustancias químicas". Biomarcadores en toxicología . Academic Press. págs. 1033–1038. ISBN 9780124046306.
  4. ^ Trapnell, Cole (octubre de 2015). "Definición de tipos y estados celulares con genómica unicelular". Genome Research . 25 (10): 1491–1498. doi :10.1101/gr.190595.115. ISSN  1549-5469. PMC 4579334 . PMID  26430159. 
  5. ^ Stegle, O.; Teichmann, S.; Marioni, J. (2015). "Desafíos computacionales y analíticos en la transcriptómica de células individuales". Nature Reviews Genetics . 16 (3): 133–145. doi :10.1038/nrg3833. PMID  25628217. S2CID  205486032.
  6. ^ Kolodziejczyk, Aleksandra A.; Kim, Jong Kyoung; Svensson, Valentine; Marioni, John C.; Teichmann, Sarah A. (mayo de 2015). "La tecnología y la biología de la secuenciación de ARN de células individuales". Molecular Cell . 58 (4): 610–620. doi : 10.1016/j.molcel.2015.04.005 . PMID  26000846.
  7. ^ Poulin, Jean-Francois; Tasic, Bosiljka; Hjerling-Leffler, Jens; Trimarchi, Jeffrey M.; Awatramani, Rajeshwar (1 de septiembre de 2016). "Descifrando la diversidad de células neuronales mediante la transcriptómica de células individuales". Nature Neuroscience . 19 (9): 1131–1141. doi :10.1038/nn.4366. ISSN  1097-6256. PMID  27571192. S2CID  14461377.
  8. ^ Muraro, Mauro J.; Dharmadhikari, Gitanjali; Grün, Dominic; Groen, Nathalie; Dielen, Tim; Jansen, Erik; van Gurp, León; Engelse, Marten A.; Carlotti, Françoise; de Koning, Eelco JP; van Oudenaarden, Alejandro (26 de octubre de 2016). "Un atlas del transcriptoma unicelular del páncreas humano". Sistemas celulares . 3 (4): 385–394.e3. doi :10.1016/j.cels.2016.09.002. ISSN  2405-4712. PMC 5092539 . PMID  27693023. 
  9. ^ "Archivos SORT-seq". Descubrimientos de células individuales . Consultado el 15 de noviembre de 2022 .
  10. ^ Zheng, Grace XY; Terry, Jessica M.; Belgrader, Phillip; Ryvkin, Paul; Bent, Zachary W.; Wilson, Ryan; Ziraldo, Solongo B.; Wheeler, Tobias D.; McDermott, Geoff P.; Zhu, Junjie; Gregory, Mark T.; Shuga, Joe; Montesclaros, Luz; Underwood, Jason G.; Masquelier, Donald A. (16 de enero de 2017). "Perfiles transcripcionales digitales masivamente paralelos de células individuales". Nature Communications . 8 (1): 14049. Bibcode :2017NatCo...814049Z. doi : 10.1038/ncomms14049 . ISSN  2041-1723. PMC 5241818 . PMID  28091601. 
  11. ^ Radonić, Aleksandar; Thulke, Stefanie; Mackay, Ian M.; Landt, Olfert; Siegert, Wolfgang; Nitsche, Andreas (23 de enero de 2004). "Directriz para la selección de genes de referencia para PCR cuantitativa en tiempo real". Comunicaciones de investigación bioquímica y biofísica . 313 (4): 856–862. doi :10.1016/j.bbrc.2003.11.177. ISSN  0006-291X. PMID  14706621.
  12. ^ Wildsmith, SE; Archer, GE; Winkley, AJ; Lane, PW; Bugelski, PJ (1 de enero de 2001). "Maximización de la señal derivada de microarrays de ADNc". BioTechniques . 30 (1): 202–206, 208. doi : 10.2144/01301dd04 . ISSN  0736-6205. PMID  11196312.
  13. ^ Wang, Zhong; Gerstein, Mark; Snyder, Michael (23 de marzo de 2017). "RNA-Seq: una herramienta revolucionaria para la transcriptómica". Nature Reviews. Genética . 10 (1): 57–63. doi :10.1038/nrg2484. ISSN  1471-0056. PMC 2949280 . PMID  19015660. 
  14. ^ Jiang, Lichun; Schlesinger, Felix; Davis, Carrie A.; Zhang, Yu; Li, Renhua; Salit, Marc; Gingeras, Thomas R.; Oliver, Brian (23 de marzo de 2017). "Estándares de adición de genes sintéticos para experimentos de secuenciación de ARN". Genome Research . 21 (9): 1543–1551. doi :10.1101/gr.121095.111. ISSN  1088-9051. PMC 3166838 . PMID  21816910. 
  15. ^ ab Islam, Saiful; Zeisel, Amit; Joost, Simon; La Manno, Gioele; Zajac, Pawel; Kasper, Maria; Lönnerberg, Peter; Linnarsson, Sten (1 de febrero de 2014). "Secuenciación cuantitativa de ARN unicelular con identificadores moleculares únicos". Nature Methods . 11 (2): 163–166. doi :10.1038/nmeth.2772. ISSN  1548-7091. PMID  24363023. S2CID  6765530.
  16. ^ Kharchenko, Peter V.; Silberstein, Lev; Scadden, David T. (1 de julio de 2014). "Enfoque bayesiano para el análisis de expresión diferencial de células individuales". Nature Methods . 11 (7): 740–742. doi :10.1038/nmeth.2967. ISSN  1548-7091. PMC 4112276 . PMID  24836921. 
  17. ^ Svensson, Valentine; Natarajan, Kedar Nath; Ly, Lam-Ha; Miragaia, Ricardo J.; Labalette, Charlotte; Macaulay, Iain C.; Cvejic, Ana; Teichmann, Sarah A. (6 de marzo de 2017). "Análisis de potencia de experimentos de secuenciación de ARN de células individuales". Nature Methods . publicación anticipada en línea (4): 381–387. doi :10.1038/nmeth.4220. ISSN  1548-7105. PMC 5376499 . PMID  28263961. 
  18. ^ Stegle, Oliver; Teichmann, Sarah A.; Marioni, John C. (1 de marzo de 2015). "Desafíos computacionales y analíticos en la transcriptómica de células individuales". Nature Reviews Genetics . 16 (3): 133–145. doi :10.1038/nrg3833. ISSN  1471-0056. PMID  25628217. S2CID  205486032.
  19. ^ Buettner, Florian; Natarajan, Kedar N.; Casale, F. Paolo; Proserpio, Valentina; Scialdone, Antonio; Theis, Fabian J.; Teichmann, Sarah A.; Marioni, John C.; Stegle, Oliver (1 de febrero de 2015). "El análisis computacional de la heterogeneidad de célula a célula en datos de secuenciación de ARN de células individuales revela subpoblaciones ocultas de células". Nature Biotechnology . 33 (2): 155–160. doi : 10.1038/nbt.3102 . ISSN  1087-0156. PMID  25599176.
  20. ^ Ntranos, Vasilis; Kamath, Govinda M.; Zhang, Jesse M.; Pachter, Lior; Tse, David N. (26 de mayo de 2016). "Análisis rápido y preciso de secuenciación de ARN de una sola célula mediante agrupamiento de recuentos de compatibilidad de transcripción". Genome Biology . 17 (1): 112. doi : 10.1186/s13059-016-0970-8 . ISSN  1474-7596. PMC 4881296 . PMID  27230763. 
  21. ^ Pierson, Emma; Yau, Christopher (1 de enero de 2015). "ZIFA: reducción de la dimensionalidad para el análisis de la expresión génica de células individuales infladas a cero". Genome Biology . 16 : 241. doi : 10.1186/s13059-015-0805-z . ISSN  1474-760X. PMC 4630968 . PMID  26527291. 
  22. ^ Treutlein, Barbara; Brownfield, Doug G.; Wu, Angela R.; Neff, Norma F.; Mantalas, Gary L.; Espinoza, F. Hernan; Desai, Tushar J.; Krasnow, Mark A.; Quake, Stephen R. (15 de mayo de 2014). "Reconstrucción de las jerarquías de linaje del epitelio pulmonar distal mediante secuenciación de ARN de una sola célula". Nature . 509 (7500): 371–375. Bibcode :2014Natur.509..371T. doi :10.1038/nature13173. PMC 4145853 . PMID  24739965. 
  23. ^ Korthauer, Keegan D.; Chu, Li-Fang; Newton, Michael A.; Li, Yuan; Thomson, James; Stewart, Ron; Kendziorski, Christina (1 de enero de 2016). "Un enfoque estadístico para identificar distribuciones diferenciales en experimentos de secuenciación de ARN de una sola célula". Genome Biology . 17 (1): 222. doi : 10.1186/s13059-016-1077-y . ISSN  1474-760X. PMC 5080738 . PMID  27782827. 
  24. ^ ab Haghverdi, Laleh; Büttner, Maren; Lobo, F. Alejandro; Buettner, Florian; Theis, Fabián J. (1 de octubre de 2016). "El pseudotiempo de difusión reconstruye sólidamente la ramificación del linaje" (PDF) . Métodos de la naturaleza . 13 (10): 845–848. doi :10.1038/nmeth.3971. ISSN  1548-7091. PMID  27571553. S2CID  3594049.
  25. ^ Saelens, Wouter; Cannoodt, Robrecht; Todorov, Helena; Saeys, Yvan (5 de marzo de 2018). "Una comparación de métodos de inferencia de trayectorias de células individuales: hacia herramientas más precisas y robustas". bioRxiv : 276907. doi : 10.1101/276907 . Consultado el 12 de marzo de 2018 .
  26. ^ Trapnell, Cole; Cacchiarelli, Davide; Grimsby, Jonna; Pokharel, Prapti; Li, Shuqiang; Morse, Michael; Lennon, Niall J.; Livak, Kenneth J.; Mikkelsen, Tarjei S.; Rinn, John L. (23 de marzo de 2017). "El ordenamiento pseudotemporal de células individuales revela dinámicas y reguladores de las decisiones sobre el destino celular". Nature Biotechnology . 32 (4): 381–386. doi :10.1038/nbt.2859. ISSN  1087-0156. PMC 4122333 . PMID  24658644. 
  27. ^ ab Pandey, Kushagra; Zafar, Hamim (2022). "Inferencia de transiciones de estados celulares y plasticidad del destino celular a partir de una sola célula con MARGARET". Investigación de ácidos nucleicos . 50 (15): e86. doi : 10.1093/nar/gkac412 . ISSN  0305-1048. PMC 9410915 . PMID  35639499. 
  28. ^ Wei, J.; Hu, X.; Zou, X.; Tian, ​​T. (1 de diciembre de 2016). "Inferencia de la red reguladora genética para células madre utilizando datos de expresión de células individuales". Conferencia internacional IEEE de 2016 sobre bioinformática y biomedicina (BIBM) . págs. 217–222. doi :10.1109/BIBM.2016.7822521. ISBN . 978-1-5090-1611-2. Número de identificación del sujeto  27737735.
  29. ^ Moignard, Victoria; Macaulay, Iain C.; Swiers, Gemma; Buettner, Florian; Schütte, Judith; Calero-Nieto, Fernando J.; Kinston, Sarah; Joshi, Anagha; Ana, Rebeca; Theis, Fabián J.; Jacobsen, Sten Eirik; de Bruijn, Marella F.; Göttgens, Berthold (1 de abril de 2013). "Caracterización de redes transcripcionales en células progenitoras y madre sanguíneas mediante análisis de expresión génica unicelular de alto rendimiento". Biología celular de la naturaleza . 15 (4): 363–372. doi :10.1038/ncb2709. ISSN  1465-7392. PMC 3796878 . PMID  23524953. 
  30. ^ Hicks, Stephanie C; Townes, William F; Teng, Mingxiang; Irizarry, Rafael A (6 de noviembre de 2017). "Datos faltantes y variabilidad técnica en experimentos de secuenciación de ARN de células individuales". Bioestadística . 19 (4): 562–578. doi :10.1093/biostatistics/kxx053. PMC 6215955 . PMID  29121214. 
  31. ^ Haghverdi, Laleh; Lun, Aaron TL; Morgan, Michael D; Marioni, John C (2 de abril de 2018). "Los efectos de lote en los datos de secuenciación de ARN de células individuales se corrigen haciendo coincidir los vecinos más cercanos mutuos". Nature Biotechnology . 36 (5): 421–427. doi :10.1038/nbt.4091. PMC 6152897 . PMID  29608177. 
  32. ^ Butler, Andrew; Hoffman, Paul; Smibert, Peter; Papalexi, Efthymia; Satija, Rahul (2 de abril de 2018). "Integración de datos transcriptómicos de células individuales en diferentes condiciones, tecnologías y especies". Nature Biotechnology . 36 (5): 421–427. doi :10.1038/nbt.4096. PMC 6700744 . PMID  29608179. 
  33. ^ Stuart, Tim; Butler, Andrew; Hoffman, Paul; Hafemeister, Christoph; Papalexia, Efthymia; Mauck, William M III; Hao, Yuhan; Marlon, Stoeckius; Smibert, Peter; Satija, Rahul (6 de junio de 2019). "Integración completa de datos de una sola célula". Cell . 177 (7): 1888–1902. doi :10.1016/j.cell.2019.05.031. PMC 6687398 . PMID  31178118. 
  34. ^ Shree, Ajita; Pavan, Musale Krushna; Zafar, Hamim (27 de noviembre de 2023). "scDREAMER para la integración a nivel de atlas de conjuntos de datos de una sola célula utilizando un modelo generativo profundo emparejado con un clasificador adversarial". Nature Communications . 14 (1): 7781. doi : 10.1038/s41467-023-43590-8 . PMC 10682386 . PMID  38012145. 

Enlaces externos