stringtranslate.com

Transcriptómica unicelular

La transcriptómica unicelular examina el nivel de expresión génica de células individuales en una población determinada midiendo simultáneamente la concentración de ARN (convencionalmente sólo ARN mensajero (ARNm)) de cientos a miles de genes. [1] La transcriptómica unicelular permite desentrañar poblaciones celulares heterogéneas , reconstruir vías de desarrollo celular y modelar la dinámica transcripcional, todo ello previamente enmascarado en la secuenciación masiva de ARN. [2]

Fondo

El desarrollo de la secuenciación de ARN de alto rendimiento (RNA-seq) y los microarrays ha convertido el análisis de la expresión génica en una rutina. El análisis de ARN se limitaba anteriormente al seguimiento de transcripciones individuales mediante transferencias Northern o PCR cuantitativa . Un mayor rendimiento y velocidad permiten a los investigadores caracterizar con frecuencia los perfiles de expresión de poblaciones de miles de células. Los datos de ensayos masivos han llevado a la identificación de genes expresados ​​diferencialmente en distintas poblaciones de células y al descubrimiento de biomarcadores . [3]

Estos estudios son limitados ya que proporcionan mediciones de tejidos completos y, como resultado, muestran un perfil de expresión promedio para todas las células constituyentes. Esto tiene un par de inconvenientes. En primer lugar, diferentes tipos de células dentro del mismo tejido pueden tener funciones distintas en organismos multicelulares. A menudo forman subpoblaciones con perfiles transcripcionales únicos. Las correlaciones en la expresión genética de las subpoblaciones a menudo pueden pasarse por alto debido a la falta de identificación de las subpoblaciones. [1] En segundo lugar, los ensayos masivos no reconocen si un cambio en el perfil de expresión se debe a un cambio en la regulación o la composición, por ejemplo, si un tipo de célula domina la población. Por último, cuando su objetivo es estudiar la progresión celular a través de la diferenciación , los perfiles de expresión promedio solo pueden ordenar las células por tiempo en lugar de por etapa de desarrollo. En consecuencia, no pueden mostrar tendencias en los niveles de expresión genética específicos de determinadas etapas. [4]

Los avances recientes en biotecnología permiten medir la expresión genética en cientos de miles de células individuales simultáneamente. Si bien estos avances en las tecnologías transcriptómicas han permitido la generación de datos transcriptómicos unicelulares, también presentaron nuevos desafíos computacionales y analíticos. Los bioinformáticos pueden utilizar técnicas de secuenciación de ARN masiva para datos unicelulares. Aún así, se han tenido que diseñar muchos enfoques computacionales nuevos para este tipo de datos para facilitar un estudio completo y detallado de los perfiles de expresión unicelulares. [5]

Pasos experimentales

Hasta el momento no existe una técnica estandarizada para generar datos unicelulares: todos los métodos deben incluir el aislamiento celular de la población, la formación de lisados , la amplificación mediante transcripción inversa y la cuantificación de los niveles de expresión. Las técnicas comunes para medir la expresión son la PCR cuantitativa o RNA-seq. [6]

Aislar células individuales

Flujo de trabajo de clasificación de células asistida por fluorescencia (FACS)

Hay varios métodos disponibles para aislar y amplificar células para análisis unicelulares. Las técnicas de bajo rendimiento pueden aislar cientos de células, son lentas y permiten la selección. Estos métodos incluyen:

Los métodos de alto rendimiento pueden aislar rápidamente de cientos a decenas de miles de células. [7] Las técnicas comunes incluyen:

La combinación de FACS con scRNA-seq ha producido protocolos optimizados como SORT-seq. [8] Puede encontrar una lista de estudios que utilizaron SORT-seq aquí. [9] Además, la combinación de dispositivos de microfluidos con scRNA-seq se ha optimizado en protocolos de genómica 10x. [10]

PCR cuantitativa (qPCR)

Para medir el nivel de expresión de cada transcripción se puede aplicar qPCR. Los cebadores específicos de genes se utilizan para amplificar el gen correspondiente como ocurre con la PCR normal y, como resultado, normalmente solo se obtienen datos para tamaños de muestra de menos de 100 genes. Para la normalización se utiliza la inclusión de genes constitutivos , cuya expresión debe ser constante según las condiciones. Los genes internos más comúnmente utilizados incluyen GAPDH y α- actina , aunque la confiabilidad de la normalización a través de este proceso es cuestionable ya que hay evidencia de que el nivel de expresión puede variar significativamente. [11] Los tintes fluorescentes se utilizan como moléculas informadoras para detectar el producto de la PCR y monitorear el progreso de la amplificación; el aumento en la intensidad de la fluorescencia es proporcional a la concentración del amplicón . Se realiza un gráfico de fluorescencia frente al número de ciclos y se utiliza un nivel umbral de fluorescencia para encontrar el número de ciclo en el que el gráfico alcanza este valor. El número de ciclo en este punto se conoce como ciclo umbral (Ct ) y se mide para cada gen. [12]

Secuencia de ARN unicelular

Experimento de secuencia de ARN

La técnica RNA-seq unicelular convierte una población de ARN en una biblioteca de fragmentos de ADNc . Estos fragmentos se secuencian mediante técnicas de secuenciación de próxima generación de alto rendimiento y las lecturas se asignan al genoma de referencia, lo que proporciona un recuento del número de lecturas asociadas con cada gen. [13]

La normalización de los datos de RNA-seq explica la variación de célula a célula en la eficiencia de la formación y secuenciación de la biblioteca de ADNc. Un método se basa en el uso de picos de ARN extrínsecos (secuencias de ARN de secuencia y cantidad conocidas) que se agregan en cantidades iguales a cada lisado celular y se usan para normalizar el recuento de lecturas según el número de lecturas asignadas al ARNm de picos . [14]

Otro control utiliza identificadores moleculares únicos (UMI): secuencias de ADN cortas (6 a 10 nt) que se agregan a cada ADNc antes de la amplificación y actúan como un código de barras para cada molécula de ADNc. La normalización se logra utilizando el número de UMI únicos asociados con cada gen para tener en cuenta las diferencias en la eficiencia de la amplificación. [15]

Se ha combinado una combinación de picos, UMI y otros enfoques para una normalización más precisa.

Consideraciones

Un problema asociado con los datos unicelulares se produce en forma de distribuciones de expresión genética infladas a cero, conocidas como abandonos técnicos, que son comunes debido a bajas concentraciones de ARNm de genes menos expresados ​​que no se capturan en el proceso de transcripción inversa. El porcentaje de moléculas de ARNm que se detectan en el lisado celular suele ser sólo del 10-20%. [dieciséis]

Cuando se utilizan picos de ARN para la normalización, se supone que las eficiencias de amplificación y secuenciación para el ARN endógeno y el pico son las mismas. La evidencia sugiere que este no es el caso dadas las diferencias fundamentales en tamaño y características, como la falta de una cola poliadenilada en las puntas y, por lo tanto, una longitud más corta. [17] Además, la normalización mediante UMI supone que la biblioteca de ADNc está secuenciada hasta la saturación, lo que no siempre es el caso. [15]

Análisis de los datos

Los conocimientos basados ​​en el análisis de datos unicelulares suponen que la entrada es una matriz de recuentos de expresión genética normalizada, generada por los enfoques descritos anteriormente, y puede brindar oportunidades que no se pueden obtener de forma masiva.

Se proporcionaron tres ideas principales: [18]

  1. Identificación y caracterización de tipos celulares y su organización espacial en el tiempo.
  2. Inferencia de redes reguladoras de genes y su fuerza en células individuales.
  3. Clasificación del componente estocástico de la transcripción.

Las técnicas descritas han sido diseñadas para ayudar a visualizar y explorar patrones en los datos con el fin de facilitar la revelación de estas tres características.

Agrupación

K-medias-datos-gaussianos
Dendrograma del iris producido mediante un algoritmo de agrupamiento jerárquico

La agrupación permite la formación de subgrupos en la población celular. Las células se pueden agrupar según su perfil transcriptómico para analizar la estructura de la subpoblación e identificar tipos o subtipos de células raros. Alternativamente, los genes pueden agruparse según sus estados de expresión para identificar genes covariantes. Se ha utilizado una combinación de ambos enfoques de agrupamiento, conocida como biclustering , para agrupar simultáneamente genes y células para encontrar genes que se comporten de manera similar dentro de los grupos de células. [19]

Los métodos de agrupamiento aplicados pueden ser agrupamiento de K-medias , formando grupos disjuntos o agrupamiento jerárquico , formando particiones anidadas.

Biclusterización

El biclustering proporciona varias ventajas al mejorar la resolución del clustering. Los genes que solo son informativos para un subconjunto de células y, por lo tanto, solo se expresan allí pueden identificarse mediante biclustering. Además, mediante este método se pueden identificar genes que se comportan de manera similar y que diferencian un grupo de células de otro. [20]

Reducción de dimensionalidad

Ejemplo de PCA de frecuencias de haplogrupos del cromosoma Y de guineanas y otras poblaciones africanas

Los algoritmos de reducción de dimensionalidad, como el análisis de componentes principales (PCA) y t-SNE, se pueden utilizar para simplificar los datos para la visualización y la detección de patrones transformando celdas de un espacio dimensional alto a uno inferior . El resultado de este método produce gráficos con cada celda como un punto en un espacio 2D o 3D. La reducción de dimensionalidad se utiliza con frecuencia antes de la agrupación, ya que las celdas en dimensiones altas pueden parecer erróneamente cercanas debido a que las métricas de distancia se comportan de manera no intuitiva. [21]

Análisis de componentes principales

La técnica más utilizada es PCA, que identifica las direcciones de los componentes principales de mayor varianza y transforma los datos de modo que el primer componente principal tenga la mayor varianza posible y los componentes principales sucesivos, a su vez, tengan cada uno la mayor varianza posible mientras permanecen ortogonales al componentes precedentes. La contribución que cada gen hace a cada componente se utiliza para inferir qué genes contribuyen más a la variación en la población y están involucrados en la diferenciación de diferentes subpoblaciones. [22]

expresión diferencial

Para detectar diferencias en el nivel de expresión génica entre dos poblaciones se utilizan datos transcriptómicos tanto unicelulares como masivos. Se han diseñado métodos especializados para datos unicelulares que consideran características de una sola celda, como abandonos técnicos y forma de la distribución, por ejemplo, bimodal frente a unimodal . [23]

Enriquecimiento de ontología genética.

Los términos de ontología genética describen las funciones de los genes y las relaciones entre esas funciones en tres clases:

  1. función molecular
  2. Componente celular
  3. Proceso biológico

El enriquecimiento de términos de ontología genética (GO) es una técnica que se utiliza para identificar qué términos GO están sobrerrepresentados o subrepresentados en un conjunto determinado de genes. En el análisis unicelular, la lista de entrada de genes de interés se puede seleccionar en función de genes expresados ​​diferencialmente o grupos de genes generados a partir de biclustering. El número de genes anotados en un término GO en la lista de entrada se normaliza con respecto al número de genes anotados en un término GO en el conjunto de antecedentes de todos los genes del genoma para determinar la significación estadística. [24]

Orden pseudotemporal

Gráfico con árbol de expansión mínimo

El ordenamiento pseudotemporal (o inferencia de trayectoria) es una técnica que tiene como objetivo inferir la dinámica de la expresión genética a partir de datos instantáneos de una sola célula. El método intenta ordenar las células de tal manera que células similares estén ubicadas muy cerca unas de otras. Esta trayectoria de celdas puede ser lineal, pero también puede bifurcarse o seguir estructuras gráficas más complejas. La trayectoria, por tanto, permite inferir la dinámica de la expresión genética y el ordenamiento de las células mediante su progresión a través de la diferenciación o la respuesta a estímulos externos. El método se basa en la suposición de que las células siguen el mismo camino a través del proceso de interés y que su estado transcripcional se correlaciona con su progresión. El algoritmo se puede aplicar tanto a poblaciones mixtas como a muestras temporales.

Se han desarrollado más de 50 métodos para el ordenamiento pseudotemporal y cada uno tiene sus propios requisitos de información previa (como celdas iniciales o datos de evolución temporal), topologías detectables y metodología. [25] Un algoritmo de ejemplo es el algoritmo Monocle [26] que lleva a cabo la reducción de dimensionalidad de los datos, construye un árbol de expansión mínimo utilizando los datos transformados, ordena las celdas en pseudo-tiempo siguiendo la ruta conectada más larga del árbol y, en consecuencia, etiqueta células por tipo. Otro ejemplo es el algoritmo de pseudotiempo de difusión (DPT), [24] que utiliza un mapa de difusión y un proceso de difusión. Otra clase de métodos, como MARGARET [27], emplea la partición de gráficos para capturar topologías de trayectorias complejas, como trayectorias desconectadas y multifurcadas.

Inferencia de red

La inferencia de redes reguladoras de genes es una técnica que tiene como objetivo construir una red, mostrada como un gráfico, en la que los nodos representan los genes y los bordes indican interacciones correguladoras. El método se basa en el supuesto de que una fuerte relación estadística entre la expresión de genes es una indicación de una posible relación funcional. [28] El método más comúnmente utilizado para medir la fuerza de una relación estadística es la correlación . Sin embargo, la correlación no logra identificar relaciones no lineales y la información mutua se utiliza como alternativa. Los grupos de genes unidos en una red significan genes que sufren cambios coordinados en su expresión. [29]

Integración

La presencia o intensidad de los efectos técnicos y los tipos de células observadas a menudo difieren en los conjuntos de datos de transcriptómica unicelular generados mediante diferentes protocolos experimentales y en diferentes condiciones. Esta diferencia da como resultado fuertes efectos de lote que pueden sesgar los hallazgos de los métodos estadísticos aplicados entre lotes, particularmente en presencia de factores de confusión . [30] Como resultado de las propiedades antes mencionadas de los datos transcriptómicos unicelulares, se observó que los métodos de corrección por lotes desarrollados para datos de secuenciación masiva funcionaban mal. En consecuencia, los investigadores desarrollaron métodos estadísticos para corregir los efectos de los lotes que son robustos a las propiedades de los datos transcriptómicos unicelulares para integrar datos de diferentes fuentes o lotes experimentales. Laleh Haghverdi realizó un trabajo fundamental al formular el uso de vecinos más cercanos mutuos entre cada lote para definir vectores de corrección de lotes. [31] Con estos vectores, puede fusionar conjuntos de datos que incluyan al menos un tipo de celda compartida. Un enfoque ortogonal implica la proyección de cada conjunto de datos en un espacio compartido de baja dimensión mediante análisis de correlación canónica . [32] Los vecinos mutuos más cercanos y el análisis de correlación canónica también se han combinado para definir "anclajes" de integración que comprenden celdas de referencia en un conjunto de datos, a las que se normalizan las celdas de consulta en otro conjunto de datos. [33] Otra clase de métodos (p. ej., scDREAMER [34] ) utiliza modelos generativos profundos, como codificadores automáticos variacionales, para aprender representaciones celulares latentes invariantes por lotes que pueden usarse para tareas posteriores, como agrupación de tipos de células, eliminación de ruido de genes unicelulares. vectores de expresión e inferencia de trayectorias. [27]

Ver también

Referencias

  1. ^ ab Kanter, Itamar; Kalisky, Tomer (2015). "Transcriptómica unicelular: métodos y aplicaciones". Fronteras en Oncología . 5 : 53. doi : 10.3389/fonc.2015.00053 . ISSN  2234-943X. PMC  4354386 . PMID  25806353.
  2. ^ Liu, Serena; Trapnell, Cole (2016). "Secuenciación del transcriptoma unicelular: avances recientes y desafíos pendientes". F1000Investigación . 5 : F1000 Facultad Rev–182. doi : 10.12688/f1000research.7223.1 . ISSN  2046-1402. PMC 4758375 . PMID  26949524. 
  3. ^ Szabo, David T. (2014). "Capítulo 62 - Biomarcadores transcriptómicos en la evaluación de riesgos y seguridad de productos químicos". Biomarcadores en Toxicología . Prensa académica. págs. 1033-1038. ISBN 9780124046306.
  4. ^ Trapnell, Cole (octubre de 2015). "Definición de tipos y estados de células con genómica unicelular". Investigación del genoma . 25 (10): 1491-1498. doi :10.1101/gr.190595.115. ISSN  1549-5469. PMC 4579334 . PMID  26430159. 
  5. ^ Stegle, O.; Teichmann, S.; Marioni, J. (2015). "Desafíos computacionales y analíticos en transcriptómica unicelular". Naturaleza Reseñas Genética . 16 (3): 133-145. doi :10.1038/nrg3833. PMID  25628217. S2CID  205486032.
  6. ^ Kolodziejczyk, Aleksandra A.; Kim, Jong Kyoung; Svensson, Valentín; Marioni, John C.; Teichmann, Sarah A. (mayo de 2015). "La tecnología y biología de la secuenciación de ARN unicelular". Célula molecular . 58 (4): 610–620. doi : 10.1016/j.molcel.2015.04.005 . PMID  26000846.
  7. ^ Poulin, Jean-François; Tasic, Bosiljka; Hjerling-Leffler, Jens; Trimarchi, Jeffrey M.; Awatramani, Rajeshwar (1 de septiembre de 2016). "Desentrañar la diversidad de células neuronales mediante transcriptómica unicelular". Neurociencia de la Naturaleza . 19 (9): 1131-1141. doi :10.1038/nn.4366. ISSN  1097-6256. PMID  27571192. S2CID  14461377.
  8. ^ Muraro, Mauro J.; Dharmadhikari, Gitanjali; Grün, Dominic; Groen, Nathalie; Dielen, Tim; Jansen, Erik; van Gurp, León; Engelse, Marten A.; Carlotti, Françoise; de Koning, Eelco JP; van Oudenaarden, Alejandro (26 de octubre de 2016). "Un atlas del transcriptoma unicelular del páncreas humano". Sistemas celulares . 3 (4): 385–394.e3. doi :10.1016/j.cels.2016.09.002. ISSN  2405-4712. PMC 5092539 . PMID  27693023. 
  9. ^ "Archivos SORT-seq". Descubrimientos unicelulares . Consultado el 15 de noviembre de 2022 .
  10. ^ Zheng, gracia XY; Terry, Jessica M.; Belgrado, Phillip; Ryvkin, Paul; Doblado, Zachary W.; Wilson, Ryan; Ziraldo, Solongo B.; Wheeler, Tobías D.; McDermott, Geoff P.; Zhu, Junjie; Gregorio, Mark T.; Shuga, Joe; Montesclaros, Luz; Underwood, Jason G.; Masquelier, Donald A. (16 de enero de 2017). "Perfiles transcripcionales digitales masivamente paralelos de células individuales". Comunicaciones de la naturaleza . 8 (1): 14049. Código bibliográfico : 2017NatCo...814049Z. doi : 10.1038/ncomms14049 . ISSN  2041-1723. PMC 5241818 . PMID  28091601. 
  11. ^ Radonić, Aleksandar; Thulke, Stefanie; Mackay, Ian M.; Landt, Olfert; Siegert, Wolfgang; Nitsche, Andreas (23 de enero de 2004). "Pauta para la selección de genes de referencia para PCR cuantitativa en tiempo real". Comunicaciones de investigación bioquímica y biofísica . 313 (4): 856–862. doi :10.1016/j.bbrc.2003.11.177. ISSN  0006-291X. PMID  14706621.
  12. ^ Wildsmith, SE; Arquero, GE; Winkley, AJ; Carril, PW; Bugelski, PJ (1 de enero de 2001). "Maximización de la señal derivada de microarrays de ADNc". BioTécnicas . 30 (1): 202–206, 208. doi : 10.2144/01301dd04 . ISSN  0736-6205. PMID  11196312.
  13. ^ Wang, Zhong; Gerstein, Marcos; Snyder, Michael (23 de marzo de 2017). "RNA-Seq: una herramienta revolucionaria para la transcriptómica". Reseñas de la naturaleza. Genética . 10 (1): 57–63. doi :10.1038/nrg2484. ISSN  1471-0056. PMC 2949280 . PMID  19015660. 
  14. ^ Jiang, Lichun; Schlesinger, Félix; Davis, Carrie A.; Zhang, Yu; Li, Renhua; Salit, Marc; Gingeras, Thomas R.; Oliver, Brian (23 de marzo de 2017). "Estándares de aumento sintético para experimentos de RNA-seq". Investigación del genoma . 21 (9): 1543-1551. doi :10.1101/gr.121095.111. ISSN  1088-9051. PMC 3166838 . PMID  21816910. 
  15. ^ ab Islam, Saiful; Zeisel, Amit; Joost, Simón; La Manno, Gioele; Zajac, Pawel; Kasper, María; Lönnerberg, Peter; Linnarsson, Sten (1 de febrero de 2014). "Secuencia de ARN unicelular cuantitativa con identificadores moleculares únicos". Métodos de la naturaleza . 11 (2): 163–166. doi :10.1038/nmeth.2772. ISSN  1548-7091. PMID  24363023. S2CID  6765530.
  16. ^ Kharchenko, Peter V.; Silberstein, Lev; Scadden, David T. (1 de julio de 2014). "Enfoque bayesiano para el análisis de expresión diferencial unicelular". Métodos de la naturaleza . 11 (7): 740–742. doi :10.1038/nmeth.2967. ISSN  1548-7091. PMC 4112276 . PMID  24836921. 
  17. ^ Svensson, Valentín; Natarajan, Kedar Nath; Ly, Lam-Ha; Miragaia, Ricardo J.; Labalette, Charlotte; Macaulay, Iain C.; Cvejic, Ana; Teichmann, Sarah A. (6 de marzo de 2017). "Análisis de potencia de experimentos de secuenciación de ARN unicelular". Métodos de la naturaleza . publicación anticipada en línea (4): 381–387. doi :10.1038/nmeth.4220. ISSN  1548-7105. PMC 5376499 . PMID  28263961. 
  18. ^ Stegle, Oliver; Teichmann, Sarah A.; Marioni, John C. (1 de marzo de 2015). "Desafíos computacionales y analíticos en transcriptómica unicelular". Naturaleza Reseñas Genética . 16 (3): 133-145. doi :10.1038/nrg3833. ISSN  1471-0056. PMID  25628217. S2CID  205486032.
  19. ^ Buettner, Florián; Natarajan, Kedar N.; Casale, F. Paolo; Proserpio, Valentina; Scialdone, Antonio; Theis, Fabián J.; Teichmann, Sarah A.; Marioni, John C.; Stegle, Oliver (1 de febrero de 2015). "El análisis computacional de la heterogeneidad entre células en datos de secuenciación de ARN unicelular revela subpoblaciones ocultas de células". Biotecnología de la Naturaleza . 33 (2): 155-160. doi : 10.1038/nbt.3102 . ISSN  1087-0156. PMID  25599176.
  20. ^ Ntranos, Vasilis; Kamath, Govinda M.; Zhang, Jesse M.; Pachter, Lior; Tse, David N. (26 de mayo de 2016). "Análisis rápido y preciso de secuencias de ARN unicelulares mediante agrupación de recuentos de compatibilidad de transcripciones". Biología del genoma . 17 (1): 112. doi : 10.1186/s13059-016-0970-8 . ISSN  1474-7596. PMC 4881296 . PMID  27230763. 
  21. ^ Pierson, Emma; Yau, Christopher (1 de enero de 2015). "ZIFA: reducción de dimensionalidad para análisis de expresión génica unicelular inflado a cero". Biología del genoma . 16 : 241. doi : 10.1186/s13059-015-0805-z . ISSN  1474-760X. PMC 4630968 . PMID  26527291. 
  22. ^ Treutlein, Bárbara; Brownfield, Doug G.; Wu, Ángela R.; Neff, Norma F.; Mantalas, Gary L.; Espinoza, F. Hernán; Desai, Tushar J.; Krasnow, Mark A.; Terremoto, Stephen R. (15 de mayo de 2014). "Reconstrucción de jerarquías de linaje del epitelio pulmonar distal utilizando RNA-seq unicelular". Naturaleza . 509 (7500): 371–375. Código Bib :2014Natur.509..371T. doi : 10.1038/naturaleza13173. PMC 4145853 . PMID  24739965. 
  23. ^ Korthauer, Keegan D.; Chu, Li-Fang; Newton, Michael A.; Li, Yuan; Thompson, James; Stewart, Ron; Kendziorski, Christina (1 de enero de 2016). "Un enfoque estadístico para identificar distribuciones diferenciales en experimentos de secuenciación de ARN unicelular". Biología del genoma . 17 (1): 222. doi : 10.1186/s13059-016-1077-y . ISSN  1474-760X. PMC 5080738 . PMID  27782827. 
  24. ^ ab Haghverdi, Laleh; Büttner, Maren; Lobo, F. Alejandro; Buettner, Florian; Theis, Fabián J. (1 de octubre de 2016). "El pseudotiempo de difusión reconstruye sólidamente la ramificación del linaje" (PDF) . Métodos de la naturaleza . 13 (10): 845–848. doi :10.1038/nmeth.3971. ISSN  1548-7091. PMID  27571553. S2CID  3594049.
  25. ^ Saelens, Wouter; Cannoodt, Robrecht; Todorov, Helena; Saeys, Yvan (5 de marzo de 2018). "Una comparación de métodos de inferencia de trayectorias unicelulares: hacia herramientas más precisas y robustas". bioRxiv : 276907. doi : 10.1101/276907 . Consultado el 12 de marzo de 2018 .
  26. ^ Trapnell, Cole; Cacchiarelli, Davide; Grimsby, Jonna; Pokharel, Prapti; Li, Shuqiang; Morse, Michael; Lennon, Niall J.; Livak, Kenneth J.; Mikkelsen, Tarjei S.; Rinn, John L. (23 de marzo de 2017). "El orden pseudotemporal de células individuales revela dinámicas y reguladores de las decisiones sobre el destino celular". Biotecnología de la Naturaleza . 32 (4): 381–386. doi :10.1038/nbt.2859. ISSN  1087-0156. PMC 4122333 . PMID  24658644. 
  27. ^ ab Pandey, Kushagra; Zafar, Hamim (2022). "Inferencia de transiciones de estado celular y plasticidad del destino celular a partir de una sola célula con MARGARET". Investigación de ácidos nucleicos . 50 (15): e86. doi : 10.1093/nar/gkac412 . ISSN  0305-1048. PMC 9410915 . PMID  35639499. 
  28. ^ Wei, J.; Hu, X.; Zou, X.; Tian, ​​T. (1 de diciembre de 2016). "Inferencia de la red reguladora genética para células madre utilizando datos de expresión de células individuales". Conferencia Internacional IEEE 2016 sobre Bioinformática y Biomedicina (BIBM) . págs. 217-222. doi :10.1109/BIBM.2016.7822521. ISBN 978-1-5090-1611-2. S2CID  27737735.
  29. ^ Moignard, Victoria; Macaulay, Iain C.; Swiers, Gemma; Buettner, Florian; Schütte, Judith; Calero-Nieto, Fernando J.; Kinston, Sarah; Joshi, Anagha; Ana, Rebeca; Theis, Fabián J.; Jacobsen, Sten Eirik; de Bruijn, Marella F.; Göttgens, Berthold (1 de abril de 2013). "Caracterización de redes transcripcionales en células madre y progenitoras sanguíneas mediante análisis de expresión génica unicelular de alto rendimiento". Biología celular de la naturaleza . 15 (4): 363–372. doi :10.1038/ncb2709. ISSN  1465-7392. PMC 3796878 . PMID  23524953. 
  30. ^ Hicks, Stephanie C; Townes, William F; Teng, Mingxiang; Irizarry, Rafael A (6 de noviembre de 2017). "Datos faltantes y variabilidad técnica en experimentos de secuenciación de ARN unicelular". Bioestadística . 19 (4): 562–578. doi : 10.1093/bioestadística/kxx053. PMC 6215955 . PMID  29121214. 
  31. ^ Haghverdi, Laleh; Lun, Aaron TL; Morgan, Michael D; Marioni, John C (2 de abril de 2018). "Los efectos por lotes en los datos de secuenciación de ARN unicelular se corrigen haciendo coincidir los vecinos más cercanos entre sí". Biotecnología de la Naturaleza . 36 (5): 421–427. doi :10.1038/nbt.4091. PMC 6152897 . PMID  29608177. 
  32. ^ Mayordomo, Andrés; Hoffman, Pablo; Smibert, Peter; Papalexi, Eftimia; Satija, Rahul (2 de abril de 2018). "Integración de datos transcriptómicos unicelulares en diferentes condiciones, tecnologías y especies". Biotecnología de la Naturaleza . 36 (5): 421–427. doi :10.1038/nbt.4096. PMC 6700744 . PMID  29608179. 
  33. ^ Estuardo, Tim; Mayordomo, Andrés; Hoffman, Pablo; Hafemeister, Christoph; Papalexia, Eftimia; Mauck, Guillermo M III; Hao, Yuhan; Marlon, Stoeckius; Smibert, Peter; Satija, Rahul (6 de junio de 2019). "Integración integral de datos unicelulares". Celúla . 177 (7): 1888-1902. doi :10.1016/j.cell.2019.05.031. PMC 6687398 . PMID  31178118. 
  34. ^ Shree, Ajita; Pavan, Musale Krushna; Zafar, Hamim (27 de noviembre de 2023). "scDREAMER para la integración a nivel de atlas de conjuntos de datos unicelulares utilizando un modelo generativo profundo combinado con un clasificador adversario". Comunicaciones de la naturaleza . 14 (1): 7781. doi : 10.1038/s41467-023-43590-8 . PMC 10682386 . PMID  38012145. 

enlaces externos