stringtranslate.com

Sec. de ARN

Resumen de RNA-Seq. Dentro del organismo, los genes se transcriben y (en un organismo eucariota ) se unen para producir transcripciones de ARNm maduros (rojo). El ARNm se extrae del organismo, se fragmenta y se copia en ADNc ds estable (azul). El ds-cDNA se secuencia utilizando métodos de secuenciación de lectura corta y alto rendimiento . Luego, estas secuencias se pueden alinear con una secuencia del genoma de referencia para reconstruir qué regiones del genoma se estaban transcribiendo. Estos datos se pueden utilizar para anotar dónde están los genes expresados, sus niveles de expresión relativos y cualquier variante de empalme alternativa. [1]

RNA-Seq (llamado así como una abreviatura de RNA sequencing ) es una técnica que utiliza secuenciación de próxima generación para revelar la presencia y cantidad de moléculas de ARN en una muestra biológica, proporcionando una instantánea de la expresión genética en la muestra, también conocida como transcriptoma . [2] [3]

Específicamente, RNA-Seq facilita la capacidad de observar transcripciones empalmadas de genes alternativos , modificaciones postranscripcionales , fusión de genes , mutaciones/ SNP y cambios en la expresión genética a lo largo del tiempo, o diferencias en la expresión genética en diferentes grupos o tratamientos. [4] Además de las transcripciones de ARNm, RNA-Seq puede analizar diferentes poblaciones de ARN para incluir ARN total, ARN pequeño, como miARN , ARNt y perfiles ribosómicos . [5] RNA-Seq también se puede utilizar para determinar los límites de exón / intrón y verificar o modificar los límites de los genes 5' y 3' previamente anotados . Los avances recientes en RNA-Seq incluyen secuenciación de células individuales , secuenciación de ARN en masa [6] , secuenciación in situ de tejido fijado y secuenciación de moléculas de ARN nativas con secuenciación en tiempo real de una sola molécula. [7] Otros ejemplos de aplicaciones emergentes de RNA-Seq debido al avance de los algoritmos bioinformáticos son la alteración del número de copias, la contaminación microbiana, los elementos transponibles, el tipo de célula (deconvolución) y la presencia de neoantígenos. [8]

Antes de RNA-Seq, los estudios de expresión génica se realizaban con microarrays basados ​​en hibridación . Los problemas con los microarrays incluyen artefactos de hibridación cruzada, mala cuantificación de genes de baja y alta expresión y la necesidad de conocer la secuencia a priori . [9] Debido a estos problemas técnicos, la transcriptómica pasó a métodos basados ​​en secuenciación. Estos progresaron desde la secuenciación de Sanger de bibliotecas de etiquetas de secuencia expresada hasta métodos basados ​​en etiquetas químicas (p. ej., análisis en serie de la expresión génica ) y, finalmente, hasta la tecnología actual, la secuenciación de próxima generación de ADN complementario (ADNc), en particular RNA-Seq.

Primero, el ARNm celular se extrae y se fragmenta en secuencias de ARNm más pequeñas, que se someten a transcripción inversa. Los ADNc resultantes se secuencian en una plataforma de secuenciación de próxima generación (NGS). Los resultados de dicha secuenciación permiten la generación de mapas genómicos de secuenciación transcriptómica.
Técnica experimental de secuenciación del transcriptoma (RNA-seq).

Métodos

Preparación de la biblioteca

Flujo de trabajo experimental típico de RNA-Seq. El ARN se aísla de múltiples muestras, se convierte en bibliotecas de ADNc, se secuencia en un formato legible por computadora, se alinea con una referencia y se cuantifica para análisis posteriores, como la expresión diferencial y el empalme alternativo. Descripción general de un flujo de trabajo experimental típico de RNA-Seq. [10]

Los pasos generales para preparar una biblioteca de ADN complementario (ADNc) para la secuenciación se describen a continuación, pero a menudo varían entre plataformas. [10] [3] [11]

  1. Aislamiento de ARN: el ARN se aísla del tejido y se mezcla con desoxirribonucleasa (DNasa). La ADNasa reduce la cantidad de ADN genómico. La cantidad de degradación del ARN se verifica con gel y electroforesis capilar y se utiliza para asignar un número de integridad del ARN a la muestra. Esta calidad del ARN y la cantidad total de ARN inicial se tienen en cuenta durante los pasos posteriores de preparación, secuenciación y análisis de la biblioteca.
  2. Selección/agotamiento de ARN: para analizar señales de interés, el ARN aislado puede mantenerse tal como está, enriquecerse con ARN con colas 3' poliadeniladas (poli(A)) para incluir solo ARNm eucariota , empobrecerse de ARN ribosomal (ARNr) y /o filtrado para ARN que se une a secuencias específicas ( tabla de métodos de selección y agotamiento de ARN , a continuación). Las moléculas de ARN que tienen colas 3' poli(A) en eucariotas se componen principalmente de secuencias codificantes maduras y procesadas. La selección de poli(A) se realiza mezclando ARN con oligómeros de poli(T) unidos covalentemente a un sustrato, normalmente perlas magnéticas. [12] [13] La selección de poli(A) tiene limitaciones importantes en la detección de biotipos de ARN. Muchos biotipos de ARN no están poliadenilados, incluidos muchos ARN no codificantes y transcripciones de proteínas con núcleo de histonas, o están regulados a través de la longitud de su cola poli(A) (p. ej., citoquinas) y, por lo tanto, es posible que no se detecten después de la selección poli(A). [14] Además, la selección poli(A) puede mostrar un mayor sesgo 3', especialmente con ARN de menor calidad. [15] [16] Estas limitaciones se pueden evitar con el agotamiento ribosómico, eliminando el ARNr que normalmente representa más del 90% del ARN de una célula. Tanto el enriquecimiento con poli(A) como el agotamiento ribosomal requieren mucha mano de obra y podrían introducir sesgos, por lo que se han desarrollado enfoques más simples para omitir estos pasos. [17] Los objetivos de ARN pequeños, como los miARN , se pueden aislar aún más mediante la selección de tamaño con geles de exclusión, perlas magnéticas o kits comerciales.
  3. Síntesis de ADNc: el ARN se transcribe de forma inversa a ADNc porque el ADN es más estable y para permitir la amplificación (que utiliza ADN polimerasas ) y aprovechar una tecnología de secuenciación de ADN más madura. La amplificación posterior a la transcripción inversa da como resultado la pérdida de cadena , que puede evitarse con marcaje químico o secuenciación de una sola molécula. La fragmentación y la selección de tamaño se realizan para purificar secuencias que tienen la longitud adecuada para la máquina secuenciadora. El ARN, el ADNc o ambos se fragmentan con enzimas, sonicación o nebulizadores. La fragmentación del ARN reduce el sesgo 5' de la transcripción inversa cebada aleatoriamente y la influencia de los sitios de unión del cebador , [13] con la desventaja de que los extremos 5' y 3' se convierten en ADN de manera menos eficiente. A la fragmentación le sigue la selección de tamaño, donde se eliminan secuencias pequeñas o se selecciona un rango reducido de longitudes de secuencia. Debido a que los ARN pequeños como los miARN se pierden, estos se analizan de forma independiente. El ADNc de cada experimento se puede indexar con un código de barras de hexámero u octámero, de modo que estos experimentos se puedan agrupar en un solo carril para la secuenciación multiplexada.

Secuenciación complementaria de ADN (cDNA-Seq)

Luego, la biblioteca de ADNc derivada de biotipos de ARN se secuencia en un formato legible por computadora. Existen muchas tecnologías de secuenciación de alto rendimiento para la secuenciación de ADNc, incluidas plataformas desarrolladas por Illumina , Thermo Fisher , BGI/MGI , PacBio y Oxford Nanopore Technologies . [18] Para la secuenciación de lectura corta de Illumina, una tecnología común para la secuenciación de ADNc, se ligan adaptadores al ADNc, se une el ADN a una celda de flujo, se generan grupos a través de ciclos de amplificación y desnaturalización de puentes, y se secuencia por síntesis. realizado en ciclos de síntesis de hebras complementarias y excitación láser de bases con terminadores reversibles. La elección y los parámetros de la plataforma de secuenciación se guían por el diseño y el costo experimentales. Las consideraciones comunes del diseño experimental incluyen decidir sobre la longitud y la profundidad de la secuenciación, el uso de secuenciación de extremo único versus secuenciación de extremo emparejado, número de réplicas, multiplexación, aleatorización y picos. [19]

Secuenciación de ARN pequeño/ARN no codificante

Al secuenciar ARN distinto del ARNm, se modifica la preparación de la biblioteca. El ARN celular se selecciona en función del rango de tamaño deseado. Para dianas de ARN pequeñas, como miARN , el ARN se aísla mediante selección de tamaño. Esto se puede realizar con un gel de exclusión de tamaño, mediante perlas magnéticas de selección de tamaño o con un kit desarrollado comercialmente. Una vez aislados, se añaden conectores al extremo 3' y 5' y luego se purifican. El último paso es la generación de ADNc mediante transcripción inversa.

Secuenciación directa de ARN

Debido a que se ha demostrado que la conversión de ARN en ADNc , la ligadura, la amplificación y otras manipulaciones de muestras introducen sesgos y artefactos que pueden interferir tanto con la caracterización como con la cuantificación adecuadas de las transcripciones, [20] empresas como Helicos han explorado la secuenciación directa de ARN de una sola molécula. (en quiebra), Oxford Nanopore Technologies , [21] y otros. Esta tecnología secuencia moléculas de ARN directamente de manera masivamente paralela.

Secuenciación de ARN de una sola molécula en tiempo real

Se ha explorado el RNA-Seq directo de molécula única masivamente paralelo como una alternativa al RNA-Seq tradicional, en el que la conversión, ligación, amplificación y otros pasos de manipulación de muestras de ARN a ADNc pueden introducir sesgos y artefactos. [22] Las plataformas tecnológicas que realizan RNA-Seq en tiempo real de una sola molécula incluyen la secuenciación de nanoporos de Oxford Nanopore Technologies (ONT) , [21] PacBio IsoSeq y Helicos (en quiebra). La secuenciación del ARN en su forma nativa preserva modificaciones como la metilación, lo que permite investigarlas directa y simultáneamente. [21] Otro beneficio de RNA-Seq de una sola molécula es que las transcripciones se pueden cubrir en su totalidad, lo que permite una detección y cuantificación de isoformas de mayor confianza en comparación con la secuenciación de lectura corta. Tradicionalmente, los métodos RNA-Seq de una sola molécula tienen tasas de error más altas en comparación con la secuenciación de lectura corta, pero los métodos más nuevos como ONT direct RNA-Seq limitan los errores al evitar la fragmentación y la conversión de ADNc. Los usos recientes de ONT direct RNA-Seq para la expresión diferencial en poblaciones de células humanas han demostrado que esta tecnología puede superar muchas limitaciones de la secuenciación de ADNc corta y larga. [23]

Secuenciación de ARN unicelular (scRNA-Seq)

Los métodos estándar, como los microarrays y el análisis RNA-Seq en masa estándar, analizan la expresión de ARN de grandes poblaciones de células. En poblaciones de células mixtas, estas mediciones pueden ocultar diferencias críticas entre células individuales dentro de estas poblaciones. [24] [25]

La secuenciación de ARN unicelular (scRNA-Seq) proporciona los perfiles de expresión de células individuales. Aunque no es posible obtener información completa sobre cada ARN expresado por cada célula, debido a la pequeña cantidad de material disponible, se pueden identificar patrones de expresión genética mediante análisis de agrupación de genes . Esto puede descubrir la existencia de tipos de células raras dentro de una población de células que quizás nunca antes se hayan visto. Por ejemplo, en 2018, dos grupos identificaron células especializadas raras en el pulmón llamadas ionocitos pulmonares que expresan el regulador de conductancia transmembrana de la fibrosis quística que realizaron scRNA-Seq en los epitelios de las vías respiratorias pulmonares. [26] [27]

Procedimientos experimentales

Flujo de trabajo típico de RNA-Seq unicelular. Se aíslan células individuales de una muestra en pocillos o gotitas, se generan y amplifican bibliotecas de ADNc, se secuencian bibliotecas y se generan matrices de expresión para análisis posteriores, como la identificación del tipo de célula.

Los protocolos actuales de scRNA-Seq implican los siguientes pasos: aislamiento de células individuales y ARN, transcripción inversa (RT), amplificación, generación de bibliotecas y secuenciación. Las células individuales se separan mecánicamente en micropocillos (p. ej., BD Rhapsody, Takara ICELL8, Vycap Puncher Platform o CellMicrosystems CellRaft) o se encapsulan en gotitas (p. ej., 10x Genomics Chromium, Illumina Bio-Rad ddSEQ, 1CellBio InDrop, Dolomite Bio Nadia). [28] Las células individuales se marcan añadiendo perlas con oligonucleótidos con código de barras; Tanto las células como las perlas se suministran en cantidades limitadas, de modo que la coocupación con múltiples células y perlas es un evento muy raro. Una vez que se completa la transcripción inversa, los ADNc de muchas células se pueden mezclar para secuenciarlos; Las transcripciones de una celda en particular se identifican mediante el código de barras único de cada celda. [29] [30] Se pueden adjuntar identificadores moleculares únicos (UMI) a secuencias objetivo de ARNm/ADNc para ayudar a identificar artefactos durante la preparación de la biblioteca. [31]

Los desafíos para scRNA-Seq incluyen preservar la abundancia relativa inicial de ARNm en una célula e identificar transcripciones raras. [32] El paso de transcripción inversa es fundamental ya que la eficiencia de la reacción de RT determina qué parte de la población de ARN de la célula será finalmente analizada por el secuenciador. La procesividad de las transcriptasas inversas y las estrategias de cebado utilizadas pueden afectar la producción de ADNc de longitud completa y la generación de bibliotecas sesgadas hacia el extremo 3' o 5' de los genes.

En el paso de amplificación, actualmente se utiliza PCR o transcripción in vitro (IVT) para amplificar el ADNc. Una de las ventajas de los métodos basados ​​en PCR es la capacidad de generar ADNc de longitud completa. Sin embargo, la diferente eficiencia de la PCR en secuencias particulares (por ejemplo, contenido de GC y estructura snapback) también puede amplificarse exponencialmente, produciendo bibliotecas con cobertura desigual. Por otro lado, si bien las bibliotecas generadas por IVT pueden evitar el sesgo de secuencia inducido por la PCR, secuencias específicas pueden transcribirse de manera ineficiente, lo que provoca la pérdida de secuencias o la generación de secuencias incompletas. [33] [24] Se han publicado varios protocolos scRNA-Seq: Tang et al., [34] STRT, [35] SMART-seq, [36] CEL-seq, [37] RAGE-seq, [38] Quartz -seq [39] y C1-CAGE. [40] Estos protocolos difieren en términos de estrategias para la transcripción inversa, síntesis y amplificación de ADNc, y la posibilidad de acomodar códigos de barras de secuencia específica (es decir, UMI ) o la capacidad de procesar muestras agrupadas. [41]

En 2017, se introdujeron dos enfoques para medir simultáneamente la expresión de proteínas y ARNm de una sola célula a través de anticuerpos marcados con oligonucleótidos conocidos como REAP-seq, [42] y CITE-seq. [43]

Aplicaciones

scRNA-Seq se está utilizando ampliamente en disciplinas biológicas que incluyen desarrollo, neurología , [44] oncología , [45] [46] [47] enfermedades autoinmunes , [48] y enfermedades infecciosas . [49]

scRNA-Seq ha proporcionado información considerable sobre el desarrollo de embriones y organismos, incluido el gusano Caenorhabditis elegans , [50] y la planaria regenerativa Schmidtea mediterranea . [51] [52] Los primeros animales vertebrados en ser mapeados de esta manera fueron el pez cebra [53] [54] y Xenopus laevis . [55] En cada caso se estudiaron múltiples etapas del embrión, lo que permitió mapear todo el proceso de desarrollo célula por célula. [10] La ciencia reconoció estos avances como el Avance del Año 2018 . [56]

Consideraciones experimentales

Se consideran una variedad de parámetros al diseñar y realizar experimentos de RNA-Seq:

Análisis

Un flujo de trabajo de análisis de RNA-Seq estándar. Las lecturas secuenciadas se alinean con un genoma y/o transcriptoma de referencia y posteriormente se procesan para una variedad de controles de calidad, descubrimientos y análisis basados ​​en hipótesis.

Montaje del transcriptoma

Se utilizan dos métodos para asignar lecturas de secuencias sin procesar a características genómicas (es decir, ensamblar el transcriptoma):

Alineación de RNA-Seq con lecturas cortas divididas en intrones. Alineación de lecturas cortas con una secuencia de ARNm y el genoma de referencia. El software de alineación debe tener en cuenta lecturas breves que se superponen a las uniones exón-exón (en rojo) y, por lo tanto, omiten secciones intrónicas del pre-ARNm y el genoma de referencia.

Una nota sobre la calidad del ensamblaje: el consenso actual es que 1) la calidad del ensamblaje puede variar según la métrica que se utilice, 2) las herramientas de ensamblaje que obtuvieron buenos resultados en una especie no necesariamente funcionan bien en la otra especie, y 3) combinar diferentes enfoques podría ser el más confiable. [77] [78] [79]

Cuantificación de la expresión genética.

La expresión se cuantifica para estudiar los cambios celulares en respuesta a estímulos externos, las diferencias entre estados sanos y enfermos y otras preguntas de investigación. Los niveles de transcripción se utilizan a menudo como un indicador de la abundancia de proteínas, pero a menudo no son equivalentes debido a eventos postranscripcionales como la interferencia del ARN y la descomposición mediada sin sentido . [80]

La expresión se cuantifica contando el número de lecturas asignadas a cada locus en el paso de ensamblaje del transcriptoma. La expresión se puede cuantificar para exones o genes utilizando contigs o anotaciones de transcripción de referencia. [10] Estos recuentos de lecturas de RNA-Seq observados se han validado sólidamente frente a tecnologías más antiguas, incluidas las micromatrices de expresión y qPCR . [57] [81] Las herramientas que cuantifican los recuentos son HTSeq, [82] FeatureCounts, [83] Rcount, [84] maxcounts, [85] FIXSEQ, [86] y Cuffquant. Estas herramientas determinan los recuentos de lectura a partir de datos de RNA-Seq alineados, pero también se pueden obtener recuentos sin alineación con Sailfish [87] y Kallisto. [88] Los recuentos de lecturas se convierten luego en métricas apropiadas para pruebas de hipótesis, regresiones y otros análisis. Los parámetros para esta conversión son:

Spike-ins para la cuantificación absoluta y la detección de efectos en todo el genoma

Los picos de ARN son muestras de ARN en concentraciones conocidas que pueden usarse como estándares de oro en el diseño experimental y durante los análisis posteriores para la cuantificación absoluta y la detección de efectos en todo el genoma.

expresión diferencial

El uso más simple pero a menudo más poderoso de RNA-Seq es encontrar diferencias en la expresión genética entre dos o más afecciones ( p . ej ., tratadas versus no tratadas); este proceso se llama expresión diferencial. Las salidas se denominan frecuentemente genes expresados ​​diferencialmente (DEG) y estos genes pueden estar regulados hacia arriba o hacia abajo ( es decir , más alto o más bajo en la condición de interés). Hay muchas herramientas que realizan expresión diferencial . La mayoría se ejecutan en R , Python o la línea de comandos de Unix . Las herramientas comúnmente utilizadas incluyen DESeq, [96] edgeR, [97] y voom+limma, [95] [102], todas las cuales están disponibles a través de R/ Bioconductor . [103] [104] Estas son las consideraciones comunes al realizar la expresión diferencial:

Los análisis posteriores para obtener una lista de genes expresados ​​diferencialmente son de dos tipos: validan observaciones y hacen inferencias biológicas. Debido a los inconvenientes de la expresión diferencial y RNA-Seq, las observaciones importantes se replican con (1) un método ortogonal en las mismas muestras (como la PCR en tiempo real ) o (2) otro experimento, a veces prerregistrado , en una nueva cohorte. . Esto último ayuda a garantizar la generalización y, por lo general, puede seguirse con un metanálisis de todas las cohortes agrupadas. El método más común para obtener una comprensión biológica de alto nivel de los resultados es el análisis de enriquecimiento de conjuntos de genes , aunque a veces se emplean enfoques de genes candidatos. El enriquecimiento del conjunto de genes determina si la superposición entre dos conjuntos de genes es estadísticamente significativa, en este caso la superposición entre genes expresados ​​diferencialmente y conjuntos de genes de vías/bases de datos conocidas (p. ej., ontología de genes , KEGG , ontología de fenotipo humano ) o de análisis complementarios en el mismos datos (como redes de coexpresión). Las herramientas comunes para el enriquecimiento de conjuntos de genes incluyen interfaces web ( p. ej. , ENRICHR, g:profiler, WEBGESTALT) [117] y paquetes de software. Al evaluar los resultados del enriquecimiento, una heurística es buscar primero el enriquecimiento de la biología conocida como control de cordura y luego ampliar el alcance para buscar biología novedosa.

Ejemplos de modos alternativos de empalme de ARN. Los exones se representan como bloques azules y amarillos, los intrones empalmados como líneas negras horizontales que conectan dos exones y las uniones exón-exón como delgadas líneas grises que conectan entre dos exones.

Splicing alternativo

El empalme de ARN es integral para los eucariotas y contribuye significativamente a la regulación y diversidad de proteínas, y ocurre en >90% de los genes humanos. [118] Existen múltiples modos de empalme alternativos : omisión de exones (modo de empalme más común en humanos y eucariotas superiores), exones mutuamente excluyentes, sitios donantes o aceptores alternativos, retención de intrones (modo de empalme más común en plantas, hongos y protozoos), sitio de inicio de transcripción alternativo (promotor) y poliadenilación alternativa. [118] Un objetivo de RNA-Seq es identificar eventos de empalme alternativos y probar si difieren entre condiciones. La secuenciación de lectura larga captura la transcripción completa y, por lo tanto, minimiza muchos de los problemas al estimar la abundancia de isoformas, como el mapeo de lectura ambiguo. Para RNA-Seq de lectura corta, existen múltiples métodos para detectar empalmes alternativos que se pueden clasificar en tres grupos principales: [119] [91] [120]

Las herramientas de expresión genética diferencial también se pueden utilizar para la expresión de isoformas diferenciales si las isoformas se cuantifican de antemano con otras herramientas como RSEM. [127]

Redes de coexpresión

Las redes de coexpresión son representaciones derivadas de datos de genes que se comportan de manera similar en tejidos y condiciones experimentales. [128] Su objetivo principal radica en la generación de hipótesis y los enfoques de culpa por asociación para inferir funciones de genes previamente desconocidos. [128] Los datos de RNA-Seq se han utilizado para inferir genes involucrados en vías específicas basadas en la correlación de Pearson , tanto en plantas [129] como en mamíferos. [130] La principal ventaja de los datos de RNA-Seq en este tipo de análisis sobre las plataformas de microarrays es la capacidad de cubrir todo el transcriptoma, lo que permite desentrañar representaciones más completas de las redes reguladoras de genes. La regulación diferencial de las isoformas de empalme del mismo gen se puede detectar y utilizar para predecir sus funciones biológicas. [131] [132] El análisis de redes de coexpresión de genes ponderados se ha utilizado con éxito para identificar módulos de coexpresión y genes centrales intramodulares basados ​​en datos de secuencias de ARN. Los módulos de coexpresión pueden corresponder a tipos o vías de células. Los hubs intramodulares altamente conectados pueden interpretarse como representantes de su módulo respectivo. Un gen propio es una suma ponderada de expresión de todos los genes en un módulo. Los genes propios son biomarcadores (características) útiles para el diagnóstico y el pronóstico. [133] Se han propuesto enfoques de transformación estabilizadora de la varianza para estimar coeficientes de correlación basados ​​en datos de secuencias de ARN. [129]

Descubrimiento de variantes

RNA-Seq captura la variación del ADN, incluidas variantes de un solo nucleótido y pequeñas inserciones/eliminaciones . y variación estructural . La llamada de variantes en RNA-Seq es similar a la llamada de variantes de ADN y, a menudo, emplea las mismas herramientas (incluidas SAMtools mpileup [134] y GATK HaplotypeCaller [135] ) con ajustes para tener en cuenta el empalme. Una dimensión única para las variantes de ARN es la expresión específica de alelo (ASE) : las variantes de un solo haplotipo podrían expresarse preferentemente debido a efectos reguladores que incluyen la impresión y la expresión de loci de rasgos cuantitativos y variantes raras no codificantes . [136] [137] Las limitaciones de la identificación de variantes de ARN incluyen que solo refleja regiones expresadas (en humanos, <5% del genoma), podría estar sujeta a sesgos introducidos por el procesamiento de datos (p. ej., los conjuntos de transcriptomas de novo subestiman la heterocigosidad [138 ] ), y tiene una calidad inferior en comparación con la secuenciación directa de ADN.

Edición de ARN (alteraciones postranscripcionales)

Tener las secuencias genómicas y transcriptómicas coincidentes de un individuo puede ayudar a detectar ediciones postranscripcionales ( edición de ARN ). [3] Se identifica un evento de modificación postranscripcional si la transcripción del gen tiene un alelo/variante no observado en los datos genómicos.

Un evento de fusión genética y el comportamiento de lecturas de extremos pares que caen a ambos lados de la unión genética. Las fusiones de genes pueden ocurrir en Trans , entre genes en cromosomas separados, o en Cis , entre dos genes en el mismo cromosoma.

Detección de genes de fusión

Provocados por diferentes modificaciones estructurales en el genoma, los genes de fusión han ganado atención por su relación con el cáncer. [139] La capacidad de RNA-Seq para analizar el transcriptoma completo de una muestra de manera imparcial lo convierte en una herramienta atractiva para encontrar este tipo de eventos comunes en el cáncer. [4]

La idea surge del proceso de alinear las lecturas transcriptómicas cortas con un genoma de referencia. La mayoría de las lecturas cortas se ubicarán dentro de un exón completo, y se esperaría que un conjunto más pequeño pero aún grande se mapee en uniones exón-exón conocidas. Las lecturas cortas restantes no asignadas se analizarían más a fondo para determinar si coinciden con una unión exón-exón donde los exones provienen de genes diferentes. Esto sería evidencia de un posible evento de fusión; sin embargo, debido a la longitud de las lecturas, esto podría resultar muy ruidoso. Un enfoque alternativo es utilizar lecturas de extremos emparejados, cuando una cantidad potencialmente grande de lecturas emparejadas asignaría cada extremo a un exón diferente, brindando una mejor cobertura de estos eventos (ver figura). No obstante, el resultado final consta de combinaciones de genes múltiples y potencialmente novedosas que proporcionan un punto de partida ideal para una mayor validación.

Alteración del número de copia

Los análisis de alteración del número de copias (CNA) se utilizan comúnmente en estudios de cáncer. La ganancia y la pérdida de genes tienen implicaciones en las vías de señalización y son un biomarcador clave de disfunción molecular en oncología. Obtener la información de CNA a partir de datos de RNA-Seq no es sencillo debido a las diferencias en la expresión genética, que conducen a una variación de la profundidad de lectura de diferentes magnitudes entre los genes. Debido a estas dificultades, la mayoría de estos análisis generalmente se realizan mediante secuenciación del genoma completo/secuenciación del exoma completo (WGS/WES). Pero las herramientas bioinformáticas avanzadas pueden llamar a CNA desde RNA-Seq. [140]

Otros análisis y aplicaciones emergentes

Las aplicaciones de RNA-Seq crecen día a día. Otra aplicación nueva de RNA-Seq incluye la detección de contaminantes microbianos, [141] determinar la abundancia del tipo de célula (deconvolución del tipo de célula), [8] medir la expresión de TE y la predicción de neoantígenos, etc. [8]

Historia

Las coincidencias de manuscritos publicados en Pubmed resaltan la creciente popularidad de RNA-Seq. Las coincidencias son para RNA-Seq (azul, términos de búsqueda: "RNA Seq" O "RNA-Seq" O "RNA sequencing" O "RNASeq") [ 142] y RNA=Seq en medicina (oro, términos de búsqueda: ("RNA Seq" O "RNA-Seq" O "Secuenciación de ARN" O "RNASeq") Y "Medicina"). [143] El número de manuscritos en PubMed que presentan RNA-Seq sigue aumentando.

RNA-Seq se desarrolló por primera vez a mediados de la década de 2000 con la llegada de la tecnología de secuenciación de próxima generación. [144] Los primeros manuscritos que utilizaron RNA-Seq incluso sin utilizar el término incluyen los de líneas celulares de cáncer de próstata [145] (con fecha de 2006), Medicago truncatula [146] (2006), maíz [147] (2007) y Arabidopsis. thaliana [148] (2007), mientras que el término "RNA-Seq" en sí se mencionó por primera vez en 2008. [13] [149] El número de manuscritos que hacen referencia a RNA-Seq en el título o resumen (Figura, línea azul) es aumentando continuamente con 6754 manuscritos publicados en 2018. La intersección de RNA-Seq y la medicina (Figura, línea dorada) tiene una celeridad similar. [150]

Aplicaciones a la medicina

RNA-Seq tiene el potencial de identificar la biología de nuevas enfermedades, perfilar biomarcadores para indicaciones clínicas, inferir vías farmacológicas y realizar diagnósticos genéticos. Estos resultados podrían personalizarse aún más para subgrupos o incluso pacientes individuales, lo que podría resaltar una prevención, diagnóstico y terapia más eficaces. La viabilidad de este enfoque depende en parte de los costos en dinero y tiempo; una limitación relacionada es el equipo necesario de especialistas (bioinformáticos, médicos/clínicos, investigadores básicos, técnicos) para interpretar completamente la enorme cantidad de datos generados por este análisis. [151]

Esfuerzos de secuenciación a gran escala.

Se ha dado mucho énfasis a los datos de RNA-Seq después de que los proyectos Encyclopedia of DNA Elements (ENCODE) y The Cancer Genome Atlas (TCGA) utilizaron este enfoque para caracterizar docenas de líneas celulares [152] y miles de muestras de tumores primarios. [153] respectivamente. ENCODE tenía como objetivo identificar regiones reguladoras de todo el genoma en diferentes cohortes de líneas celulares y los datos transcriptómicos son fundamentales para comprender el efecto posterior de esas capas reguladoras genéticas y epigenéticas. TCGA, en cambio, tenía como objetivo recopilar y analizar miles de muestras de pacientes de 30 tipos de tumores diferentes para comprender los mecanismos subyacentes de la transformación y progresión maligna. En este contexto, los datos de RNA-Seq proporcionan una instantánea única del estado transcriptómico de la enfermedad y analizan una población imparcial de transcripciones que permite la identificación de transcripciones nuevas, transcripciones de fusión y ARN no codificantes que podrían no detectarse con diferentes tecnologías.

Ver también

Referencias

Este artículo se envió a WikiJournal of Science para revisión por pares académicos externos en 2019 (informes de revisores). El contenido actualizado se reintegró a la página de Wikipedia bajo una licencia CC-BY-SA-3.0 ( 2021 ). La versión del registro revisada es: Felix Richter, et al. (17 de mayo de 2021). "Una amplia introducción a RNA-Seq" (PDF) . WikiRevista científica . 4 (2): 4. doi :10.15347/WJS/2021.004. ISSN  2470-6345. Wikidata  Q100146647.

  1. ^ Lowe R, Shirley N, Bleackley M, Dolan S, Shafee T (mayo de 2017). "Tecnologías transcriptómicas". PLOS Biología Computacional . 13 (5): e1005457. Código Bib : 2017PLSCB..13E5457L. doi : 10.1371/journal.pcbi.1005457 . PMC 5436640 . PMID  28545146. 
  2. ^ Chu Y, Corey DR (agosto de 2012). "Secuenciación de ARN: selección de plataforma, diseño experimental e interpretación de datos". Terapéutica con ácidos nucleicos . 22 (4): 271–4. doi :10.1089/nat.2012.0367. PMC 3426205 . PMID  22830413. 
  3. ^ abc Wang Z, Gerstein M, Snyder M (enero de 2009). "RNA-Seq: una herramienta revolucionaria para la transcriptómica". Reseñas de la naturaleza. Genética . 10 (1): 57–63. doi :10.1038/nrg2484. PMC 2949280 . PMID  19015660. 
  4. ^ ab Maher CA, Kumar-Sinha C, Cao X, Kalyana-Sundaram S, Han B, Jing X, et al. (Marzo de 2009). "Secuenciación de transcriptomas para detectar fusiones de genes en el cáncer". Naturaleza . 458 (7234): 97–101. Código Bib :2009Natur.458...97M. doi : 10.1038/naturaleza07638. PMC 2725402 . PMID  19136943. 
  5. ^ Ingolia NT, Brar GA, Rouskin S, McGeachy AM, Weissman JS (julio de 2012). "La estrategia de elaboración de perfiles de ribosomas para controlar la traducción in vivo mediante secuenciación profunda de fragmentos de ARNm protegidos por ribosomas". Protocolos de la Naturaleza . 7 (8): 1534–50. doi :10.1038/nprot.2012.086. PMC 3535016 . PMID  22836135. 
  6. ^ Alpern D, Gardeux V, Russeil J, Mangeat B, Meireles-Filho AC, Breysse R, et al. (19 de abril de 2019). "BRB-seq: transcriptómica de alto rendimiento ultra asequible habilitada mediante secuenciación y códigos de barras de ARN masivos". Biología del genoma . 20 (1): 71. doi : 10.1186/s13059-019-1671-x . ISSN  1474-760X. PMC 6474054 . PMID  30999927. 
  7. ^ Lee JH, Daugharthy ER, Scheiman J, Kalhor R, Yang JL, Ferrante TC y col. (Marzo del 2014). "Secuenciación in situ de ARN subcelular altamente multiplexado". Ciencia . 343 (6177): 1360–3. Código Bib : 2014 Ciencia... 343.1360L. doi : 10.1126/ciencia.1250212. PMC 4140943 . PMID  24578530. 
  8. ^ abc Thind AS, Monga I, Thakur PK, Kumari P, Dindhoria K, Krzak M, et al. (noviembre de 2021). "Desmitificar las aplicaciones emergentes de RNA-Seq a granel: la aplicación y utilidad de la metodología bioinformática". Sesiones informativas en Bioinformática . 22 (6). doi :10.1093/bib/bbab259. PMID  34329375.
  9. ^ Kukurba KR, Montgomery SB (abril de 2015). "Análisis y secuenciación de ARN". Protocolos de Cold Spring Harbor . 2015 (11): 951–69. doi : 10.1101/pdb.top084970. PMC 4863231 . PMID  25870306. 
  10. ^ abcde Griffith M, Walker JR, Spies NC, Ainscough BJ, Griffith OL (agosto de 2015). "Informática para la secuenciación de ARN: un recurso web para el análisis en la nube". PLOS Biología Computacional . 11 (8): e1004393. Código Bib : 2015PLSCB..11E4393G. doi : 10.1371/journal.pcbi.1004393 . PMC 4527835 . PMID  26248053. 
  11. ^ "ARN-seqlopedia". rnaseq.uoregon.edu . Consultado el 8 de febrero de 2017 .
  12. ^ Morin R, Bainbridge M, Fejes A, Hirst M, Krzywinski M, Pugh T, et al. (Julio de 2008). "Perfilado del transcriptoma HeLa S3 utilizando ADNc preparado aleatoriamente y secuenciación de lectura corta masivamente paralela". BioTécnicas . 45 (1): 81–94. doi : 10.2144/000112900 . PMID  18611170.
  13. ^ abcd Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B (julio de 2008). "Mapeo y cuantificación de transcriptomas de mamíferos mediante RNA-Seq". Métodos de la naturaleza . 5 (7): 621–8. doi :10.1038/nmeth.1226. PMID  18516045. S2CID  205418589.
  14. ^ Sun Q, Hao Q, Prasanth KV (febrero de 2018). "ARN nucleares largos no codificantes: reguladores clave de la expresión genética". Tendencias en Genética . 34 (2): 142-157. doi :10.1016/j.tig.2017.11.005. PMC 6002860 . PMID  29249332. 
  15. ^ Sigurgeirsson B, Emanuelsson O, Lundeberg J (2014). "Secuenciación de ARN degradado abordada mediante conteo de etiquetas 3 '". MÁS UNO . 9 (3): e91851. Código Bib : 2014PLoSO...991851S. doi : 10.1371/journal.pone.0091851 . PMC 3954844 . PMID  24632678. 
  16. ^ Chen EA, Souaiaia T, Herstein JS, Evgrafov OV, Spitsyna VN, Rebolini DF y otros. (octubre de 2014). "Efecto de la integridad del ARN en lecturas asignadas de forma única en RNA-Seq". Notas de investigación de BMC . 7 : 753. doi : 10.1186/1756-0500-7-753 . PMC 4213542 . PMID  25339126. 
  17. ^ Moll P, Ante M, Seitz A, Reda T (diciembre de 2014). "Secuenciación de ARNm QuantSeq 3 ′ para cuantificación de ARN". Métodos de la naturaleza . 11 (12): i-iii. doi :10.1038/nmeth.f.376. ISSN  1548-7105. S2CID  83424788.
  18. ^ Oikonomopoulos S, Bayega A, Fahiminiya S, Djambazian H, Berube P, Ragoussis J (2020). "Metodologías para la elaboración de perfiles de transcripciones utilizando tecnologías de lectura prolongada". Fronteras en genética . 11 : 606. doi : 10.3389/fgene.2020.00606 . PMC 7358353 . PMID  32733532. 
  19. ^ ab Conesa A, Madrigal P, Tarazona S, Gómez-Cabrero D, Cervera A, McPherson A, et al. (Enero de 2016). "Una encuesta de mejores prácticas para el análisis de datos de RNA-seq". Biología del genoma . 17 (1): 13. doi : 10.1186/s13059-016-0881-8 . PMC 4728800 . PMID  26813401. 
  20. ^ Liu D, Graber JH (febrero de 2006). "La comparación cuantitativa de bibliotecas EST requiere compensación por sesgos sistemáticos en la generación de ADNc". Bioinformática BMC . 7 : 77. doi : 10.1186/1471-2105-7-77 . PMC 1431573 . PMID  16503995. 
  21. ^ abc Garalde DR, Snell EA, Jachimowicz D, Sipos B, Lloyd JH, Bruce M, et al. (Marzo de 2018). "Secuenciación directa de ARN altamente paralela en una serie de nanoporos". Métodos de la naturaleza . 15 (3): 201–206. doi :10.1038/nmeth.4577. PMID  29334379. S2CID  3589823.
  22. ^ Liu D, Graber JH (febrero de 2006). "La comparación cuantitativa de bibliotecas EST requiere compensación por sesgos sistemáticos en la generación de ADNc". Bioinformática BMC . 7 : 77. doi : 10.1186/1471-2105-7-77 . PMC 1431573 . PMID  16503995. 
  23. ^ Gleeson J, Lane TA, Harrison PJ, Haerty W, Clark MB (3 de agosto de 2020). "La secuenciación directa de ARN por nanoporos detecta la expresión diferencial entre poblaciones de células humanas". bioRxiv : 2020.08.02.232785. doi : 10.1101/2020.08.02.232785 . S2CID  220975367.
  24. ^ ab " Shapiro E, Biezuner T, Linnarsson S (septiembre de 2013). "Las tecnologías basadas en secuenciación unicelular revolucionarán la ciencia de organismos completos". Nature Reviews. Genetics . 14 (9): 618–30. doi :10.1038/ nrg3542.PMID 23897237. S2CID  500845  ."
  25. ^ Kolodziejczyk AA, Kim JK, Svensson V, Marioni JC, Teichmann SA (mayo de 2015). "La tecnología y biología de la secuenciación de ARN unicelular". Célula molecular . 58 (4): 610–20. doi : 10.1016/j.molcel.2015.04.005 . PMID  26000846.
  26. ^ Montoro DT, Haber AL, Biton M, Vinarsky V, Lin B, Birket SE, et al. (Agosto de 2018). "Una jerarquía epitelial de las vías respiratorias revisada incluye ionocitos que expresan CFTR". Naturaleza . 560 (7718): 319–324. Código Bib :2018Natur.560..319M. doi :10.1038/s41586-018-0393-7. PMC 6295155 . PMID  30069044. 
  27. ^ Plasschaert LW, Žilionis R, Choo-Wing R, Savova V, Knehr J, Roma G, et al. (Agosto de 2018). "Un atlas unicelular del epitelio de las vías respiratorias revela el ionocito pulmonar rico en CFTR". Naturaleza . 560 (7718): 377–381. Código Bib :2018Natur.560..377P. doi :10.1038/s41586-018-0394-6. PMC 6108322 . PMID  30069046. 
  28. ^ Valihrach L, Androvic P, Kubista M (marzo de 2018). "Plataformas de recogida y análisis unicelulares". Revista Internacional de Ciencias Moleculares . 19 (3): 807. doi : 10.3390/ijms19030807 . PMC 5877668 . PMID  29534489. 
  29. ^ Klein AM, Mazutis L, Akartuna I, Tallapragada N, Veres A, Li V, et al. (mayo de 2015). "Códigos de barras de gotas para transcriptómica unicelular aplicada a células madre embrionarias". Celúla . 161 (5): 1187-1201. doi :10.1016/j.cell.2015.04.044. PMC 4441768 . PMID  26000487. 
  30. ^ Macosko EZ, Basu A, Satija R, Nemesh J, Shekhar K, Goldman M, et al. (mayo de 2015). "Perfil de expresión de todo el genoma altamente paralelo de células individuales utilizando gotitas de nanolitros". Celúla . 161 (5): 1202-1214. doi :10.1016/j.cell.2015.05.002. PMC 4481139 . PMID  26000488. 
  31. ^ Islam S, Zeisel A, Joost S, La Manno G, Zajac P, Kasper M, et al. (Febrero 2014). "Secuencia de ARN unicelular cuantitativa con identificadores moleculares únicos". Métodos de la naturaleza . 11 (2): 163–6. doi :10.1038/nmeth.2772. PMID  24363023. S2CID  6765530.
  32. ^ " Hebenstreit D (noviembre de 2012). "Métodos, desafíos y potenciales de la secuencia de ARN unicelular". Biología . 1 (3): 658–67. doi : 10.3390 /biology1030658 . PMC 4009822. PMID  24832513. "
  33. ^ Eberwine J, Sul JY, Bartfai T, Kim J (enero de 2014). "La promesa de la secuenciación unicelular". Métodos de la naturaleza . 11 (1): 25–7. doi :10.1038/nmeth.2769. PMID  24524134. S2CID  11575439.
  34. ^ Tang F, Barbacioru C, Wang Y, Nordman E, Lee C, Xu N, et al. (mayo de 2009). "Análisis del transcriptoma completo de mRNA-Seq de una sola célula". Métodos de la naturaleza . 6 (5): 377–82. doi :10.1038/NMETH.1315. PMID  19349980. S2CID  16570747.
  35. ^ Islam S, Kjällquist U, Moliner A, Zajac P, Fan JB, Lönnerberg P, et al. (Julio de 2011). "Caracterización del panorama transcripcional unicelular mediante RNA-seq altamente multiplexado". Investigación del genoma . 21 (7): 1160–7. doi :10.1101/gr.110882.110. PMC 3129258 . PMID  21543516. 
  36. ^ Ramsköld D, Luo S, Wang YC, Li R, Deng Q, Faridani OR, et al. (Agosto 2012). "Seq de ARNm de longitud completa a partir de niveles de ARN unicelulares y células tumorales circulantes individuales". Biotecnología de la Naturaleza . 30 (8): 777–82. doi :10.1038/nbt.2282. PMC 3467340 . PMID  22820318. 
  37. ^ Hashimshony T, Wagner F, Sher N, Yanai I (septiembre de 2012). "CEL-Seq: RNA-Seq unicelular mediante amplificación lineal multiplexada". Informes celulares . 2 (3): 666–73. doi : 10.1016/j.celrep.2012.08.003 . PMID  22939981.
  38. ^ Singh M, Al-Eryani G, Carswell S, Ferguson JM, Blackburn J, Barton K, et al. (2018). "La secuenciación de células individuales de lectura larga dirigida de alto rendimiento revela el panorama clonal y transcripcional de los linfocitos". bioRxiv . 10 (1): 3120. doi : 10.1101/424945 . PMC 6635368 . PMID  31311926. 
  39. ^ Sasagawa Y, Nikaido I, Hayashi T, Danno H, Uno KD, Imai T, et al. (Abril 2013). "Quartz-Seq: un método de secuenciación de ARN unicelular altamente reproducible y sensible, revela heterogeneidad de expresión genética no genética". Biología del genoma . 14 (4): R31. doi : 10.1186/gb-2013-14-4-r31 . PMC 4054835 . PMID  23594475. 
  40. ^ Kouno T, Moody J, Kwon AT, Shibayama Y, Kato S, Huang Y, et al. (Enero de 2019). "C1 CAGE detecta sitios de inicio de la transcripción y actividad potenciadora con resolución unicelular". Comunicaciones de la naturaleza . 10 (1): 360. Código bibliográfico : 2019NatCo..10..360K. doi :10.1038/s41467-018-08126-5. PMC 6341120 . PMID  30664627. 
  41. ^ Dal Molin A, Di Camillo B (2019). "Cómo diseñar un experimento de secuenciación de ARN unicelular: obstáculos, desafíos y perspectivas". Sesiones informativas en Bioinformática . 20 (4): 1384-1394. doi : 10.1093/bib/bby007. PMID  29394315.
  42. ^ Peterson VM, Zhang KX, Kumar N, Wong J, Li L, Wilson DC y col. (octubre de 2017). "Cuantificación multiplexada de proteínas y transcripciones en células individuales". Biotecnología de la Naturaleza . 35 (10): 936–939. doi :10.1038/nbt.3973. PMID  28854175. S2CID  205285357.
  43. ^ Stoeckius M, Hafemeister C, Stephenson W, Houck-Loomis B, Chattopadhyay PK, Swerdlow H, et al. (septiembre de 2017). "Medición simultánea de epítopo y transcriptoma en células individuales". Métodos de la naturaleza . 14 (9): 865–868. doi :10.1038/nmeth.4380. PMC 5669064 . PMID  28759029. 
  44. ^ Raj B, Wagner DE, McKenna A, Pandey S, Klein AM, Shendure J, et al. (junio de 2018). "Perfiles unicelulares simultáneos de linajes y tipos de células en el cerebro de los vertebrados". Biotecnología de la Naturaleza . 36 (5): 442–450. doi :10.1038/nbt.4103. PMC 5938111 . PMID  29608178. 
  45. ^ Olmos D, Arkenau HT, Ang JE, Ledaki I, Attard G, Carden CP, et al. (Enero de 2009). "Las células tumorales circulantes (CTC) cuentan como criterios de valoración intermedios en el cáncer de próstata resistente a la castración (CRPC): una experiencia de un solo centro". Anales de Oncología . 20 (1): 27–33. doi : 10.1093/annonc/mdn544 . PMID  18695026.
  46. ^ Levitin HM, Yuan J, Sims PA (abril de 2018). "Análisis transcriptómico unicelular de la heterogeneidad tumoral". Tendencias en cáncer . 4 (4): 264–268. doi :10.1016/j.trecan.2018.02.003. PMC 5993208 . PMID  29606308. 
  47. ^ Jerby-Arnon L, Shah P, Cuoco MS, Rodman C, Su MJ, Melms JC y col. (noviembre de 2018). "Un programa de células cancerosas promueve la exclusión de células T y la resistencia al bloqueo de puntos de control". Celúla . 175 (4): 984–997.e24. doi : 10.1016/j.cell.2018.09.006. PMC 6410377 . PMID  30388455. 
  48. ^ Stephenson W, Donlin LT, Butler A, Rozo C, Bracken B, Rashidfarrokhi A, et al. (febrero de 2018). "Secuencia de ARN unicelular del tejido sinovial de la artritis reumatoide utilizando instrumentación de microfluidos de bajo costo". Comunicaciones de la naturaleza . 9 (1): 791. Código bibliográfico : 2018NatCo...9..791S. doi :10.1038/s41467-017-02659-x. PMC 5824814 . PMID  29476078. 
  49. ^ Avraham R, Haseley N, Brown D, Peñaranda C, Jijon HB, Trombetta JJ y col. (Septiembre de 2015). "La variabilidad de célula a célula del patógeno impulsa la heterogeneidad en las respuestas inmunes del huésped". Celúla . 162 (6): 1309–21. doi :10.1016/j.cell.2015.08.027. PMC 4578813 . PMID  26343579. 
  50. ^ Cao J, Packer JS, Ramani V, Cusanovich DA, Huynh C, Daza R, et al. (Agosto de 2017). "Perfiles transcripcionales unicelulares completos de un organismo multicelular". Ciencia . 357 (6352): 661–667. Código Bib : 2017 Ciencia... 357..661C. doi : 10.1126/ciencia.aam8940. PMC 5894354 . PMID  28818938. 
  51. ^ Plass M, Solana J, Wolf FA, Ayoub S, Misios A, Glažar P, et al. (mayo de 2018). "Atlas de tipos celulares y árbol de linaje de un animal complejo completo mediante transcriptómica unicelular". Ciencia . 360 (6391): eaaq1723. doi : 10.1126/ciencia.aaq1723 . PMID  29674432.
  52. ^ Fincher CT, Wurtzel O, de Hoog T, Kravarik KM, Reddien PW (mayo de 2018). "Schmidtea mediterránea". Ciencia . 360 (6391): eaaq1736. doi : 10.1126/ciencia.aaq1736. PMC 6563842 . PMID  29674431. 
  53. ^ Wagner DE, Weinreb C, Collins ZM, Briggs JA, Megason SG, Klein AM (junio de 2018). "Mapeo unicelular de paisajes y linaje de expresión genética en el embrión de pez cebra". Ciencia . 360 (6392): 981–987. Código Bib : 2018 Ciencia... 360.. 981W. doi : 10.1126/ciencia.aar4362. PMC 6083445 . PMID  29700229. 
  54. ^ Farrell JA, Wang Y, Riesenfeld SJ, Shekhar K, Regev A, Schier AF (junio de 2018). "Reconstrucción unicelular de trayectorias de desarrollo durante la embriogénesis del pez cebra". Ciencia . 360 (6392): oreja3131. doi : 10.1126/ciencia.aar3131. PMC 6247916 . PMID  29700225. 
  55. ^ Briggs JA, Weinreb C, Wagner DE, Megason S, Peshkin L, Kirschner MW y col. (junio de 2018). "La dinámica de la expresión génica en la embriogénesis de vertebrados con resolución unicelular". Ciencia . 360 (6392): oreja5780. doi : 10.1126/science.aar5780. PMC 6038144 . PMID  29700227. 
  56. ^ You J. "Avance científico del año 2018: seguimiento del desarrollo célula por célula". Revista de Ciencias . Asociación Estadounidense para el Avance de la Ciencia.
  57. ^ ab Li H, Lovci MT, Kwon YS, Rosenfeld MG, Fu XD, Yeo GW ​​(diciembre de 2008). "Determinación de la densidad de etiquetas requerida para el análisis del transcriptoma digital: aplicación a un modelo de cáncer de próstata sensible a andrógenos". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 105 (51): 20179–84. Código Bib : 2008PNAS..10520179L. doi : 10.1073/pnas.0807121105 . PMC 2603435 . PMID  19088194. 
  58. ^ ab Stegle O, Partes L, Piipari M, Winn J, Durbin R (febrero de 2012). "Uso de la estimación probabilística de residuos de expresión (PEER) para obtener mayor potencia e interpretabilidad de los análisis de expresión génica". Protocolos de la Naturaleza . 7 (3): 500–7. doi :10.1038/nprot.2011.457. PMC 3398141 . PMID  22343431. 
  59. ^ Kingsford C, Patro R (junio de 2015). "Compresión basada en referencias de secuencias de lectura corta mediante codificación de ruta". Bioinformática . 31 (12): 1920–8. doi : 10.1093/bioinformática/btv071. PMC 4481695 . PMID  25649622. 
  60. ^ ab Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, Amit I, et al. (mayo de 2011). "Ensamblaje del transcriptoma completo a partir de datos de RNA-Seq sin un genoma de referencia". Biotecnología de la Naturaleza . 29 (7): 644–52. doi :10.1038/nbt.1883. PMC 3571712 . PMID  21572440. 
  61. ^ "Ensamblaje de Novo utilizando lecturas de Illumina" (PDF) . Consultado el 22 de octubre de 2016 .
  62. ^ Oasis: un ensamblador de transcriptomas para lecturas muy breves
  63. ^ Zerbino DR, Birney E (mayo de 2008). "Velvet: algoritmos para el ensamblaje de lectura corta de novo utilizando gráficos de Bruijn". Investigación del genoma . 18 (5): 821–9. doi :10.1101/gr.074492.107. PMC 2336801 . PMID  18349386. 
  64. ^ Chang Z, Li G, Liu J, Zhang Y, Ashby C, Liu D, et al. (febrero de 2015). "Bridger: un nuevo marco para el ensamblaje del transcriptoma de novo utilizando datos de RNA-seq". Biología del genoma . 16 (1): 30. doi : 10.1186/s13059-015-0596-2 . PMC 4342890 . PMID  25723335. 
  65. ^ Bushmanova E, Antipov D, Lapidus A, Prjibelski AD (septiembre de 2019). "rnaSPAdes: un ensamblador de transcriptomas de novo y su aplicación a datos de RNA-Seq". GigaCiencia . 8 (9). doi : 10.1093/gigascience/giz100. PMC 6736328 . PMID  31494669. 
  66. ^ ab Li B, Fillmore N, Bai Y, Collins M, Thomson JA, Stewart R, et al. (Diciembre de 2014). "Evaluación de conjuntos de transcriptomas de novo a partir de datos de RNA-Seq". Biología del genoma . 15 (12): 553. doi : 10.1186/s13059-014-0553-5 . PMC 4298084 . PMID  25608678. 
  67. ^ ab Dobin A, Davis CA, Schlesinger F, Drenkow J, Zaleski C, Jha S, et al. (Enero 2013). "STAR: alineador universal ultrarrápido de RNA-seq". Bioinformática . 29 (1): 15-21. doi : 10.1093/bioinformática/bts635. PMC 3530905 . PMID  23104886. 
  68. ^ Langmead B , Trapnell C, Pop M, Salzberg SL (2009). "Alineación ultrarrápida y eficiente en memoria de secuencias cortas de ADN con el genoma humano". Biología del genoma . 10 (3): R25. doi : 10.1186/gb-2009-10-3-r25 . PMC 2690996 . PMID  19261174. 
  69. ^ Trapnell C, Pachter L , Salzberg SL (mayo de 2009). "TopHat: descubriendo uniones de empalme con RNA-Seq". Bioinformática . 25 (9): 1105–11. doi : 10.1093/bioinformática/btp120. PMC 2672628 . PMID  19289445. 
  70. ^ ab Trapnell C, Roberts A, Goff L, Pertea G, Kim D, Kelley DR, et al. (Marzo de 2012). "Análisis diferencial de expresión de genes y transcripciones de experimentos de RNA-seq con TopHat y Cufflinks". Protocolos de la Naturaleza . 7 (3): 562–78. doi :10.1038/nprot.2012.016. PMC 3334321 . PMID  22383036. 
  71. ^ Liao Y, Smyth GK, Shi W (mayo de 2013). "El alineador Subread: mapeo de lectura rápido, preciso y escalable mediante semilla y voto". Investigación de ácidos nucleicos . 41 (10): e108. doi : 10.1093/nar/gkt214. PMC 3664803 . PMID  23558742. 
  72. ^ Kim D, Langmead B, Salzberg SL (abril de 2015). "HISAT: un alineador empalmado rápido con bajos requisitos de memoria". Métodos de la naturaleza . 12 (4): 357–60. doi :10.1038/nmeth.3317. PMC 4655817 . PMID  25751142. 
  73. ^ Wu TD, Watanabe CK (mayo de 2005). "GMAP: un programa de alineación y mapeo genómico para secuencias de ARNm y EST". Bioinformática . 21 (9): 1859–75. doi : 10.1093/bioinformática/bti310 . PMID  15728110.
  74. ^ Pertea M, Pertea GM, Antonescu CM, Chang TC, Mendell JT, Salzberg SL (marzo de 2015). "StringTie permite una reconstrucción mejorada de un transcriptoma a partir de lecturas de RNA-seq". Biotecnología de la Naturaleza . 33 (3): 290–5. doi :10.1038/nbt.3122. PMC 4643835 . PMID  25690850. 
  75. ^ Baruzzo G, Hayer KE, Kim EJ, Di Camillo B, FitzGerald GA, Grant GR (febrero de 2017). "Evaluación comparativa integral basada en simulación de alineadores RNA-seq". Métodos de la naturaleza . 14 (2): 135-139. doi :10.1038/nmeth.4106. PMC 5792058 . PMID  27941783. 
  76. ^ Engström PG, Steijger T, Sipos B, Grant GR, Kahles A, Rätsch G, et al. (Diciembre 2013). "Evaluación sistemática de programas de alineación empalmados para datos de RNA-seq". Métodos de la naturaleza . 10 (12): 1185–91. doi :10.1038/nmeth.2722. PMC 4018468 . PMID  24185836. 
  77. ^ Lu B, Zeng Z, Shi T (febrero de 2013). "Estudio comparativo de estrategias de ensamblaje de novo y ensamblaje guiado por genoma para la reconstrucción del transcriptoma basado en RNA-Seq". Ciencias Ciencias de la vida de China . 56 (2): 143–55. doi : 10.1007/s11427-013-4442-z . PMID  23393030.
  78. ^ Bradnam KR, Fass JN, Alexandrov A, Baranay P, Bechner M, Birol I, et al. (Julio 2013). "Assemblathon 2: evaluación de métodos de novo de ensamblaje del genoma en tres especies de vertebrados". GigaCiencia . 2 (1): 10. arXiv : 1301.5406 . Código Bib : 2013arXiv1301.5406B. doi : 10.1186/2047-217X-2-10 . PMC 3844414 . PMID  23870653. 
  79. ^ Hölzer M, Marz M (mayo de 2019). "Ensamblaje de transcriptoma de novo: una comparación integral entre especies de ensambladores de RNA-Seq de lectura corta". GigaCiencia . 8 (5). doi : 10.1093/gigascience/giz039. PMC 6511074 . PMID  31077315. 
  80. ^ Greenbaum D, Colangelo C, Williams K, Gerstein M (2003). "Comparación de la abundancia de proteínas y los niveles de expresión de ARNm a escala genómica". Biología del genoma . 4 (9): 117. doi : 10.1186/gb-2003-4-9-117 . PMC 193646 . PMID  12952525. 
  81. ^ Zhang ZH, Jhaveri DJ, Marshall VM, Bauer DC, Edson J, Narayanan RK y otros. (Agosto de 2014). "Un estudio comparativo de técnicas para el análisis de expresión diferencial en datos de RNA-Seq". MÁS UNO . 9 (8): e103207. Código Bib : 2014PLoSO...9j3207Z. doi : 10.1371/journal.pone.0103207 . PMC 4132098 . PMID  25119138. 
  82. ^ Anders S, Pyl PT, Huber W (enero de 2015). "HTSeq: un marco de Python para trabajar con datos de secuenciación de alto rendimiento". Bioinformática . 31 (2): 166–9. doi : 10.1093/bioinformática/btu638. PMC 4287950 . PMID  25260700. 
  83. ^ Liao Y, Smyth GK, Shi W (abril de 2014). "featureCounts: un programa eficaz de propósito general para asignar lecturas de secuencias a características genómicas". Bioinformática . 30 (7): 923–30. arXiv : 1305.3347 . doi : 10.1093/bioinformática/btt656. PMID  24227677.
  84. ^ Schmid MW, Grossniklaus U (febrero de 2015). "Rcount: recuento de lecturas de RNA-Seq simple y flexible". Bioinformática . 31 (3): 436–7. doi : 10.1093/bioinformática/btu680 . PMID  25322836.
  85. ^ Finotello F, Lavezzo E, Bianco L, Barzon L, Mazzon P, Fontana P, et al. (2014). "Reducir el sesgo en los datos de secuenciación de ARN: un enfoque novedoso para calcular recuentos". Bioinformática BMC . 15 (Suplemento 1): T7. doi : 10.1186/1471-2105-15-s1-s7 . PMC 4016203 . PMID  24564404. 
  86. ^ Hashimoto TB, Edwards MD, Gifford DK (marzo de 2014). "Corrección de recuento universal para secuenciación de alto rendimiento". PLOS Biología Computacional . 10 (3): e1003494. Código Bib : 2014PLSCB..10E3494H. doi : 10.1371/journal.pcbi.1003494 . PMC 3945112 . PMID  24603409. 
  87. ^ Patro R, Mount SM, Kingsford C (mayo de 2014). "Sailfish permite la cuantificación de isoformas sin alineación a partir de lecturas de RNA-seq utilizando algoritmos ligeros". Biotecnología de la Naturaleza . 32 (5): 462–4. arXiv : 1308.3700 . doi :10.1038/nbt.2862. PMC 4077321 . PMID  24752080. 
  88. ^ Bray NL, Pimentel H, Melsted P, Pachter L (mayo de 2016). "Cuantificación probabilística casi óptima de RNA-seq". Biotecnología de la Naturaleza . 34 (5): 525–7. doi :10.1038/nbt.3519. PMID  27043002. S2CID  205282743.
  89. ^ ab Robinson MD, Oshlack A (2010). "Un método de normalización de escala para el análisis de expresión diferencial de datos de RNA-seq". Biología del genoma . 11 (3): R25. doi : 10.1186/gb-2010-11-3-r25 . PMC 2864565 . PMID  20196867. 
  90. ^ Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G, van Baren MJ y col. (mayo de 2010). "El ensamblaje de transcripciones y la cuantificación mediante RNA-Seq revela transcripciones sin anotaciones y cambio de isoformas durante la diferenciación celular". Biotecnología de la Naturaleza . 28 (5): 511–5. doi :10.1038/nbt.1621. PMC 3146043 . PMID  20436464. 
  91. ^ ab Pachter L (19 de abril de 2011). "Modelos para la cuantificación de la transcripción de RNA-Seq". arXiv : 1104.3889 [q-bio.GN].
  92. ^ "¿Qué es el FPKM? Una revisión de las unidades de expresión de RNA-Seq". El fárrago . 8 de mayo de 2014 . Consultado el 28 de marzo de 2018 .
  93. ^ Wagner GP, Kin K, Lynch VJ (diciembre de 2012). "Medición de la abundancia de ARNm utilizando datos de RNA-seq: la medida RPKM es inconsistente entre las muestras". Teoría en Biociencias . 131 (4): 281–5. doi :10.1007/s12064-012-0162-3. PMID  22872506. S2CID  16752581.
  94. ^ Evans C, Hardin J, Stoebel DM (septiembre de 2018). "Seleccionar métodos de normalización de RNA-Seq entre muestras desde la perspectiva de sus suposiciones". Sesiones informativas en Bioinformática . 19 (5): 776–792. doi :10.1093/bib/bbx008. PMC 6171491 . PMID  28334202. 
  95. ^ ab Law CW, Chen Y, Shi W, Smyth GK (febrero de 2014). "voom: los pesos de precisión desbloquean herramientas de análisis de modelos lineales para recuentos de lecturas de RNA-seq". Biología del genoma . 15 (2): R29. doi : 10.1186/gb-2014-15-2-r29 . PMC 4053721 . PMID  24485249. 
  96. ^ ab Anders S, Huber W (2010). "Análisis de expresión diferencial para datos de recuento de secuencias". Biología del genoma . 11 (10): R106. doi : 10.1186/gb-2010-11-10-r106 . PMC 3218662 . PMID  20979621. 
  97. ^ ab Robinson MD, McCarthy DJ, Smyth GK (enero de 2010). "edgeR: un paquete de bioconductores para análisis de expresión diferencial de datos de expresión génica digital". Bioinformática . 26 (1): 139–40. doi : 10.1093/bioinformática/btp616. PMC 2796818 . PMID  19910308. 
  98. ^ Marguerat S, Schmidt A, Codlin S, Chen W, Aebersold R, Bähler J (octubre de 2012). "Análisis cuantitativo de transcriptomas y proteomas de levadura de fisión en células proliferantes y quiescentes". Celúla . 151 (3): 671–83. doi : 10.1016/j.cell.2012.09.019. PMC 3482660 . PMID  23101633. 
  99. ^ Owens ND, Blitz IL, Lane MA, Patrushev I, Overton JD, Gilchrist MJ, et al. (Enero de 2016). "La medición del número absoluto de copias de ARN con alta resolución temporal revela la cinética del transcriptoma en desarrollo". Informes celulares . 14 (3): 632–647. doi :10.1016/j.celrep.2015.12.050. PMC 4731879 . PMID  26774488. 
  100. ^ Chen K, Hu Z, Xia Z, Zhao D, Li W, Tyler JK (diciembre de 2015). "El hecho pasado por alto: necesidad fundamental de control de picos para prácticamente todos los análisis de todo el genoma". Biología Molecular y Celular . 36 (5): 662–7. doi :10.1128/MCB.00970-14. PMC 4760223 . PMID  26711261. 
  101. ^ Lovén J, Orlando DA, Sigova AA, Lin CY, Rahl PB, Burge CB, et al. (Octubre 2012). "Revisando el análisis de expresión genética global". Celúla . 151 (3): 476–82. doi :10.1016/j.cell.2012.10.012. PMC 3505597 . PMID  23101621. 
  102. ^ Ritchie ME, Phipson B, Wu D, Hu Y, Law CW, Shi W, et al. (Abril de 2015). "limma potencia los análisis de expresión diferencial para estudios de microarrays y secuenciación de ARN". Investigación de ácidos nucleicos . 43 (7): e47. doi :10.1093/nar/gkv007. PMC 4402510 . PMID  25605792. 
  103. ^ "Bioconductor: software de código abierto para bioinformática".
  104. ^ Huber W, Carey VJ, Gentleman R, Anders S, Carlson M, Carvalho BS, et al. (febrero de 2015). "Orquestación de análisis genómico de alto rendimiento con Bioconductor". Métodos de la naturaleza . 12 (2): 115–21. doi :10.1038/nmeth.3252. PMC 4509590 . PMID  25633503. 
  105. ^ Puerro JT, Storey JD (septiembre de 2007). "Capturar la heterogeneidad en estudios de expresión génica mediante análisis de variables sustitutas". PLOS Genética . 3 (9): 1724–35. doi : 10.1371/journal.pgen.0030161 . PMC 1994707 . PMID  17907809. 
  106. ^ Pimentel H, Bray NL, Puente S, Melsted P, Pachter L (julio de 2017). "Análisis diferencial de RNA-seq incorporando incertidumbre en la cuantificación". Métodos de la naturaleza . 14 (7): 687–690. doi :10.1038/nmeth.4324. PMID  28581496. S2CID  15063247.
  107. ^ Trapnell C, Hendrickson DG, Sauvageau M, Goff L, Rinn JL, Pachter L (enero de 2013). "Análisis diferencial de la regulación genética en la resolución de la transcripción con RNA-seq". Biotecnología de la Naturaleza . 31 (1): 46–53. doi :10.1038/nbt.2450. PMC 3869392 . PMID  23222703. 
  108. ^ Frazee AC, Pertea G, Jaffe AE, Langmead B, Salzberg SL, Leek JT (marzo de 2015). "Ballgown cierra la brecha entre el ensamblaje del transcriptoma y el análisis de expresión". Biotecnología de la Naturaleza . 33 (3): 243–6. doi :10.1038/nbt.3172. PMC 4792117 . PMID  25748911. 
  109. ^ ab Sahraeian SM, Mohiyuddin M, Sebra R, Tilgner H, Afshar PT, Au KF, et al. (julio de 2017). "Obtener una visión biológica completa del transcriptoma mediante la realización de un análisis de secuencia de ARN de amplio espectro". Comunicaciones de la naturaleza . 8 (1): 59. Código Bib : 2017NatCo...8...59S. doi :10.1038/s41467-017-00050-4. PMC 5498581 . PMID  28680106. 
  110. ^ Ziemann M, Eren Y, El-Osta A (agosto de 2016). "Los errores en los nombres de genes están muy extendidos en la literatura científica". Biología del genoma . 17 (1): 177. doi : 10.1186/s13059-016-1044-7 . PMC 4994289 . PMID  27552985. 
  111. ^ Soneson C, Delorenzi M (marzo de 2013). "Una comparación de métodos para el análisis de expresión diferencial de datos de RNA-seq". Bioinformática BMC . 14 : 91. doi : 10.1186/1471-2105-14-91 . PMC 3608160 . PMID  23497356. 
  112. ^ Fonseca NA, Marioni J, Brazma A (30 de septiembre de 2014). "Perfiles del gen RNA-Seq: una comparación empírica sistemática". MÁS UNO . 9 (9): e107026. Código Bib : 2014PLoSO...9j7026F. doi : 10.1371/journal.pone.0107026 . PMC 4182317 . PMID  25268973. 
  113. ^ Seyednasrollah F, Laiho A, Elo LL (enero de 2015). "Comparación de paquetes de software para detectar expresión diferencial en estudios de RNA-seq". Sesiones informativas en Bioinformática . 16 (1): 59–70. doi : 10.1093/bib/bbt086. PMC 4293378 . PMID  24300110. 
  114. ^ Rapaport F, Khanin R, Liang Y, Pirun M, Krek A, Zumbo P, et al. (2013). "Evaluación integral de métodos de análisis de expresión génica diferencial para datos de RNA-seq". Biología del genoma . 14 (9): R95. doi : 10.1186/gb-2013-14-9-r95 . PMC 4054597 . PMID  24020486. 
  115. ^ Costa-Silva J, Domingues D, Lopes FM (21 de diciembre de 2017). "Análisis de expresión diferencial de RNA-Seq: una revisión ampliada y una herramienta de software". MÁS UNO . 12 (12): e0190152. Código Bib : 2017PLoSO..1290152C. doi : 10.1371/journal.pone.0190152 . PMC 5739479 . PMID  29267363. 
  116. ^ Corchete LA, Rojas EA, Alonso-López D, De Las Rivas J, Gutiérrez NC, Burguillo FJ (12 de noviembre de 2020). "Comparación y evaluación sistemática de procedimientos RNA-seq para análisis cuantitativo de expresión génica". Informes científicos . 12 (10): 19737. Código bibliográfico : 2020NatSR..1019737C. doi : 10.1038/s41598-020-76881-x . PMC 7665074 . PMID  33184454. 
  117. ^ Liao Y, Wang J, Jaehnig EJ, Shi Z, Zhang B (julio de 2019). "WebGestalt 2019: conjunto de herramientas de análisis de conjuntos de genes con interfaces de usuario y API renovadas". Investigación de ácidos nucleicos . 47 (W1): W199-W205. doi :10.1093/nar/gkz401. PMC 6602449 . PMID  31114916. 
  118. ^ ab Keren H, Lev-Maor G, Ast G (mayo de 2010). "Evolución y empalme alternativo: diversificación, definición y función de exón". Reseñas de la naturaleza. Genética . 11 (5): 345–55. doi :10.1038/nrg2776. PMID  20376054. S2CID  5184582.
  119. ^ Liu R, Loraine AE, Dickerson JA (diciembre de 2014). "Comparaciones de métodos computacionales para la detección diferencial de empalme alternativo utilizando RNA-seq en sistemas vegetales". Bioinformática BMC . 15 (1): 364. doi : 10.1186/s12859-014-0364-4 . PMC 4271460 . PMID  25511303. 
  120. ^ ab Li YI, Knowles DA, Humphrey J, Barbeira AN, Dickinson SP, Im HK, et al. (Enero de 2018). "Cuantificación sin anotaciones del empalme de ARN utilizando LeafCutter". Genética de la Naturaleza . 50 (1): 151-158. doi :10.1038/s41588-017-0004-9. PMC 5742080 . PMID  29229983. 
  121. ^ Anders S, Reyes A, Huber W (octubre de 2012). "Detección del uso diferencial de exones a partir de datos de RNA-seq". Investigación del genoma . 22 (10): 2008–17. doi :10.1101/gr.133744.111. PMC 3460195 . PMID  22722343. 
  122. ^ Shen S, Park JW, Huang J, Dittmar KA, Lu ZX, Zhou Q y col. (Abril de 2012). "MATS: un marco bayesiano para la detección flexible de empalme alternativo diferencial a partir de datos de RNA-Seq". Investigación de ácidos nucleicos . 40 (8): e61. doi : 10.1093/nar/gkr1291. PMC 3333886 . PMID  22266656. 
  123. ^ Wang X, Cairns MJ (junio de 2014). "SeqGSEA: un paquete de bioconductores para el análisis de enriquecimiento de conjuntos de genes de datos de RNA-Seq que integra expresión diferencial y empalme". Bioinformática . 30 (12): 1777–9. doi : 10.1093/bioinformática/btu090 . PMID  24535097.
  124. ^ Trapnell C, Hendrickson DG, Sauvageau M, Goff L, Rinn JL, Pachter L (enero de 2013). "Análisis diferencial de la regulación genética en la resolución de la transcripción con RNA-seq". Biotecnología de la Naturaleza . 31 (1): 46–53. doi :10.1038/nbt.2450. PMC 3869392 . PMID  23222703. 
  125. ^ Hu Y, Huang Y, Du Y, Orellana CF, Singh D, Johnson AR y col. (Enero 2013). "DiffSplice: la detección de eventos de empalme diferencial en todo el genoma con RNA-seq". Investigación de ácidos nucleicos . 41 (2): e39. doi : 10.1093/nar/gks1026. PMC 3553996 . PMID  23155066. 
  126. ^ Vaquero-García J, Barrera A, Gazzara MR, González-Vallinas J, Lahens NF, Hogenesch JB, et al. (febrero de 2016). "Una nueva visión de la complejidad y regulación del transcriptoma a través de la lente de las variaciones de empalme local". eVida . 5 : e11752. doi : 10.7554/eLife.11752 . PMC 4801060 . PMID  26829591. 
  127. ^ Merino GA, Conesa A, Fernández EA (marzo de 2019). "Una evaluación comparativa de flujos de trabajo para detectar empalme diferencial y expresión diferencial a nivel de isoformas en estudios de secuenciación de ARN humano". Sesiones informativas en Bioinformática . 20 (2): 471–481. doi :10.1093/babero/bbx122. PMID  29040385. S2CID  22706028.
  128. ^ ab Marcotte EM, Pellegrini M, Thompson MJ, Yeates TO, Eisenberg D (noviembre de 1999). "Un algoritmo combinado para la predicción de la función de las proteínas en todo el genoma". Naturaleza . 402 (6757): 83–6. Código Bib :1999Natur.402...83M. doi :10.1038/47048. PMID  10573421. S2CID  144447.
  129. ^ ab Giorgi FM, Del Fabbro C, Licausi F (marzo de 2013). "Estudio comparativo de redes de coexpresión derivadas de microarrays y secuencias de ARN en Arabidopsis thaliana". Bioinformática . 29 (6): 717–24. doi : 10.1093/bioinformática/btt053 . hdl : 11390/990155 . PMID  23376351.
  130. ^ Iancu OD, Kawane S, Bottomly D, Searles R, Hitzemann R, McWeeney S (junio de 2012). "Utilización de datos de RNA-Seq para la inferencia de redes de coexpresión de novo". Bioinformática . 28 (12): 1592–7. doi : 10.1093/bioinformática/bts245. PMC 3493127 . PMID  22556371. 
  131. ^ Eksi R, Li HD, Menon R, Wen Y, Omenn GS, Kretzler M, et al. (Noviembre de 2013). "Diferenciar sistemáticamente funciones para isoformas empalmadas alternativamente mediante la integración de datos de RNA-seq". PLOS Biología Computacional . 9 (11): e1003314. Código Bib : 2013PLSCB...9E3314E. doi : 10.1371/journal.pcbi.1003314 . PMC 3820534 . PMID  24244129. 
  132. ^ Li HD, Menon R, Omenn GS, Guan Y (agosto de 2014). "La era emergente de la integración de datos genómicos para analizar la función de isoformas de empalme". Tendencias en Genética . 30 (8): 340–7. doi :10.1016/j.tig.2014.05.005. PMC 4112133 . PMID  24951248. 
  133. ^ Foroushani A, Agrahari R, Docking R, Chang L, Duns G, Hudoba M, et al. (Marzo de 2017). "El análisis de redes genéticas a gran escala revela la importancia de la vía de la matriz extracelular y los genes homeobox en la leucemia mieloide aguda: una introducción al paquete Pigengene y sus aplicaciones". Genómica médica BMC . 10 (1): 16.doi : 10.1186 /s12920-017-0253-6 . PMC 5353782 . PMID  28298217. 
  134. ^ Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, et al. (Agosto de 2009). "El formato de mapa / alineación de secuencia y SAMtools". Bioinformática . 25 (16): 2078–9. doi : 10.1093/bioinformática/btp352. PMC 2723002 . PMID  19505943. 
  135. ^ DePristo MA, Banks E, Poplin R, Garimella KV, Maguire JR, Hartl C, et al. (mayo de 2011). "Un marco para el descubrimiento de variaciones y el genotipado utilizando datos de secuenciación de ADN de próxima generación". Genética de la Naturaleza . 43 (5): 491–8. doi :10.1038/ng.806. PMC 3083463 . PMID  21478889. 
  136. ^ Batalla A, Brown CD, Engelhardt BE, Montgomery SB (octubre de 2017). "Efectos genéticos sobre la expresión genética en tejidos humanos". Naturaleza . 550 (7675): 204–213. Código Bib :2017Natur.550..204A. doi : 10.1038/naturaleza24277. hdl : 10230/34202 . PMC 5776756 . PMID  29022597. 
  137. ^ Richter F, Hoffman GE, Manheimer KB, Patel N, Sharp AJ, McKean D, et al. (octubre de 2019). "ORE identifica efectos de expresión extremos enriquecidos para variantes raras". Bioinformática . 35 (20): 3906–3912. doi : 10.1093/bioinformática/btz202. PMC 6792115 . PMID  30903145. 
  138. ^ Freedman AH, Clamp M, Sackton TB (enero de 2021). "Error, ruido y sesgo en ensamblajes de transcriptomas de novo". Recursos de ecología molecular . 21 (1): 18–29. doi :10.1111/1755-0998.13156. PMID  32180366. S2CID  212739959.
  139. ^ Teixeira MR (diciembre de 2006). "Oncogenes de fusión recurrentes en carcinomas". Reseñas críticas en oncogénesis . 12 (3–4): 257–71. doi : 10.1615/critrevoncog.v12.i3-4.40. PMID  17425505. S2CID  40770452.
  140. ^ Thind AS, Monga I, Thakur PK, Kumari P, Dindhoria K, Krzak M, et al. (noviembre de 2021). "Desmitificar las aplicaciones emergentes de RNA-Seq a granel: la aplicación y utilidad de la metodología bioinformática". Sesiones informativas en Bioinformática . 22 (6). doi :10.1093/bib/bbab259. PMID  34329375.
  141. ^ Sangiovanni M, Granata I, Thind AS, Guarracino MR (abril de 2019). "De la basura al tesoro: detección de contaminación inesperada en datos NGS no mapeados". Bioinformática BMC . 20 (Suplemento 4): 168. doi : 10.1186/s12859-019-2684-x . PMC 6472186 . PMID  30999839. 
  142. ^ "Búsqueda en PubMed:" RNA Seq "O" RNA-Seq "O" Secuenciación de ARN "O" RNASeq"". PubMed . Consultado el 20 de junio de 2021 .
  143. ^ "Búsqueda en PubMed: ("RNA Seq" O "RNA-Seq" O "RNA sequencing" O "RNASeq") Y "Medicina"". PubMed . Consultado el 20 de junio de 2021 .
  144. ^ Weber AP (noviembre de 2015). "Descubrimiento de nueva biología mediante la secuenciación de ARN". Fisiología de las plantas . 169 (3): 1524–31. doi : 10.1104/pp.15.01081. PMC 4634082 . PMID  26353759. 
  145. ^ Bainbridge MN, Warren RL, Hirst M, Romanuik T, Zeng T, Go A, et al. (Septiembre de 2006). "Análisis del transcriptoma LNCaP de la línea celular de cáncer de próstata mediante un enfoque de secuenciación por síntesis". Genómica BMC . 7 : 246. doi : 10.1186/1471-2164-7-246 . PMC 1592491 . PMID  17010196. 
  146. ^ Cheung F, Haas BJ, Goldberg SM, May GD, Xiao Y, Town CD (octubre de 2006). "Secuenciación de etiquetas secuenciadas expresadas de Medicago truncatula utilizando tecnología 454 Life Sciences". Genómica BMC . 7 : 272. doi : 10.1186/1471-2164-7-272 . PMC 1635983 . PMID  17062153. 
  147. ^ Emrich SJ, Barbazuk WB, Li L, Schnable PS (enero de 2007). "Descubrimiento y anotación de genes mediante secuenciación del transcriptoma LCM-454". Investigación del genoma . 17 (1): 69–73. doi :10.1101/gr.5145806. PMC 1716268 . PMID  17095711. 
  148. ^ Weber AP, Weber KL, Carr K, Wilkerson C, Ohlrogge JB (mayo de 2007). "Muestreo del transcriptoma de Arabidopsis con pirosecuenciación masiva paralela". Fisiología de las plantas . 144 (1): 32–42. doi : 10.1104/pp.107.096677. PMC 1913805 . PMID  17351049. 
  149. ^ Nagalakshmi U, Wang Z, Waern K, Shou C, Raha D, Gerstein M, et al. (junio de 2008). "El panorama transcripcional del genoma de la levadura definido por secuenciación de ARN". Ciencia . 320 (5881): 1344–9. Código bibliográfico : 2008 Ciencia... 320.1344N. doi : 10.1126/ciencia.1158441. PMC 2951732 . PMID  18451266. 
  150. ^ Richter F (2021). "Una amplia introducción a RNA-Seq". WikiRevista científica . 4 (1): 4. doi : 10.15347/WJS/2021.004 .
  151. ^ Sandberg R (enero de 2014). "Entrando en la era de la transcriptómica unicelular en biología y medicina". Métodos de la naturaleza . 11 (1): 22–4. doi :10.1038/nmeth.2764. PMID  24524133. S2CID  27632439.
  152. ^ "CODIFICAR matriz de datos" . Consultado el 28 de julio de 2013 .
  153. ^ "Atlas del genoma del cáncer: portal de datos" . Consultado el 28 de julio de 2013 .

Otras lecturas

enlaces externos