stringtranslate.com

Tecnologías transcriptómicas

Las tecnologías transcriptómicas son las técnicas utilizadas para estudiar el transcriptoma de un organismo , la suma de todas sus transcripciones de ARN . El contenido de información de un organismo se registra en el ADN de su genoma y se expresa mediante transcripción . Aquí, el ARNm sirve como molécula intermediaria transitoria en la red de información, mientras que los ARN no codificantes realizan diversas funciones adicionales. Un transcriptoma captura una instantánea en el tiempo del total de transcripciones presentes en una célula . Las tecnologías transcriptómicas proporcionan una descripción amplia de qué procesos celulares están activos y cuáles están inactivos. Un desafío importante en biología molecular es comprender cómo un solo genoma da origen a una variedad de células. Otra es cómo se regula la expresión genética.

Los primeros intentos de estudiar transcriptomas completos comenzaron a principios de los años 1990. Los avances tecnológicos posteriores desde finales de la década de 1990 han transformado repetidamente el campo y han convertido a la transcriptómica en una disciplina generalizada en las ciencias biológicas. Hay dos técnicas contemporáneas clave en este campo: microarrays , que cuantifican un conjunto de secuencias predeterminadas, y RNA-Seq , que utiliza secuenciación de alto rendimiento para registrar todas las transcripciones. A medida que la tecnología mejoró, aumentó el volumen de datos producidos por cada experimento de transcriptoma. Como resultado, los métodos de análisis de datos se han ido adaptando constantemente para analizar con mayor precisión y eficiencia volúmenes de datos cada vez más grandes. Las bases de datos de transcriptomas se vuelven más grandes y más útiles a medida que los investigadores continúan recopilando y compartiendo los transcriptomas. Sería casi imposible interpretar la información contenida en un transcriptoma sin el conocimiento de experimentos previos.

Medir la expresión de los genes de un organismo en diferentes tejidos o condiciones , o en diferentes momentos, brinda información sobre cómo se regulan los genes y revela detalles de la biología de un organismo. También se puede utilizar para inferir las funciones de genes no anotados previamente . El análisis del transcriptoma ha permitido estudiar cómo cambia la expresión genética en diferentes organismos y ha sido fundamental para la comprensión de las enfermedades humanas . Un análisis de la expresión genética en su totalidad permite la detección de amplias tendencias coordinadas que no pueden discernirse mediante ensayos más específicos .

Historia

Uso del método transcriptómico a lo largo del tiempo. Artículos publicados que hacen referencia a RNA-Seq (negro), microarrays de ARN (rojo), etiqueta de secuencia expresada (azul), visualización diferencial digital (verde) y análisis serial/cap de expresión génica (amarillo) desde 1990. [1]

La transcriptómica se ha caracterizado por el desarrollo de nuevas técnicas que han redefinido lo que es posible cada década aproximadamente y han dejado obsoletas las tecnologías anteriores. El primer intento de capturar un transcriptoma humano parcial se publicó en 1991 y reportó 609 secuencias de ARNm del cerebro humano . [2] En 2008, se publicaron dos transcriptomas humanos, compuestos por millones de secuencias derivadas de transcripciones que cubren 16.000 genes, [3] [4] y en 2015 se habían publicado transcriptomas para cientos de individuos. [5] [6] Actualmente se generan de forma rutinaria transcriptomas de diferentes estados patológicos , tejidos o incluso células individuales. [6] [7] [8] Esta explosión en la transcriptómica ha sido impulsada por el rápido desarrollo de nuevas tecnologías con mayor sensibilidad y economía. [9] [10] [11] [12]

Antes de la transcriptómica

Se realizaron estudios de transcripciones individuales varias décadas antes de que estuviera disponible cualquier enfoque transcriptómico. A finales de la década de 1970 se recolectaron bibliotecas de transcripciones de ARNm de polilla de seda y se convirtieron en ADN complementario (ADNc) para su almacenamiento mediante transcriptasa inversa . [13] En la década de 1980, la secuenciación de bajo rendimiento utilizando el método Sanger se utilizó para secuenciar transcripciones aleatorias, produciendo etiquetas de secuencia expresada (EST). [2] [14] [15] [16] El método de secuenciación de Sanger fue predominante hasta la llegada de métodos de alto rendimiento como la secuenciación por síntesis (Solexa/Illumina). Las tecnologías ecológicamente racionales adquirieron importancia durante la década de 1990 como método eficaz para determinar el contenido genético de un organismo sin secuenciar el genoma completo . [16] Las cantidades de transcripciones individuales se cuantificaron mediante transferencia Northern , matrices de membrana de nailon y, posteriormente, métodos de PCR cuantitativa con transcriptasa inversa (RT-qPCR), [17] [18] pero estos métodos son laboriosos y solo pueden capturar una pequeña subsección de una transcriptoma. [12] En consecuencia, la manera en que se expresa y regula un transcriptoma en su conjunto permaneció desconocida hasta que se desarrollaron técnicas de mayor rendimiento.

Primeros intentos

La palabra "transcriptoma" se utilizó por primera vez en la década de 1990. [19] [20] En 1995, se desarrolló uno de los primeros métodos transcriptómicos basados ​​en secuenciación, el análisis en serie de la expresión génica (SAGE), que funcionaba mediante la secuenciación de Sanger de fragmentos de transcripción aleatorios concatenados. [21] Las transcripciones se cuantificaron haciendo coincidir los fragmentos con genes conocidos. También se utilizó brevemente una variante de SAGE que utiliza técnicas de secuenciación de alto rendimiento, denominada análisis de expresión genética digital. [9] [22] Sin embargo, estos métodos fueron superados en gran medida por la secuenciación de alto rendimiento de transcripciones completas, que proporcionó información adicional sobre la estructura de la transcripción, como las variantes de empalme . [9]

Desarrollo de técnicas contemporáneas.

Las técnicas contemporáneas dominantes, los microarrays y RNA-Seq , se desarrollaron a mediados de los años 1990 y 2000. [9] [33] Los microarrays que miden la abundancia de un conjunto definido de transcripciones mediante su hibridación con una serie de sondas complementarias se publicaron por primera vez en 1995. [34] [35] La tecnología de microarrays permitió el ensayo de miles de transcripciones simultáneamente y en un coste muy reducido por gen y un ahorro de mano de obra. [36] Tanto los arreglos de oligonucleótidos manchados como los arreglos de alta densidad de Affymetrix fueron el método de elección para la elaboración de perfiles transcripcionales hasta finales de la década de 2000. [12] [33] Durante este período, se produjo una variedad de microarrays para cubrir genes conocidos en organismos modelo o económicamente importantes. Los avances en el diseño y fabricación de matrices mejoraron la especificidad de las sondas y permitieron probar más genes en una sola matriz. Los avances en la detección de fluorescencia aumentaron la sensibilidad y la precisión de la medición de transcripciones de baja abundancia. [35] [37]

"RNA-Seq se logra mediante la transcripción inversa del ARN in vitro y la secuenciación de los ADNc resultantes ". [10] La abundancia de transcripciones se deriva del número de recuentos de cada transcripción. Por lo tanto, la técnica se ha visto fuertemente influenciada por el desarrollo de tecnologías de secuenciación de alto rendimiento . [9] [11] La secuenciación masiva de firmas paralelas (MPSS) fue un ejemplo temprano basado en la generación de secuencias de 16 a 20  pb a través de una serie compleja de hibridaciones , [38] [nota 1] y se utilizó en 2004 para validar la expresión de diez Mil genes en Arabidopsis thaliana . [39] El primer trabajo de RNA-Seq se publicó en 2006 con cien mil transcripciones secuenciadas utilizando tecnología 454 . [40] Esta fue una cobertura suficiente para cuantificar la abundancia relativa de transcripciones. RNA-Seq comenzó a ganar popularidad después de 2008, cuando las nuevas tecnologías Solexa/Illumina permitieron registrar mil millones de secuencias de transcripción. [4] [10] [41] [42] Este rendimiento ahora permite la cuantificación y comparación de transcriptomas humanos. [43]

Recopilación de datos

La generación de datos sobre transcripciones de ARN se puede lograr mediante cualquiera de dos principios fundamentales: secuenciación de transcripciones individuales ( EST o RNA-Seq) o hibridación de transcripciones con una matriz ordenada de sondas de nucleótidos (microarrays). [23]

Aislamiento de ARN

Todos los métodos transcriptómicos requieren que primero se aísle el ARN del organismo experimental antes de poder registrar las transcripciones. Aunque los sistemas biológicos son increíblemente diversos, las técnicas de extracción de ARN son muy similares e implican la alteración mecánica de células o tejidos, la alteración de la ARNasa con sales caotrópicas , [44] la alteración de macromoléculas y complejos de nucleótidos, la separación del ARN de biomoléculas no deseadas , incluido el ADN, y la concentración. del ARN mediante precipitación de una solución o elución de una matriz sólida . [44] [45] El ARN aislado también se puede tratar con ADNasa para digerir cualquier rastro de ADN. [46] Es necesario enriquecer el ARN mensajero ya que los extractos totales de ARN suelen contener un 98% de ARN ribosomal . [47] El enriquecimiento de las transcripciones se puede realizar mediante métodos de afinidad poli-A o mediante el agotamiento del ARN ribosomal utilizando sondas específicas de secuencia. [48] ​​El ARN degradado puede afectar los resultados posteriores; por ejemplo, el enriquecimiento del ARNm a partir de muestras degradadas dará como resultado el agotamiento de los extremos 5' del ARNm y una señal desigual a lo largo de una transcripción. Es habitual congelar rápidamente el tejido antes del aislamiento del ARN y se tiene cuidado de reducir la exposición a las enzimas RNasa una vez que se completa el aislamiento. [45]

Etiquetas de secuencia expresada

Una etiqueta de secuencia expresada (EST) es una secuencia de nucleótidos corta generada a partir de una única transcripción de ARN. El ARN se copia primero como ADN complementario (ADNc) mediante una enzima transcriptasa inversa antes de secuenciar el ADNc resultante. [16] Debido a que las tecnologías ecológicamente racionales se pueden recolectar sin conocimiento previo del organismo del que provienen, se pueden elaborar a partir de mezclas de organismos o muestras ambientales. [49] [16] Aunque ahora se utilizan métodos de mayor rendimiento, las bibliotecas EST comúnmente proporcionaban información de secuencia para los primeros diseños de microarrays; por ejemplo, se diseñó un microarray de cebada a partir de 350.000 EST previamente secuenciadas. [50]

Análisis serial y cap de expresión génica (SAGE/CAGE)

Resumen de SAGE . Dentro de los organismos, los genes se transcriben y se empalman (en eucariotas ) para producir transcripciones de ARNm maduros (rojo). El ARNm se extrae del organismo y se utiliza la transcriptasa inversa para copiar el ARNm en un ADNc bicatenario estable ( ds - ADNc ; azul). En SAGE, el ADNc ds se digiere mediante enzimas de restricción (en la ubicación 'X' y 'X'+11) para producir fragmentos de "etiqueta" de 11 nucleótidos. Estas etiquetas se concatenan y secuencian mediante secuenciación Sanger de lectura larga (diferentes tonos de azul indican etiquetas de diferentes genes). Las secuencias se desconvolucionan para encontrar la frecuencia de cada etiqueta. La frecuencia de la etiqueta se puede utilizar para informar sobre la transcripción del gen del que procede la etiqueta. [51]

El análisis en serie de la expresión génica (SAGE) fue un desarrollo de la metodología EST para aumentar el rendimiento de las etiquetas generadas y permitir cierta cuantificación de la abundancia de transcripciones. [21] El ADNc se genera a partir del ARN , pero luego se digiere en fragmentos de "etiquetas" de 11 pb utilizando enzimas de restricción que cortan el ADN en una secuencia específica y 11 pares de bases a lo largo de esa secuencia. Luego, estas etiquetas de ADNc se unen de cabeza a cola en hebras largas (>500 pb) y se secuencian utilizando métodos de bajo rendimiento, pero de longitud de lectura larga, como la secuenciación de Sanger . Luego, las secuencias se vuelven a dividir en sus etiquetas originales de 11 pb utilizando software de computadora en un proceso llamado deconvolución . [21] Si se dispone de un genoma de referencia de alta calidad , estas etiquetas pueden coincidir con su gen correspondiente en el genoma. Si no se dispone de un genoma de referencia, las etiquetas se pueden utilizar directamente como marcadores de diagnóstico si se descubre que se expresan diferencialmente en un estado de enfermedad. [21]

El método de expresión génica de análisis de cap (CAGE) es una variante de SAGE que secuencia etiquetas del extremo 5' de una transcripción de ARNm únicamente. [52] Por lo tanto, el sitio de inicio de la transcripción de los genes se puede identificar cuando las etiquetas se alinean con un genoma de referencia. La identificación de los sitios de inicio de genes es útil para el análisis de promotores y para la clonación de ADNc de longitud completa.

Los métodos SAGE y CAGE producen información sobre más genes de lo que era posible al secuenciar tecnologías ecológicamente racionales individuales, pero la preparación de muestras y el análisis de datos suelen requerir más mano de obra. [52]

Microarrays

Resumen de microarrays de ADN . Dentro de los organismos, los genes se transcriben y se empalman (en eucariotas) para producir transcripciones de ARNm maduros (rojo). El ARNm se extrae del organismo y se utiliza la transcriptasa inversa para copiar el ARNm en ADNc-ds estable (azul). En los microarrays, el ds-cDNA está fragmentado y marcado con fluorescencia (naranja). Los fragmentos marcados se unen a una serie ordenada de oligonucleótidos complementarios y la medición de la intensidad fluorescente en toda la serie indica la abundancia de un conjunto predeterminado de secuencias. Por lo general, estas secuencias se eligen específicamente para informar sobre genes de interés dentro del genoma del organismo. [51]

Principios y avances

Los microarrays suelen consistir en una rejilla de oligómeros de nucleótidos cortos , conocidos como " sondas ", normalmente dispuestos sobre un portaobjetos de vidrio. [53] La abundancia de transcripciones se determina mediante la hibridación de transcripciones marcadas fluorescentemente con estas sondas. [54] La intensidad de fluorescencia en cada ubicación de la sonda en la matriz indica la abundancia de transcripción para esa secuencia de sonda. [54] Los grupos de sondas diseñadas para medir el mismo transcrito (es decir, hibridar un transcrito específico en diferentes posiciones) generalmente se denominan "conjuntos de sondas".

Los microarrays requieren cierto conocimiento genómico del organismo de interés, por ejemplo, en forma de una secuencia genómica anotada o una biblioteca de tecnologías ecológicamente racionales que puedan usarse para generar las sondas para el conjunto. [36]

Métodos

Los microarreglos para transcriptómica generalmente se clasifican en una de dos categorías amplias: arreglos manchados de baja densidad o arreglos de sondas cortas de alta densidad. La abundancia de las transcripciones se infiere a partir de la intensidad de la fluorescencia derivada de las transcripciones marcadas con fluoróforos que se unen a la matriz. [36]

Las matrices manchadas de baja densidad suelen presentar gotas de picolitros [nota 2] de una variedad de ADNc purificados dispuestos sobre la superficie de un portaobjetos de vidrio. [55] Estas sondas son más largas que las de matrices de alta densidad y no pueden identificar eventos de empalme alternativos . Las matrices manchadas utilizan dos fluoróforos diferentes para etiquetar las muestras de prueba y de control, y la proporción de fluorescencia se utiliza para calcular una medida relativa de abundancia. [56] Las matrices de alta densidad utilizan una única etiqueta fluorescente y cada muestra se hibrida y se detecta individualmente. [57] Las matrices de alta densidad se popularizaron gracias a la matriz Affymetrix GeneChip , donde cada transcripción se cuantifica mediante varias sondas cortas de 25 unidades que en conjunto analizan un gen. [58]

Los conjuntos NimbleGen eran conjuntos de alta densidad producidos mediante un método de fotoquímica sin máscara , que permitía la fabricación flexible de conjuntos en cantidades pequeñas o grandes. Estas matrices tenían 100.000 sondas de 45 a 85 unidades y se hibridaron con una muestra marcada con un color para el análisis de expresión. [59] Algunos diseños incorporaron hasta 12 matrices independientes por diapositiva.

Sec. de ARN

Resumen de RNA-Seq . Dentro de los organismos, los genes se transcriben y se empalman (en eucariotas) para producir transcripciones de ARNm maduros (rojo). El ARNm se extrae del organismo, se fragmenta y se copia en ADNc-ds estable (azul). El ds-cDNA se secuencia utilizando métodos de secuenciación de lectura corta y alto rendimiento . Luego, estas secuencias se pueden alinear con una secuencia del genoma de referencia para reconstruir qué regiones del genoma se estaban transcribiendo. Estos datos se pueden utilizar para anotar dónde están los genes expresados, sus niveles de expresión relativos y cualquier variante de empalme alternativa. [51]

Principios y avances

RNA-Seq se refiere a la combinación de una metodología de secuenciación de alto rendimiento con métodos computacionales para capturar y cuantificar transcripciones presentes en un extracto de ARN. [10] Las secuencias de nucleótidos generadas suelen tener una longitud de alrededor de 100 pb, pero pueden oscilar entre 30 pb y más de 10 000 pb, según el método de secuenciación utilizado. RNA-Seq aprovecha el muestreo profundo del transcriptoma con muchos fragmentos cortos de un transcriptoma para permitir la reconstrucción computacional de la transcripción de ARN original alineando las lecturas con un genoma de referencia o entre sí ( ensamblaje de novo ). [9] Tanto los ARN de baja abundancia como los de alta abundancia se pueden cuantificar en un experimento RNA-Seq ( rango dinámico de 5 órdenes de magnitud ), una ventaja clave sobre los transcriptomas de microarrays. Además, las cantidades de ARN de entrada son mucho menores para RNA-Seq (cantidad de nanogramos) en comparación con los microarrays (cantidad de microgramos), que permiten el examen del transcriptoma incluso con una resolución unicelular cuando se combinan con la amplificación de ADNc. [25] [60] Teóricamente, no existe un límite superior de cuantificación en RNA-Seq, y el ruido de fondo es muy bajo para lecturas de 100 pb en regiones no repetitivas. [10]

RNA-Seq se puede usar para identificar genes dentro de un genoma , o identificar qué genes están activos en un momento particular, y los recuentos de lectura se pueden usar para modelar con precisión el nivel relativo de expresión genética. La metodología RNA-Seq ha mejorado constantemente, principalmente mediante el desarrollo de tecnologías de secuenciación de ADN para aumentar el rendimiento, la precisión y la longitud de lectura. [61] Desde las primeras descripciones en 2006 y 2008, [40] [62] RNA-Seq se adoptó rápidamente y superó a los microarrays como técnica de transcriptómica dominante en 2015. [63]

La búsqueda de datos del transcriptoma a nivel de células individuales ha impulsado avances en los métodos de preparación de bibliotecas de RNA-Seq, lo que ha dado lugar a avances espectaculares en la sensibilidad. Los transcriptomas unicelulares ahora están bien descritos e incluso se han extendido a RNA-Seq in situ , donde los transcriptomas de células individuales se interrogan directamente en tejidos fijos . [64]

Métodos

RNA-Seq se estableció en conjunto con el rápido desarrollo de una variedad de tecnologías de secuenciación de ADN de alto rendimiento. [65] Sin embargo, antes de secuenciar las transcripciones de ARN extraídas, se realizan varios pasos de procesamiento clave. Los métodos difieren en el uso de enriquecimiento de la transcripción, fragmentación, amplificación, secuenciación de extremos simples o pares y si se debe preservar la información de la cadena. [sesenta y cinco]

La sensibilidad de un experimento de RNA-Seq se puede aumentar enriqueciendo las clases de ARN que son de interés y agotando los abundantes ARN conocidos. Las moléculas de ARNm se pueden separar utilizando sondas de oligonucleótidos que se unen a sus colas poli-A . Alternativamente, se puede utilizar el agotamiento de ribo para eliminar específicamente los ARN ribosómicos (ARNr) abundantes pero poco informativos mediante hibridación con sondas adaptadas a las secuencias de ARNr específicas del taxón (por ejemplo, ARNr de mamíferos, ARNr de plantas). Sin embargo, el agotamiento de ribo también puede introducir cierto sesgo a través del agotamiento no específico de transcripciones fuera del objetivo. [66] Los ARN pequeños, como los microARN , se pueden purificar en función de su tamaño mediante electroforesis en gel y extracción.

Dado que los ARNm son más largos que las longitudes de lectura de los métodos típicos de secuenciación de alto rendimiento, las transcripciones generalmente se fragmentan antes de la secuenciación. [67] El método de fragmentación es un aspecto clave de la construcción de bibliotecas de secuenciación. La fragmentación se puede lograr mediante hidrólisis química , nebulización , sonicación o transcripción inversa con nucleótidos terminales de cadena . [67] Alternativamente, la fragmentación y el etiquetado del ADNc se pueden realizar simultáneamente mediante el uso de enzimas transposasa . [68]

Durante la preparación para la secuenciación, las copias de ADNc de los transcritos se pueden amplificar mediante PCR para enriquecer los fragmentos que contienen las secuencias adaptadoras 5' y 3' esperadas. [69] La amplificación también se utiliza para permitir la secuenciación de cantidades muy bajas de ARN de entrada, hasta tan solo 50 pg en aplicaciones extremas. [70] Los controles de adición de ARN conocidos se pueden utilizar para la evaluación del control de calidad para verificar la preparación y secuenciación de la biblioteca, en términos de contenido de GC , longitud del fragmento, así como el sesgo debido a la posición del fragmento dentro de una transcripción. [71] Los identificadores moleculares únicos (UMI) son secuencias aleatorias cortas que se utilizan para etiquetar individualmente fragmentos de secuencia durante la preparación de la biblioteca, de modo que cada fragmento etiquetado sea único. [72] Los UMI proporcionan una escala absoluta para la cuantificación, la oportunidad de corregir el sesgo de amplificación posterior introducido durante la construcción de la biblioteca y estimar con precisión el tamaño de la muestra inicial. Los UMI son particularmente adecuados para la transcriptómica de RNA-Seq unicelular, donde la cantidad de ARN de entrada está restringida y se requiere una amplificación extendida de la muestra. [73] [74] [75]

Una vez que se han preparado las moléculas de transcripción, se pueden secuenciar en una sola dirección (extremo único) o en ambas direcciones (extremo pareado). Una secuencia de un solo extremo suele ser más rápida de producir, más barata que la secuenciación de extremos pares y suficiente para cuantificar los niveles de expresión génica. La secuenciación de extremos emparejados produce alineamientos/ensamblajes más robustos, lo que es beneficioso para la anotación de genes y el descubrimiento de isoformas de transcripción . [10] Los métodos RNA-Seq específicos de la cadena preservan la información de la cadena de una transcripción secuenciada. [76] Sin información de la cadena, las lecturas se pueden alinear con el locus de un gen, pero no informan en qué dirección se transcribe el gen. Stranded-RNA-Seq es útil para descifrar la transcripción de genes que se superponen en diferentes direcciones y para realizar predicciones genéticas más sólidas en organismos que no son modelo. [76]

Leyenda: NCBI SRA – Centro nacional de información de biotecnología, archivo de lectura de secuencias.

Actualmente, RNA-Seq se basa en copiar moléculas de ARN en moléculas de ADNc antes de la secuenciación; por lo tanto, las plataformas posteriores son las mismas para datos transcriptómicos y genómicos. En consecuencia, el desarrollo de tecnologías de secuenciación de ADN ha sido una característica definitoria de RNA-Seq. [78] [80] [81] La secuenciación directa de ARN mediante secuenciación de nanoporos representa una técnica de RNA-Seq de última generación. [82] [83] La secuenciación de ARN con nanoporos puede detectar bases modificadas que de otro modo quedarían enmascaradas al secuenciar ADNc y también elimina pasos de amplificación que de otro modo pueden introducir sesgos. [11] [84]

La sensibilidad y precisión de un experimento de RNA-Seq dependen de la cantidad de lecturas obtenidas de cada muestra. [85] [86] Se necesita una gran cantidad de lecturas para garantizar una cobertura suficiente del transcriptoma, lo que permite la detección de transcripciones de baja abundancia. El diseño experimental se complica aún más por las tecnologías de secuenciación con un rango de salida limitado, la eficiencia variable de la creación de secuencias y la calidad de secuencia variable. A esas consideraciones se suma que cada especie tiene una cantidad diferente de genes y, por lo tanto, requiere un rendimiento de secuencia personalizado para un transcriptoma eficaz. Los primeros estudios determinaron empíricamente umbrales adecuados, pero a medida que la tecnología maduró, la cobertura adecuada se predijo computacionalmente mediante la saturación del transcriptoma. De manera algo contraria a la intuición, la forma más eficaz de mejorar la detección de la expresión diferencial en genes de baja expresión es agregar más réplicas biológicas en lugar de agregar más lecturas. [87] Los puntos de referencia actuales recomendados por el Proyecto Enciclopedia de Elementos de ADN (ENCODE) son para una cobertura del exoma de 70 veces para RNA-Seq estándar y una cobertura del exoma de hasta 500 veces para detectar transcripciones e isoformas raras. [88] [89] [90]

Análisis de los datos

Los métodos de transcriptómica son muy paralelos y requieren una computación significativa para producir datos significativos tanto para experimentos de microarrays como de RNA-Seq. [91] [92] [93] [94] [95] Los datos de microarrays se registran como imágenes de alta resolución , lo que requiere detección de características y análisis espectral. [96] Los archivos de imágenes sin procesar de microarrays tienen cada uno un tamaño de aproximadamente 750 MB, mientras que las intensidades procesadas tienen un tamaño de aproximadamente 60 MB. Múltiples sondas cortas que coinciden con una sola transcripción pueden revelar detalles sobre la estructura intrón - exón , lo que requiere modelos estadísticos para determinar la autenticidad de la señal resultante. Los estudios RNA-Seq producen miles de millones de secuencias cortas de ADN, que deben alinearse con genomas de referencia compuestos por millones o miles de millones de pares de bases. El ensamblaje de novo de lecturas dentro de un conjunto de datos requiere la construcción de gráficos de secuencia altamente complejos . [97] Las operaciones de RNA-Seq son muy repetitivas y se benefician del cálculo paralelizado , pero los algoritmos modernos significan que el hardware informático de consumo es suficiente para experimentos de transcriptómica simples que no requieren un ensamblaje de lecturas de novo . [98] Un transcriptoma humano podría capturarse con precisión utilizando RNA-Seq con 30 millones de secuencias de 100 pb por muestra. [85] [86] Este ejemplo requeriría aproximadamente 1,8 gigabytes de espacio en disco por muestra cuando se almacena en un formato fastq comprimido . Los datos de recuento procesados ​​para cada gen serían mucho más pequeños, equivalentes a las intensidades de microarrays procesados. Los datos de secuencia pueden almacenarse en repositorios públicos, como el Archivo de lectura de secuencia (SRA). [99] Los conjuntos de datos de RNA-Seq se pueden cargar a través de Gene Expression Omnibus. [100]

Procesamiento de imágenes

Microarrays y celda de flujo de secuenciación . Los microarrays y RNA-seq se basan en el análisis de imágenes de diferentes maneras. En un chip de micromatriz, cada punto del chip es una sonda de oligonucleótido definida y la intensidad de la fluorescencia detecta directamente la abundancia de una secuencia específica (Affymetrix). En una celda de flujo de secuenciación de alto rendimiento, los puntos se secuencian un nucleótido a la vez, y el color de cada ronda indica el siguiente nucleótido de la secuencia (Illumina Hiseq). Otras variaciones de estas técnicas utilizan más o menos canales de color. [51] [101]

El procesamiento de imágenes de microarrays debe identificar correctamente la cuadrícula regular de características dentro de una imagen y cuantificar de forma independiente la intensidad de fluorescencia de cada característica. Además , los defectos de la imagen deben identificarse y eliminarse del análisis general. Las intensidades de fluorescencia indican directamente la abundancia de cada secuencia, ya que ya se conoce la secuencia de cada sonda en la matriz. [102]

Los primeros pasos de RNA-seq también incluyen un procesamiento de imágenes similar; sin embargo, la conversión de imágenes a datos de secuencia normalmente la realiza automáticamente el software del instrumento. El método de secuenciación por síntesis de Illumina da como resultado una serie de grupos distribuidos sobre la superficie de una celda de flujo. [103] Se obtienen imágenes de la celda de flujo hasta cuatro veces durante cada ciclo de secuenciación, con decenas a cientos de ciclos en total. Los grupos de células de flujo son análogos a los puntos de microarrays y deben identificarse correctamente durante las primeras etapas del proceso de secuenciación. En el método de pirosecuenciación de Roche , la intensidad de la luz emitida determina el número de nucleótidos consecutivos en una repetición de homopolímero. Existen muchas variantes de estos métodos, cada una con un perfil de error diferente para los datos resultantes. [104]

Análisis de datos de RNA-Seq.

Los experimentos de RNA-Seq generan un gran volumen de lecturas de secuencias sin procesar que deben procesarse para generar información útil. El análisis de datos generalmente requiere una combinación de herramientas de software bioinformático (ver también Lista de herramientas bioinformáticas RNA-Seq ) que varían según el diseño y los objetivos experimentales. El proceso se puede dividir en cuatro etapas: control de calidad, alineación, cuantificación y expresión diferencial. [105] Los programas RNA-Seq más populares se ejecutan desde una interfaz de línea de comandos , ya sea en un entorno Unix o dentro del entorno estadístico R / Bioconductor . [94]

Control de calidad

Las lecturas de secuencia no son perfectas, por lo que es necesario estimar la precisión de cada base en la secuencia para los análisis posteriores. Los datos sin procesar se examinan para garantizar que: los puntajes de calidad de las llamadas base sean altos, el contenido del GC coincida con la distribución esperada, los motivos de secuencia corta ( k-mers ) no estén sobrerrepresentados y la tasa de duplicación de lectura sea aceptablemente baja. [86] Existen varias opciones de software para el análisis de la calidad de la secuencia, incluidos FastQC y FaQC. [106] [107] Las anomalías se pueden eliminar (recortar) o etiquetar para un tratamiento especial durante procesos posteriores.

Alineación

Para vincular la abundancia de lecturas de secuencias con la expresión de un gen particular, las secuencias de transcripción se alinean con un genoma de referencia o se alinean de novo entre sí si no hay ninguna referencia disponible. [108] [109] [110] Los desafíos clave para el software de alineación incluyen la velocidad suficiente para permitir que miles de millones de secuencias cortas se alineen en un período de tiempo significativo, la flexibilidad para reconocer y lidiar con el empalme de intrones del ARNm eucariota y la asignación correcta de lecturas que mapa a múltiples ubicaciones. Los avances del software han abordado en gran medida estos problemas y los aumentos en la duración de la lectura de secuenciación reducen la posibilidad de alineaciones de lectura ambiguas. La EBI mantiene una lista de alineadores de secuencia de alto rendimiento disponibles actualmente . [111] [112]

La alineación de secuencias de ARNm de transcripción primaria derivadas de eucariotas con un genoma de referencia requiere un manejo especializado de secuencias de intrones , que están ausentes en el ARNm maduro. [113] Los alineadores de lectura corta realizan una ronda adicional de alineamientos diseñados específicamente para identificar uniones de empalme , informados por secuencias de sitios de empalme canónicos e información conocida del sitio de empalme de intrones. La identificación de uniones de empalme de intrones evita que las lecturas se desalineen entre las uniones de empalme o se descarten erróneamente, lo que permite alinear más lecturas con el genoma de referencia y mejorar la precisión de las estimaciones de expresión génica. Dado que la regulación genética puede ocurrir a nivel de isoformas de ARNm , las alineaciones con reconocimiento de empalme también permiten la detección de cambios en la abundancia de isoformas que de otro modo se perderían en un análisis masivo. [114]

El ensamblaje de novo se puede utilizar para alinear lecturas entre sí para construir secuencias de transcripción completas sin el uso de un genoma de referencia. [115] Los desafíos particulares del ensamblaje de novo incluyen requisitos computacionales mayores en comparación con un transcriptoma basado en referencia, validación adicional de variantes o fragmentos de genes y anotaciones adicionales de transcripciones ensambladas. Se ha demostrado que las primeras métricas utilizadas para describir conjuntos de transcriptomas, como N50 , son engañosas [116] y ahora se encuentran disponibles métodos de evaluación mejorados. [117] [118] Las métricas basadas en anotaciones son mejores evaluaciones de la integridad del ensamblaje, como el recuento de mejores aciertos recíprocos contig . Una vez ensamblado de novo , el ensamblaje se puede utilizar como referencia para métodos posteriores de alineación de secuencias y análisis cuantitativos de expresión génica.

Leyenda: RAM – memoria de acceso aleatorio; MPI – interfaz de paso de mensajes; EST: etiqueta de secuencia expresada.

Cuantificación

Identificación de mapas de calor de patrones de coexpresión genética en diferentes muestras. Cada columna contiene las mediciones del cambio de expresión genética para una sola muestra. La expresión genética relativa se indica mediante el color: expresión alta (rojo), expresión media (blanco) y expresión baja (azul). Los genes y muestras con perfiles de expresión similares se pueden agrupar automáticamente (árboles izquierdo y superior). Las muestras pueden ser diferentes individuos, tejidos, entornos o condiciones de salud. En este ejemplo, la expresión del conjunto de genes 1 es alta y la expresión del conjunto de genes 2 es baja en las muestras 1, 2 y 3. [51] [129]

La cuantificación de alineamientos de secuencias se puede realizar a nivel de gen, exón o transcripción. [91] [87] Las salidas típicas incluyen una tabla de recuentos de lecturas para cada característica suministrada al software; por ejemplo, para genes en un archivo de formato de características generales . Los recuentos de lecturas de genes y exones se pueden calcular con bastante facilidad utilizando HTSeq, por ejemplo. [130] La cuantificación a nivel de transcripción es más complicada y requiere métodos probabilísticos para estimar la abundancia de isoformas de transcripción a partir de información de lectura breve; por ejemplo, utilizando software para gemelos. [114] Las lecturas que se alinean igualmente bien con múltiples ubicaciones deben identificarse y eliminarse, alinearse con una de las ubicaciones posibles o alinearse con la ubicación más probable.

Algunos métodos de cuantificación pueden evitar por completo la necesidad de una alineación exacta de una lectura con una secuencia de referencia. El método del software kallisto combina pseudoalineación y cuantificación en un solo paso que se ejecuta 2 órdenes de magnitud más rápido que los métodos contemporáneos como los utilizados por el software tophat/cufflinks, con menos carga computacional. [131]

expresión diferencial

Una vez que los recuentos cuantitativos de cada transcripción están disponibles, la expresión genética diferencial se mide normalizando, modelando y analizando estadísticamente los datos. [108] La mayoría de las herramientas leerán una tabla de genes y leerán recuentos como entrada, pero algunos programas, como cuffdiff, aceptarán alineaciones de lectura en formato de mapa de alineación binaria como entrada. Los resultados finales de estos análisis son listas de genes con pruebas asociadas por pares para la expresión diferencial entre tratamientos y las estimaciones de probabilidad de esas diferencias. [132]

Leyenda: ARNm - ARN mensajero.

Validación

Los análisis transcriptómicos pueden validarse mediante una técnica independiente, por ejemplo, la PCR cuantitativa (qPCR), que es reconocible y estadísticamente evaluable. [135] La expresión génica se mide según estándares definidos tanto para el gen de interés como para los genes de control . La medición por qPCR es similar a la obtenida por RNA-Seq en la que se puede calcular un valor para la concentración de una región objetivo en una muestra determinada. Sin embargo, la qPCR está restringida a amplicones de menos de 300 pb, generalmente hacia el extremo 3' de la región codificante, evitando la 3'UTR . [136] Si se requiere la validación de las isoformas de la transcripción, una inspección de las alineaciones de lectura de RNA-Seq debe indicar dónde se pueden colocar los cebadores de qPCR para una máxima discriminación. La medición de múltiples genes de control junto con los genes de interés produce una referencia estable dentro de un contexto biológico. [137] La ​​validación por qPCR de los datos de RNA-Seq generalmente ha demostrado que los diferentes métodos de RNA-Seq están altamente correlacionados. [62] [138] [139]

La validación funcional de genes clave es una consideración importante para la planificación posterior al transcriptoma. Los patrones de expresión genética observados pueden vincularse funcionalmente a un fenotipo mediante un estudio independiente de eliminación / rescate en el organismo de interés. [140]

Aplicaciones

Diagnóstico y perfil de enfermedades.

Las estrategias transcriptómicas han tenido una amplia aplicación en diversas áreas de la investigación biomédica, incluido el diagnóstico y la elaboración de perfiles de enfermedades . [10] [141] Los enfoques RNA-Seq han permitido la identificación a gran escala de sitios de inicio de la transcripción , el uso de promotores alternativos descubierto y nuevas alteraciones de empalme . Estos elementos reguladores son importantes en las enfermedades humanas y, por lo tanto, definir tales variantes es crucial para la interpretación de los estudios de asociación de enfermedades . [142] RNA-Seq también puede identificar polimorfismos de un solo nucleótido (SNP) asociados a enfermedades , expresión específica de alelos y fusiones de genes , lo que contribuye a la comprensión de las variantes causales de las enfermedades. [143]

Los retrotransposones son elementos transponibles que proliferan dentro de los genomas eucariotas mediante un proceso que implica transcripción inversa . RNA-Seq puede proporcionar información sobre la transcripción de retrotransposones endógenos que pueden influir en la transcripción de genes vecinos mediante diversos mecanismos epigenéticos que conducen a enfermedades. [144] De manera similar, el potencial para usar RNA-Seq para comprender las enfermedades relacionadas con el sistema inmunológico se está expandiendo rápidamente debido a la capacidad de diseccionar poblaciones de células inmunes y secuenciar repertorios de receptores de células T y células B de los pacientes. [145] [146]

Transcriptomas humanos y patógenos.

RNA-Seq de patógenos humanos se ha convertido en un método establecido para cuantificar cambios en la expresión genética, identificar nuevos factores de virulencia , predecir la resistencia a los antibióticos y revelar interacciones inmunes huésped-patógeno . [147] [148] Un objetivo principal de esta tecnología es desarrollar medidas optimizadas de control de infecciones y tratamientos individualizados específicos . [146]

El análisis transcriptómico se ha centrado predominantemente en el huésped o el patógeno. Se ha aplicado Dual RNA-Seq para perfilar simultáneamente la expresión de ARN tanto en el patógeno como en el huésped durante todo el proceso de infección. Esta técnica permite el estudio de la respuesta dinámica y las redes reguladoras de genes entre especies en ambos socios de interacción desde el contacto inicial hasta la invasión y la persistencia final del patógeno o su eliminación por parte del sistema inmunológico del huésped. [149] [150]

Respuestas al medio ambiente

La transcriptómica permite la identificación de genes y vías que responden y contrarrestan el estrés ambiental biótico y abiótico. [151] [140] La naturaleza no dirigida de la transcriptómica permite la identificación de nuevas redes transcripcionales en sistemas complejos. Por ejemplo, el análisis comparativo de una variedad de líneas de garbanzos en diferentes etapas de desarrollo identificó distintos perfiles transcripcionales asociados con estrés por sequía y salinidad , incluida la identificación del papel de las isoformas de transcripción de AP2 - EREBP . [151] La investigación de la expresión genética durante la formación de biopelículas por el hongo patógeno Candida albicans reveló un conjunto corregulado de genes críticos para el establecimiento y mantenimiento de biopelículas. [152]

Los perfiles transcriptómicos también proporcionan información crucial sobre los mecanismos de resistencia a los medicamentos . El análisis de más de 1000 aislamientos de Plasmodium falciparum , un parásito virulento responsable de la malaria en humanos, [153] identificó que la regulación positiva de la respuesta de la proteína desplegada y la progresión más lenta a lo largo de las primeras etapas del ciclo de desarrollo intraeritrocítico asexual se asociaron con la resistencia a la artemisinina en aislados de El sudeste de Asia . [154]

El uso de la transcriptómica también es importante para investigar las respuestas en el medio marino. [155] En ecología marina, el " estrés " y la " adaptación " han estado entre los temas de investigación más comunes, especialmente relacionados con el estrés antropogénico, como el cambio global y la contaminación . [155] La mayoría de los estudios en esta área se han realizado en animales , aunque los invertebrados han estado subrepresentados. [155] Un problema todavía es una deficiencia en los estudios genéticos funcionales, que obstaculizan las anotaciones genéticas , especialmente para especies que no son modelo, y pueden llevar a conclusiones vagas sobre los efectos de las respuestas estudiadas. [155]

Anotación de función genética

Todas las técnicas transcriptómicas han sido particularmente útiles para identificar las funciones de los genes y los responsables de fenotipos particulares. La transcriptómica de los ecotipos de Arabidopsis que hiperacumulan metales correlaciona los genes implicados en la absorción , la tolerancia y la homeostasis de los metales con el fenotipo. [156] La integración de conjuntos de datos RNA-Seq en diferentes tejidos se ha utilizado para mejorar la anotación de funciones genéticas en organismos comercialmente importantes (por ejemplo, pepino ) [157] o especies amenazadas (por ejemplo, koala ). [158]

El ensamblaje de lecturas de RNA-Seq no depende de un genoma de referencia [122] y, por lo tanto, es ideal para estudios de expresión génica de organismos no modelo con recursos genómicos inexistentes o poco desarrollados. Por ejemplo, se creó una base de datos de SNP utilizados en programas de mejoramiento del abeto Douglas mediante análisis de transcriptoma de novo en ausencia de un genoma secuenciado . [159] De manera similar, se identificaron genes que funcionan en el desarrollo del tejido cardíaco, muscular y nervioso en las langostas comparando los transcriptomas de los distintos tipos de tejido sin el uso de una secuencia genómica. [160] RNA-Seq también se puede utilizar para identificar regiones codificantes de proteínas previamente desconocidas en genomas secuenciados existentes.

ARN no codificante

La transcriptómica se aplica más comúnmente al contenido de ARNm de la célula. Sin embargo, las mismas técnicas son igualmente aplicables a los ARN no codificantes (ARNnc) que no se traducen en una proteína, sino que tienen funciones directas (por ejemplo, funciones en la traducción de proteínas , la replicación del ADN , el empalme de ARN y la regulación transcripcional ). [161] [162] [163] [164] Muchos de estos ncRNA afectan estados patológicos, incluidos el cáncer, las enfermedades cardiovasculares y neurológicas. [165]

Bases de datos de transcriptomas

Los estudios de transcriptómica generan grandes cantidades de datos que tienen aplicaciones potenciales mucho más allá de los objetivos originales de un experimento. Como tal, los datos sin procesar o procesados ​​pueden depositarse en bases de datos públicas para garantizar su utilidad para la comunidad científica en general. Por ejemplo, en 2018, Gene Expression Omnibus contenía millones de experimentos. [166]

Leyenda: NCBI – Centro Nacional de Información Biotecnológica; EBI – Instituto Europeo de Bioinformática; DDBJ – Banco de datos de ADN de Japón; ENA – Archivo Europeo de Nucleótidos; MIAME – Información mínima sobre un experimento de microarrays; MINSEQE: información mínima sobre un experimento de secuenciación de nucleótidos de alto rendimiento.

Ver también

Referencias

Este artículo fue adaptado de la siguiente fuente bajo una licencia CC BY 4.0 (2017) (informes de los revisores): Rohan Lowe; Neil Shirley; Mark Bleackley; Stephen Dolan; Thomas Shafee (18 de mayo de 2017). "Tecnologías transcriptómicas". PLOS Biología Computacional . 13 (5): e1005457. doi : 10.1371/JOURNAL.PCBI.1005457 . ISSN  1553-734X. PMC  5436640 . PMID  28545146. S2CID  3714586. Wikidata  Q33703532.

  1. ^ "Tendencia de Medline: estadísticas anuales automatizadas de los resultados de PubMed para cualquier consulta". dan.corlan.net . Consultado el 5 de octubre de 2016 .
  2. ^ ab Adams MD, Kelley JM, Gocayne JD, Dubnick M, Polymeropoulos MH, Xiao H, et al. (junio de 1991). "Secuenciación complementaria de ADN: etiquetas de secuencia expresada y proyecto del genoma humano". Ciencia . 252 (5013): 1651–6. Código bibliográfico : 1991 Ciencia... 252.1651A. doi : 10.1126/ciencia.2047873. PMID  2047873. S2CID  13436211.
  3. ^ Pan Q, Shai O, Lee LJ, Frey BJ, Blencowe BJ (diciembre de 2008). "Estudio profundo de la complejidad del empalme alternativo en el transcriptoma humano mediante secuenciación de alto rendimiento". Genética de la Naturaleza . 40 (12): 1413–5. doi :10.1038/ng.259. PMID  18978789. S2CID  9228930.
  4. ^ ab Sultan M, Schulz MH, Richard H, Magen A, Klingenhoff A, Scherf M, et al. (Agosto de 2008). "Una visión global de la actividad genética y el empalme alternativo mediante secuenciación profunda del transcriptoma humano". Ciencia . 321 (5891): 956–60. Código bibliográfico : 2008 Ciencia... 321..956S. doi : 10.1126/ciencia.1160342. PMID  18599741. S2CID  10013179.
  5. ^ Lappalainen T, Sammeth M, Friedländer MR, 't Hoen PA, Monlong J, Rivas MA, et al. (Septiembre 2013). "La secuenciación del transcriptoma y del genoma descubre variaciones funcionales en humanos". Naturaleza . 501 (7468): 506–11. Código Bib :2013Natur.501..506L. doi : 10.1038/naturaleza12531. PMC 3918453 . PMID  24037378. 
  6. ^ ab Melé M, Ferreira PG, Reverter F, DeLuca DS, Monlong J, Sammeth M, et al. (mayo de 2015). "Genómica humana. El transcriptoma humano en tejidos e individuos". Ciencia . 348 (6235): 660–5. Código Bib : 2015 Ciencia... 348..660M. doi : 10.1126/ciencia.aaa0355. PMC 4547472 . PMID  25954002. 
  7. ^ Sandberg R (enero de 2014). "Entrando en la era de la transcriptómica unicelular en biología y medicina". Métodos de la naturaleza . 11 (1): 22–4. doi :10.1038/nmeth.2764. PMID  24524133. S2CID  27632439.
  8. ^ Kolodziejczyk AA, Kim JK, Svensson V, Marioni JC, Teichmann SA (mayo de 2015). "La tecnología y biología de la secuenciación de ARN unicelular". Célula molecular . 58 (4): 610–20. doi : 10.1016/j.molcel.2015.04.005 . PMID  26000846.
  9. ^ abcdef McGettigan PA (febrero de 2013). "Transcriptómica en la era RNA-seq". Opinión actual en biología química . 17 (1): 4-11. doi :10.1016/j.cbpa.2012.12.008. PMID  23290152.
  10. ^ abcdefghijkl Wang Z, Gerstein M, Snyder M (enero de 2009). "RNA-Seq: una herramienta revolucionaria para la transcriptómica". Naturaleza Reseñas Genética . 10 (1): 57–63. doi :10.1038/nrg2484. PMC 2949280 . PMID  19015660. 
  11. ^ abc Ozsolak F, Milos PM (febrero de 2011). "Secuenciación de ARN: avances, desafíos y oportunidades". Naturaleza Reseñas Genética . 12 (2): 87–98. doi :10.1038/nrg2934. PMC 3031867 . PMID  21191423. 
  12. ^ abc Morozova O, Hirst M, Marra MA (2009). "Aplicaciones de nuevas tecnologías de secuenciación para el análisis del transcriptoma". Revista Anual de Genómica y Genética Humana . 10 : 135–51. doi :10.1146/annurev-genom-082908-145957. PMID  19715439.
  13. ^ Sim GK, Kafatos FC, Jones CW, Koehler MD, Efstratiadis A, Maniatis T (diciembre de 1979). "Uso de una biblioteca de ADNc para estudios sobre la evolución y expresión del desarrollo de las familias multigénicas del corion". Celúla . 18 (4): 1303–16. doi : 10.1016/0092-8674(79)90241-1 . PMID  519770.
  14. ^ Sutcliffe JG, Milner RJ, Bloom FE, Lerner RA (agosto de 1982). "Secuencia común de 82 nucleótidos exclusiva del ARN cerebral". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 79 (16): 4942–6. Código bibliográfico : 1982PNAS...79.4942S. doi : 10.1073/pnas.79.16.4942 . PMC 346801 . PID  6956902. 
  15. ^ Putney SD, Herlihy WC, Schimmel P (abril de 1983). "Un nuevo clon de troponina T y ADNc para 13 proteínas musculares diferentes, encontrado mediante secuenciación escopeta". Naturaleza . 302 (5910): 718–21. Código Bib :1983Natur.302..718P. doi :10.1038/302718a0. PMID  6687628. S2CID  4364361.
  16. ^ abcd Marra MA, Hillier L, Waterston RH (enero de 1998). "Etiquetas de secuencia expresada: estableciendo puentes entre genomas". Tendencias en Genética . 14 (1): 4–7. doi :10.1016/S0168-9525(97)01355-3. PMID  9448457.
  17. ^ Alwine JC, Kemp DJ, Stark GR (diciembre de 1977). "Método de detección de ARN específicos en geles de agarosa mediante transferencia a papel diazobenciloximetilo e hibridación con sondas de ADN". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 74 (12): 5350–4. Código bibliográfico : 1977PNAS...74.5350A. doi : 10.1073/pnas.74.12.5350 . PMC 431715 . PMID  414220. 
  18. ^ Becker-André M, Hahlbrock K (noviembre de 1989). "Cuantificación absoluta de ARNm mediante la reacción en cadena de la polimerasa (PCR). Un enfoque novedoso mediante un ensayo de titulación de transcritos asistido por PCR (PATTY)". Investigación de ácidos nucleicos . 17 (22): 9437–46. doi : 10.1093/nar/17.22.9437. PMC 335144 . PMID  2479917. 
  19. ^ Piétu G, Mariage-Samson R, Fayein NA, Matingou C, Eveno E, Houlgatte R, Decraene C, Vandenbrouck Y, Tahi F, Devignes MD, Wirkner U, Ansorge W, Cox D, Nagase T, Nomura N, Auffray C (febrero de 1999). "La base de conocimientos Genexpress IMAGE del transcriptoma del cerebro humano: un prototipo de recurso integrado para genómica funcional y computacional". Investigación del genoma . 9 (2): 195–209. doi :10.1101/gr.9.2.195. PMC 310711 . PMID  10022985. 
  20. ^ Velculescu VE, Zhang L, Zhou W, Vogelstein J, Basrai MA, Bassett DE, Hieter P, Vogelstein B, Kinzler KW (enero de 1997). "Caracterización del transcriptoma de levadura". Celúla . 88 (2): 243–51. doi : 10.1016/S0092-8674(00)81845-0 . PMID  9008165. S2CID  11430660.
  21. ^ abcd Velculescu VE, Zhang L, Vogelstein B, Kinzler KW (octubre de 1995). "Análisis seriado de expresión génica". Ciencia . 270 (5235): 484–7. Código Bib : 1995 Ciencia... 270.. 484V. doi : 10.1126/ciencia.270.5235.484. PMID  7570003. S2CID  16281846.
  22. ^ Audic S, Claverie JM (octubre de 1997). "El significado de los perfiles digitales de expresión de genes". Investigación del genoma . 7 (10): 986–95. doi : 10.1101/gr.7.10.986 . PMID  9331369.
  23. ^ abcdef Mantione KJ, Kream RM, Kuzelova H, Ptacek R, Raboch J, Samuel JM, Stefano GB (agosto de 2014). "Comparación de métodos bioinformáticos de elaboración de perfiles de expresión génica: microarrays y RNA-Seq". Investigación Básica del Monitor de Ciencias Médicas . 20 : 138–42. doi :10.12659/MSMBR.892101. PMC 4152252 . PMID  25149683. 
  24. ^ Zhao S, Fung-Leung WP, Bittner A, Ngo K, Liu X (2014). "Comparación de RNA-Seq y microarrays en el perfil del transcriptoma de células T activadas". MÁS UNO . 9 (1): e78644. Código Bib : 2014PLoSO...978644Z. doi : 10.1371/journal.pone.0078644 . PMC 3894192 . PMID  24454679. 
  25. ^ ab Hashimshony T, Wagner F, Sher N, Yanai I (septiembre de 2012). "CEL-Seq: RNA-Seq unicelular mediante amplificación lineal multiplexada". Informes celulares . 2 (3): 666–73. doi : 10.1016/j.celrep.2012.08.003 . PMID  22939981.
  26. ^ Stears RL, Getts RC, Gullans SR (agosto de 2000). "Un sistema de detección novedoso y sensible para microarrays de alta densidad que utiliza tecnología dendrímero". Genómica fisiológica . 3 (2): 93–9. doi :10.1152/fisiolgenomics.2000.3.2.93. PMID  11015604.
  27. ^ abcdef Illumina (11 de julio de 2011). "Comparación de datos de RNA-Seq con microarrays de expresión genética" (PDF) . Revista farmacéutica europea.
  28. ^ ab Black MB, Parks BB, Pluta L, Chu TM, Allen BC, Wolfinger RD, Thomas RS (febrero de 2014). "Comparación de microarrays y RNA-seq para análisis de expresión génica de experimentos de dosis-respuesta". Ciencias Toxicológicas . 137 (2): 385–403. doi : 10.1093/toxsci/kft249. PMID  24194394.
  29. ^ Marioni JC, Mason CE, Mane SM, Stephens M, Gilad Y (septiembre de 2008). "RNA-seq: una evaluación de la reproducibilidad técnica y comparación con matrices de expresión génica". Investigación del genoma . 18 (9): 1509–17. doi :10.1101/gr.079558.108. PMC 2527709 . PMID  18550803. 
  30. ^ Consorcio SEQC/MAQC-III (septiembre de 2014). "Una evaluación integral de la precisión, reproducibilidad y contenido de la información de RNA-seq realizada por el Consorcio de Control de Calidad de Secuenciación". Biotecnología de la Naturaleza . 32 (9): 903–14. doi :10.1038/nbt.2957. PMC 4321899 . PMID  25150838. 
  31. ^ Chen JJ, Hsueh HM, Delongchamp RR, Lin CJ, Tsai CA (octubre de 2007). "Reproducibilidad de datos de microarrays: un análisis adicional de los datos de control de calidad de microarrays (MAQC)". Bioinformática BMC . 8 : 412. doi : 10.1186/1471-2105-8-412 . PMC 2204045 . PMID  17961233. 
  32. ^ Larkin JE, Frank BC, Gavras H, Sultana R, Quackenbush J (mayo de 2005). "Independencia y reproducibilidad entre plataformas de microarrays". Métodos de la naturaleza . 2 (5): 337–44. doi : 10.1038/nmeth757. PMID  15846360. S2CID  16088782.
  33. ^ ab Nelson Nueva Jersey (abril de 2001). "Han llegado los microarrays: madura la herramienta de expresión genética". Revista del Instituto Nacional del Cáncer . 93 (7): 492–4. doi :10.1093/jnci/93.7.492. PMID  11287436.
  34. ^ Schena M, Shalon D, Davis RW, Brown PO (octubre de 1995). "Seguimiento cuantitativo de patrones de expresión génica con un microarray de ADN complementario". Ciencia . 270 (5235): 467–70. Código Bib : 1995 Ciencia... 270.. 467S. doi : 10.1126/ciencia.270.5235.467. PMID  7569999. S2CID  6720459.
  35. ^ ab Pozhitkov AE, Tautz D, Noble PA (junio de 2007). "Microarrays de oligonucleótidos: ampliamente aplicados, poco comprendidos". Sesiones informativas sobre genómica y proteómica funcional . 6 (2): 141–8. doi : 10.1093/bfgp/elm014 . hdl : 11858/00-001M-0000-000F-D7B3-3 . PMID  17644526.
  36. ^ abc Heller MJ (2002). "Tecnología de microarrays de ADN: dispositivos, sistemas y aplicaciones". Revista Anual de Ingeniería Biomédica . 4 : 129–53. doi :10.1146/annurev.bioeng.4.020702.153438. PMID  12117754.
  37. ^ McLachlan GJ, Do KA , Ambroise C (2005). Análisis de datos de expresión genética de microarrays . Hoboken: John Wiley e hijos. ISBN 978-0-471-72612-8.[ página necesaria ]
  38. ^ Brenner S, Johnson M, Bridgham J, Golda G, Lloyd DH, Johnson D, Luo S, McCurdy S, Foy M, Ewan M, Roth R, George D, Eletr S, Albrecht G, Vermaas E, Williams SR, Moon K, Burcham T, Pallas M, DuBridge RB, Kirchner J, Fearon K, Mao J, Corcoran K (junio de 2000). "Análisis de expresión génica mediante secuenciación masiva de firmas paralelas (MPSS) en matrices de microperlas". Biotecnología de la Naturaleza . 18 (6): 630–4. doi :10.1038/76469. PMID  10835600. S2CID  13884154.
  39. ^ Meyers BC, Vu TH, Tej SS, Ghazal H, Matvienko M, Agrawal V, Ning J, Haudenschild CD (agosto de 2004). "Análisis de la complejidad transcripcional de Arabidopsis thaliana mediante secuenciación masiva de firmas paralelas". Biotecnología de la Naturaleza . 22 (8): 1006–11. doi :10.1038/nbt992. PMID  15247925. S2CID  15336496.
  40. ^ ab Bainbridge MN, Warren RL, Hirst M, Romanuik T, Zeng T, Go A, Delaney A, Griffith M, Hickenbotham M, Magrini V, Mardis ER, Sadar MD, Siddiqui AS, Marra MA, Jones SJ (septiembre de 2006) . "Análisis del transcriptoma LNCaP de la línea celular de cáncer de próstata mediante un enfoque de secuenciación por síntesis". Genómica BMC . 7 : 246. doi : 10.1186/1471-2164-7-246 . PMC 1592491 . PMID  17010196. 
  41. ^ Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B (julio de 2008). "Mapeo y cuantificación de transcriptomas de mamíferos mediante RNA-Seq". Métodos de la naturaleza . 5 (7): 621–8. doi :10.1038/nmeth.1226. PMID  18516045. S2CID  205418589.
  42. ^ Wilhelm BT, Marguerat S, Watt S, Schubert F, Wood V, Goodhead I, Penkett CJ, Rogers J, Bähler J (junio de 2008). "Repertorio dinámico de un transcriptoma eucariota estudiado con resolución de un solo nucleótido". Naturaleza . 453 (7199): 1239–43. Código Bib : 2008Natur.453.1239W. doi : 10.1038/naturaleza07002. PMID  18488015. S2CID  205213499.
  43. ^ Sultan M, Schulz MH, Richard H, Magen A, Klingenhoff A, Scherf M, Seifert M, Borodina T, Soldatov A, Parkhomchuk D, Schmidt D, O'Keeffe S, Haas S, Vingron M, Lehrach H, Yaspo ML (Agosto de 2008). "Una visión global de la actividad genética y el empalme alternativo mediante secuenciación profunda del transcriptoma humano". Ciencia . 321 (5891): 956–60. Código bibliográfico : 2008 Ciencia... 321..956S. doi : 10.1126/ciencia.1160342. PMID  18599741. S2CID  10013179.
  44. ^ ab Chomczynski P, Sacchi N (abril de 1987). "Método de aislamiento de ARN en un solo paso mediante extracción ácida con tiocianato-fenol-cloroformo de guanidinio". Bioquímica Analítica . 162 (1): 156–9. doi :10.1016/0003-2697(87)90021-2. PMID  2440339.
  45. ^ ab Chomczynski P, Sacchi N (2006). "El método de un solo paso de aislamiento de ARN mediante extracción ácida con tiocianato-fenol-cloroformo de guanidinio: veintitantos años después". Protocolos de la Naturaleza . 1 (2): 581–5. doi :10.1038/nprot.2006.83. PMID  17406285. S2CID  28653075.
  46. ^ Grillo M, Margolis FL (septiembre de 1990). "Uso de la reacción en cadena de la polimerasa con transcriptasa inversa para controlar la expresión de genes sin intrones". BioTécnicas . 9 (3): 262, 264, 266–8. PMID  1699561.
  47. ^ Bryant S, Manning DL (1998). "Aislamiento de ARN mensajero". Protocolos de caracterización y aislamiento de ARN . Métodos en biología molecular. vol. 86, págs. 61–4. doi :10.1385/0-89603-494-1:61. ISBN 978-0-89603-494-5. PMID  9664454.
  48. ^ Zhao W, He X, Hoadley KA, Parker JS, Hayes DN, Perou CM (junio de 2014). "Comparación de RNA-Seq por captura de poli (A), agotamiento de ARN ribosomal y microarrays de ADN para perfiles de expresión". Genómica BMC . 15 (1): 419. doi : 10.1186/1471-2164-15-419 . PMC 4070569 . PMID  24888378. 
  49. ^ Algunos ejemplos de muestras ambientales incluyen: agua de mar, suelo o aire.
  50. ^ Cerrar TJ, Wanamaker SI, Caldo RA, Turner SM, Ashlock DA, Dickerson JA, Wing RA, Muehlbauer GJ, Kleinhofs A, Wise RP (marzo de 2004). "Un nuevo recurso para la genómica de cereales: GeneChip de cebada 22K alcanza la mayoría de edad". Fisiología de las plantas . 134 (3): 960–8. doi : 10.1104/pp.103.034462. PMC 389919 . PMID  15020760. 
  51. ^ abcde Lowe R, Shirley N, Bleackley M, Dolan S, Shafee T (mayo de 2017). "Tecnologías transcriptómicas". PLOS Biología Computacional . 13 (5): e1005457. Código Bib : 2017PLSCB..13E5457L. doi : 10.1371/journal.pcbi.1005457 . PMC 5436640 . PMID  28545146. 
  52. ^ ab Shiraki T, Kondo S, Katayama S, Waki ​​K, Kasukawa T, Kawaji H, Kodzius R, Watahiki A, Nakamura M, Arakawa T, Fukuda S, Sasaki D, Podhajska A, Harbers M, Kawai J, Carninci P, Hayashizaki Y (diciembre de 2003). "Análisis de expresión genética de cap para análisis de alto rendimiento del punto de partida transcripcional e identificación del uso del promotor". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 100 (26): 15776–81. Código bibliográfico : 2003PNAS..10015776S. doi : 10.1073/pnas.2136655100 . PMC 307644 . PMID  14663149. 
  53. ^ Romanov V, Davidoff SN, Miles AR, Grainger DW, Gale BK, Brooks BD (marzo de 2014). "Una comparación crítica de las tecnologías de fabricación de microarrays de proteínas". El Analista . 139 (6): 1303–26. Código bibliográfico : 2014Ana...139.1303R. doi :10.1039/c3an01577g. PMID  24479125.
  54. ^ ab Barbulovic-Nad I, Lucente M, Sun Y, Zhang M, Wheeler AR, Bussmann M (1 de octubre de 2006). "Técnicas de fabricación de biomicroarrays: una revisión". Reseñas críticas en biotecnología . 26 (4): 237–59. CiteSeerX 10.1.1.661.6833 . doi :10.1080/07388550600978358. PMID  17095434. S2CID  13712888. 
  55. ^ Auburn RP, Kreil DP, Meadows LA, Fischer B, Matilla SS, Russell S (julio de 2005). "Detección robótica de microarrays de oligonucleótidos y ADNc". Tendencias en Biotecnología . 23 (7): 374–9. doi :10.1016/j.tibtech.2005.04.002. PMID  15978318.
  56. ^ Shalon D, Smith SJ, Brown PO (julio de 1996). "Un sistema de microarrays de ADN para analizar muestras de ADN complejas mediante hibridación con sonda fluorescente de dos colores". Investigación del genoma . 6 (7): 639–45. doi : 10.1101/gr.6.7.639 . PMID  8796352.
  57. ^ Lockhart DJ, Dong H, Byrne MC, Follettie MT, Gallo MV, Chee MS, Mittmann M, Wang C, Kobayashi M, Horton H, Brown EL (diciembre de 1996). "Monitoreo de expresión mediante hibridación con matrices de oligonucleótidos de alta densidad". Biotecnología de la Naturaleza . 14 (13): 1675–80. doi :10.1038/nbt1296-1675. PMID  9634850. S2CID  35232673.
  58. ^ Irizarry RA, Bolstad BM, Collin F, Cope LM, Hobbs B, Speed ​​TP (febrero de 2003). "Resúmenes de datos a nivel de sonda Affymetrix GeneChip". Investigación de ácidos nucleicos . 31 (4): 15e-15. doi : 10.1093/nar/gng015. PMC 150247 . PMID  12582260. 
  59. ^ Selzer RR, Richmond TA, Pofahl NJ, Green RD, Eis PS, Nair P, Brothman AR, Stallings RL (noviembre de 2005). "Análisis de puntos de ruptura cromosómicos en neuroblastoma con una resolución inferior a kilobase utilizando una matriz de oligonucleótidos CGH de mosaico fino". Genes, cromosomas y cáncer . 44 (3): 305–19. doi :10.1002/gcc.20243. PMID  16075461. S2CID  39437458.
  60. ^ Svensson V, Vento-Tormo R, Teichmann SA (abril de 2018). "Escalado exponencial de secuencias de ARN unicelulares en la última década". Protocolos de la Naturaleza . 13 (4): 599–604. doi :10.1038/nprot.2017.149. PMID  29494575. S2CID  3560001.
  61. ^ Tachibana C (18 de agosto de 2015). "La transcriptómica actual: microarrays, RNA-seq y más". Ciencia . 349 (6247): 544. Bibcode : 2015Sci...349..544T. doi : 10.1126/science.opms.p1500095 .
  62. ^ ab Nagalakshmi U, Wang Z, Waern K, Shou C, Raha D, Gerstein M, Snyder M (junio de 2008). "El panorama transcripcional del genoma de la levadura definido por secuenciación de ARN". Ciencia . 320 (5881): 1344–9. Código bibliográfico : 2008 Ciencia... 320.1344N. doi : 10.1126/ciencia.1158441. PMC 2951732 . PMID  18451266. 
  63. ^ Su Z, Fang H, Hong H, Shi L, Zhang W, Zhang W, Zhang Y, Dong Z, Lancashire LJ, Bessarabova M, Yang X, Ning B, Gong B, Meehan J, Xu J, Ge W, Perkins R, Fischer M, Tong W (diciembre de 2014). "Una investigación de biomarcadores derivados de datos de microarrays heredados para su utilidad en la era RNA-seq". Biología del genoma . 15 (12): 523. doi : 10.1186/s13059-014-0523-y . PMC 4290828 . PMID  25633159. 
  64. ^ Lee JH, Daugharthy ER, Scheiman J, Kalhor R, Yang JL, Ferrante TC, Terry R, ​​Jeanty SS, Li C, Amamoto R, Peters DT, Turczyk BM, Marblestone AH, Inverso SA, Bernard A, Mali P, Rios X, Aach J, Church GM (marzo de 2014). "Secuenciación in situ de ARN subcelular altamente multiplexado". Ciencia . 343 (6177): 1360–3. Código Bib : 2014 Ciencia... 343.1360L. doi : 10.1126/ciencia.1250212. PMC 4140943 . PMID  24578530. 
  65. ^ ab Shendure J, Ji H (octubre de 2008). "Secuenciación de ADN de próxima generación". Biotecnología de la Naturaleza . 26 (10): 1135–45. doi :10.1038/nbt1486. PMID  18846087. S2CID  6384349.
  66. ^ Lahens NF, Kavakli IH, Zhang R, Hayer K, Black MB, Dueck H, Pizarro A, Kim J, Irizarry R, ​​Thomas RS, Grant GR, Hogenesch JB (junio de 2014). "IVT-seq revela un sesgo extremo en la secuenciación de ARN". Biología del genoma . 15 (6): R86. doi : 10.1186/gb-2014-15-6-r86 . PMC 4197826 . PMID  24981968. 
  67. ^ ab Knierim E, Lucke B, Schwarz JM, Schuelke M, Seelow D (2011). "Comparación sistemática de tres métodos de fragmentación de productos de PCR de largo alcance para secuenciación de próxima generación". MÁS UNO . 6 (11): e28240. Código Bib : 2011PLoSO...628240K. doi : 10.1371/journal.pone.0028240 . PMC 3227650 . PMID  22140562. 
  68. ^ Routh A, Head SR, Ordoukhanian P, Johnson JE (agosto de 2015). "ClickSeq: secuenciación de próxima generación sin fragmentación mediante ligadura por clic de adaptadores a ADNc 3'-Azido terminados estocásticamente". Revista de biología molecular . 427 (16): 2610–6. doi :10.1016/j.jmb.2015.06.011. PMC 4523409 . PMID  26116762. 
  69. ^ Parekh S, Ziegenhain C, Vieth B, Enard W, Hellmann I (mayo de 2016). "El impacto de la amplificación en los análisis de expresión diferencial por RNA-seq". Informes científicos . 6 : 25533. Código Bib : 2016NatSR...625533P. doi :10.1038/srep25533. PMC 4860583 . PMID  27156886. 
  70. ^ Shanker S, Paulson A, Edenberg HJ, Peak A, Perera A, Alekseyev YO, Beckloff N, Bivens NJ, Donnelly R, Gillaspy AF, Grove D, Gu W, Jafari N, Kerley-Hamilton JS, Lyons RH, Tepper C , Nicolet CM (abril de 2015). "Evaluación de kits de amplificación de ARN disponibles comercialmente para la secuenciación de ARN utilizando cantidades de entrada muy bajas de ARN total". Revista de Técnicas Biomoleculares . 26 (1): 4-18. doi :10.7171/jbt.15-2601-001. PMC 4310221 . PMID  25649271. 
  71. ^ Jiang L, Schlesinger F, Davis CA, Zhang Y, Li R, Salit M, Gingeras TR, Oliver B (septiembre de 2011). "Estándares de aumento sintético para experimentos de RNA-seq". Investigación del genoma . 21 (9): 1543–51. doi :10.1101/gr.121095.111. PMC 3166838 . PMID  21816910. 
  72. ^ Kivioja T, Vähärautio A, Karlsson K, Bonke M, Enge M, Linnarsson S, Taipale J (noviembre de 2011). "Contar números absolutos de moléculas utilizando identificadores moleculares únicos". Métodos de la naturaleza . 9 (1): 72–4. doi :10.1038/nmeth.1778. PMID  22101854. S2CID  39225091.
  73. ^ Tang F, Barbacioru C, Wang Y, Nordman E, Lee C, Xu N, Wang X, Bodeau J, Tuch BB, Siddiqui A, Lao K, Surani MA (mayo de 2009). "Análisis del transcriptoma completo de mRNA-Seq de una sola célula". Métodos de la naturaleza . 6 (5): 377–82. doi :10.1038/nmeth.1315. PMID  19349980. S2CID  16570747.
  74. ^ Islam S, Zeisel A, Joost S, La Manno G, Zajac P, Kasper M, Lönnerberg P, Linnarsson S (febrero de 2014). "Secuencia de ARN unicelular cuantitativa con identificadores moleculares únicos". Métodos de la naturaleza . 11 (2): 163–6. doi :10.1038/nmeth.2772. PMID  24363023. S2CID  6765530.
  75. ^ Jaitin DA, Kenigsberg E, Keren-Shaul H, Elefant N, Paul F, Zaretsky I, Mildner A, Cohen N, Jung S, Tanay A, Amit I (febrero de 2014). "Secuencia de ARN unicelular masivamente paralela para la descomposición de tejidos sin marcadores en tipos de células". Ciencia . 343 (6172): 776–9. Código Bib : 2014 Ciencia... 343..776J. doi : 10.1126/ciencia.1247651. PMC 4412462 . PMID  24531970. 
  76. ^ ab Levin JZ, Yassour M, Adiconis X, Nusbaum C, Thompson DA, Friedman N, Gnirke A, Regev A (septiembre de 2010). "Análisis comparativo completo de métodos de secuenciación de ARN de cadena específica". Métodos de la naturaleza . 7 (9): 709–15. doi :10.1038/nmeth.1491. PMC 3005310 . PMID  20711195. 
  77. ^ Quail MA, Smith M, Coupland P, Otto TD, Harris SR, Connor TR, Bertoni A, Swerdlow HP, Gu Y (julio de 2012). "Una historia de tres plataformas de secuenciación de próxima generación: comparación de los secuenciadores Ion Torrent, Pacific Biosciences e Illumina MiSeq". Genómica BMC . 13 : 341. doi : 10.1186/1471-2164-13-341 . PMC 3431227 . PMID  22827831. 
  78. ^ ab Liu L, Li Y, Li S, Hu N, He Y, Pong R, Lin D, Lu L, Law M (2012). "Comparación de sistemas de secuenciación de próxima generación". Revista de Biomedicina y Biotecnología . 2012 : 251364. doi : 10.1155/2012/251364 . PMC 3398667 . PMID  22829749. 
  79. ^ "SRA" . Consultado el 6 de octubre de 2016 .Se buscó en el archivo de lectura de secuencias (SRA) del NCBI utilizando “RNA-Seq[Strategy]” y uno de “LS454[Platform]”, “Illumina[platform]”, “ABI Solid[Platform]”, “Ion Torrent[Platform] ”, "PacBio SMRT"[Plataforma]” para informar el número de ejecuciones de RNA-Seq depositadas para cada plataforma.
  80. ^ Loman NJ, Misra RV, Dallman TJ, Constantinidou C, Gharbia SE, Wain J, Pallen MJ (mayo de 2012). "Comparación de rendimiento de plataformas de secuenciación de alto rendimiento de sobremesa". Biotecnología de la Naturaleza . 30 (5): 434–9. doi :10.1038/nbt.2198. PMID  22522955. S2CID  5300923.
  81. ^ Goodwin S, McPherson JD, McCombie WR (mayo de 2016). "Mayoría de edad: diez años de tecnologías de secuenciación de próxima generación". Naturaleza Reseñas Genética . 17 (6): 333–51. doi :10.1038/nrg.2016.49. PMC 10373632 . PMID  27184599. S2CID  8295541. 
  82. ^ Garalde DR, Snell EA, Jachimowicz D, Sipos B, Lloyd JH, Bruce M, Pantic N, Admassu T, James P, Warland A, Jordan M, Ciccone J, Serra S, Keenan J, Martin S, McNeill L, Wallace EJ, Jayasinghe L, Wright C, Blasco J, Young S, Brocklebank D, Juul S, Clarke J, Heron AJ, Turner DJ (marzo de 2018). "Secuenciación directa de ARN altamente paralela en una serie de nanoporos". Métodos de la naturaleza . 15 (3): 201–206. doi :10.1038/nmeth.4577. PMID  29334379. S2CID  3589823.
  83. ^ Loman Nueva Jersey, Quick J, Simpson JT (agosto de 2015). "Un genoma bacteriano completo ensamblado de novo utilizando únicamente datos de secuenciación de nanoporos". Métodos de la naturaleza . 12 (8): 733–5. doi :10.1038/nmeth.3444. PMID  26076426. S2CID  15053702.
  84. ^ Ozsolak F, Platt AR, Jones DR, Reifenberger JG, Sass LE, McInerney P, Thompson JF, Bowers J, Jarosz M, Milos PM (octubre de 2009). "Secuenciación directa de ARN". Naturaleza . 461 (7265): 814–8. Código Bib :2009Natur.461..814O. doi : 10.1038/naturaleza08390. PMID  19776739. S2CID  4426760.
  85. ^ ab Hart SN, Therneau TM, Zhang Y, Polonia GA, Kocher JP (diciembre de 2013). "Cálculo de estimaciones del tamaño de muestra para datos de secuenciación de ARN". Revista de biología computacional . 20 (12): 970–8. doi :10.1089/cmb.2012.0283. PMC 3842884 . PMID  23961961. 
  86. ^ abc Conesa A, Madrigal P, Tarazona S, Gomez-Cabrero D, Cervera A, McPherson A, Szcześniak MW, Gaffney DJ, Elo LL, Zhang X, Mortazavi A (enero de 2016). "Una encuesta de mejores prácticas para el análisis de datos de RNA-seq". Biología del genoma . 17 : 13. doi : 10.1186/s13059-016-0881-8 . PMC 4728800 . PMID  26813401. 
  87. ^ ab Rapaport F, Khanin R, Liang Y, Pirun M, Krek A, Zumbo P, Mason CE, Socci ND, Betel D (2013). "Evaluación integral de métodos de análisis de expresión génica diferencial para datos de RNA-seq". Biología del genoma . 14 (9): R95. doi : 10.1186/gb-2013-14-9-r95 . PMC 4054597 . PMID  24020486. 
  88. ^ Consorcio del Proyecto ENCODE; Aldred, Shelley F.; Collins, Patrick J.; Davis, Carrie A.; Doyle, Francisco; Epstein, Charles B.; Frietze, Seth; Grada, Jennifer; Kaul, Rajinder; Jatun, Jainab; Lajoie, Bryan R.; Landt, Stephen G.; Lee, Bum Kyu; Pauli, Florencia; Rosenbloom, Kate R.; Sabo, Pedro; Safí, Alexias; Sanyal, Amartya; Shoresh, Noam; Simón, Jeremy M.; Canción, Lingyun; Altshuler, Robert C.; Birney, Ewan; Marrón, James B.; Cheng, Chao; Djebali, Sarah; Dong, Xianjun; Dunham, Ian; Ernst, Jason; et al. (Septiembre 2012). "Una enciclopedia integrada de elementos del ADN en el genoma humano". Naturaleza . 489 (7414): 57–74. Código Bib :2012Natur.489...57T. doi : 10.1038/naturaleza11247. PMC 3439153 . PMID  22955616. 
  89. ^ Sloan CA, Chan ET, Davidson JM, Malladi VS, Strattan JS, Hitz BC y otros. (Enero de 2016). "Datos ENCODE en el portal ENCODE". Investigación de ácidos nucleicos . 44 (D1): D726–32. doi : 10.1093/nar/gkv1160. PMC 4702836 . PMID  26527727. 
  90. ^ "ENCODE: Enciclopedia de elementos del ADN". encodeproject.org .
  91. ^ ab Thind AS, Monga I, Thakur PK, Kumari P, Dindhoria K, Krzak M, Ranson M, Ashford B (noviembre de 2021). "Desmitificar las aplicaciones emergentes de RNA-Seq a granel: la aplicación y utilidad de la metodología bioinformática". Sesiones informativas en Bioinformática . 22 (6). doi :10.1093/bib/bbab259. PMID  34329375.
  92. ^ ab Ritchie ME, Phipson B, Wu D, Hu Y, Law CW, Shi W, Smyth GK (abril de 2015). "limma potencia los análisis de expresión diferencial para estudios de microarrays y secuenciación de ARN". Investigación de ácidos nucleicos . 43 (7): e47. doi :10.1093/nar/gkv007. PMC 4402510 . PMID  25605792. 
  93. ^ ab Robinson MD, McCarthy DJ, Smyth GK (enero de 2010). "edgeR: un paquete de bioconductores para análisis de expresión diferencial de datos de expresión génica digital". Bioinformática . 26 (1): 139–40. doi : 10.1093/bioinformática/btp616. PMC 2796818 . PMID  19910308. 
  94. ^ ab Huber W, Carey VJ, Gentleman R, Anders S, Carlson M, Carvalho BS, et al. (febrero de 2015). "Orquestación de análisis genómico de alto rendimiento con Bioconductor". Métodos de la naturaleza . 12 (2): 115–21. doi :10.1038/nmeth.3252. PMC 4509590 . PMID  25633503. 
  95. ^ Smyth, GK (2005). "Limma: modelos lineales para datos de microarrays". Soluciones de bioinformática y biología computacional utilizando R y bioconductor . Estadística para Biología y Salud. Springer, Nueva York, Nueva York. págs. 397–420. CiteSeerX 10.1.1.361.8519 . doi :10.1007/0-387-29362-0_23. ISBN  9780387251462.
  96. ^ Steve, Russell (2008). Tecnología de microarrays en la práctica . Meadows, Lisa A. Burlington: Elsevier. ISBN 9780080919768. OCLC  437246554.
  97. ^ ab Haas BJ, Papanicolaou A, Yassour M, Grabherr M, Blood PD, Bowden J, Couger MB, Eccles D, Li B, Lieber M, MacManes MD, Ott M, Orvis J, Pochet N, Strozzi F, Weeks N, Westerman R, William T, Dewey CN, Henschel R, LeDuc RD, Friedman N, Regev A (agosto de 2013). "Reconstrucción de secuencia de transcripción de novo a partir de RNA-seq utilizando la plataforma Trinity para generación y análisis de referencia". Protocolos de la Naturaleza . 8 (8): 1494–512. doi :10.1038/nprot.2013.084. PMC 3875132 . PMID  23845962. 
  98. ^ ab Pertea M, Pertea GM, Antonescu CM, Chang TC, Mendell JT, Salzberg SL (marzo de 2015). "StringTie permite una reconstrucción mejorada de un transcriptoma a partir de lecturas de RNA-seq". Biotecnología de la Naturaleza . 33 (3): 290–5. doi :10.1038/nbt.3122. PMC 4643835 . PMID  25690850. 
  99. ^ Kodama Y, Shumway M, Leinonen R (enero de 2012). "The Sequence Read Archive: crecimiento explosivo de datos de secuenciación". Investigación de ácidos nucleicos . 40 (Problema de la base de datos): D54–6. doi : 10.1093/nar/gkr854. PMC 3245110 . PMID  22009675. 
  100. ^ ab Edgar R, Domrachev M, Lash AE (enero de 2002). "Gene Expression Omnibus: repositorio de datos de matriz de hibridación y expresión genética de NCBI". Investigación de ácidos nucleicos . 30 (1): 207–10. doi :10.1093/nar/30.1.207. PMC 99122 . PMID  11752295. 
  101. ^ Petrov A, Shams S (1 de noviembre de 2004). "Procesamiento de imágenes de microarrays y control de calidad". Revista de sistemas de procesamiento de señales VLSI para tecnología de señal, imagen y vídeo . 38 (3): 211–226. doi :10.1023/B:VLSI.0000042488.08307.ad. S2CID  31598448.
  102. ^ Petrov A, Shams S (2004). "Procesamiento de imágenes de microarrays y control de calidad". La revista de sistemas de procesamiento de señales VLSI para tecnología de señales, imágenes y video . 38 (3): 211–226. doi :10.1023/B:VLSI.0000042488.08307.ad. S2CID  31598448.
  103. ^ Kwon YM, Ricke S (2011). Secuenciación de próxima generación de alto rendimiento . Métodos en biología molecular. vol. 733. Enlace Springer. doi :10.1007/978-1-61779-089-8. ISBN 978-1-61779-088-1. S2CID  3684245.
  104. ^ Nakamura K, Oshima T, Morimoto T, Ikeda S, Yoshikawa H, Shiwa Y, Ishikawa S, Linak MC, Hirai A, Takahashi H, Altaf-Ul-Amin M, Ogasawara N, Kanaya S (julio de 2011). "Perfil de error específico de secuencia de secuenciadores Illumina". Investigación de ácidos nucleicos . 39 (13): e90. doi : 10.1093/nar/gkr344. PMC 3141275 . PMID  21576222. 
  105. ^ Van Verk MC, Hickman R, Pieterse CM, Van Wees SC (abril de 2013). "RNA-Seq: revelación de los mensajeros". Tendencias en ciencia vegetal . 18 (4): 175–9. doi :10.1016/j.tplants.2013.02.001. hdl : 1874/309456 . PMID  23481128. S2CID  205453732.
  106. ^ Andrews S (2010). "FastQC: una herramienta de control de calidad para datos de secuencia de alto rendimiento". Bioinformática de Babraham . Consultado el 23 de mayo de 2017 .
  107. ^ Lo CC, Cadena PS (noviembre de 2014). "Evaluación rápida y control de calidad de datos de secuenciación de próxima generación con FaQC". Bioinformática BMC . 15 (1): 366. doi : 10.1186/s12859-014-0366-2 . PMC 4246454 . PMID  25408143. 
  108. ^ abc Trapnell C, Hendrickson DG, Sauvageau M, Goff L, Rinn JL, Pachter L (enero de 2013). "Análisis diferencial de la regulación genética en la resolución de la transcripción con RNA-seq". Biotecnología de la Naturaleza . 31 (1): 46–53. doi :10.1038/nbt.2450. PMC 3869392 . PMID  23222703. 
  109. ^ ab Xie Y, Wu G, Tang J, Luo R, Patterson J, Liu S, Huang W, He G, Gu S, Li S, Zhou X, Lam TW, Li Y, Xu X, Wong GK, Wang J ( junio de 2014). "SOAPdenovo-Trans: ensamblaje de transcriptoma de novo con lecturas cortas de RNA-Seq". Bioinformática . 30 (12): 1660–6. arXiv : 1305.6760 . doi : 10.1093/bioinformática/btu077. PMID  24532719. S2CID  5152689.
  110. ^ Siadjeu, cristiano; Mayland-Quellhorst, Eike; Pande, Shruti; Laubinger, Sascha; Albach, Dirk C. (2021). "La secuencia del transcriptoma revela genes candidatos implicados en el endurecimiento poscosecha del ñame trifoliado Dioscorea dumetorum". Plantas . 10 (4): 787. doi : 10.3390/plantas10040787 . PMC 8074181 . PMID  33923758. 
  111. ^ Mapeadores HTS. http://www.ebi.ac.uk/~nf/hts_mappers/
  112. ^ Fonseca NA, Rung J, Brazma A, Marioni JC (diciembre de 2012). "Herramientas para mapear datos de secuenciación de alto rendimiento". Bioinformática . 28 (24): 3169–77. doi : 10.1093/bioinformática/bts605 . PMID  23060614.
  113. ^ Trapnell C, Pachter L, Salzberg SL (mayo de 2009). "TopHat: descubriendo uniones de empalme con RNA-Seq". Bioinformática . 25 (9): 1105–11. doi : 10.1093/bioinformática/btp120. PMC 2672628 . PMID  19289445. 
  114. ^ ab Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G, van Baren MJ, Salzberg SL, Wold BJ, Pachter L (mayo de 2010). "El ensamblaje de transcripciones y la cuantificación mediante RNA-Seq revela transcripciones sin anotaciones y cambio de isoformas durante la diferenciación celular". Biotecnología de la Naturaleza . 28 (5): 511–5. doi :10.1038/nbt.1621. PMC 3146043 . PMID  20436464. 
  115. ^ Miller JR, Koren S, Sutton G (junio de 2010). "Algoritmos de ensamblaje para datos de secuenciación de próxima generación". Genómica . 95 (6): 315–27. doi :10.1016/j.ygeno.2010.03.001. PMC 2874646 . PMID  20211242. 
  116. ^ O'Neil ST, Emrich SJ (julio de 2013). "Evaluación de las métricas de ensamblaje del transcriptoma De Novo para determinar su coherencia y utilidad". Genómica BMC . 14 : 465. doi : 10.1186/1471-2164-14-465 . PMC 3733778 . PMID  23837739. 
  117. ^ Smith-Unna R, Boursnell C, Patro R, Hibberd JM, Kelly S (agosto de 2016). "TransRate: evaluación de calidad sin referencias de conjuntos de transcriptomas de novo". Investigación del genoma . 26 (8): 1134–44. doi :10.1101/gr.196469.115. PMC 4971766 . PMID  27252236. 
  118. ^ Li B, Fillmore N, Bai Y, Collins M, Thomson JA, Stewart R, Dewey CN (diciembre de 2014). "Evaluación de conjuntos de transcriptomas de novo a partir de datos de RNA-Seq". Biología del genoma . 15 (12): 553. doi : 10.1186/s13059-014-0553-5 . PMC 4298084 . PMID  25608678. 
  119. ^ Zerbino DR, Birney E (mayo de 2008). "Velvet: algoritmos para el ensamblaje de lectura corta de novo utilizando gráficos de Bruijn". Investigación del genoma . 18 (5): 821–9. doi :10.1101/gr.074492.107. PMC 2336801 . PMID  18349386. 
  120. ^ Schulz MH, Zerbino DR, Vingron M, Birney E (abril de 2012). "Oases: ensamblaje robusto de RNA-seq de novo en todo el rango dinámico de niveles de expresión". Bioinformática . 28 (8): 1086–92. doi : 10.1093/bioinformática/bts094. PMC 3324515 . PMID  22368243. 
  121. ^ Robertson G, Schein J, Chiu R, Corbett R, Field M, Jackman SD y col. (noviembre de 2010). "Ensamblaje y análisis de novo de datos de RNA-seq". Métodos de la naturaleza . 7 (11): 909–12. doi :10.1038/nmeth.1517. hdl : 1885/51040 . PMID  20935650. S2CID  1034682.
  122. ^ ab Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, Amit I, Adiconis X, Fan L, Raychowdhury R, ​​Zeng Q, Chen Z, Mauceli E, Hacohen N, Gnirke A, Rhind N, di Palma F , Birren BW, Nusbaum C, Lindblad-Toh K, Friedman N, Regev A (mayo de 2011). "Ensamblaje del transcriptoma completo a partir de datos de RNA-Seq sin un genoma de referencia". Biotecnología de la Naturaleza . 29 (7): 644–52. doi :10.1038/nbt.1883. PMC 3571712 . PMID  21572440. 
  123. ^ Chevreux B, Pfisterer T, Drescher B, Driesel AJ, Müller WE, Wetter T, Suhai S (junio de 2004). "Uso del ensamblador miraEST para el ensamblaje confiable y automatizado de transcripciones de ARNm y la detección de SNP en EST secuenciadas". Investigación del genoma . 14 (6): 1147–59. doi :10.1101/gr.1917404. PMC 419793 . PMID  15140833. 
  124. ^ Margulies M, Egholm M, Altman WE, Attiya S, Bader JS, Bemben LA, et al. (Septiembre de 2005). "Secuenciación del genoma en reactores de picolitros de alta densidad microfabricados". Naturaleza . 437 (7057): 376–80. Código Bib :2005Natur.437..376M. doi : 10.1038/naturaleza03959. PMC 1464427 . PMID  16056220. 
  125. ^ Kumar S, Blaxter ML (octubre de 2010). "Comparación de ensambladores de novo para datos de transcriptomas 454". Genómica BMC . 11 : 571. doi : 10.1186/1471-2164-11-571 . PMC 3091720 . PMID  20950480. 
  126. ^ Bankevich A, Nurk S, Antipov D, Gurevich AA, Dvorkin M, Kulikov AS, Lesin VM, Nikolenko SI, Pham S, Prjibelski AD, Pyshkin AV, Sirotkin AV, Vyahhi N, Tesler G, Alekseyev MA, Pevzner PA (mayo 2012). "SPAdes: un nuevo algoritmo de ensamblaje del genoma y sus aplicaciones a la secuenciación unicelular". Revista de biología computacional . 19 (5): 455–77. doi :10.1089/cmb.2012.0021. PMC 3342519 . PMID  22506599. 
  127. ^ Li B, Dewey CN (agosto de 2011). "RSEM: cuantificación precisa de la transcripción a partir de datos de RNA-Seq con o sin genoma de referencia". Bioinformática BMC . 12 : 323. doi : 10.1186/1471-2105-12-323 . PMC 3163565 . PMID  21816040. 
  128. ^ Kovaka, Sam; Zimin, Aleksey V.; Pertea, Geo M.; Razaghi, Roham; Salzberg, Steven L.; Pertea, Mihaela (8 de julio de 2019). "Ensamblaje del transcriptoma a partir de alineamientos de RNA-seq de lectura larga con StringTie2". bioRxiv : 694554. doi : 10.1101/694554 . Consultado el 27 de agosto de 2019 .
  129. ^ Gehlenborg N, O'Donoghue SI, Baliga NS, Goesmann A, Hibbs MA, Kitano H, Kohlbacher O, Neuweger H, Schneider R, Tenenbaum D, Gavin AC (marzo de 2010). "Visualización de datos ómicos para biología de sistemas". Métodos de la naturaleza . 7 (3 suplementos): S56–68. doi :10.1038/nmeth.1436. PMID  20195258. S2CID  205419270.
  130. ^ Anders S, Pyl PT, Huber W (enero de 2015). "HTSeq: un marco de Python para trabajar con datos de secuenciación de alto rendimiento". Bioinformática . 31 (2): 166–9. doi : 10.1093/bioinformática/btu638. PMC 4287950 . PMID  25260700. 
  131. ^ Bray NL, Pimentel H, Melsted P, Pachter L (mayo de 2016). "Cuantificación probabilística casi óptima de RNA-seq". Biotecnología de la Naturaleza . 34 (5): 525–7. doi :10.1038/nbt.3519. PMID  27043002. S2CID  205282743.
  132. ^ Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R (agosto de 2009). "El formato de mapa / alineación de secuencia y SAMtools". Bioinformática . 25 (16): 2078–9. doi : 10.1093/bioinformática/btp352. PMC 2723002 . PMID  19505943. 
  133. ^ Con amor MI, Huber W, Anders S (2014). "Estimación moderada del cambio y la dispersión de los datos de RNA-seq con DESeq2". Biología del genoma . 15 (12): 550. doi : 10.1186/s13059-014-0550-8 . PMC 4302049 . PMID  25516281. 
  134. ^ Frazee AC, Pertea G, Jaffe AE, Langmead B, Salzberg SL, Leek JT (marzo de 2015). "Ballgown cierra la brecha entre el ensamblaje del transcriptoma y el análisis de expresión". Biotecnología de la Naturaleza . 33 (3): 243–6. doi :10.1038/nbt.3172. PMC 4792117 . PMID  25748911. 
  135. ^ Fang Z, Cui X (mayo de 2011). "Problemas de diseño y validación en experimentos de RNA-seq". Sesiones informativas en Bioinformática . 12 (3): 280–7. doi : 10.1093/bib/bbr004 . PMID  21498551.
  136. ^ Ramsköld D, Wang ET, Burge CB, Sandberg R (diciembre de 2009). "Una abundancia de genes expresados ​​de forma ubicua revelados por datos de secuencia del transcriptoma tisular". PLOS Biología Computacional . 5 (12): e1000598. Código Bib : 2009PLSCB...5E0598R. doi : 10.1371/journal.pcbi.1000598 . PMC 2781110 . PMID  20011106. 
  137. ^ Vandesompele J, De Preter K, Pattyn F, Poppe B, Van Roy N, De Paepe A, Speleman F (junio de 2002). "Normalización precisa de datos cuantitativos de RT-PCR en tiempo real mediante un promedio geométrico de múltiples genes de control interno". Biología del genoma . 3 (7): INVESTIGACIÓN0034. doi : 10.1186/gb-2002-3-7-research0034 . PMC 126239 . PMID  12184808. 
  138. ^ Core LJ, Waterfall JJ, Lis JT (diciembre de 2008). "La secuenciación de ARN naciente revela pausas generalizadas e iniciación divergente en promotores humanos". Ciencia . 322 (5909): 1845–8. Código Bib : 2008 Ciencia... 322.1845C. doi : 10.1126/ciencia.1162228. PMC 2833333 . PMID  19056941. 
  139. ^ Camarena L, Bruno V, Euskirchen G, Poggio S, Snyder M (abril de 2010). "Mecanismos moleculares de patogénesis inducida por etanol revelados por secuenciación de ARN". Más patógenos . 6 (4): e1000834. doi : 10.1371/journal.ppat.1000834 . PMC 2848557 . PMID  20368969. 
  140. ^ ab Govind G, Harshavardhan VT, ThammeGowda HV, Patricia JK, Kalaiarasi PJ, Dhanalakshmi R, Iyer DR, Senthil Kumar M, Muthappa SK, Sreenivasulu N, Nese S, Udayakumar M, Makarla UK (junio de 2009). "Identificación y validación funcional de un conjunto único de genes inducidos por sequía expresados ​​​​preferentemente en respuesta al estrés hídrico gradual en maní". Genética y Genómica Molecular . 281 (6): 591–605. doi :10.1007/s00438-009-0432-z. PMC 2757612 . PMID  19224247. 
  141. ^ Tavassoly, Imán; Goldfarb, José; Iyengar, Ravi (4 de octubre de 2018). "Introducción a la biología de sistemas: los métodos y enfoques básicos". Ensayos de Bioquímica . 62 (4): 487–500. doi :10.1042/EBC20180003. ISSN  0071-1365. PMID  30287586. S2CID  52922135.
  142. ^ Costa V, Aprile M, Esposito R, Ciccodicola A (febrero de 2013). "RNA-Seq y enfermedades humanas complejas: logros recientes y perspectivas de futuro". Revista europea de genética humana . 21 (2): 134–42. doi :10.1038/ejhg.2012.129. PMC 3548270 . PMID  22739340. 
  143. ^ Khurana E, Fu Y, Chakravarty D, Demichelis F, Rubin MA, Gerstein M (febrero de 2016). "Papel de las variantes de secuencias no codificantes en el cáncer". Naturaleza Reseñas Genética . 17 (2): 93-108. doi :10.1038/nrg.2015.17. PMID  26781813. S2CID  14433306.
  144. ^ Slotkin RK, Martienssen R (abril de 2007). "Elementos transponibles y regulación epigenética del genoma". Naturaleza Reseñas Genética . 8 (4): 272–85. doi :10.1038/nrg2072. PMID  17363976. S2CID  9719784.
  145. ^ Proserpio V, Mahata B (febrero de 2016). "Tecnologías unicelulares para estudiar el sistema inmunológico". Inmunología . 147 (2): 133–40. doi : 10.1111/imm.12553. PMC 4717243 . PMID  26551575. 
  146. ^ ab Byron SA, Van Keuren-Jensen KR, Engelthaler DM, Carpten JD, Craig DW (mayo de 2016). "Traducir la secuenciación de ARN al diagnóstico clínico: oportunidades y desafíos". Naturaleza Reseñas Genética . 17 (5): 257–71. doi :10.1038/nrg.2016.10. PMC 7097555 . PMID  26996076. 
  147. ^ Wu HJ, Wang AH, diputado de Jennings (febrero de 2008). "Descubrimiento de factores de virulencia de bacterias patógenas" (PDF) . Opinión actual en biología química . 12 (1): 93-101. doi :10.1016/j.cbpa.2008.01.023. PMID  18284925.
  148. ^ Suzuki S, Horinouchi T, Furusawa C (diciembre de 2014). "Predicción de la resistencia a los antibióticos mediante perfiles de expresión génica". Comunicaciones de la naturaleza . 5 : 5792. Código Bib : 2014NatCo...5.5792S. doi : 10.1038/ncomms6792. PMC 4351646 . PMID  25517437. 
  149. ^ Westermann AJ, Gorski SA, Vogel J (septiembre de 2012). "Secuencia de ARN dual de patógeno y huésped" (PDF) . Reseñas de la naturaleza. Microbiología . 10 (9): 618–30. doi :10.1038/nrmicro2852. PMID  22890146. S2CID  205498287.
  150. ^ Durmuş S, Çakır T, Özgür A, Guthke R (2015). "Una revisión sobre la biología de sistemas computacionales de las interacciones patógeno-huésped". Fronteras en Microbiología . 6 : 235. doi : 10.3389/fmicb.2015.00235 . PMC 4391036 . PMID  25914674. 
  151. ^ ab Garg R, Shankar R, Thakkar B, Kudapa H, Krishnamurthy L, Mantri N, Varshney RK, Bhatia S, Jain M (enero de 2016). "Los análisis del transcriptoma revelan respuestas moleculares específicas del genotipo y de la etapa de desarrollo a las tensiones por sequía y salinidad en los garbanzos". Informes científicos . 6 : 19228. Código Bib : 2016NatSR...619228G. doi :10.1038/srep19228. PMC 4725360 . PMID  26759178. 
  152. ^ García-Sánchez S, Aubert S, Iraqui I, Janbon G, Ghigo JM, d'Enfert C (abril de 2004). "Biopelículas de Candida albicans: un estado de desarrollo asociado con patrones de expresión genética específicos y estables". Célula eucariota . 3 (2): 536–45. doi :10.1128/EC.3.2.536-545.2004. PMC 387656 . PMID  15075282. 
  153. ^ Rich SM, Leendertz FH, Xu G, LeBreton M, Djoko CF, Aminake MN, Takang EE, Diffo JL, Pike BL, Rosenthal BM, Formenty P, Boesch C, Ayala FJ, Wolfe ND (septiembre de 2009). "El origen de la malaria maligna". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 106 (35): 14902–7. Código Bib : 2009PNAS..10614902R. doi : 10.1073/pnas.0907740106 . PMC 2720412 . PMID  19666593. 
  154. ^ Mok S, Ashley EA, Ferreira PE, Zhu L, Lin Z, Yeo T, et al. (Enero de 2015). "Resistencia a los medicamentos. La transcriptómica poblacional de los parásitos de la malaria humana revela el mecanismo de resistencia a la artemisinina". Ciencia . 347 (6220): 431–5. Código Bib : 2015 Ciencia... 347.. 431M. doi : 10.1126/ciencia.1260403. PMC 5642863 . PMID  25502316. 
  155. ^ Página abcd, Tessa M.; Lawley, Jonathan W. (2022). "La próxima generación está aquí: una revisión de los enfoques transcriptómicos en ecología marina". Fronteras en las ciencias marinas . 9 . doi : 10.3389/fmars.2022.757921 . hdl : 10072/428702 . ISSN  2296-7745.
  156. ^ Verbruggen N, Hermans C, Schat H (marzo de 2009). "Mecanismos moleculares de hiperacumulación de metales en plantas" (PDF) . El nuevo fitólogo . 181 (4): 759–76. doi :10.1111/j.1469-8137.2008.02748.x. PMID  19192189.
  157. ^ Li Z, Zhang Z, Yan P, Huang S, Fei Z, Lin K (noviembre de 2011). "RNA-Seq mejora la anotación de genes codificadores de proteínas en el genoma del pepino". Genómica BMC . 12 : 540. doi : 10.1186/1471-2164-12-540 . PMC 3219749 . PMID  22047402. 
  158. ^ Hobbs M, Pavasovic A, King AG, Prentis PJ, Eldridge MD, Chen Z, Colgan DJ, Polkinghorne A, Wilkins MR, Flanagan C, Gillett A, Hanger J, Johnson RN, Timms P (septiembre de 2014). "Un recurso de transcriptoma para el koala (Phascolarctos cinereus): conocimientos sobre la transcripción y la diversidad de secuencias del retrovirus del koala". Genómica BMC . 15 (1): 786. doi : 10.1186/1471-2164-15-786 . PMC 4247155 . PMID  25214207. 
  159. ^ Howe GT, Yu J, Knaus B, Cronn R, Kolpak S, Dolan P, Lorenz WW, ​​Dean JF (febrero de 2013). "Un recurso de SNP para abeto de Douglas: ensamblaje de transcriptoma de novo y detección y validación de SNP". Genómica BMC . 14 : 137. doi : 10.1186/1471-2164-14-137 . PMC 3673906 . PMID  23445355. 
  160. ^ McGrath LL, Vollmer SV, Kaluziak ST, Ayers J (enero de 2016). "Ensamblaje del transcriptoma de novo para la langosta Homarus americanus y caracterización de la expresión genética diferencial en los tejidos del sistema nervioso". Genómica BMC . 17 : 63. doi : 10.1186/s12864-016-2373-3 . PMC 4715275 . PMID  26772543. 
  161. ^ Noller HF (1991). "ARN ribosómico y traducción". Revista Anual de Bioquímica . 60 : 191–227. doi : 10.1146/annurev.bi.60.070191.001203. PMID  1883196.
  162. ^ Christov CP, Gardiner TJ, Szüts D, Krude T (septiembre de 2006). "Requisito funcional de los ARN Y no codificantes para la replicación del ADN cromosómico humano". Biología Molecular y Celular . 26 (18): 6993–7004. doi :10.1128/MCB.01060-06. PMC 1592862 . PMID  16943439. 
  163. ^ Kishore S, Stamm S (enero de 2006). "El snoRNA HBII-52 regula el empalme alternativo del receptor de serotonina 2C". Ciencia . 311 (5758): 230–2. Código Bib : 2006 Ciencia... 311.. 230K. doi : 10.1126/ciencia.1118265 . PMID  16357227. S2CID  44527461.
  164. ^ Hüttenhofer A, Schattner P, Polacek N (mayo de 2005). "ARN no codificantes: ¿esperanza o exageración?". Tendencias en Genética . 21 (5): 289–97. doi :10.1016/j.tig.2005.03.007. PMID  15851066.
  165. ^ Esteller M (noviembre de 2011). "ARN no codificantes en enfermedades humanas". Naturaleza Reseñas Genética . 12 (12): 861–74. doi :10.1038/nrg3074. PMID  22094949. S2CID  13036469.
  166. ^ "Ómnibus de expresión genética". www.ncbi.nlm.nih.gov . Consultado el 26 de marzo de 2018 .
  167. ^ ab Brazma A, Hingamp P, Quackenbush J, Sherlock G, Spellman P, Stoeckert C, Aach J, Ansorge W, Ball CA, Causton HC, Gaasterland T, Glenisson P, Holstege FC, Kim IF, Markowitz V, Matese JC, Parkinson H, Robinson A, Sarkans U, Schulze-Kremer S, Stewart J, Taylor R, Vilo J, Vingron M (diciembre de 2001). "Información mínima sobre un experimento de microarrays (MIAME): hacia estándares para datos de microarrays". Genética de la Naturaleza . 29 (4): 365–71. doi : 10.1038/ng1201-365 . PMID  11726920. S2CID  6994467.
  168. ^ ab Brazma A (mayo de 2009). "Información mínima sobre un experimento de microarrays (MIAME): éxitos, fracasos, desafíos". El diario científico mundial . 9 : 420–3. doi : 10.1100/tsw.2009.57 . PMC 5823224 . PMID  19484163. 
  169. ^ Kolesnikov N, Hastings E, Keays M, Melnichuk O, Tang YA, Williams E, Dylag M, Kurbatova N, Brandizi M, Burdett T, Megy K, Pilicheva E, Rustici G, Tikhonov A, Parkinson H, Petryszak R, Sarkans U, Brazma A (enero de 2015). "Actualización de ArrayExpress: simplificación del envío de datos". Investigación de ácidos nucleicos . 43 (Problema de la base de datos): D1113–6. doi : 10.1093/nar/gku1057. PMC 4383899 . PMID  25361974. 
  170. ^ Petryszak R, Keays M, Tang YA, Fonseca NA, Barrera E, Burdett T, Füllgrabe A, Fuentes AM, Jupp S, Koskinen S, Mannion O, Huerta L, Megy K, Snow C, Williams E, Barzine M, Hastings E, Weisser H, Wright J, Jaiswal P, Huber W, Choudhary J, Parkinson HE, Brazma A (enero de 2016). "Actualización de Expression Atlas: una base de datos integrada de expresión de genes y proteínas en humanos, animales y plantas". Investigación de ácidos nucleicos . 44 (D1): D746–52. doi : 10.1093/nar/gkv1045. PMC 4702781 . PMID  26481351. 
  171. ^ Hruz T, Laule O, Szabo G, Wessendorp F, Bleuler S, Oertle L, Widmayer P, Gruissem W, Zimmermann P (2008). "Genevestigator v3: una base de datos de expresión de referencia para el metanálisis de transcriptomas". Avances en Bioinformática . 2008 : 420747. doi : 10.1155/2008/420747 . PMC 2777001 . PMID  19956698. 
  172. ^ Mitsuhashi N, Fujieda K, Tamura T, Kawamoto S, Takagi T, Okubo K (enero de 2009). "BodyParts3D: base de datos de estructuras 3D para conceptos anatómicos". Investigación de ácidos nucleicos . 37 (Problema de la base de datos): D782–5. doi : 10.1093/nar/gkn613. PMC 2686534 . PMID  18835852. 
  173. ^ Zhao Y, Li H, Fang S, Kang Y, Wu W, Hao Y, Li Z, Bu D, Sun N, Zhang MQ, Chen R (enero de 2016). "NONCODE 2016: una fuente de datos valiosa e informativa sobre ARN largos no codificantes". Investigación de ácidos nucleicos . 44 (D1): D203–8. doi : 10.1093/nar/gkv1252. PMC 4702886 . PMID  26586799. 

Notas

  1. ^ En biología molecular,  la hibridación es un fenómeno en el que moléculas monocatenarias de ácido desoxirribonucleico ( ADN ) o ácido ribonucleico ( ARN )  se hibridan  con  ADN o ARN complementario .
  2. ^ Un picolitro es aproximadamente 30 millones de veces más pequeño que una gota de agua.

Otras lecturas