Tecnologías de transcriptómica

Entonces, el ARNm sirve como una molécula intermediaria y transitoria en la red de información, mientras que los ARNs no codificantes cumplen con diferentes funciones adicionales.

Las tecnologías de transcriptómica permiten saber qué procesos celulares se encuentran activos y cuáles inactivos.

Existen dos técnicas actuales clave en este campo: microarrays, los cuales cuantifican un conjunto de secuencias predeterminadas, y ARN-Seq, el cual utiliza secuenciación de alto rendimiento para registrar todos los transcritos.

Sin el conocimiento de experimentos previos, sería imposible interpretar la información contenida en un transcriptoma.

También se puede utilizar para inferir las funciones de genes previamente no anotados.

[6]​[7]​[8]​ El rápido desarrollo de nuevas tecnologías con sensibilidad mejorada y más baratas ha posibilitado esta explosión en transcriptómica.

[17]​[18]​ Sin embargo, estos métodos son laboriosos y solo pueden capturar una pequeña subsección del transcriptoma.

[39]​ El primer proyecto de ARN-Seq se publicó en 2006 con 1000 transcritos secuenciados utilizando tecnología 454.

[44]​[45]​ El ARN aislado puede ser tratado adicionalmente con DNasa para digerir cualquier traza de ADN.

Es típica la congelación rápida de tejidos previa al aislamiento del ARN.

Así se reduce la exposición de las enzimas RNasa una vez que el aislamiento está completo.

En la actualidad, los transcriptomas de célula única están bien descritos e incluso se han extendido a ARN-Seq in situ, en el que los transcriptomas de células individuales se analizan directamente en tejidos fijados.

Sin embargo, la ribo-depleción también puede introducir cierto sesgo al eliminar de manera inespecífica transcritos fuera del objetivo.

[67]​ La fragmentación se puede lograr mediante hidrólisis química, nebulización, sonicación o transcripción inversa con nucleótidos terminadores de cadena.

[71]​ Los identificadores moleculares únicos (UMIs) son secuencias cortas al azar que se utilizan para marcar individualmente fragmentos de secuencia durante la preparación de genotecas para que cada fragmento marcado sea único.

Los datos de secuenciación se pueden almacenar en repositorios públicos, tales como el Sequence Read Archive (SRA).

Adicionalmente, se deben identificar los artefactos en imágenes y eliminarlos del análisis general.

El proceso se puede dividir en cuatro etapas: control de calidad, alineamiento, cuantificación y expresión diferencial.

[105]​[106]​ Las anormalidades se pueden eliminar o marcar para tratamientos especiales en procesos posteriores.

El software kallisto es un método que combina el pseudoalineamiento y cuantificación en un solo paso, ejecutándose 2 órdenes de magnitud más rápido que otros métodos contemporáneos, tales como aquellos utilizados por tophat/cufflinks, con menos carga computacional.

Los análisis de transcriptómica se pueden validar utilizando una técnica independiente, por ejemplo, una PCR cuantitativa (qPCR), la cual es reconocible y estadísticamente evaluable.

La medición por qPCR es similar a la obtenida por ARN-Seq, en la que se puede calcular un valor para la concentración de una región diana en una muestra dada.

[62]​[137]​[138]​ La validación funcional de genes clave es una consideración importante para la planificación posterior a la construcción del transcriptoma.

[144]​[145]​ El ARN-Seq de patógenos humanos se ha convertido en un método establecido para cuantificar cambios en la expresión génica, identificando nuevos factores de virulencia, prediciendo resistencia a antibióticos, y desentrañando interacciones inmunitarias huésped-patógeno.

[145]​ El análisis transcriptómico se ha centrado predominantemente en ya sea el huésped o el patógeno.

Esta técnica permite estudiar la respuesta dinámica y redes reguladoras de genes inter-especie en ambas partes involucradas en la interacción desde el contacto inicial hasta la invasión y la persistencia final del patógeno o su eliminación por el sistema inmunitario del huésped.

[151]​ Los perfiles transcriptómicos también aportan información crucial sobre los mecanismos de resistencia a fármacos.

[159]​ El ARN-Seq también se puede utilizar para identificar regiones codificantes de proteínas previamente desconocidas en genomas ya secuenciados.

Sin embargo, una aproximación que utiliza el escalado temporal y binarización de transcriptomas para definir un conjunto de genes que predice la edad biológica con precisión permitió alcanzar una evaluación cercana al límite teórico.

[160]​ La transcriptómica se aplican más comúnmente al contenido en ARNm de una células.

Uso de métodos de transcriptómica a lo largo del tiempo. Artículos publicados sobre ARN-Seq (negro), microarrays de ARN (rojo), marcadores de secuencia expresada (EST) (azul), visualización diferencial digital (DDD) (verde) y análisis en serie/cap de la expresión génica (amarillo), desde 1990. [ 1 ]
Resumen de SAGE . En un organismo, los genes se transcriben y empalman (en eucariotas ) para producir transcritos maduros de ARNm (rojo). El ARNm se extrae del organismo, y se utiliza la transcriptasa inversa para copiar el ARNm en ADNc de doble cadena y más estable (ds-cDNA; azul). En SAGE, el ADNc se digiere mediante enzimas de restricción (en la localización "X" y "X+11") para producir fragmentos "marcadores" de 11 nucleótidos. Estos marcadores se concatenan y secuencian utilizando secuenciación de Sanger de lectura larga (las diferentes sombras indican marcadores de diferentes genes). Las secuencias se deconvuelven para encontrar la frecuencia de cada marcador. La frecuencia de un marcador se puede utilizar para informar sobre la transcripción de su gen de origen. [ 51 ]
Resumen de microarrays de ADN . En un organismo, los genes se transcriben y empalman (en eucariotas) para producir transcritos maduros de ARNm (rojo). El ARNm se extrae del organismo y se utiliza la transcriptasa inversa para copiar el ARNm a ADNc de doble cadena y más estable (ds-cDNA; azul). En microarrays, el ADNc se fragmenta y marca por fluorescencia (naranja). Los fragmentos marcados se unen a un array ordenado de oligonucleótidos ordenados. La medida de la intensidad de la fluorescencia a lo largo de la matriz indica la abundancia de un conjunto predeterminado de secuencias. Estas secuencias se seleccionan normalmente de manera específica para informar sobre los genes de interés en el genoma del organismo. [ 51 ]
Resumen de ARN-Seq . En un organismo, los genes se transcriben y empalman (en eucariotas) para producir transcritos maduros de ARNm (rojo). El ARNm se extrae del organismo, se fragmenta y copia a ADNc de doble cadena y estable (ds-cDNA; azul). El ADNc se secuencia utilizando métodos de secuenciación de lectura corta y alto rendimiento. Estas secuencias se pueden alinear a la secuencia de un genoma de referencia para reconstruir las regiones del genoma que se transcribieron. Estos datos se pueden utilizar para anotar donde se encuentran los genes en expresión, sus niveles relativos de expresión y cualquier variante de empalme alternativo . [ 51 ]
Microarray y celdas de flujo de secuenciación . Microarrays y ARN-Seq se basan en el análisis de imágenes de diferentes maneras. En un chip de microarray, cada punto del chip es una sonda de oligonucleótidos definida y la intensidad de la fluorescencia detecta directamente la abundancia de una secuencia específica ( Affymetrix ). En una celda de flujo de secuenciación de alto rendimiento, los nucleótidos se secuencian uno a uno en cada punto, donde el color de cada secuenciación indica el siguiente nucleótido en la secuencia (Illumina Hiseq). Otras variaciones de estas técnicas utilizan más o menos tipos de colores. [ 51 ] [ 100 ]
Identificación por mapa de calor de patrones de coexpresión génica en diferentes muestras. Cada columna contiene las medidas de cambios en la expresión génica para cada muestra individual. La expresión génica relativa se indica por colores: alta expresión (rojo), expresión media (blanco) y baja expresión (Azul). Los genes y muestras con perfiles de expresión similares se pueden agrupar automáticamente (árboles a la izquierda y arriba). Las muestras pueden ser de diferentes individuos, tejidos, ambientes o condiciones de salud. En este ejemplo, la expresión del grupo de genes 1 es alta y la expresión del grupo 2 es baja en las muestras 1, 2 y 3. [ 51 ] [ 128 ]