La secuenciación del perfil complejo de traducción ( TCP-seq ) es un método de biología molecular para obtener instantáneas de la distribución momentánea de complejos de síntesis de proteínas a lo largo de las cadenas de ARN mensajero (ARNm). [1]
La expresión del código genético en todas las formas de vida consta de dos procesos principales: la síntesis de copias del código genético registrado en el ADN en forma de ARNm ( transcripción ) y la propia síntesis de proteínas ( traducción ), mediante la cual las copias del código en el ARNm se decodifican en secuencias de aminoácidos de las proteínas respectivas. Tanto la transcripción como la traducción son procesos altamente regulados que controlan esencialmente todo lo que sucede en las células vivas (y, en consecuencia, en los organismos multicelulares).
El control de la traducción es especialmente importante en las células eucariotas , donde forma parte de las redes reguladoras postranscripcionales de la expresión génica. Esta funcionalidad adicional se refleja en la mayor complejidad del proceso de traducción , lo que lo convierte en un objeto difícil de investigar. Sin embargo, los detalles sobre cuándo y qué ARNm se traduce y qué mecanismos son responsables de este control son clave para comprender la funcionalidad celular normal y patológica. Se puede utilizar TCP-seq para obtener esta información.
Con la llegada de los métodos de identificación de secuencias de ADN y ARN de alto rendimiento (como la secuenciación Illumina ), se hizo posible analizar de manera eficiente las secuencias de nucleótidos de un gran número de fragmentos de ADN y ARN relativamente cortos. Las secuencias de estos fragmentos se pueden superponer para reconstruir la fuente. Alternativamente, si ya se conoce la secuencia fuente, se pueden encontrar los fragmentos dentro de ella ("mapear") y contar sus números individuales. Por lo tanto, si existe una etapa inicial en la que los fragmentos están presentes o seleccionados de manera diferencial ("enriquecidos"), este enfoque se puede utilizar para describir cuantitativamente dicha etapa incluso en un número o longitud muy grande de las secuencias de entrada, que generalmente abarcan todo el ADN o ARN de la célula.
TCP-seq se basa en estas capacidades de la secuenciación de ARN de alto rendimiento y utiliza además el fenómeno de protección de ácidos nucleicos . La protección se manifiesta como resistencia a la despolimerización o modificación de tramos de ácidos nucleicos (en particular, ARN) que están fuertemente unidos o envueltos por otras biomoléculas, que dejan así sus "huellas" sobre la cadena de ácidos nucleicos. Estos fragmentos de "huella" representan, por tanto, la ubicación en la cadena de ácidos nucleicos donde se produce la interacción. Al secuenciar y mapear los fragmentos de nuevo a la secuencia de origen, es posible identificar con precisión las ubicaciones y los recuentos de estos contactos intermoleculares.
En el caso de TCP-seq, los ribosomas y las subunidades ribosómicas involucradas en la interacción con el ARNm primero se reticulan químicamente de forma rápida con formaldehído para preservar el estado existente de interacciones ("instantánea" de distribución) y para bloquear cualquier posible proceso de no equilibrio. La reticulación se puede realizar directamente en células vivas, pero no se limita a ellas. Luego, el ARN se degrada parcialmente ( por ejemplo, con ribonucleasa ) de modo que solo quedan fragmentos protegidos por los ribosomas o las subunidades ribosómicas. Luego, los fragmentos protegidos se purifican de acuerdo con la dinámica de sedimentación de los ribosomas o las subunidades ribosómicas unidos, se desbloquean, se secuencian y se asignan al transcriptoma de origen , lo que proporciona las ubicaciones originales de los complejos de traducción sobre el ARNm.
TCP-seq combina varios elementos típicos de otros análisis de todo el transcriptoma de su tipo. En particular, los métodos de perfilado de polisomas [2] [3] y perfilado de ribosomas (traducción) [4] también se emplean para identificar el ARNm involucrado en la formación de polisomas y las ubicaciones de los ribosomas en elongación sobre las regiones codificantes de las transcripciones, correspondientemente. Sin embargo, estos métodos no utilizan la estabilización química de los complejos de traducción ni la purificación de los intermediarios unidos covalentemente de las células vivas. Por lo tanto, TCP-seq puede considerarse más como un equivalente funcional de ChIP-seq y métodos similares de investigación de interacciones momentáneas del ADN que se rediseñan para ser aplicables a la traducción.
Las ventajas del método incluyen:
Las desventajas incluyen:
El método se está desarrollando actualmente y se aplicó para investigar la dinámica de la traducción en células de levadura vivas y está ampliando, en lugar de simplemente combinar, las capacidades de las técnicas anteriores. [1] El único otro método de todo el transcriptoma para mapear las posiciones de los ribosomas sobre el ARNm con precisión de nucleótidos es el perfil de ribosomas (traducción). Sin embargo, captura las posiciones de los ribosomas en elongación, y la mayoría de los intermediarios de traducción dinámicos y funcionalmente importantes en la etapa de iniciación no se detectan.
TCP-seq fue diseñado para apuntar específicamente a estos puntos ciegos. Esencialmente, puede proporcionar el mismo nivel de detalles para la fase de elongación que el perfil de ribosomas (traducción), pero también incluye el registro de intermediarios de iniciación, terminación y reciclaje (y básicamente cualquier otro complejo de traducción posible siempre que el ribosoma o sus subunidades estén en contacto y protegiendo el ARNm) de la síntesis de proteínas que anteriormente permanecían fuera del alcance. Por lo tanto, TCP-seq proporciona un enfoque único para una visión completa del proceso de traducción de una muestra biológica. Se puede esperar que este aspecto particular del método se desarrolle más, ya que la dinámica del escaneo ribosómico en el ARNm durante la iniciación de la traducción generalmente es desconocida durante la mayor parte de la vida. El conjunto de datos actual que contiene datos de TCP-seq para la iniciación de la traducción está disponible para la levadura Saccharomyces cerevisiae , [5] [6] y es probable que se amplíe para otros organismos en el futuro.