La secuenciación con bisulfito [1] (también conocida como secuenciación con bisulfito ) es el uso de tratamiento con bisulfito del ADN antes de la secuenciación de rutina para determinar el patrón de metilación . La metilación del ADN fue la primera marca epigenética descubierta y sigue siendo la más estudiada. En animales implica predominantemente la adición de un grupo metilo a la posición del carbono 5 de los residuos de citosina del dinucleótido CpG y está implicado en la represión de la actividad transcripcional .
El tratamiento del ADN con bisulfito convierte los residuos de citosina en uracilo , pero no afecta los residuos de 5-metilcitosina . Por tanto, el ADN que ha sido tratado con bisulfito conserva sólo citosinas metiladas. Por tanto, el tratamiento con bisulfito introduce cambios específicos en la secuencia de ADN que dependen del estado de metilación de residuos de citosina individuales, lo que produce información de resolución de un solo nucleótido sobre el estado de metilación de un segmento de ADN. Se pueden realizar varios análisis sobre la secuencia alterada para recuperar esta información. El objetivo de este análisis se reduce, por tanto, a diferenciar entre polimorfismos de un solo nucleótido (citosinas y timidina ) resultantes de la conversión de bisulfito (Figura 1).
La secuenciación con bisulfito aplica métodos de secuenciación de rutina en ADN genómico tratado con bisulfito para determinar el estado de metilación en los dinucleótidos CpG. También se emplean otras estrategias sin secuenciación para interrogar la metilación en loci específicos o a nivel de todo el genoma . Todas las estrategias suponen que la conversión de citosinas no metiladas en uracilo inducida por bisulfito es completa, y esto sirve como base para todas las técnicas posteriores. Idealmente, el método utilizado determinaría el estado de metilación por separado para cada alelo . Los métodos alternativos a la secuenciación con bisulfito incluyen el análisis de restricción combinado con bisulfito y la inmunoprecipitación de ADN metilado (MeDIP).
Continuamente se desarrollan metodologías para analizar el ADN tratado con bisulfito. Para resumir estas metodologías en rápida evolución, se han escrito numerosos artículos de revisión. [2] [3] [4] [5]
Las metodologías se pueden dividir generalmente en estrategias basadas en PCR específica de metilación (MSP) (Figura 4) y estrategias que emplean la reacción en cadena de la polimerasa (PCR) realizada en condiciones no específicas de metilación (Figura 3). Los métodos basados en microarrays también utilizan PCR basada en condiciones no específicas de metilación.
El primer método informado de análisis de metilación que utiliza ADN tratado con bisulfito utilizó PCR y secuenciación de ADN de didesoxinucleótido estándar para determinar directamente los nucleótidos resistentes a la conversión de bisulfito. [6] Los cebadores están diseñados para ser específicos de cadena y de bisulfito (es decir, cebadores que contienen citosinas no CpG de modo que no son complementarios del ADN no tratado con bisulfito), flanqueando (pero sin involucrar) el sitio de metilación. de interés. Por lo tanto, amplificará secuencias tanto metiladas como no metiladas, a diferencia de la PCR específica de metilación. Todos los sitios de citosinas no metiladas se muestran como timinas en la secuencia amplificada resultante de la cadena sentido y como adeninas en la cadena antisentido amplificada . Al incorporar adaptadores de secuenciación de alto rendimiento en los cebadores de PCR, los productos de PCR se pueden secuenciar mediante secuenciación masiva en paralelo. Alternativamente, y con mucha mano de obra, el producto de la PCR se puede clonar y secuenciar. Se pueden utilizar métodos de PCR anidados para mejorar el producto para la secuenciación .
Todas las técnicas posteriores de análisis de metilación del ADN que utilizan ADN tratado con bisulfito se basan en este informe de Frommer et al. (Figura 2). [6] Aunque la mayoría de las otras modalidades no son verdaderas técnicas basadas en secuenciación, el término "secuenciación con bisulfito" se utiliza a menudo para describir las técnicas de análisis de metilación del ADN por conversión con bisulfito en general.
La pirosecuenciación también se ha utilizado para analizar ADN tratado con bisulfito sin utilizar PCR específica de metilación. [7] [8] Después de la amplificación por PCR de la región de interés, se utiliza la pirosecuenciación para determinar la secuencia convertida con bisulfito de sitios CpG específicos en la región. La relación de C a T en sitios individuales se puede determinar cuantitativamente en función de la cantidad de incorporación de C y T durante la extensión de la secuencia. La principal limitación de este método es el coste de la tecnología. Sin embargo, la pirosecuenciación permite la extensión a métodos de detección de alto rendimiento .
Una variante de esta técnica, descrita por Wong et al. , utiliza cebadores específicos de alelo que incorporan polimorfismos de un solo nucleótido en la secuencia del cebador de secuenciación, lo que permite el análisis por separado de los alelos maternos y paternos . [9] Esta técnica es de particular utilidad para el análisis de impronta genómica .
Este método se basa en el método de análisis de polimorfismo de conformación monocatenario (SSCA) desarrollado para el análisis de polimorfismo de un solo nucleótido (SNP). [10] SSCA diferencia entre fragmentos de ADN monocatenario de tamaño idéntico pero secuencia distinta basándose en la migración diferencial en electroforesis no desnaturalizante . En MS-SSCA, esto se utiliza para distinguir entre regiones amplificadas por PCR tratadas con bisulfito que contienen los sitios CpG de interés. Aunque SSCA carece de sensibilidad cuando solo está presente una diferencia de un único nucleótido , el tratamiento con bisulfito frecuentemente realiza varias conversiones de C a T en la mayoría de las regiones de interés, y la sensibilidad resultante se acerca al 100%. MS-SSCA también proporciona un análisis semicuantitativo del grado de metilación del ADN en función de la relación de intensidades de las bandas. Sin embargo, este método está diseñado para evaluar todos los sitios CpG en su conjunto en la región de interés en lugar de sitios de metilación individuales.
Otro método para diferenciar el ADN tratado con bisulfito convertido del no convertido es el uso de análisis de fusión de alta resolución (HRM), una técnica cuantitativa basada en PCR diseñada inicialmente para distinguir los SNP. [11] Los amplicones de PCR se analizan directamente mediante aumento de temperatura y la liberación resultante de un tinte fluorescente intercalado durante la fusión. El grado de metilación, representado por el contenido de C a T en el amplicón , determina la rapidez de fusión y la consiguiente liberación del tinte. Este método permite la cuantificación directa en un ensayo de un solo tubo, pero evalúa la metilación en la región amplificada como un todo en lugar de en sitios CpG específicos .
"MS-SnuPE emplea el método de extensión de cebadores diseñado inicialmente para analizar polimorfismos de un solo nucleótido ". [12] El ADN se convierte con bisulfito y los cebadores específicos de bisulfito se hibridan con la secuencia hasta el par de bases inmediatamente antes del CpG de interés. Se permite que el cebador se extienda un par de bases hacia la C (o T) usando didesoxinucleótidos terminales de ADN polimerasa , y la proporción de C a T se determina cuantitativamente.
Se pueden utilizar varios métodos para determinar esta relación C:T. Al principio, MS-SnuPE se basó en ddNTP radiactivos como informadores de la extensión del cebador. También se pueden utilizar métodos basados en fluorescencia o pirosecuenciación . [13] Sin embargo, el análisis de espectrometría de masas de tiempo de vuelo/desorción ionización láser asistida por matriz ( MALDI-TOF ) para diferenciar entre los dos productos de extensión de cebador polimórfico se puede utilizar, en esencia, basándose en el ensayo GOOD diseñado para el genotipado de SNP. . La cromatografía líquida de alto rendimiento en fase inversa de pares iónicos (IP-RP- HPLC ) también se ha utilizado para distinguir los productos de extensión de cebadores. [14]
Un método descrito recientemente por Ehrich et al. Aprovecha además las conversiones de bisulfito agregando un paso de escisión específico de base para mejorar la información obtenida de los cambios de nucleótidos. [15] Al usar primero la transcripción in vitro de la región de interés en ARN (agregando un sitio promotor de ARN polimerasa al cebador de PCR en la amplificación inicial), se puede usar la RNasa A para escindir la transcripción de ARN en sitios específicos de bases. Como la RNasa A escinde el ARN específicamente en los ribonucleótidos de citosina y uracilo , la especificidad de base se logra agregando dTTP resistente a la escisión cuando se desea una escisión específica de citosina (específica de C), e incorporando dCTP cuando se desea una escisión específica de uracilo (específica de U) es deseado. Los fragmentos escindidos pueden luego analizarse mediante MALDI-TOF . El tratamiento con bisulfito da como resultado la introducción/eliminación de sitios de escisión mediante conversiones de C a U o un cambio en la masa del fragmento mediante conversiones de G a A en la cadena inversa amplificada. La escisión específica de C cortará específicamente en todos los sitios CpG metilados . Al analizar los tamaños de los fragmentos resultantes, es posible determinar el patrón específico de metilación del ADN de los sitios CpG dentro de la región, en lugar de determinar el grado de metilación de la región en su conjunto. Este método demostró eficacia para la detección de alto rendimiento , lo que permite el interrogatorio de numerosos sitios CpG en múltiples tejidos de una manera rentable.
Este método alternativo de análisis de metilación también utiliza ADN tratado con bisulfito pero evita la necesidad de secuenciar el área de interés. [16] En cambio, los pares de cebadores se diseñan para que sean "específicos de metilados" al incluir secuencias que complementan sólo las 5-metilcitosinas no convertidas o, por el contrario, "específicas de metilados", que complementan las timinas convertidas a partir de citosinas no metiladas. La metilación está determinada por la capacidad del cebador específico para lograr la amplificación. Este método es particularmente útil para interrogar islas CpG con una densidad de metilación posiblemente alta, ya que un mayor número de pares CpG en el cebador aumenta la especificidad del ensayo. Colocar el par CpG en el extremo 3' del cebador también mejora la sensibilidad. El informe inicial que utilizó MSP describió una sensibilidad suficiente para detectar la metilación del 0,1% de los alelos . En general, MSP y sus protocolos relacionados se consideran los más sensibles al interrogar el estado de metilación en un locus específico .
El método MethyLight se basa en MSP, pero proporciona un análisis cuantitativo mediante PCR cuantitativa . [17] Se utilizan cebadores específicos metilados y también se utiliza una sonda indicadora de fluorescencia específica metilada que se hibrida con la región amplificada. De manera alternativa, los cebadores o la sonda pueden diseñarse sin especificidad de metilación si se necesita discriminación entre los pares CpG dentro de las secuencias involucradas. La cuantificación se realiza con referencia a un ADN de referencia metilado. Una modificación de este protocolo para aumentar la especificidad de la PCR para el ADN convertido con bisulfito con éxito (ConLight-MSP) utiliza una sonda adicional para el ADN no convertido con bisulfito para cuantificar esta amplificación no específica. [18]
Una metodología adicional que utiliza ADN amplificado por MSP analiza los productos mediante análisis de curva de fusión (Mc-MSP). [19] Este método amplifica el ADN convertido con bisulfito con cebadores específicos metilados y no metilados, y determina la proporción cuantitativa de los dos productos comparando los picos diferenciales generados en un análisis de curva de fusión. Se ha introducido un método de análisis de fusión de alta resolución que utiliza tanto PCR cuantitativa como análisis de fusión, en particular, para la detección sensible de metilación de bajo nivel [20]
Los métodos basados en microarrays son una extensión lógica de las tecnologías disponibles para analizar el ADN tratado con bisulfito y permitir el análisis de la metilación de todo el genoma. [21] Las micromatrices de oligonucleótidos se diseñan utilizando pares de sondas de hibridación de oligonucleótidos dirigidas a sitios CpG de interés. Uno es complementario a la secuencia metilada inalterada y el otro es complementario a la secuencia no metilada convertida de C a U. Las sondas también son específicas de bisulfito para evitar la unión al ADN convertido de forma incompleta por bisulfito. El ensayo de metilación de Illumina es uno de esos ensayos que aplica la tecnología de secuenciación con bisulfito a nivel de microarrays para generar datos de metilación de todo el genoma.
La secuenciación con bisulfito se utiliza ampliamente en los genomas de los mamíferos; sin embargo, han surgido complicaciones con el descubrimiento de una nueva modificación del ADN de los mamíferos, la 5-hidroximetilcitosina . [22] [23] La 5-hidroximetilcitosina se convierte en citosina-5-metilsulfonato tras el tratamiento con bisulfito, que luego se lee como una C cuando se secuencia. [24] Por lo tanto, la secuenciación con bisulfito no puede discriminar entre 5-metilcitosina y 5-hidroximetilcitosina. Esto significa que el resultado de la secuenciación con bisulfito ya no se puede definir únicamente como metilación del ADN, ya que es una combinación de 5-metilcitosina y 5-hidroximetilcitosina. El desarrollo de la secuenciación con bisulfito oxidativo asistida por Tet por parte de Chuan He en la Universidad de Chicago ahora puede distinguir entre las dos modificaciones con una resolución de base única. [25]
La secuenciación con bisulfito se basa en la conversión de cada residuo de citosina no metilado en uracilo. Si la conversión es incompleta, el análisis posterior interpretará incorrectamente las citosinas no metiladas no convertidas como citosinas metiladas, lo que generará resultados falsos positivos para la metilación. Sólo las citosinas en el ADN monocatenario son susceptibles al ataque del bisulfito, por lo que la desnaturalización del ADN sometido a análisis es fundamental. [2] Es importante garantizar que los parámetros de reacción, como la temperatura y la concentración de sal, sean adecuados para mantener el ADN en una conformación monocatenaria y permitir una conversión completa. Se ha informado que incrustar el ADN en gel de agarosa mejora la tasa de conversión al mantener las hebras de ADN físicamente separadas. [26] Las tasas de conversión incompletas se pueden estimar y ajustar después de la secuenciación incluyendo un control interno en la biblioteca de secuenciación, como el ADN del fago lambda (que se sabe que no está metilado) o alineando las lecturas de secuenciación con bisulfito con una región no metilada conocida en organismo, como el genoma del cloroplasto. [27]
Un desafío importante en la secuenciación con bisulfito es la degradación del ADN que tiene lugar al mismo tiempo que la conversión. Las condiciones necesarias para una conversión completa, como largos tiempos de incubación, temperatura elevada y alta concentración de bisulfito, pueden conducir a la degradación de aproximadamente el 90% del ADN incubado. [28] Dado que la cantidad inicial de ADN es a menudo limitada, una degradación tan extensa puede ser problemática. La degradación se produce como despurinaciones que dan lugar a roturas aleatorias de las hebras. [29] Por lo tanto, cuanto más largo sea el amplicón de PCR deseado , más limitado será probablemente el número de moléculas plantilla intactas. Esto podría provocar el fallo de la amplificación por PCR o la pérdida de información cuantitativamente precisa sobre los niveles de metilación como resultado del muestreo limitado de moléculas plantilla. Por lo tanto, es importante evaluar la cantidad de degradación del ADN resultante de las condiciones de reacción empleadas y considerar cómo afectará esto al amplicón deseado . También se pueden utilizar técnicas para minimizar la degradación del ADN, como el ciclo de la temperatura de incubación. [29]
En 2020, New England Biolabs desarrolló NEBNext Enzymatic Mmethyl-seq, un enfoque enzimático alternativo para minimizar el daño al ADN. [30]
Un problema potencialmente significativo después del tratamiento con bisulfito es la desulfonación incompleta de los residuos de pirimidina debido a una alcalinización inadecuada de la solución. Esto puede inhibir algunas ADN polimerasas , dificultando la PCR posterior. Sin embargo, esta situación se puede evitar monitoreando el pH de la solución para garantizar que la desulfonación sea completa. [2]
Una última preocupación es que el tratamiento con bisulfito reduce en gran medida el nivel de complejidad de la muestra, lo que puede resultar problemático si se van a realizar múltiples reacciones de PCR (2006). [5] El diseño del cebador es más difícil y la hibridación cruzada inapropiada es más frecuente.
Los avances en la secuenciación con bisulfito han llevado a la posibilidad de aplicarlos a escala de todo el genoma , donde, anteriormente, la medición global de la metilación del ADN solo era factible utilizando otras técnicas, como el escaneo genómico de referencia de restricción . Muchos científicos consideran que el mapeo del epigenoma humano es la continuación lógica de la finalización del Proyecto Genoma Humano . [31] [32] Esta información epigenómica será importante para comprender cómo se implementa y regula la función de la secuencia genética. Dado que el epigenoma es menos estable que el genoma, se cree que es importante en las interacciones gen-ambiente . [33]
Sin embargo , el mapeo epigenómico es inherentemente más complejo que la secuenciación del genoma , ya que el epigenoma es mucho más variable que el genoma . El epigenoma varía con la edad, difiere entre tejidos, se ve alterado por factores ambientales y muestra aberraciones en las enfermedades. Sin embargo, un mapeo epigenómico tan rico, que represente diferentes edades, tipos de tejidos y estados patológicos, arrojaría información valiosa sobre la función normal de las marcas epigenéticas , así como sobre los mecanismos que conducen al envejecimiento y las enfermedades.
Los beneficios directos del mapeo epigenómico incluyen probables avances en la tecnología de clonación . Se cree que los fracasos en la producción de animales clonados con viabilidad y esperanza de vida normales se deben a patrones inapropiados de marcas epigenéticas. Además, los patrones aberrantes de metilación están bien caracterizados en muchos cánceres . La hipometilación global produce una disminución de la estabilidad genómica, mientras que la hipermetilación local de los promotores de genes supresores de tumores a menudo explica su pérdida de función . Los patrones específicos de metilación son indicativos de tipos de cáncer específicos, tienen valor pronóstico y pueden ayudar a guiar el mejor curso de tratamiento. [32]
Se están realizando esfuerzos de mapeo del epigenoma a gran escala en todo el mundo y se han organizado en el marco del Proyecto del Epigenoma Humano . [33] Esto se basa en una estrategia de varios niveles, mediante la cual se utiliza la secuenciación con bisulfito para obtener perfiles de metilación de alta resolución para un número limitado de epigenomas de referencia, mientras que se realizan análisis menos exhaustivos en un espectro más amplio de muestras. Este enfoque pretende maximizar el conocimiento obtenido a partir de una determinada cantidad de recursos, ya que el mapeo de todo el genoma de alta resolución sigue siendo una tarea costosa.
Se ha demostrado que el análisis de conjuntos de genes (por ejemplo, utilizando herramientas como DAVID y GoSeq) está muy sesgado cuando se aplica a datos de metilación de alto rendimiento (por ejemplo, secuenciación con bisulfito de todo el genoma); Se ha sugerido que esto se puede corregir usando permutaciones de etiquetas de muestra o usando un modelo estadístico para controlar las diferencias en el número de sondas CpG/sitios CpG que se dirigen a cada gen. [34]
La 5-metilcitosina y la 5-hidroximetilcitosina se leen como una C en la secuenciación con bisulfito. [24] La secuenciación con bisulfito oxidativo es un método para discriminar entre 5-metilcitosina y 5-hidroximetilcitosina con una resolución de base única. El método emplea una oxidación química específica (asistida por Tet) de 5-hidroximetilcitosina a 5-formilcitosina, que posteriormente se convierte en uracilo durante el tratamiento con bisulfito. [35] La única base que luego se lee como C es 5-metilcitosina, lo que proporciona un mapa del verdadero estado de metilación en la muestra de ADN. Los niveles de 5-hidroximetilcitosina también se pueden cuantificar midiendo la diferencia entre la secuenciación de bisulfito y bisulfito oxidativo.