La secuenciación con bisulfito [1] (también conocida como secuenciación con bisulfito ) es el uso del tratamiento con bisulfito del ADN antes de la secuenciación de rutina para determinar el patrón de metilación . La metilación del ADN fue la primera marca epigenética descubierta y sigue siendo la más estudiada. En animales, implica predominantemente la adición de un grupo metilo a la posición de carbono 5 de los residuos de citosina del dinucleótido CpG y está implicada en la represión de la actividad transcripcional .
El tratamiento del ADN con bisulfito convierte los residuos de citosina en uracilo , pero deja intactos los residuos de 5-metilcitosina . Por lo tanto, el ADN que ha sido tratado con bisulfito retiene solo las citosinas metiladas. Por lo tanto, el tratamiento con bisulfito introduce cambios específicos en la secuencia de ADN que dependen del estado de metilación de los residuos de citosina individuales, lo que produce información de resolución de un solo nucleótido sobre el estado de metilación de un segmento de ADN. Se pueden realizar varios análisis en la secuencia alterada para recuperar esta información. El objetivo de este análisis se reduce, por tanto, a diferenciar entre polimorfismos de un solo nucleótido (citosinas y timidina ) resultantes de la conversión con bisulfito (Figura 1).
La secuenciación con bisulfito aplica métodos de secuenciación rutinarios en ADN genómico tratado con bisulfito para determinar el estado de metilación en dinucleótidos CpG. También se emplean otras estrategias no secuenciales para interrogar la metilación en loci específicos o a nivel de todo el genoma . Todas las estrategias suponen que la conversión inducida por bisulfito de citosinas no metiladas a uracilo es completa, y esto sirve como base para todas las técnicas posteriores. Idealmente, el método utilizado determinaría el estado de metilación por separado para cada alelo . Los métodos alternativos a la secuenciación con bisulfito incluyen el análisis de restricción combinado con bisulfito y la inmunoprecipitación de ADN metilado (MeDIP).
Se están desarrollando continuamente metodologías para analizar el ADN tratado con bisulfito. Para resumir estas metodologías en rápida evolución, se han escrito numerosos artículos de revisión. [2] [3] [4] [5]
Las metodologías se pueden dividir en general en estrategias basadas en PCR específica de metilación (MSP) (Figura 4) y estrategias que emplean la reacción en cadena de la polimerasa (PCR) realizada en condiciones no específicas de metilación (Figura 3). Los métodos basados en microarrays también utilizan PCR basada en condiciones no específicas de metilación.
El primer método de análisis de metilación informado utilizando ADN tratado con bisulfito utilizó PCR y secuenciación estándar de ADN didesoxinucleótido para determinar directamente los nucleótidos resistentes a la conversión con bisulfito. [6] Los cebadores están diseñados para ser específicos de la cadena, así como específicos del bisulfito (es decir, cebadores que contienen citosinas no CpG de modo que no sean complementarios al ADN no tratado con bisulfito), flanqueando (pero sin involucrar) el sitio de metilación de interés. Por lo tanto, amplificará tanto las secuencias metiladas como las no metiladas, a diferencia de la PCR específica de metilación. Todos los sitios de citosinas no metiladas se muestran como timinas en la secuencia amplificada resultante de la cadena sentido, y como adeninas en la cadena antisentido amplificada . Al incorporar adaptadores de secuenciación de alto rendimiento en los cebadores de PCR, los productos de PCR se pueden secuenciar con secuenciación masiva paralela. Alternativamente, y con mucha mano de obra, el producto de PCR se puede clonar y secuenciar. Se pueden utilizar métodos de PCR anidada para mejorar el producto para la secuenciación .
Todas las técnicas de análisis de metilación de ADN posteriores que utilizan ADN tratado con bisulfito se basan en este informe de Frommer et al. (Figura 2). [6] Aunque la mayoría de las demás modalidades no son verdaderas técnicas basadas en secuenciación, el término "secuenciación con bisulfito" se utiliza a menudo para describir las técnicas de análisis de metilación de ADN por conversión con bisulfito en general.
La pirosecuenciación también se ha utilizado para analizar el ADN tratado con bisulfito sin utilizar PCR específica de metilación. [7] [8] Después de la amplificación por PCR de la región de interés, se utiliza la pirosecuenciación para determinar la secuencia convertida con bisulfito de sitios CpG específicos en la región. La relación de C a T en sitios individuales se puede determinar cuantitativamente en función de la cantidad de incorporación de C y T durante la extensión de la secuencia. La principal limitación de este método es el costo de la tecnología. Sin embargo, la pirosecuenciación permite la extensión a métodos de detección de alto rendimiento .
Una variante de esta técnica, descrita por Wong et al. , utiliza cebadores específicos de alelos que incorporan polimorfismos de un solo nucleótido en la secuencia del cebador de secuenciación, lo que permite un análisis separado de los alelos maternos y paternos . [9] Esta técnica es de particular utilidad para el análisis de la impronta genómica .
Este método se basa en el método de análisis de polimorfismo de conformación de cadena sencilla (SSCA) desarrollado para el análisis de polimorfismo de nucleótido único (SNP). [10] SSCA diferencia entre fragmentos de ADN de cadena sencilla de tamaño idéntico pero secuencia distinta basándose en la migración diferencial en electroforesis no desnaturalizante . En MS-SSCA, esto se utiliza para distinguir entre regiones tratadas con bisulfito, amplificadas por PCR que contienen los sitios CpG de interés. Aunque SSCA carece de sensibilidad cuando solo hay una única diferencia de nucleótido , el tratamiento con bisulfito con frecuencia produce una serie de conversiones de C a T en la mayoría de las regiones de interés, y la sensibilidad resultante se acerca al 100%. MS-SSCA también proporciona un análisis semicuantitativo del grado de metilación del ADN basado en la relación de intensidades de banda. Sin embargo, este método está diseñado para evaluar todos los sitios CpG como un todo en la región de interés en lugar de sitios de metilación individuales.
Otro método para diferenciar el ADN tratado con bisulfito convertido del no convertido es el uso del análisis de fusión de alta resolución (HRM), una técnica cuantitativa basada en PCR diseñada inicialmente para distinguir los SNP. [11] Los amplicones de PCR se analizan directamente mediante el aumento gradual de la temperatura y la liberación resultante de un colorante fluorescente intercalante durante la fusión. El grado de metilación, representado por el contenido de C a T en el amplicón , determina la rapidez de la fusión y la consiguiente liberación del colorante. Este método permite la cuantificación directa en un ensayo de un solo tubo, pero evalúa la metilación en la región amplificada como un todo en lugar de en sitios CpG específicos .
MS-SnuPE emplea el método de extensión de cebadores diseñado inicialmente para analizar polimorfismos de un solo nucleótido . [12] El ADN se convierte con bisulfito y los cebadores específicos de bisulfito se unen a la secuencia hasta el par de bases inmediatamente anterior al CpG de interés. Se permite que el cebador se extienda un par de bases hacia la C (o T) utilizando didesoxinucleótidos que terminan con la ADN polimerasa y se determina cuantitativamente la relación de C a T.
Se pueden utilizar varios métodos para determinar esta relación C:T. Al principio, MS-SnuPE dependía de ddNTP radiactivos como reportero de la extensión del cebador. También se pueden utilizar métodos basados en fluorescencia o pirosecuenciación . [13] Sin embargo, el análisis de espectrometría de masas con desorción láser asistida por matriz/tiempo de vuelo ( MALDI-TOF ) para diferenciar entre los dos productos de extensión de cebador polimórficos se puede utilizar, en esencia, basándose en el ensayo GOOD diseñado para la genotipificación de SNP . La cromatografía líquida de alto rendimiento en fase inversa de pares iónicos (IP-RP -HPLC ) también se ha utilizado para distinguir los productos de extensión de cebadores. [14]
Un método descrito recientemente por Ehrich et al. aprovecha aún más las conversiones de bisulfito añadiendo un paso de escisión específico de base para mejorar la información obtenida de los cambios de nucleótidos. [15] Al utilizar primero la transcripción in vitro de la región de interés en ARN (añadiendo un sitio promotor de la ARN polimerasa al cebador de PCR en la amplificación inicial), se puede utilizar la ARNasa A para escindir la transcripción de ARN en sitios específicos de base. Como la ARNasa A escinde el ARN específicamente en los ribonucleótidos de citosina y uracilo , la especificidad de base se consigue añadiendo la incorporación de dTTP resistente a la escisión cuando se desea la escisión específica de la citosina (específica de C), e incorporando dCTP cuando se desea la escisión específica del uracilo (específica de U). Los fragmentos escindidos se pueden analizar entonces mediante MALDI-TOF . El tratamiento con bisulfito da como resultado la introducción/eliminación de sitios de escisión por conversiones de C a U o un cambio en la masa del fragmento por conversiones de G a A en la cadena inversa amplificada. La escisión específica de C cortará específicamente en todos los sitios CpG metilados . Al analizar los tamaños de los fragmentos resultantes, es posible determinar el patrón específico de metilación del ADN de los sitios CpG dentro de la región, en lugar de determinar el grado de metilación de la región en su totalidad. Este método demostró eficacia para el cribado de alto rendimiento , lo que permite la interrogación de numerosos sitios CpG en múltiples tejidos de una manera rentable.
Este método alternativo de análisis de metilación también utiliza ADN tratado con bisulfito pero evita la necesidad de secuenciar el área de interés. [16] En cambio, los pares de cebadores están diseñados para ser "específicos de metilación" al incluir secuencias que complementan solo las 5-metilcitosinas no convertidas o, por el contrario, "específicos de no metilación", que complementan las timinas convertidas a partir de citosinas no metiladas. La metilación está determinada por la capacidad del cebador específico para lograr la amplificación. Este método es particularmente útil para interrogar islas CpG con una posible alta densidad de metilación, ya que un mayor número de pares CpG en el cebador aumenta la especificidad del ensayo. Colocar el par CpG en el extremo 3' del cebador también mejora la sensibilidad. El informe inicial que utiliza MSP describió una sensibilidad suficiente para detectar la metilación del 0,1% de los alelos . En general, se considera que MSP y sus protocolos relacionados son los más sensibles al interrogar el estado de metilación en un locus específico .
El método MethyLight se basa en MSP, pero proporciona un análisis cuantitativo mediante PCR cuantitativa . [17] Se utilizan cebadores específicos metilados y también se utiliza una sonda de fluorescencia específica metilada que se une a la región amplificada. De manera alternativa, los cebadores o la sonda se pueden diseñar sin especificidad de metilación si se necesita discriminación entre los pares CpG dentro de las secuencias involucradas. La cuantificación se realiza en referencia a un ADN de referencia metilado. Una modificación de este protocolo para aumentar la especificidad de la PCR para el ADN convertido con bisulfito (ConLight-MSP) utiliza una sonda adicional al ADN no convertido con bisulfito para cuantificar esta amplificación no específica. [18]
Otra metodología que utiliza ADN amplificado con MSP analiza los productos mediante el análisis de la curva de fusión (Mc-MSP). [19] Este método amplifica el ADN convertido con bisulfito con cebadores específicos metilados y no metilados, y determina la relación cuantitativa de los dos productos comparando los picos diferenciales generados en un análisis de la curva de fusión. Se ha introducido un método de análisis de fusión de alta resolución que utiliza tanto PCR cuantitativa como análisis de fusión, en particular, para la detección sensible de la metilación de bajo nivel [20].
Los métodos basados en microarrays son una extensión lógica de las tecnologías disponibles para analizar el ADN tratado con bisulfito y permitir el análisis de la metilación en todo el genoma. [21] Los microarrays de oligonucleótidos se diseñan utilizando pares de sondas de hibridación de oligonucleótidos que se dirigen a los sitios CpG de interés. Una es complementaria a la secuencia metilada inalterada y la otra es complementaria a la secuencia no metilada convertida de C a U. Las sondas también son específicas del bisulfito para evitar la unión al ADN convertido de forma incompleta por el bisulfito. El ensayo de metilación de Illumina es uno de esos ensayos que aplica la tecnología de secuenciación con bisulfito a nivel de microarray para generar datos de metilación en todo el genoma.
La secuenciación con bisulfito se utiliza ampliamente en los genomas de mamíferos, sin embargo, han surgido complicaciones con el descubrimiento de una nueva modificación del ADN de mamíferos, la 5-hidroximetilcitosina . [22] [23] La 5-hidroximetilcitosina se convierte en citosina-5-metilsulfonato tras el tratamiento con bisulfito, que luego se lee como una C cuando se secuencia. [24] Por lo tanto, la secuenciación con bisulfito no puede discriminar entre 5-metilcitosina y 5-hidroximetilcitosina. Esto significa que el resultado de la secuenciación con bisulfito ya no se puede definir únicamente como metilación del ADN, ya que es el compuesto de 5-metilcitosina y 5-hidroximetilcitosina. El desarrollo de la secuenciación oxidativa con bisulfito asistida por Tet por Chuan He en la Universidad de Chicago ahora puede distinguir entre las dos modificaciones con una resolución de base única. [25]
La secuenciación con bisulfito se basa en la conversión de cada residuo de citosina no metilada en uracilo. Si la conversión es incompleta, el análisis posterior interpretará incorrectamente las citosinas no metiladas no convertidas como citosinas metiladas, lo que dará como resultado resultados falsos positivos para la metilación. Solo las citosinas en el ADN monocatenario son susceptibles al ataque del bisulfito, por lo tanto, la desnaturalización del ADN que se analiza es fundamental. [2] Es importante asegurarse de que los parámetros de reacción, como la temperatura y la concentración de sal, sean adecuados para mantener el ADN en una conformación monocatenaria y permitir una conversión completa. Se ha informado que la inclusión del ADN en gel de agarosa mejora la tasa de conversión al mantener las hebras de ADN separadas físicamente. [26] Las tasas de conversión incompleta se pueden estimar y ajustar después de la secuenciación incluyendo un control interno en la biblioteca de secuenciación, como el ADN del fago lambda (que se sabe que no está metilado) o alineando las lecturas de secuenciación de bisulfito con una región no metilada conocida en el organismo, como el genoma del cloroplasto. [27]
Un desafío importante en la secuenciación con bisulfito es la degradación del ADN que ocurre simultáneamente con la conversión. Las condiciones necesarias para una conversión completa, como tiempos de incubación prolongados, temperatura elevada y alta concentración de bisulfito, pueden conducir a la degradación de aproximadamente el 90% del ADN incubado. [28] Dado que la cantidad inicial de ADN suele ser limitada, una degradación tan extensa puede ser problemática. La degradación se produce en forma de despurinaciones que resultan en roturas aleatorias de cadenas. [29] Por lo tanto, cuanto más largo sea el amplicón de PCR deseado , más limitado será probablemente el número de moléculas de plantilla intactas. Esto podría conducir al fracaso de la amplificación por PCR o a la pérdida de información cuantitativamente precisa sobre los niveles de metilación resultantes del muestreo limitado de moléculas de plantilla. Por lo tanto, es importante evaluar la cantidad de degradación del ADN resultante de las condiciones de reacción empleadas y considerar cómo afectará esto al amplicón deseado . También se pueden utilizar técnicas para minimizar la degradación del ADN, como el cambio cíclico de la temperatura de incubación. [29]
En 2020, New England Biolabs desarrolló NEBNext Enzymatic Methyl-seq, un enfoque enzimático alternativo para minimizar el daño al ADN. [30]
Un problema potencialmente significativo después del tratamiento con bisulfito es la desulfonación incompleta de los residuos de pirimidina debido a la alcalinización inadecuada de la solución. Esto puede inhibir algunas polimerasas de ADN , lo que dificulta la PCR posterior. Sin embargo, esta situación se puede evitar controlando el pH de la solución para garantizar que la desulfonación sea completa. [2]
Una última preocupación es que el tratamiento con bisulfito reduce en gran medida el nivel de complejidad de la muestra, lo que puede ser problemático si se deben realizar múltiples reacciones de PCR (2006). [5] El diseño de cebadores es más difícil y la hibridación cruzada inapropiada es más frecuente.
Los avances en la secuenciación con bisulfito han llevado a la posibilidad de aplicarlos a escala de todo el genoma , donde, anteriormente, la medición global de la metilación del ADN solo era factible utilizando otras técnicas, como el escaneo genómico de referencia de restricción . Muchos científicos consideran que el mapeo del epigenoma humano es la continuación lógica de la finalización del Proyecto Genoma Humano . [31] [32] Esta información epigenómica será importante para comprender cómo se implementa y regula la función de la secuencia genética. Dado que el epigenoma es menos estable que el genoma, se cree que es importante en las interacciones entre genes y ambiente . [33]
Sin embargo, el mapeo epigenómico es inherentemente más complejo que la secuenciación genómica , ya que el epigenoma es mucho más variable que el genoma . El epigenoma de una persona varía con la edad, difiere entre tejidos, se altera por factores ambientales y muestra aberraciones en las enfermedades. Sin embargo, un mapeo epigenómico tan completo, que represente diferentes edades, tipos de tejidos y estados patológicos, proporcionaría información valiosa sobre la función normal de las marcas epigenéticas , así como sobre los mecanismos que conducen al envejecimiento y la enfermedad.
Los beneficios directos del mapeo epigenómico incluyen avances probables en la tecnología de clonación . Se cree que los fracasos en la producción de animales clonados con viabilidad y esperanza de vida normales son resultado de patrones inadecuados de marcas epigenéticas. Además, los patrones de metilación aberrantes están bien caracterizados en muchos cánceres . La hipometilación global resulta en una menor estabilidad genómica, mientras que la hipermetilación local de los promotores de genes supresores de tumores a menudo explica su pérdida de función . Los patrones específicos de metilación son indicativos de tipos específicos de cáncer, tienen valor pronóstico y pueden ayudar a guiar el mejor curso de tratamiento. [32]
En todo el mundo se están realizando esfuerzos de mapeo epigenómico a gran escala, que se han organizado en el marco del Proyecto del Epigenoma Humano . [33] Este se basa en una estrategia de varios niveles, mediante la cual se utiliza la secuenciación con bisulfito para obtener perfiles de metilación de alta resolución para un número limitado de epigenomas de referencia, mientras que se realiza un análisis menos exhaustivo en un espectro más amplio de muestras. Este enfoque tiene como objetivo maximizar la información obtenida a partir de una cantidad determinada de recursos, ya que el mapeo de alta resolución de todo el genoma sigue siendo una tarea costosa.
Se ha demostrado que el análisis de conjuntos de genes (por ejemplo, utilizando herramientas como DAVID y GoSeq) está severamente sesgado cuando se aplica a datos de metilación de alto rendimiento (por ejemplo, secuenciación de bisulfito de todo el genoma); se ha sugerido que esto se puede corregir utilizando permutaciones de etiquetas de muestra o utilizando un modelo estadístico para controlar las diferencias en el número de sondas CpG / sitios CpG que se dirigen a cada gen. [34]
Tanto la 5-metilcitosina como la 5-hidroximetilcitosina se leen como una C en la secuenciación con bisulfito. [24] La secuenciación oxidativa con bisulfito es un método para discriminar entre la 5-metilcitosina y la 5-hidroximetilcitosina con una resolución de una sola base. El método emplea una oxidación química específica (asistida por Tet) de la 5-hidroximetilcitosina a 5-formilcitosina, que posteriormente se convierte en uracilo durante el tratamiento con bisulfito. [35] La única base que luego se lee como una C es la 5-metilcitosina, lo que proporciona un mapa del verdadero estado de metilación en la muestra de ADN. Los niveles de 5-hidroximetilcitosina también se pueden cuantificar midiendo la diferencia entre la secuenciación con bisulfito y la secuenciación oxidativa con bisulfito.