ChIP-on-chip (también conocido como ChIP-chip ) es una tecnología que combina la inmunoprecipitación de cromatina ('ChIP') con microarrays de ADN ( "chip" ). Al igual que el ChIP regular , ChIP-on-chip se utiliza para investigar las interacciones entre proteínas y ADN in vivo . Específicamente, permite la identificación del cistroma , la suma de sitios de unión , para proteínas de unión al ADN a nivel de todo el genoma. [1] Se puede realizar un análisis de todo el genoma para determinar las ubicaciones de los sitios de unión para casi cualquier proteína de interés. [1] Como sugiere el nombre de la técnica, dichas proteínas son generalmente aquellas que operan en el contexto de la cromatina . Los representantes más destacados de esta clase son los factores de transcripción , las proteínas relacionadas con la replicación , como la proteína del complejo de reconocimiento de origen (ORC), las histonas , sus variantes y las modificaciones de las histonas.
El objetivo de ChIP-on-chip es localizar sitios de unión de proteínas que puedan ayudar a identificar elementos funcionales en el genoma . Por ejemplo, en el caso de un factor de transcripción como proteína de interés, se pueden determinar sus sitios de unión al factor de transcripción en todo el genoma. Otras proteínas permiten la identificación de regiones promotoras , potenciadores , represores y elementos silenciadores , aisladores , elementos límite y secuencias que controlan la replicación del ADN. [2] Si las histonas son objeto de interés, se cree que la distribución de modificaciones y sus localizaciones pueden ofrecer nuevos conocimientos sobre los mecanismos de regulación .
Uno de los objetivos a largo plazo para los que se diseñó ChIP-on-chip es establecer un catálogo de organismos (seleccionados) que incluya todas las interacciones proteína-ADN en diversas condiciones fisiológicas. Este conocimiento ayudaría en última instancia a comprender la maquinaria detrás de la regulación genética, la proliferación celular y la progresión de las enfermedades. Por lo tanto, ChIP-on-chip ofrece tanto el potencial para complementar nuestro conocimiento sobre la orquestación del genoma a nivel de nucleótidos como la información sobre niveles superiores de información y regulación a medida que se propaga mediante la investigación sobre epigenética .
Las plataformas técnicas para realizar experimentos ChIP-on-chip son los microarrays de ADN , o "chips" . Se pueden clasificar y distinguir según diversas características:
Tipo de sonda : Los conjuntos de ADN pueden incluir ADNc o productos de PCR manchados mecánicamente , oligonucleótidos manchados mecánicamente u oligonucleótidos que se sintetizan in situ . Las primeras versiones de microarrays se diseñaron para detectar ARN de regiones genómicas expresadas ( marcos de lectura abiertos, también conocidos como ORF). Aunque estos conjuntos son perfectamente adecuados para estudiar perfiles de expresión génica , tienen una importancia limitada en los experimentos de ChIP, ya que la mayoría de las proteínas "interesantes" con respecto a esta técnica se unen en regiones intergénicas . Hoy en día, incluso se pueden diseñar conjuntos hechos a medida y ajustarlos para que coincidan con los requisitos de un experimento. Además, se puede sintetizar cualquier secuencia de nucleótidos para cubrir regiones génicas e intergénicas.
Tamaño de la sonda : las primeras versiones de los arrays de ADNc tenían una longitud de sonda de aproximadamente 200 pb. Las versiones más recientes de los arrays utilizan oligonucleótidos de entre 70 y 25 meros (Microarrays, Inc.) ( Affymetrix ). (Febrero de 2007)
Composición de la sonda : Existen matrices de ADN en mosaico y no en mosaico. Las matrices no en mosaico utilizan sondas seleccionadas según criterios no espaciales, es decir, las secuencias de ADN utilizadas como sondas no tienen distancias fijas en el genoma. Las matrices en mosaico, sin embargo, seleccionan una región genómica (o incluso un genoma completo) y la dividen en fragmentos iguales. Dicha región se denomina ruta en mosaico. La distancia promedio entre cada par de fragmentos vecinos (medida desde el centro de cada fragmento) proporciona la resolución de la ruta en mosaico. Una ruta puede ser superpuesta, de extremo a extremo o espaciada. [3]
Tamaño de la matriz : Las primeras micromatrices utilizadas para ChIP-on-Chip contenían alrededor de 13.000 segmentos de ADN moteados que representaban todos los ORFs y regiones intergénicas del genoma de la levadura. [2] Hoy en día, Affymetrix ofrece matrices de levadura en mosaico de todo el genoma con una resolución de 5 pb (en total 3,2 millones de sondas). Las matrices en mosaico para el genoma humano también se vuelven cada vez más potentes. Solo por nombrar un ejemplo, Affymetrix ofrece un conjunto de siete matrices con alrededor de 90 millones de sondas, que abarcan la parte completa no repetitiva del genoma humano con un espaciado de aproximadamente 35 pb. (Febrero de 2007) Además de la micromatriz propiamente dicha, se necesita otro equipo de hardware y software para ejecutar experimentos de ChIP-on-chip. Por lo general, ocurre que las micromatrices de una empresa no pueden analizarse con el hardware de procesamiento de otra empresa. Por lo tanto, comprar una matriz requiere también comprar el equipo de flujo de trabajo asociado. Los elementos más importantes son, entre otros, hornos de hibridación, escáneres de chips y paquetes de software para el posterior análisis numérico de los datos brutos.
Partiendo de una pregunta biológica, un experimento de ChIP en chip se puede dividir en tres pasos principales: el primero consiste en configurar y diseñar el experimento seleccionando la matriz y el tipo de sonda adecuados. En segundo lugar, el experimento propiamente dicho se lleva a cabo en el laboratorio. Por último, durante la parte del ciclo en el laboratorio, se analizan los datos recopilados para responder a la pregunta inicial o dar lugar a nuevas preguntas para que el ciclo pueda comenzar de nuevo.
En el primer paso, la proteína de interés (POI) se une al sitio de ADN al que se une en un entorno in vitro . Por lo general, esto se hace mediante una fijación suave con formaldehído que es reversible con calor.
Luego, las células se lisan y el ADN se corta mediante sonicación o utilizando nucleasa microcócica . Esto da como resultado fragmentos de ADN de doble cadena, normalmente de 1 kb o menos de longitud. Los que se unieron al POI forman un complejo POI-ADN.
En el siguiente paso, solo estos complejos se filtran del conjunto de fragmentos de ADN, utilizando un anticuerpo específico para el POI. Los anticuerpos pueden estar unidos a una superficie sólida, pueden tener una perla magnética o alguna otra propiedad física que permita la separación de complejos reticulados y fragmentos no unidos. Este procedimiento es esencialmente una inmunoprecipitación (IP) de la proteína. Esto se puede hacer utilizando una proteína marcada con un anticuerpo contra la etiqueta (p. ej. FLAG , HA , c-myc) o con un anticuerpo contra la proteína nativa.
La reticulación de los complejos de POI-ADN se revierte (normalmente mediante calor) y las cadenas de ADN se purifican. Para el resto del flujo de trabajo, el POI ya no es necesario.
Después de un paso de amplificación y desnaturalización , los fragmentos de ADN monocatenario se marcan con una etiqueta fluorescente como Cy5 o Alexa 647.
Finalmente, los fragmentos se vierten sobre la superficie del microarray de ADN, que está salpicado de secuencias cortas de cadena sencilla que cubren la porción genómica de interés. Cuando un fragmento marcado "encuentra" un fragmento complementario en el array, se hibridarán y formarán nuevamente un fragmento de ADN de doble cadena.
Después de un período de tiempo suficientemente amplio para permitir la hibridación, la matriz se ilumina con luz fluorescente. Las sondas de la matriz que se hibridan con uno de los fragmentos marcados emiten una señal luminosa que es captada por una cámara. Esta imagen contiene todos los datos sin procesar para la parte restante del flujo de trabajo.
Estos datos en bruto, codificados como imágenes en falso color , deben convertirse en valores numéricos antes de que se pueda realizar el análisis real. El análisis y la extracción de información de los datos en bruto a menudo sigue siendo la parte más desafiante para los experimentos ChIP-on-chip. Los problemas surgen a lo largo de esta parte del flujo de trabajo, que van desde la lectura inicial del chip, hasta los métodos adecuados para restar el ruido de fondo y, finalmente, los algoritmos apropiados que normalizan los datos y los ponen a disposición para el análisis estadístico posterior , lo que, con suerte, conduce a una mejor comprensión de la cuestión biológica que el experimento busca abordar. Además, debido a las diferentes plataformas de matriz y la falta de estandarización entre ellas, el almacenamiento e intercambio de datos es un gran problema. En términos generales, el análisis de datos se puede dividir en tres pasos principales:
Durante el primer paso, las señales de fluorescencia capturadas de la matriz se normalizan mediante señales de control derivadas del mismo chip o de un segundo chip. Dichas señales de control indican qué sondas de la matriz se hibridaron correctamente y cuáles se unieron de forma no específica.
En el segundo paso, se aplican pruebas numéricas y estadísticas a los datos de control y a los datos de fracción de IP para identificar regiones enriquecidas con POI a lo largo del genoma. Los tres métodos siguientes se utilizan ampliamente: rango percentil medio, error de matriz única y ventana deslizante. Estos métodos generalmente difieren en cómo se manejan las señales de baja intensidad, cuánto ruido de fondo se acepta y qué característica de los datos se enfatiza durante el cálculo. En el pasado reciente, el enfoque de ventana deslizante parece ser el preferido y a menudo se describe como el más poderoso.
En el tercer paso, se analizan más a fondo estas regiones. Si, por ejemplo, el POI fuera un factor de transcripción, dichas regiones representarían sus sitios de unión. El análisis posterior puede entonces querer inferir motivos de nucleótidos y otros patrones para permitir la anotación funcional del genoma. [4]
Mediante el uso de matrices en mosaico , ChIP -on-chip permite obtener mapas de alta resolución de todo el genoma. Estos mapas pueden determinar los sitios de unión de muchas proteínas que se unen al ADN, como factores de transcripción y también modificaciones de la cromatina.
Aunque el ChIP-on-chip puede ser una técnica potente en el área de la genómica, es muy costosa. La mayoría de los estudios publicados que utilizan ChIP-on-chip repiten sus experimentos al menos tres veces para garantizar mapas biológicamente significativos. El costo de los microarrays de ADN es a menudo un factor limitante para decidir si un laboratorio debe proceder con un experimento ChIP-on-chip. Otra limitación es el tamaño de los fragmentos de ADN que se pueden lograr. La mayoría de los protocolos ChIP-on-chip utilizan sonicación como método para dividir el ADN en pequeños trozos. Sin embargo, la sonicación está limitada a un tamaño mínimo de fragmento de 200 pb. Para mapas de mayor resolución, esta limitación debe superarse para lograr fragmentos más pequeños, preferiblemente con una resolución de un solo nucleosoma . Como se mencionó anteriormente, el análisis estadístico de la enorme cantidad de datos generados a partir de los arrays es un desafío y los procedimientos de normalización deben apuntar a minimizar los artefactos y determinar qué es realmente biológicamente significativo. Hasta ahora, la aplicación a los genomas de mamíferos ha sido una limitación importante, por ejemplo, debido al porcentaje significativo del genoma que está ocupado por repeticiones. Sin embargo, a medida que avance la tecnología ChIP-on-chip, deberían ser posibles mapas de alta resolución del genoma completo de mamíferos.
Los anticuerpos utilizados para ChIP -on-chip pueden ser un factor limitante importante. ChIP -on-chip requiere anticuerpos altamente específicos que deben reconocer su epítopo en solución libre y también bajo condiciones fijas. Si se demuestra que inmunoprecipita con éxito la cromatina reticulada , se denomina "grado ChIP". Las empresas que proporcionan anticuerpos de grado ChIP incluyen Abcam , Cell Signaling Technology , Santa Cruz y Upstate. Para superar el problema de la especificidad, la proteína de interés se puede fusionar a una etiqueta como FLAG o HA que son reconocidas por anticuerpos. Una alternativa a ChIP-on-chip que no requiere anticuerpos es DamID .
También están disponibles anticuerpos contra una modificación específica de histonas como H3 tri metil K4. Como se mencionó anteriormente, la combinación de estos anticuerpos y ChIP-on-chip se ha vuelto extremadamente poderosa para determinar el análisis del genoma completo de los patrones de modificación de histonas y contribuirá enormemente a nuestra comprensión del código de histonas y la epigenética.
En PLoS Biology se ha publicado un estudio que demuestra la naturaleza no específica de las proteínas de unión al ADN, lo que indica que la confirmación alternativa de la relevancia funcional es un paso necesario en cualquier experimento con ChIP-chip. [5]
En 1999 se realizó un primer experimento ChIP-on-chip para analizar la distribución de la cohesina a lo largo del cromosoma III de la levadura en ciernes. [6] Aunque el genoma no estaba completamente representado, el protocolo de este estudio sigue siendo equivalente a los utilizados en estudios posteriores. La técnica ChIP-on-chip que utiliza todos los ORFs del genoma (que sin embargo sigue estando incompleto, faltan regiones intergénicas) se aplicó con éxito en tres artículos publicados en 2000 y 2001. [7] [8] [9] Los autores identificaron sitios de unión para factores de transcripción individuales en la levadura en ciernes Saccharomyces cerevisiae . En 2002, el grupo de Richard Young [10] determinó las posiciones de todo el genoma de 106 factores de transcripción utilizando un sistema de etiquetado c-Myc en levadura. La primera demostración de la técnica ChIP-on-chip en mamíferos informó del aislamiento de nueve fragmentos de cromatina que contenían un sitio de unión E2F débil y fuerte, realizada por el laboratorio de Peggy Farnham en colaboración con el laboratorio de Michael Zhang y publicada en 2001. [11] Este estudio fue seguido varios meses después en una colaboración entre el laboratorio de Young y el laboratorio de Brian Dynlacht que utilizó la técnica ChIP-on-chip para demostrar por primera vez que los objetivos E2F codifican componentes del punto de control del daño del ADN y las vías de reparación, así como factores involucrados en el ensamblaje/condensación de la cromatina, la segregación cromosómica y el punto de control del huso mitótico [12] Otras aplicaciones para ChIP-on-chip incluyen la replicación del ADN , la recombinación y la estructura de la cromatina. Desde entonces, ChIP-on-chip se ha convertido en una poderosa herramienta para determinar mapas de modificaciones de histonas en todo el genoma y muchos más factores de transcripción. ChIP-on-chip en sistemas de mamíferos ha sido difícil debido a los genomas grandes y repetitivos. Por ello, muchos estudios en células de mamíferos se han centrado en regiones promotoras seleccionadas que se prevé que se unirán a factores de transcripción y no han analizado el genoma completo. Sin embargo, recientemente se han comercializado matrices de genomas de mamíferos completos de empresas como Nimblegen. En el futuro, a medida que las matrices ChIP-on-chip se vuelvan cada vez más avanzadas, se analizarán con más detalle mapas de alta resolución de todo el genoma de proteínas de unión al ADN y componentes de la cromatina de mamíferos.
Introducida en 2007, la secuenciación ChIP (ChIP-seq) es una tecnología que utiliza la inmunoprecipitación de la cromatina para unir las proteínas de interés al ADN, pero en lugar de utilizar una micromatriz, utiliza el método de secuenciación más preciso y de mayor rendimiento para localizar los puntos de interacción. [13]
DamID es un método alternativo que no requiere anticuerpos.
ChIP-exo utiliza el tratamiento con exonucleasa para lograr una resolución de hasta un solo par de bases.
La secuenciación CUT&RUN utiliza el reconocimiento de anticuerpos con escisión enzimática dirigida para abordar algunas limitaciones técnicas de ChIP.