stringtranslate.com

secuenciación de chips

La secuenciación de ChIP , también conocida como ChIP-seq , es un método utilizado para analizar las interacciones de proteínas con el ADN . ChIP-seq combina la inmunoprecipitación de cromatina ChIP con una secuenciación masiva de ADN paralela para identificar los sitios de unión de las proteínas asociadas al ADN. Puede utilizarse para mapear sitios de unión globales con precisión para cualquier proteína de interés. Anteriormente, ChIP-on-chip era la técnica más común utilizada para estudiar estas relaciones proteína-ADN.

Usos

ChIP-seq se utiliza principalmente para determinar cómo los factores de transcripción y otras proteínas asociadas a la cromatina influyen en los mecanismos que afectan el fenotipo . Determinar cómo las proteínas interactúan con el ADN para regular la expresión genética es esencial para comprender completamente muchos procesos biológicos y estados patológicos. Esta información epigenética es complementaria al análisis de genotipo y expresión. La tecnología ChIP-seq se considera actualmente principalmente como una alternativa al chip ChIP que requiere una matriz de hibridación . Esto introduce cierto sesgo, ya que una matriz está restringida a un número fijo de sondas. Por el contrario, se cree que la secuenciación tiene menos sesgo, aunque aún no se comprende completamente el sesgo de secuenciación de diferentes tecnologías de secuenciación. [1]

Los sitios de ADN específicos en interacción física directa con factores de transcripción y otras proteínas pueden aislarse mediante inmunoprecipitación de cromatina . ChIP produce una biblioteca de sitios de ADN objetivo unidos a una proteína de interés. Se utilizan análisis de secuencias masivamente paralelos junto con bases de datos de secuencias del genoma completo para analizar el patrón de interacción de cualquier proteína con el ADN, [2] o el patrón de cualquier modificación epigenética de la cromatina . Esto se puede aplicar al conjunto de proteínas y modificaciones compatibles con ChIP, como factores de transcripción, polimerasas y maquinaria transcripcional , proteínas estructurales , modificaciones de proteínas y modificaciones del ADN. [3] Como alternativa a la dependencia de anticuerpos específicos, se han desarrollado diferentes métodos para encontrar el superconjunto de todas las regiones reguladoras activas del genoma agotadas o alteradas por nucleosomas, como DNase -Seq [4] y FAIRE-Seq . [5] [6]

Flujo de trabajo de secuenciación de ChIP

Flujo de trabajo de secuenciación de chips

Chip

ChIP es un método poderoso para enriquecer selectivamente secuencias de ADN unidas por una proteína particular en células vivas . Sin embargo, el uso generalizado de este método se ha visto limitado por la falta de un método suficientemente sólido para identificar todas las secuencias de ADN enriquecidas. El protocolo de laboratorio húmedo de ChIP contiene ChIP e hibridación. Básicamente, el protocolo ChIP [7] consta de cinco partes que ayudan a comprender mejor el proceso general de ChIP. Para llevar a cabo el ChIP, el primer paso es la reticulación [8] utilizando formaldehído y grandes lotes de ADN para obtener una cantidad útil. Los enlaces cruzados se producen entre la proteína y el ADN, pero también entre el ARN y otras proteínas. El segundo paso es el proceso de fragmentación de la cromatina que rompe la cromatina para obtener al final piezas de ADN de alta calidad para el análisis de ChIP. Estos fragmentos deben cortarse para tener menos de 500 pares de bases [9] cada uno para obtener el mejor resultado para el mapeo del genoma. El tercer paso se llama inmunoprecipitación de cromatina, [7] que es la abreviatura de ChIP. El proceso ChIP mejora complejos de ADN-proteína reticulados específicos utilizando un anticuerpo contra la proteína de interés seguido de incubación y centrifugación para obtener la inmunoprecipitación. La etapa de inmunoprecipitación también permite la eliminación de sitios de unión no específicos. El cuarto paso es la recuperación y purificación del ADN, [7] que se produce mediante el efecto inverso del entrecruzamiento entre el ADN y la proteína para separarlos y limpiar el ADN con una extracción. El quinto y último paso es el paso de análisis del protocolo ChIP mediante el proceso de qPCR , ChIP-on-chip (matriz híbrida) o secuenciación de ChIP. Luego se añaden adaptadores de oligonucleótidos a los pequeños tramos de ADN que estaban unidos a la proteína de interés para permitir una secuenciación masiva en paralelo . A través del análisis, las secuencias pueden identificarse e interpretarse según el gen o la región a la que se unió la proteína. [7]

Secuenciación

Después de la selección del tamaño, todos los fragmentos de ADN ChIP resultantes se secuencian simultáneamente utilizando un secuenciador de genoma. Una sola secuenciación puede buscar asociaciones en todo el genoma con alta resolución, lo que significa que las características pueden ubicarse con precisión en los cromosomas. ChIP-chip, por el contrario, requiere grandes conjuntos de matrices de mosaicos para una resolución más baja. [10]

Hay muchos métodos de secuenciación nuevos que se utilizan en este paso de secuenciación. Algunas tecnologías que analizan las secuencias pueden utilizar la amplificación en grupo de fragmentos de ADN ChIP ligados por adaptador en un sustrato de celda de flujo sólido para crear grupos de aproximadamente 1000 copias clonales cada uno. La matriz de alta densidad resultante de grupos de plantillas en la superficie de la celda de flujo se secuencia mediante un programa de análisis del genoma. Cada grupo de plantillas se secuencia por síntesis en paralelo utilizando nuevos nucleótidos terminadores reversibles marcados con fluorescencia. Las plantillas se secuencian base por base durante cada lectura. Luego, el software de análisis y recopilación de datos alinea las secuencias de muestra con una secuencia genómica conocida para identificar los fragmentos de ChIP-DNA. [ cita necesaria ]

Control de calidad

ChIP-seq nos ofrece un análisis rápido, sin embargo, se debe realizar un control de calidad para asegurarnos de que los resultados obtenidos sean confiables:

Sensibilidad

La sensibilidad de esta tecnología depende de la profundidad de la secuenciación (es decir, el número de etiquetas de secuencia mapeadas), el tamaño del genoma y la distribución del factor objetivo. La profundidad de la secuenciación está directamente correlacionada con el costo. Si es necesario mapear con alta sensibilidad abundantes aglutinantes en genomas grandes, los costos son altos ya que se requerirá un número enormemente alto de etiquetas de secuencia. Esto contrasta con el chip ChIP, en el que los costes no están correlacionados con la sensibilidad. [12] [13]

A diferencia de los métodos ChIP basados ​​en microarrays , la precisión del ensayo ChIP-seq no está limitada por el espaciado de las sondas predeterminadas. Al integrar una gran cantidad de lecturas cortas, se obtiene una localización del sitio de unión altamente precisa. En comparación con ChIP-chip, los datos de ChIP-seq se pueden utilizar para localizar el sitio de unión a unas pocas decenas de pares de bases del sitio de unión a proteína real. Las densidades de etiquetas en los sitios de unión son un buen indicador de la afinidad de unión entre proteína y ADN, [14] lo que facilita la cuantificación y comparación de las afinidades de unión de una proteína a diferentes sitios de ADN. [15]

La investigación actual

Asociación de ADN de STAT1: ChIP-seq se utilizó para estudiar objetivos STAT1 en células HeLa S3, que son clones de la línea HeLa que se utilizan para el análisis de poblaciones celulares. [16] Luego se comparó el rendimiento de ChIP-seq con los métodos alternativos de interacción proteína-ADN de ChIP-PCR y ChIP-chip. [17]

Arquitectura de promotores de nucleosomas: utilizando ChIP-seq, se determinó que los genes de levadura parecen tener una región promotora mínima libre de nucleosomas de 150 pb en la que la ARN polimerasa puede iniciar la transcripción. [18]

Conservación del factor de transcripción: se utilizó ChIP-seq para comparar la conservación de los TF en el tejido del cerebro anterior y del corazón en ratones embrionarios. Los autores identificaron y validaron la funcionalidad cardíaca de los potenciadores de la transcripción y determinaron que los potenciadores de la transcripción del corazón están menos conservados que los del prosencéfalo durante la misma etapa de desarrollo. [19]

ChIP-seq de todo el genoma: se completó la secuenciación de ChIP en el gusano C. elegans para explorar los sitios de unión de 22 factores de transcripción en todo el genoma. Hasta el 20% de los genes candidatos anotados se asignaron a factores de transcripción. Se asignaron varios factores de transcripción a regiones de ARN no codificantes y pueden estar sujetos a variables ambientales o de desarrollo. También se identificaron las funciones de algunos de los factores de transcripción. Algunos de los factores de transcripción regulan genes que controlan otros factores de transcripción. Estos genes no están regulados por otros factores. La mayoría de los factores de transcripción sirven como objetivos y reguladores de otros factores, lo que demuestra una red de regulación. [20]

Red reguladora inferida: se demostró que la señal ChIP-seq de modificación de histonas está más correlacionada con motivos de factores de transcripción en los promotores en comparación con el nivel de ARN. [21] Por lo tanto, el autor propuso que el uso de la modificación de histonas ChIP-seq proporcionaría una inferencia más confiable de las redes reguladoras de genes en comparación con otros métodos basados ​​en la expresión.

ChIP-seq ofrece una alternativa a ChIP-chip. Los datos experimentales de ChIP-seq de STAT1 tienen un alto grado de similitud con los resultados obtenidos por ChIP-chip para el mismo tipo de experimento, con más del 64 % de picos en regiones genómicas compartidas. Debido a que los datos son lecturas de secuencia, ChIP-seq ofrece un proceso de análisis rápido siempre que haya una secuencia del genoma de alta calidad disponible para la lectura del mapeo y el genoma no tenga contenido repetitivo que confunda el proceso de mapeo. ChIP-seq también tiene el potencial de detectar mutaciones en las secuencias del sitio de unión, lo que puede respaldar directamente cualquier cambio observado en la unión de proteínas y la regulación genética.

Análisis computacional

Como ocurre con muchos enfoques de secuenciación de alto rendimiento, ChIP-seq genera conjuntos de datos extremadamente grandes, para los cuales se requieren métodos de análisis computacional apropiados. Para predecir los sitios de unión al ADN a partir de los datos de recuento de lecturas de ChIP-seq, se han desarrollado métodos de llamada de picos . Uno de los métodos más populares [ cita necesaria ] es MACS, que modela empíricamente el tamaño de cambio de las etiquetas ChIP-Seq y lo utiliza para mejorar la resolución espacial de los sitios de unión previstos. [22] MACS está optimizado para picos de mayor resolución, mientras que otro algoritmo popular, SICER, está programado para solicitar picos más amplios, que abarcan desde kilobases hasta megabases para buscar dominios de cromatina más amplios. SICER es más útil para las marcas de histonas que abarcan cuerpos genéticos. Se puede utilizar un método matemático más riguroso, BCP (punto de cambio bayesiano), para picos tanto agudos como amplios con una velocidad computacional más rápida, [23] consulte la comparación comparativa de las herramientas de llamada de picos ChIP-seq realizada por Thomas et al. (2017). [24]

Otro problema computacional relevante es la llamada diferencial de picos, que identifica diferencias significativas en dos señales ChIP-seq de distintas condiciones biológicas. Los llamadores de picos diferenciales segmentan dos señales ChIP-seq e identifican picos diferenciales utilizando modelos ocultos de Markov . Ejemplos de llamadores de pico diferencial de dos etapas son ChIPDiff [25] y ODIN. [26]

Para reducir los sitios falsos de ChIP-seq, se pueden usar múltiples controles experimentales para detectar sitios de unión de un experimento de IP. Bay2Ctrls adopta un modelo bayesiano para integrar el control de entrada de ADN para la IP, la IP simulada y su correspondiente control de entrada de ADN para predecir los sitios de unión a partir de la IP. [27] Este enfoque es particularmente eficaz para muestras complejas, como organismos modelo completos. Además, el análisis indica que, para muestras complejas, los controles de IP simulados superan sustancialmente a los controles de entrada de ADN, probablemente debido a los genomas activos de las muestras. [27]

Ver también

Métodos similares

Referencias

  1. ^ Mahoma, Isiaka Ibrahim; Kong, Sze Ling; Akmar Abdullah, Siti Nor; Munusamy, Umaiyal (25 de diciembre de 2019). "RNA-seq y ChIP-seq como enfoques complementarios para la comprensión del mecanismo regulador transcripcional de las plantas". Revista Internacional de Ciencias Moleculares . 21 (1): 167. doi : 10.3390/ijms21010167 . ISSN  1422-0067. PMC  6981605 . PMID  31881735.
  2. ^ Johnson DS, Mortazavi A, Myers RM, Wold B (junio de 2007). "Mapeo de todo el genoma de las interacciones proteína-ADN in vivo" (PDF) . Ciencia . 316 (5830): 1497–502. Código bibliográfico : 2007 Ciencia... 316.1497J. doi : 10.1126/ciencia.1141319. PMID  17540862. S2CID  519841.
  3. ^ "Secuenciación IP de cromatina del genoma completo (ChIP-Seq)" (PDF) . Illumina, Inc. 26 de noviembre de 2007.
  4. ^ Canción, Lingyun; Crawford, Gregory E. (febrero de 2010). "DNase-seq: una técnica de alta resolución para mapear elementos reguladores de genes activos en todo el genoma de células de mamíferos". Protocolos de Cold Spring Harbor . 2010 (2): pdb.prot5384. doi :10.1101/pdb.prot5384. ISSN  1559-6095. PMC 3627383 . PMID  20150147. 
  5. ^ Giresi, Paul G.; Kim, Jonghwan; McDaniell, Ryan M.; Iyer, Vishwanath R.; Lieb, Jason D. (junio de 2007). "FAIRE (aislamiento de elementos reguladores asistido por formaldehído) aísla elementos reguladores activos de la cromatina humana". Investigación del genoma . 17 (6): 877–885. doi :10.1101/gr.5533506. ISSN  1088-9051. PMC 1891346 . PMID  17179217. 
  6. ^ Kumar, Vibhor; Muratani, Masafumi; Rayan, Nirmala Arul; Kraus, Petra; Lufkin, Thomas; Ng, Huck Hui; Prabhakar, Shyam (julio de 2013). "Procesamiento de señales óptimo y uniforme de datos de secuenciación profunda mapeados". Biotecnología de la Naturaleza . 31 (7): 615–622. doi : 10.1038/nbt.2596 . ISSN  1087-0156. PMID  23770639. S2CID  32510475.
  7. ^ abcd "Guía ChIP: aplicaciones de epigenética | Abcam". www.abcam.com . Consultado el 2 de marzo de 2020 .
  8. ^ Kim TH, Dekker J (abril de 2018). "Reticulación de formaldehído". Protocolos de Cold Spring Harbor . 2018 (4): pdb.prot082594. doi : 10.1101/pdb.prot082594. PMID  29610357.
  9. ^ Kim TH, Dekker J (abril de 2018). "Preparación de cromatina reticulada para ChIP". Protocolos de Cold Spring Harbor . 2018 (4): pdb.prot082602. doi : 10.1101/pdb.prot082602. PMID  29610358.
  10. ^ Park, Peter J. (octubre de 2009). "ChIP-seq: ventajas y desafíos de una tecnología en maduración". Reseñas de la naturaleza. Genética . 10 (10): 669–680. doi :10.1038/nrg2641. ISSN  1471-0064. PMC 3191340 . PMID  19736561. 
  11. ^ ab Chen, Yiwen; Negre, Nicolás; Li, Qunhua; Mieczkowska, Joanna O.; Slattery, Mateo; Liu, Tao; Zhang, Yong; Kim, Tae Kyung; Él, Housheng Hansen; Zieba, Jennifer; Ruan, Yijun (junio de 2012). "Evaluación sistemática de factores que influyen en la fidelidad de ChIP-seq". Métodos de la naturaleza . 9 (6): 609–614. doi :10.1038/nmeth.1985. ISSN  1548-7105. PMC 3477507 . PMID  22522655. 
  12. ^ Jung, Youngsook L.; Luquette, Lovelace J.; Ho, Josué WK; Ferrari, Francisco; Tolstorukov, Michael; Minoda, Aki; Issner, Robbyn; Epstein, Charles B.; Karpen, Gary H.; Kuroda, Mitzi I.; Park, Peter J. (mayo de 2014). "Impacto de la profundidad de secuenciación en experimentos ChIP-seq". Investigación de ácidos nucleicos . 42 (9): e74. doi : 10.1093/nar/gku178. ISSN  1362-4962. PMC 4027199 . PMID  24598259. 
  13. ^ Ho, Joshua WK; Obispo, Eric; Karchenko, Peter V.; Nègre, Nicolás; Blanco, Kevin P.; Park, Peter J. (28 de febrero de 2011). "ChIP-chip versus ChIP-seq: lecciones para el diseño experimental y análisis de datos". Genómica BMC . 12 : 134. doi : 10.1186/1471-2164-12-134 . ISSN  1471-2164. PMC 3053263 . PMID  21356108. 
  14. ^ Jothi, et al. (2008). "Identificación de todo el genoma de sitios de unión de ADN-proteína in vivo a partir de datos de ChIP-seq". Ácidos nucleicos Res . 36 (16): 5221–5231. doi : 10.1093/nar/gkn488 . PMC 2532738 . PMID  18684996. 
  15. ^ Bernstein BE, Kamal M, Lindblad-Toh K, Bekiranov S, Bailey DK, Huebert DJ y otros. (Enero de 2005). "Mapas genómicos y análisis comparativo de modificaciones de histonas en humanos y ratones". Celúla . 120 (2): 169–81. doi : 10.1016/j.cell.2005.01.001 . PMID  15680324. S2CID  7193829.
  16. ^ "HeLa S3 de ATCC | Biocompare.com". www.biocompare.com . Consultado el 21 de marzo de 2020 .
  17. ^ Robertson G, Hirst M, Bainbridge M, Bilenky M, Zhao Y, Zeng T, et al. (Agosto de 2007). "Perfiles de todo el genoma de la asociación de ADN de STAT1 mediante inmunoprecipitación de cromatina y secuenciación masiva paralela". Métodos de la naturaleza . 4 (8): 651–7. doi : 10.1038/nmeth1068. PMID  17558387. S2CID  28531263.
  18. ^ Schmid CD, Bucher P (noviembre de 2007). "Los datos de ChIP-Seq revelan la arquitectura de nucleosomas de promotores humanos". Celúla . 131 (5): 831–2, respuesta del autor 832–3. doi : 10.1016/j.cell.2007.11.017 . PMID  18045524. S2CID  29234049.
  19. ^ Blow MJ, McCulley DJ, Li Z, Zhang T, Akiyama JA, Holt A, et al. (Septiembre de 2010). "Identificación ChIP-Seq de potenciadores cardíacos débilmente conservados". Genética de la Naturaleza . 42 (9): 806–10. doi :10.1038/ng.650. PMC 3138496 . PMID  20729851. 
  20. ^ Niu W, Lu ZJ, Zhong M, Sarov M, Murray JI, Brdlik CM y col. (febrero de 2011). "Diversas características de unión de factores de transcripción reveladas por ChIP-seq de todo el genoma en C. elegans". Investigación del genoma . 21 (2): 245–54. doi :10.1101/gr.114587.110. PMC 3032928 . PMID  21177963. 
  21. ^ Kumar V, Muratani M, Rayan NA, Kraus P, Lufkin T, Ng HH, Prabhakar S (julio de 2013). "Procesamiento de señales óptimo y uniforme de datos de secuenciación profunda mapeados". Biotecnología de la Naturaleza . 31 (7): 615–22. doi : 10.1038/nbt.2596 . PMID  23770639.
  22. ^ Zhang Y, Liu T, Meyer CA, Eeckhoute J, Johnson DS, Bernstein BE, et al. (2008). "Análisis basado en modelos de ChIP-Seq (MACS)". Biología del genoma . 9 (9): R137. doi : 10.1186/gb-2008-9-9-r137 . PMC 2592715 . PMID  18798982. 
  23. ^ Xing H, Mo Y, Liao W, Zhang MQ (2012). "Localización de todo el genoma de la unión proteína-ADN y modificación de histonas mediante un método de punto de cambio bayesiano con datos ChIP-seq". PLOS Comput Biol . 8 (7): e1002613. Código Bib : 2012PLSCB...8E2613X. doi : 10.1371/journal.pcbi.1002613 . PMC 5429005 . PMID  22844240. 
  24. ^ Thomas R, Thomas S, Holloway AK, Pollard KS (2017). "Características que definen los mejores algoritmos de llamada de picos de ChIP-seq". Breve Bioinformación . 18 (3): 441–450. doi : 10.1093/babero/bbw035. PMC 5429005 . PMID  27169896. 
  25. ^ Xu H, Wei CL, Lin F, Sung WK ​​(octubre de 2008). "Un enfoque HMM para la identificación de todo el genoma de sitios de modificación diferencial de histonas a partir de datos ChIP-seq". Bioinformática . 24 (20): 2344–9. doi : 10.1093/bioinformática/btn402 . PMID  18667444.
  26. ^ Allhoff M, Seré K, Chauvistré H, Lin Q, Zenke M, Costa IG (diciembre de 2014). "Detección de picos diferenciales en señales ChIP-seq con ODIN". Bioinformática . 30 (24): 3467–75. doi : 10.1093/bioinformática/btu722. PMID  25371479.
  27. ^ ab Xu, Jinrui; Kudron, Michelle M; Victorsen, Alec; Gao, Jiahao; Ammouri, Haneen N; Navarro, Fabio CP; Gevirtzman, Luis; Waterston, Robert H; Blanco, Kevin P; Reinke, Valerie; Gerstein, Mark (21 de diciembre de 2020). "Para burlarse o no: una comparación completa de entradas de ADN y IP simuladas para ChIP-seq". Investigación de ácidos nucleicos . 49 (3): gkaa1155. doi : 10.1093/nar/gkaa1155 . ISSN  0305-1048. PMC 7897498 . PMID  33347581. 
  28. ^ Licatalosi DD, Mele A, Fak JJ, Ule J, Kayikci M, Chi SW y col. (noviembre de 2008). "HITS-CLIP proporciona información sobre todo el genoma sobre el procesamiento de ARN alternativo del cerebro". Naturaleza . 456 (7221): 464–9. Código Bib :2008Natur.456..464L. doi : 10.1038/naturaleza07488. PMC 2597294 . PMID  18978773. 
  29. ^ Darnell RB (2010). "HITS-CLIP: vistas panorámicas de la regulación de proteínas-ARN en células vivas". Reseñas interdisciplinarias de Wiley. ARN . 1 (2): 266–286. doi :10.1002/wrna.31. PMC 3222227 . PMID  21935890. 
  30. ^ Wang H, Mayhew D, Chen X, Johnston M, Mitra RD (mayo de 2011). "Las tarjetas telefónicas permiten la identificación multiplexada de los objetivos genómicos de las proteínas de unión al ADN". Investigación del genoma . 21 (5): 748–55. doi :10.1101/gr.114850.110. PMC 3083092 . PMID  21471402. 

enlaces externos

  1. ^ Chèneby J, Gheorghe M, Artufel M, Mathelier A, Ballester B (enero de 2018). "ReMap 2018: un atlas actualizado de regiones reguladoras a partir de un análisis integrativo de experimentos ChIP-seq de unión a ADN". Investigación de ácidos nucleicos . 46 (D1): D267-D275. doi :10.1093/nar/gkx1092. PMC 5753247 . PMID  29126285. 
  2. ^ Bailey T, Krajewski P, Ladunga I, Lefebvre C, Li Q, Liu T, et al. (2013). "Pautas prácticas para el análisis integral de datos ChIP-seq". PLOS Biología Computacional . 9 (11): e1003326. Código Bib : 2013PLSCB...9E3326B. doi : 10.1371/journal.pcbi.1003326 . PMC 3828144 . PMID  24244136.