stringtranslate.com

Matriz de mosaicos

Comparación de métodos para la cobertura genómica dentro de aplicaciones de matriz de teselas.

Los microarrays son un subtipo de chips de microarrays . Al igual que los microarrays tradicionales, funcionan hibridando moléculas de ADN o ARN marcadas con sondas fijadas sobre una superficie sólida.

Los arreglos de mosaico se diferencian de los microarreglos tradicionales en la naturaleza de las sondas. En lugar de sondear secuencias de genes conocidos o predichos que pueden estar dispersos por todo el genoma , los arreglos de mosaico sondean intensivamente secuencias que se sabe que existen en una región contigua. Esto es útil para caracterizar regiones que están secuenciadas, pero cuyas funciones locales son en gran parte desconocidas. Los arreglos de mosaico ayudan en el mapeo del transcriptoma , así como en el descubrimiento de sitios de interacción ADN/ proteína ( ChIP-chip , DamID ), de metilación del ADN (MeDIP-chip) y de sensibilidad a la DNasa (DNase Chip) y al CGH de arreglo. [1] Además de detectar genes no identificados previamente y secuencias reguladoras, es posible una cuantificación mejorada de los productos de transcripción. Las sondas específicas están presentes en millones de copias (a diferencia de solo varias en los arreglos tradicionales) dentro de una unidad de arreglo llamada característica, con entre 10,000 y más de 6,000,000 de características diferentes por arreglo. [2] Se pueden obtener resoluciones de mapeo variables ajustando la cantidad de superposición de secuencias entre sondas, o la cantidad de pares de bases conocidos entre secuencias de sondas, así como la longitud de la sonda. Para genomas más pequeños como Arabidopsis , se pueden examinar genomas completos. [3] Las matrices de mosaico son una herramienta útil en estudios de asociación de todo el genoma .

Síntesis y fabricantes

Las dos formas principales de sintetizar matrices de mosaico son la fabricación fotolitográfica y la impresión o punteo mecánico.

El primer método implica la síntesis in situ , en la que se construyen sondas de aproximadamente 25 pb sobre la superficie del chip. Estas matrices pueden contener hasta 6 millones de características discretas, cada una de las cuales contiene millones de copias de una sonda.

La otra forma de sintetizar chips de matriz de mosaico es mediante la impresión mecánica de sondas en el chip. Esto se hace mediante el uso de máquinas automatizadas con pines que colocan las sondas previamente sintetizadas en la superficie. Debido a la restricción de tamaño de los pines, estos chips pueden albergar hasta casi 400.000 características. [4] Tres fabricantes de matrices de mosaico son Affymetrix , NimbleGen y Agilent . Sus productos varían en la longitud y el espaciado de las sondas. ArrayExplorer.com es un servidor web gratuito para comparar matrices de mosaico.

Aplicaciones y tipos

Descripción general del procedimiento ChIP-chip.

Chip-chip

El uso más popular de los microarrays de ADN es el de los chips ChIP. La inmunoprecipitación de la cromatina permite identificar los sitios de unión de las proteínas . Una variante de este método que abarca todo el genoma se conoce como ChIP-on-chip. Las proteínas que se unen a la cromatina se reticulan in vivo , normalmente mediante fijación con formaldehído . A continuación, la cromatina se fragmenta y se expone a anticuerpos específicos de la proteína de interés. A continuación, estos complejos se precipitan. A continuación, se aísla y purifica el ADN. Con los microarrays de ADN tradicionales, el ADN inmunoprecipitado se hibrida con el chip, que contiene sondas diseñadas para cubrir regiones representativas del genoma. Se pueden utilizar sondas superpuestas o sondas muy próximas entre sí. Esto proporciona un análisis imparcial con alta resolución. Además de estas ventajas, los microarrays de ADN muestran una alta reproducibilidad y, con sondas superpuestas que abarcan grandes segmentos del genoma, los microarrays de ADN pueden interrogar los sitios de unión de las proteínas, que albergan repeticiones. Los experimentos con ChIP-chip han podido identificar sitios de unión de factores de transcripción en todo el genoma de levaduras, drosophila y algunas especies de mamíferos. [5]

Descripción general del procedimiento de mapeo del transcriptoma.

Mapeo del transcriptoma

Otro uso popular de las matrices de teselación es para encontrar genes expresados. Los métodos tradicionales de predicción de genes para la anotación de secuencias genómicas han tenido problemas cuando se han utilizado para mapear el transcriptoma, como no producir una estructura precisa de los genes y también omitir transcripciones por completo. El método de secuenciación de ADNc para encontrar genes transcritos también se enfrenta a problemas, como no detectar moléculas de ARN raras o muy cortas, y por lo tanto no detectar genes que están activos solo en respuesta a señales o que son específicos de un marco de tiempo. Las matrices de teselación pueden resolver estos problemas. Debido a la alta resolución y sensibilidad, se pueden detectar incluso moléculas pequeñas y raras. La naturaleza superpuesta de las sondas también permite la detección de ARN no poliadenilado y puede producir una imagen más precisa de la estructura genética. [6] Estudios anteriores sobre los cromosomas 21 y 22 mostraron el poder de las matrices de teselación para identificar unidades de transcripción. [7] [8] [9] Los autores utilizaron sondas de 25 meros que estaban separadas por 35 pb, abarcando todos los cromosomas. Los objetivos marcados se crearon a partir de ARN poliadenilado. Encontraron muchas más transcripciones de las predichas y el 90% estaban fuera de los exones anotados. Otro estudio con Arabidopsis utilizó matrices de oligonucleótidos de alta densidad que cubren todo el genoma. Se encontraron más de 10 veces más transcripciones de las predichas por los EST [ aclaración necesaria ] y otras herramientas de predicción. [3] [10] También se encontraron nuevas transcripciones en las regiones centroméricas donde se pensaba que no se expresaban genes activamente. Se han identificado muchos ARN antisentido naturales y no codificantes utilizando matrices de teselación. [9]

Descripción general del procedimiento del chip MeDIP.

Chip MeDIP

La inmunoprecipitación de metil-ADN seguida de un análisis de matriz de mosaico permite el mapeo y la medición de la metilación del ADN en todo el genoma. El ADN se metila en citosina en dinucleótidos CG en muchos lugares del genoma. Esta modificación es uno de los cambios epigenéticos hereditarios mejor comprendidos y se ha demostrado que afecta la expresión génica. El mapeo de estos sitios puede contribuir al conocimiento de los genes expresados ​​y también a la regulación epigenética a nivel de todo el genoma. Los estudios de matriz de mosaico han generado mapas de metilación de alta resolución para el genoma de Arabidopsis para generar el primer "metiloma".

Descripción general del procedimiento DNase-chip.

Chip de ADNasa

El chip DNase es una aplicación de matrices de mosaico para identificar sitios hipersensibles, segmentos de cromatina abierta que se escinden más fácilmente con DNaseI. La escisión con DNaseI produce fragmentos más grandes, de alrededor de 1,2 kb de tamaño. Se ha demostrado que estos sitios hipersensibles predicen con precisión elementos reguladores como regiones promotoras, potenciadores y silenciadores. [11] Históricamente, el método utiliza Southern blotting para encontrar fragmentos digeridos. Las matrices de mosaico han permitido a los investigadores aplicar la técnica a escala de todo el genoma.

Hibridación genómica comparativa (CGH)

La CGH basada en matrices es una técnica que se utiliza a menudo en el diagnóstico para comparar las diferencias entre los tipos de ADN, como las células normales frente a las cancerosas. Para la CGH de matrices se utilizan habitualmente dos tipos de matrices en mosaico: el genoma completo y el mosaico fino. El enfoque del genoma completo sería útil para identificar variaciones en el número de copias con alta resolución. Por otro lado, la CGH de matriz en mosaico fino produciría una resolución ultraalta para encontrar otras anomalías, como puntos de ruptura. [12]

Procedimiento

Flujo de trabajo del procedimiento de agrupamiento de matrices.

Existen varios métodos diferentes para realizar el mosaico de una matriz. Un protocolo para analizar la expresión génica implica primero aislar el ARN total. Luego, se purifica este ARN de las moléculas de ARNr. El ARN se copia en ADN de doble cadena, que posteriormente se amplifica y se transcribe in vitro a ARNbc. El producto se divide en triplicados para producir ADN de doble cadena, que luego se fragmenta y se etiqueta. Finalmente, las muestras se hibridan con el chip de mosaico de la matriz. Las señales del chip se escanean e interpretan mediante computadoras.

Existen varios programas y algoritmos disponibles para el análisis de datos y sus beneficios varían según el fabricante del chip. Para los chips Affymetrix, el análisis basado en modelos de matriz de mosaicos (MAT) o el análisis hipergeométrico de matrices de mosaicos (HAT [13] ) son algoritmos de búsqueda de picos eficaces. Para los chips NimbleGen, TAMAL es más adecuado para localizar sitios de unión. Los algoritmos alternativos incluyen MA2C y TileScope, que son menos complicados de operar. El algoritmo de desconvolución de unión conjunta se utiliza comúnmente para los chips Agilent. Si se requiere un análisis de secuencia del sitio de unión o la anotación del genoma, se utilizan programas como MEME, Gibbs Motif Sampler, sistema de anotación de elementos reguladores cis y Galaxy . [4]

Ventajas y desventajas

Las matrices de mosaico proporcionan una herramienta imparcial para investigar la unión de proteínas, la expresión génica y la estructura génica en todo el genoma. Permiten un nuevo nivel de conocimiento en el estudio del transcriptoma y el metiloma.

Entre las desventajas se encuentra el costo de los kits de matriz de mosaico. Aunque los precios han bajado en los últimos años, el precio hace que sea poco práctico utilizar matrices de mosaico de todo el genoma para genomas de mamíferos y otros genomas grandes. Otro problema es el "ruido transcripcional" producido por su capacidad de detección ultrasensible. [2] Además, el método no proporciona un inicio o un final claramente definidos para las regiones de interés identificadas por la matriz. Finalmente, las matrices generalmente solo brindan números de cromosoma y posición, por lo que a menudo es necesario secuenciar como un paso separado (aunque algunas matrices modernas brindan información de secuencia. [14] )

Referencias

  1. ^ Yazaki, J; Gregory, BD; Ecker, JR (octubre de 2007). "Mapeo del paisaje del genoma utilizando tecnología de matriz de mosaico". Current Opinion in Plant Biology . 10 (5): 534–42. doi :10.1016/j.pbi.2007.07.006. PMC  2665186 . PMID  17703988.
  2. ^ ab Mockler, TC; Chan, S; Sundaresan, A; Chen, H; Jacobsen, SE; Ecker, JR (enero de 2005). "Aplicaciones de matrices de teselación de ADN para el análisis del genoma completo". Genómica . 85 (1): 1–15. doi :10.1016/j.ygeno.2004.10.005. PMID  15607417.
  3. ^ ab Yamada, K; Lim, J; Dale, JM; Chen, H; Shinn, P; Palm, CJ; Southwick, AM; Wu, HC; Kim, C; Nguyen, M; Pham, P; Cheuk, R; et al. (31 de octubre de 2003). "Análisis empírico de la actividad transcripcional en el genoma de Arabidopsis". Science . 302 (5646): 842–6. Bibcode :2003Sci...302..842Y. doi :10.1126/science.1088305. PMID  14593172. S2CID  7076927.
  4. ^ ab Liu, XS (octubre de 2007). "Introducción al análisis de microarrays en mosaico". PLOS Computational Biology . 3 (10): 1842–4. Bibcode :2007PLSCB...3..183L. doi : 10.1371/journal.pcbi.0030183 . PMC 2041964 . PMID  17967045. 
  5. ^ O'Geen, H; Squazzo, SL; Iyengar, S; Blahnik, K; Rinn, JL; Chang, HY; Green, R; Farnham, PJ (junio de 2007). "El análisis de todo el genoma de la unión de KAP1 sugiere la autorregulación de KRAB-ZNF". PLOS Genetics . 3 (6): e89. doi : 10.1371/journal.pgen.0030089 . PMC 1885280 . PMID  17542650. 
  6. ^ Bertone, P; Gerstein, M; Snyder, M (2005). "Aplicaciones de matrices de teselación de ADN a la anotación experimental del genoma y al descubrimiento de vías reguladoras". Investigación cromosómica . 13 (3): 259–74. doi :10.1007/s10577-005-2165-0. PMID  15868420. S2CID  24058431.
  7. ^ Cawley, S; Bekiranov, S; Ng, HH; Kapranov, P; Sekinger, EA; Kampa, D; Piccolboni, A; Sementchenko, V; Cheng, J; Williams, AJ; Wheeler, R; Wang, B; Drenkow, J; Yamanaka, M; Patel, S; Brubaker, S; Tammana, H; Helt, G; Struhl, K; Gingeras, TR (20 de febrero de 2004). "El mapeo imparcial de los sitios de unión de factores de transcripción a lo largo de los cromosomas humanos 21 y 22 apunta a una regulación generalizada de los ARN no codificantes". Celúla . 116 (4): 499–509. doi : 10.1016/S0092-8674(04)00127-8 . PMID  14980218. S2CID  7793221.
  8. ^ Kapranov, P; Cawley, SE; Drenkow, J; Bekiranov, S; Strausberg, RL; Fodor, SP; Gingeras, TR (3 de mayo de 2002). "Actividad transcripcional a gran escala en los cromosomas 21 y 22". Science . 296 (5569): 916–9. Bibcode :2002Sci...296..916K. doi :10.1126/science.1068597. PMID  11988577. S2CID  18336536.
  9. ^ ab Kampa, D; Cheng, J; Kapranov, P; Yamanaka, M; Brubaker, S; Cawley, S; Drenkow, J; Piccolboni, A; Bekiranov, S; Helt, G; Tammana, H; Gingeras, TR (marzo de 2004). "Nuevos ARN identificados a partir de un análisis en profundidad del transcriptoma de los cromosomas 21 y 22 humanos". Investigación del genoma . 14 (3): 331–42. doi :10.1101/gr.2094104. PMC 353210 . PMID  14993201. 
  10. ^ Stolc, V; Samanta, MP; Tongprasit, W; Sethi, H; Liang, S; Nelson, DC; Hegeman, A; Nelson, C; Rancour, D; Bednarek, S; Ulrich, EL; Zhao, Q; Wrobel, RL; Newman, CS; Fox, BG; Phillips, GN Jr; Markley, JL; Sussman, MR (22 de marzo de 2005). "Identificación de secuencias transcritas en Arabidopsis thaliana mediante el uso de matrices de mosaico de genoma de alta resolución". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 102 (12): 4453–8. Código Bibliográfico :2005PNAS..102.4453S. doi : 10.1073/pnas.0408203102 . PMC 555476 . Número de modelo:  PMID15755812. 
  11. ^ Crawford, Gregory E; Davis, Sean; Scacheri, Peter C; Renaud, Gabriel; Halawi, Mohamad J; Erdos, Michael R; Green, Roland; Meltzer, Paul S; Wolfsberg, Tyra G ; Collins, Francis S (21 de junio de 2006). "Chip de DNasa: un método de alta resolución para identificar sitios hipersensibles a la DNasa I utilizando microarreglos en mosaico". Nature Methods . 3 (7): 503–9. doi :10.1038/nmeth888. PMC 2698431 . PMID  16791207. 
  12. ^ Heidenblad, M; Lindgren, D; Jonson, T; Liedberg, F; Veerla, S; Chebil, G; Gudjonsson, S; Borg, A; Månsson, W; Höglund, M (31 de enero de 2008). "La matriz de resolución de mosaico CGH y el perfil de expresión de alta densidad de carcinomas uroteliales delinean amplicones genómicos y genes diana candidatos específicos para tumores avanzados". BMC Medical Genomics . 1 : 3. doi : 10.1186/1755-8794-1-3 . PMC 2227947 . PMID  18237450. 
  13. ^ Taskesen, Erdogan; Beekman, Renée; de Ridder, Jeroen; Wouters, Bas J; Peeters, Justine K; Touw, Ivo P; Reinders, Marcel JT; Delwel, Ruud (2010). "HAT: Análisis hipergeométrico de matrices de mosaicos con aplicación a datos del promotor-GeneChip". Bioinformática BMC . 11 (1): 275. doi : 10.1186/1471-2105-11-275 . PMC 2892465 . PMID  20492700. 
  14. ^ Mockler, Todd C.; Ecker, Joseph R. (enero de 2005). "Aplicaciones de matrices de mosaico de ADN para el análisis del genoma completo". Genomics . 85 (1): 1–15. doi :10.1016/j.ygeno.2004.10.005. PMID  15607417.