stringtranslate.com

Matriz de mosaicos

Comparación de métodos para la cobertura genómica dentro de aplicaciones de mosaicos.

Las matrices de mosaicos son un subtipo de chips de microarrays . Al igual que los microarrays tradicionales, funcionan hibridando moléculas diana de ADN o ARN marcadas con sondas fijadas sobre una superficie sólida.

Los conjuntos de mosaicos se diferencian de los microarrays tradicionales en la naturaleza de las sondas. En lugar de buscar secuencias de genes conocidos o predichos que puedan estar dispersos por todo el genoma , los mosaicos de matrices buscan intensivamente secuencias que se sabe que existen en una región contigua. Esto es útil para caracterizar regiones secuenciadas, pero cuyas funciones locales se desconocen en gran medida. Las matrices de mosaico ayudan en el mapeo del transcriptoma , así como en el descubrimiento de sitios de interacción ADN/ proteína ( ChIP-chip , DamID ), de metilación del ADN (MeDIP-chip) y de sensibilidad a la ADNasa (DNase Chip) y la matriz CGH. [1] Además de detectar genes y secuencias reguladoras no identificadas previamente, es posible mejorar la cuantificación de los productos de transcripción. Las sondas específicas están presentes en millones de copias (a diferencia de solo varias en las matrices tradicionales) dentro de una unidad de matriz llamada característica, con entre 10.000 y más de 6.000.000 de características diferentes por matriz. [2] Se pueden obtener resoluciones de mapeo variables ajustando la cantidad de superposición de secuencias entre sondas, o la cantidad de pares de bases conocidos entre secuencias de sondas, así como la longitud de la sonda. Para genomas más pequeños como Arabidopsis , se pueden examinar genomas completos. [3] Las matrices de mosaicos son una herramienta útil en estudios de asociación de todo el genoma .

Síntesis y fabricantes.

Las dos formas principales de sintetizar matrices de mosaicos son la fabricación fotolitográfica y el manchado o impresión mecánica.

El primer método implica la síntesis in situ donde se construyen sondas, de aproximadamente 25 pb, en la superficie del chip. Estos conjuntos pueden contener hasta 6 millones de características discretas, cada una de las cuales contiene millones de copias de una sonda.

La otra forma de sintetizar chips de matriz de mosaicos es mediante la impresión mecánica de sondas en el chip. Esto se hace mediante el uso de máquinas automatizadas con pasadores que colocan las sondas previamente sintetizadas en la superficie. Debido a la restricción de tamaño de los pines, estos chips pueden contener hasta casi 400.000 funciones. [4] Tres fabricantes de matrices de mosaicos son Affymetrix , NimbleGen y Agilent . Sus productos varían en longitud y espaciado de sondas. ArrayExplorer.com es un servidor web gratuito para comparar matrices de mosaicos.

Aplicaciones y tipos

Descripción general del procedimiento del chip ChIP.

chip chip

ChIP-chip es uno de los usos más populares de matrices de mosaico. La inmunoprecipitación de cromatina permite identificar los sitios de unión de las proteínas . Una variación de esto en todo el genoma se conoce como ChIP-on-chip. Las proteínas que se unen a la cromatina se entrecruzan in vivo , generalmente mediante fijación con formaldehído . Luego, la cromatina se fragmenta y se expone a anticuerpos específicos de la proteína de interés. Luego estos complejos se precipitan. Luego, el ADN se aísla y se purifica. Con los microarrays de ADN tradicionales, el ADN inmunoprecipitado se hibrida con el chip, que contiene sondas diseñadas para cubrir regiones representativas del genoma. Se pueden utilizar sondas superpuestas o muy próximas. Esto proporciona un análisis imparcial con alta resolución. Además de estas ventajas, las matrices en mosaico muestran una alta reproducibilidad y con sondas superpuestas que abarcan grandes segmentos del genoma, las matrices en mosaico pueden interrogar los sitios de unión de proteínas, que albergan repeticiones. Los experimentos con chips ChIP han podido identificar sitios de unión de factores de transcripción en todo el genoma de levaduras, drosophila y algunas especies de mamíferos. [5]

Descripción general del procedimiento de mapeo del transcriptoma.

Mapeo del transcriptoma

Otro uso popular de las matrices de mosaicos es la búsqueda de genes expresados. Los métodos tradicionales de predicción de genes para la anotación de secuencias genómicas han tenido problemas cuando se utilizan para mapear el transcriptoma, como no producir una estructura precisa de los genes y también faltar transcripciones por completo. El método de secuenciar el ADNc para encontrar genes transcritos también presenta problemas, como no detectar moléculas de ARN raras o muy cortas, por lo que no detecta genes que están activos sólo en respuesta a señales o que son específicos de un período de tiempo. Las matrices en mosaico pueden resolver estos problemas. Gracias a la alta resolución y sensibilidad, se pueden detectar incluso moléculas pequeñas y raras. La naturaleza superpuesta de las sondas también permite la detección de ARN no poliadenilado y puede producir una imagen más precisa de la estructura genética. [6] Estudios anteriores sobre los cromosomas 21 y 22 mostraron el poder de las matrices de mosaico para identificar unidades de transcripción. [7] [8] [9] Los autores utilizaron sondas de 25 unidades separadas por 35 pb, que abarcaban todos los cromosomas. Las dianas marcadas se fabricaron a partir de ARN poliadenilado. Encontraron muchas más transcripciones de las previstas y el 90% estaban fuera de los exones anotados . Otro estudio con Arabidopsis utilizó matrices de oligonucleótidos de alta densidad que cubren todo el genoma. Se encontraron más de 10 veces más transcripciones de las predichas por las tecnologías ecológicamente racionales [ se necesita aclaración ] y otras herramientas de predicción. [3] [10] También se encontraron transcripciones novedosas en las regiones centroméricas donde se pensaba que ningún gen se expresaba activamente. Se han identificado muchos ARN antisentido naturales y no codificantes utilizando matrices de mosaico. [9]

Descripción general del procedimiento del chip MeDIP.

chip MeDIP

La inmunoprecipitación de metil-ADN seguida de una matriz en mosaico permite mapear y medir la metilación del ADN en todo el genoma. El ADN está metilado en citosina en dinucleótidos CG en muchos lugares del genoma. Esta modificación es uno de los cambios epigenéticos hereditarios mejor comprendidos y se ha demostrado que afecta la expresión genética. El mapeo de estos sitios puede contribuir al conocimiento de los genes expresados ​​y también a la regulación epigenética a nivel de todo el genoma. Los estudios de mosaicos han generado mapas de metilación de alta resolución para el genoma de Arabidopsis para generar el primer "metiloma".

Descripción general del procedimiento del chip DNase.

chip de ADNasa

El chip DNase es una aplicación de matrices de mosaicos para identificar sitios hipersensibles, segmentos de cromatina abierta que la DNaseI escinde más fácilmente. La escisión de DNasaI produce fragmentos más grandes, de alrededor de 1,2 kb de tamaño. Se ha demostrado que estos sitios hipersensibles predicen con precisión elementos reguladores como regiones promotoras, potenciadores y silenciadores. [11] Históricamente, el método utiliza transferencia Southern para encontrar fragmentos digeridos. Los conjuntos de mosaicos han permitido a los investigadores aplicar la técnica a escala de todo el genoma.

Hibridación genómica comparada (CGH)

La CGH basada en matrices es una técnica que se utiliza a menudo en el diagnóstico para comparar diferencias entre tipos de ADN, como células normales y células cancerosas. Se utilizan comúnmente dos tipos de matrices de mosaicos para la matriz CGH, genoma completo y mosaicos finos. El enfoque del genoma completo sería útil para identificar variaciones en el número de copias con alta resolución. Por otro lado, la CGH de matriz en mosaico fino produciría una resolución ultraalta para encontrar otras anomalías, como puntos de interrupción. [12]

Procedimiento

Flujo de trabajo del procedimiento de matriz de mosaico.

Existen varios métodos diferentes para colocar en mosaico una matriz. Un protocolo para analizar la expresión génica implica aislar primero el ARN total. Luego se purifica de moléculas de ARNr. El ARN se copia en ADN bicatenario, que posteriormente se amplifica y se transcribe in vitro a ARNc. El producto se divide por triplicado para producir ADNbc, que luego se fragmenta y se etiqueta. Finalmente, las muestras se hibridan con el chip de matriz de mosaico. Las señales del chip son escaneadas e interpretadas por computadoras.

Hay varios software y algoritmos disponibles para el análisis de datos y sus beneficios varían según el fabricante del chip. Para los chips Affymetrix, el análisis basado en modelos de matrices de mosaicos (MAT) o el análisis hipergeométrico de matrices de mosaicos (HAT [13] ) son algoritmos eficaces de búsqueda de picos. Para los chips NimbleGen, TAMAL es más adecuado para localizar sitios de unión. Los algoritmos alternativos incluyen MA2C y TileScope, que son menos complicados de operar. El algoritmo de deconvolución de unión conjunta se utiliza habitualmente para los chips de Agilent. Si se requiere un análisis de secuencia del sitio de unión o anotación del genoma, se utilizan programas como MEME, Gibbs Motif Sampler, sistema de anotación de elementos reguladores Cis y Galaxy . [4]

Ventajas y desventajas

Los conjuntos de mosaicos proporcionan una herramienta imparcial para investigar la unión de proteínas, la expresión genética y la estructura genética en un ámbito de todo el genoma. Permiten un nuevo nivel de conocimiento en el estudio del transcriptoma y el metiloma.

Los inconvenientes incluyen el costo de los kits de mosaicos. Aunque los precios han caído en los últimos años, hacen que no sea práctico utilizar matrices de mosaicos de todo el genoma para genomas de mamíferos y otros genomas grandes. Otro problema es el "ruido transcripcional" producido por su capacidad de detección ultrasensible. [2] Además, el enfoque no proporciona un inicio o fin claramente definido para las regiones de interés identificadas por la matriz. Finalmente, las matrices generalmente solo brindan números de cromosoma y posición, lo que a menudo requiere la secuenciación como un paso separado (aunque algunas matrices modernas brindan información de secuencia ) .

Referencias

  1. ^ Yazaki, J; Gregorio, BD; Ecker, JR (octubre de 2007). "Mapeo del paisaje del genoma utilizando tecnología de matriz de mosaicos". Opinión actual en biología vegetal . 10 (5): 534–42. doi :10.1016/j.pbi.2007.07.006. PMC  2665186 . PMID  17703988.
  2. ^ ab Mockler, TC; Chan, S; Sundaresan, A; Chen, H; Jacobsen, SE; Ecker, JR (enero de 2005). "Aplicaciones de matrices de mosaico de ADN para el análisis del genoma completo". Genómica . 85 (1): 1–15. doi :10.1016/j.ygeno.2004.10.005. PMID  15607417.
  3. ^ ab Yamada, K; Lim, J; Dale, JM; Chen, H; Shinn, P; Palma, CJ; Southwick, AM; Wu, HC; Kim, C; Nguyen, M; Pham, P; Cheuk, R; et al. (31 de octubre de 2003). "Análisis empírico de la actividad transcripcional en el genoma de Arabidopsis". Ciencia . 302 (5646): 842–6. Código Bib : 2003 Ciencia... 302..842Y. doi : 10.1126/ciencia.1088305. PMID  14593172. S2CID  7076927.
  4. ^ ab Liu, XS (octubre de 2007). "Introducción al análisis de microarrays en mosaico". PLOS Biología Computacional . 3 (10): 1842–4. Código Bib : 2007PLSCB...3..183L. doi : 10.1371/journal.pcbi.0030183 . PMC 2041964 . PMID  17967045. 
  5. ^ O'Geen, H; Squazzo, SL; Iyengar, S; Blahnik, K; Rinn, JL; Chang, HY; Verde, R; Farnham, PJ (junio de 2007). "El análisis de todo el genoma de la unión de KAP1 sugiere la autorregulación de KRAB-ZNF". PLOS Genética . 3 (6): e89. doi : 10.1371/journal.pgen.0030089 . PMC 1885280 . PMID  17542650. 
  6. ^ Bertone, P; Gerstein, M; Snyder, M (2005). "Aplicaciones de matrices de mosaico de ADN a la anotación del genoma experimental y al descubrimiento de vías reguladoras". Investigación de cromosomas . 13 (3): 259–74. doi :10.1007/s10577-005-2165-0. PMID  15868420. S2CID  24058431.
  7. ^ Cawley, S; Bekiranov, S; Ng, HH; Kapranov, P; Sekinger, EA; Kampa, D; Piccolboni, A; Sementchenko, V; Cheng, J; Williams, AJ; Wheeler, R; Wang, B; Drenkow, J; Yamanaka, M; Patel, S; Brubaker, S; Tammana, H; Helt, G; Struhl, K; Gingeras, TR (20 de febrero de 2004). "El mapeo imparcial de los sitios de unión de factores de transcripción a lo largo de los cromosomas humanos 21 y 22 apunta a una regulación generalizada de los ARN no codificantes". Celúla . 116 (4): 499–509. doi : 10.1016/S0092-8674(04)00127-8 . PMID  14980218. S2CID  7793221.
  8. ^ Kapranov, P; Cawley, SE; Drenkow, J; Bekiranov, S; Strausberg, RL; Fodor, SP; Gingeras, TR (3 de mayo de 2002). "Actividad transcripcional a gran escala en los cromosomas 21 y 22". Ciencia . 296 (5569): 916–9. Código Bib : 2002 Ciencia... 296..916K. doi : 10.1126/ciencia.1068597. PMID  11988577. S2CID  18336536.
  9. ^ ab Kampa, D; Cheng, J; Kapranov, P; Yamanaka, M; Brubaker, S; Cawley, S; Drenkow, J; Piccolboni, A; Bekiranov, S; Helt, G; Tammana, H; Gingeras, TR (marzo de 2004). "Nuevos ARN identificados a partir de un análisis en profundidad del transcriptoma de los cromosomas 21 y 22 humanos". Investigación del genoma . 14 (3): 331–42. doi :10.1101/gr.2094104. PMC 353210 . PMID  14993201. 
  10. ^ Stolc, V; Samanta, diputada; Tongprasit, W; Sethi, H; Liang, S; Nelson, CC; Hegeman, A; Nelson, C; Rencor, D; Bednarek, S; Ulrich, EL; Zhao, Q; Wrobel, RL; Newman, CS; Fox, BG; Phillips, GN Jr; Markley, JL; Sussman, MR (22 de marzo de 2005). "Identificación de secuencias transcritas en Arabidopsis thaliana mediante el uso de matrices de mosaico de genoma de alta resolución". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 102 (12): 4453–8. Código Bib : 2005PNAS..102.4453S. doi : 10.1073/pnas.0408203102 . PMC 555476 . PMID  15755812. 
  11. ^ Crawford, Gregorio E; Davis, Sean; Scacheri, Peter C; Renaud, Gabriel; Halawi, Mohamad J; Erdos, Michael R; Verde, Roland; Meltzer, Paul S; Wolfsberg, Tyra G ; Collins, Francis S (21 de junio de 2006). "DNase-chip: un método de alta resolución para identificar sitios hipersensibles a la DNasa I mediante micromatrices en mosaico". Métodos de la naturaleza . 3 (7): 503–9. doi : 10.1038/nmeth888. PMC 2698431 . PMID  16791207. 
  12. ^ Heidenblad, M; Lindgren, D; Jonson, T; Liedberg, F; Veerla, S; Chebil, G; Gudjonsson, S; Borg, A; Mansson, W; Höglund, M (31 de enero de 2008). "La matriz de resolución en mosaico CGH y los perfiles de expresión de alta densidad de carcinomas uroteliales delinean amplicones genómicos y genes diana candidatos específicos para tumores avanzados". Genómica médica BMC . 1 : 3. doi : 10.1186/1755-8794-1-3 . PMC 2227947 . PMID  18237450. 
  13. ^ Taskesen, Erdogan; Beekman, Renée; de Ridder, Jeroen; Wouters, Bas J; Peeters, Justine K; Touw, Ivo P; Reinders, Marcel JT; Delwel, Ruud (2010). "HAT: Análisis hipergeométrico de matrices de mosaicos con aplicación a datos del promotor-GeneChip". Bioinformática BMC . 11 (1): 275. doi : 10.1186/1471-2105-11-275 . PMC 2892465 . PMID  20492700. 
  14. ^ Burlador, Todd C.; Ecker, Joseph R. (enero de 2005). "Aplicaciones de matrices de mosaico de ADN para el análisis del genoma completo". Genómica . 85 (1): 1–15. doi :10.1016/j.ygeno.2004.10.005. PMID  15607417.