El ADN satélite consta de conjuntos muy grandes de ADN no codificante que se repite en tándem . El ADN satélite es el componente principal de los centrómeros funcionales y forma el principal constituyente estructural de la heterocromatina . [1]
El nombre "ADN satélite" se refiere al fenómeno de que las repeticiones de una secuencia corta de ADN tienden a producir una frecuencia diferente de las bases adenina , citosina , guanina y timina y, por lo tanto, tienen una densidad diferente a la del ADN en masa, de modo que forman una segunda. o banda(s) "satélite" cuando el ADN genómico se separa a lo largo de un gradiente de densidad de cloruro de cesio usando centrifugación de densidad flotante . [2] Las secuencias con una mayor proporción de A+T muestran una densidad más baja, mientras que aquellas con una mayor proporción de G+C muestran una densidad más alta que la mayor parte del ADN genómico. Algunas secuencias repetitivas son ~50% G+C/A+T y, por lo tanto, tienen densidades flotantes iguales que las del ADN genómico en masa. Estos satélites se denominan satélites "crípticos" porque forman una banda oculta dentro de la banda principal de ADN genómico. "Isopícnico" es otro término utilizado para los satélites crípticos. [3]
El ADN satélite, junto con el ADN de minisatélite y microsatélite , constituyen las repeticiones en tándem . [4] El tamaño de las matrices de ADN satélite varía mucho entre individuos. [5]
Las principales familias de ADN satélite en humanos se denominan:
Un patrón repetido puede tener entre 1 par de bases (pb) de largo (una repetición de mononucleótido) y varios miles de pares de bases de largo, [7] y el tamaño total de un bloque de ADN satélite puede ser de varias megabases sin interrupción. Se han descrito unidades de repetición largas que contienen dominios de segmentos repetidos más cortos y mononucleótidos (1-5 pb), dispuestos en grupos de microsatélites, en los que se agruparon las diferencias entre copias individuales de las unidades de repetición más largas. [7] La mayor parte del ADN satélite se localiza en la región telomérica o centromérica del cromosoma. La secuencia de nucleótidos de las repeticiones está bastante bien conservada en todas las especies. Sin embargo, es común la variación en la duración de la repetición.
Los estudios basados en secuenciación de baja resolución han demostrado variaciones en la longitud de los conjuntos de satélites de población humana, así como en la frecuencia de ciertas secuencias y variaciones estructurales (11-13, 29). Sin embargo, debido a la falta de conjuntos de centrómeros completos, la comprensión básica de la variación y evolución de la matriz de satélites sigue siendo débil. [5] Por ejemplo, el ADN minisatélite es una región corta (1-5 kb) de elementos repetidos con una longitud >9 nucleótidos. Mientras que se considera que los microsatélites en las secuencias de ADN tienen una longitud de 1 a 8 nucleótidos. [8] La diferencia en cuántas repeticiones están presentes en la región (longitud de la región) es la base para el perfilado de ADN . [ cita necesaria ]
Se cree que los microsatélites se originaron por deslizamiento de la polimerasa durante la replicación del ADN. Esto proviene de la observación de que los alelos de microsatélites suelen ser polimórficos en longitud; específicamente, las diferencias de longitud observadas entre los alelos de microsatélites son generalmente múltiplos de la longitud de la unidad repetida. [9]
El ADN satélite adopta estructuras tridimensionales de orden superior en un complejo ADN satélite natural del cangrejo terrestre Gecarcinus lateralis , cuyo genoma contiene el 3% de una banda satélite rica en GC que consta de un motivo de secuencia de "unidad repetida" de ~2100 pb llamado RU. . [10] [11] La RU se dispuso en largas matrices en tándem con aproximadamente 16.000 copias por genoma. Se clonaron y secuenciaron varias secuencias de RU para revelar regiones conservadas de secuencias de ADN convencionales en tramos superiores a 550 pb, intercaladas con cinco "dominios divergentes" dentro de cada copia de RU.
Cuatro dominios divergentes consistían en repeticiones de microsatélites, sesgadas en la composición de bases, con purinas en una cadena y pirimidinas en la otra. Algunos contenían repeticiones de mononucleótidos de pares de bases C:G de aproximadamente 20 pb de longitud. Estos dominios de microsatélites con tendencia a la hebra variaban en longitud desde aproximadamente 20 pb hasta más de 250 pb. Las secuencias repetidas más frecuentes en las regiones de microsatélites integradas fueron CT:AG, CCT:AGG, CCCT:AGGG y CGCAC:GTGCG [12] [13] [7]. Se demostró que estas secuencias repetidas adoptan estructuras alteradas, incluido el ADN de triple hebra. , Z-DNA , vástago-bucle y otras conformaciones bajo tensión superhelicoidal . [12] [13] [7]
Entre las repeticiones de microsatélites con tendencia a la cadena y las repeticiones de mononucleótidos C:G, todas las variaciones de secuencia retuvieron uno o dos pares de bases con A (purina) interrumpiendo la cadena rica en pirimidina y T (pirimidina) interrumpiendo la cadena rica en purina. Estas interrupciones en el sesgo compositivo adoptaron conformaciones altamente distorsionadas, como lo demuestra su respuesta a las enzimas nucleasas estructurales, incluidas las nucleasas S1, P1 y de frijol mungo. [12]
El dominio de microsatélites de RU con sesgo de composición más complejo incluía la secuencia TTAA:TTAA, así como una repetición en espejo. Produjo la señal más fuerte en respuesta a las nucleasas en comparación con todas las demás estructuras alteradas en observaciones experimentales. Ese dominio divergente con tendencia a la hebra en particular fue subclonado y su estructura helicoidal alterada se estudió con mayor detalle. [12]
Un quinto dominio divergente en la secuencia RU se caracterizó por variaciones de un motivo de secuencia de ADN simétrico de purinas y pirimidinas alternas que se demostró que adoptan una estructura de ADN Z zurda o de bucle de tallo bajo estrés superhelicoidal. El ADN Z simétrico conservado se abrevió Z 4 Z 5 NZ 15 NZ 5 Z 4 , donde Z representa secuencias alternas de purina/pirimidina. Una estructura de vástago-bucle estaba centrada en el elemento Z 15 en la secuencia palindrómica altamente conservada CGCACGTCG:CGCACGTGCG y estaba flanqueada por secuencias palindrómicas extendidas de ADN Z en una región de 35 pb. Muchas variantes de RU mostraron eliminaciones de al menos 10 pb fuera del elemento estructural Z 4 Z 5 NZ 15 NZ 5 Z 4 , mientras que otras tenían secuencias de ADN Z adicionales que alargaban el dominio alternativo de purina y pirimidina a más de 50 pb. [14]
Se demostró que una secuencia RU extendida (EXT) tenía seis copias en tándem de un motivo de secuencia amplificado (AMPL) de 142 pb insertado en una región bordeada por repeticiones invertidas donde la mayoría de las copias contenían solo un elemento de secuencia AMPL. No hubo estructuras alteradas sensibles a nucleasas ni divergencia de secuencia significativa en la secuencia AMPL relativamente convencional. Una secuencia RU truncada (TRU), 327 pb más corta que la mayoría de los clones, surgió de un cambio de base único que condujo a un segundo sitio de restricción EcoRI en TRU. [10]
Se demostró que otro cangrejo, el cangrejo ermitaño Pagurus pollicaris , tenía una familia de satélites ricos en AT con estructuras repetidas invertidas que comprendían el 30% de todo el genoma. Otro satélite críptico del mismo cangrejo con la secuencia CCTA:TAGG [15] [16] [Skinner DM Beattie WG Blattner FF Stark BP Dahlberg JE Biochemistry. 1974; 13: 3930-3937] fue encontrado insertado en algunos de los palíndromos. [17]