Sitio de unión del ADN

Los sitios de unión del ADN son un tipo de sitio de unión que se encuentra en el ADN donde otras moléculas pueden unirse. Los sitios de unión del ADN se distinguen de otros sitios de unión en que (1) son parte de una secuencia de ADN (por ejemplo, un genoma) y (2) están unidos por proteínas de unión al ADN . Los sitios de unión del ADN a menudo se asocian con proteínas especializadas conocidas como factores de transcripción y, por lo tanto, están vinculados a la regulación transcripcional . La suma de los sitios de unión del ADN de un factor de transcripción específico se conoce como su cistroma . Los sitios de unión del ADN también abarcan los objetivos de otras proteínas, como las enzimas de restricción , las recombinasas específicas del sitio (ver recombinación específica del sitio ) y las metiltransferasas . ^[1]

Los sitios de unión del ADN pueden definirse como secuencias cortas de ADN (normalmente de 4 a 30 pares de bases de longitud, pero hasta 200 pb en el caso de los sitios de recombinación) que están específicamente unidas por una o más proteínas o complejos proteicos de unión al ADN. Se ha informado que algunos sitios de unión tienen el potencial de sufrir cambios evolutivos rápidos. ^[2]

Tipos de sitios de unión del ADN

Los sitios de unión del ADN se pueden clasificar según su función biológica. Por lo tanto, podemos distinguir entre sitios de unión de factores de transcripción, sitios de restricción y sitios de recombinación. Algunos autores han propuesto que los sitios de unión también se podrían clasificar según su modo más conveniente de representación. ^[3] Por un lado, los sitios de restricción se pueden representar generalmente mediante secuencias de consenso. Esto se debe a que se dirigen principalmente a secuencias idénticas y la eficiencia de la restricción disminuye abruptamente para secuencias menos similares. Por otro lado, los sitios de unión del ADN para un factor de transcripción dado suelen ser todos diferentes, con distintos grados de afinidad del factor de transcripción para los diferentes sitios de unión. Esto dificulta la representación precisa de los sitios de unión de factores de transcripción utilizando secuencias de consenso , y normalmente se representan utilizando matrices de frecuencia específica de posición (PSFM), que a menudo se representan gráficamente utilizando logotipos de secuencia . Este argumento, sin embargo, es en parte arbitrario. Las enzimas de restricción, como los factores de transcripción, producen un rango gradual, aunque agudo, de afinidades para diferentes sitios ^[4] y, por lo tanto, también se representan mejor mediante PSFM. De la misma manera, las recombinasas de sitio específico también muestran un rango variado de afinidades para diferentes sitios objetivo. ^[5]^[6]

Historia y principales técnicas experimentales

La existencia de algo parecido a los sitios de unión del ADN se sospechó a partir de los experimentos sobre la biología del bacteriófago lambda ^[7] y la regulación del operón lac de Escherichia coli ^[8] . Los sitios de unión del ADN se confirmaron finalmente en ambos sistemas ^[9]^[10]^[11] con el advenimiento de las técnicas de secuenciación del ADN . A partir de entonces, se han descubierto sitios de unión del ADN para muchos factores de transcripción, enzimas de restricción y recombinasas específicas del sitio utilizando una profusión de métodos experimentales. Históricamente, las técnicas experimentales de elección para descubrir y analizar los sitios de unión del ADN han sido el ensayo de huella de ADNsa y el ensayo de desplazamiento de movilidad electroforética (EMSA). Sin embargo, el desarrollo de microarrays de ADN y técnicas de secuenciación rápida ha dado lugar a nuevos métodos masivamente paralelos para la identificación in vivo de sitios de unión, como ChIP-chip y ChIP-Seq . ^[12] Para cuantificar la afinidad de unión ^[13] de proteínas y otras moléculas a sitios de unión de ADN específicos se utiliza el método biofísico termoforesis a microescala ^[14] .

Bases de datos

Debido a la naturaleza diversa de las técnicas experimentales utilizadas para determinar los sitios de unión y a la cobertura irregular de la mayoría de los organismos y factores de transcripción, no existe una base de datos central (similar a GenBank en el Centro Nacional de Información Biotecnológica ) para los sitios de unión del ADN. Aunque NCBI contempla la anotación del sitio de unión del ADN en sus secuencias de referencia ( RefSeq ), la mayoría de las presentaciones omiten esta información. Además, debido al éxito limitado de la bioinformática en la producción de herramientas eficientes de predicción del sitio de unión del ADN (las grandes tasas de falsos positivos a menudo se asocian con los métodos de descubrimiento de motivos / búsqueda de sitios in silico), no ha habido un esfuerzo sistemático para anotar computacionalmente estas características en genomas secuenciados.

Sin embargo, existen varias bases de datos públicas y privadas dedicadas a la recopilación de sitios de unión informados experimentalmente y, a veces, predichos computacionalmente, para diferentes factores de transcripción en diferentes organismos. A continuación se presenta una tabla no exhaustiva de bases de datos disponibles:

Representación de los sitios de unión del ADN

Una colección de sitios de unión de ADN, típicamente denominada motivo de unión de ADN, puede representarse mediante una secuencia de consenso . Esta representación tiene la ventaja de ser compacta, pero a costa de ignorar una cantidad sustancial de información. ^[15] Una forma más precisa de representar los sitios de unión es a través de Matrices de Frecuencia Específica de Posición (PSFM). Estas matrices brindan información sobre la frecuencia de cada base en cada posición del motivo de unión de ADN. ^[3] Las PSFM generalmente se conciben con el supuesto implícito de independencia posicional (diferentes posiciones en el sitio de unión de ADN contribuyen independientemente a la función del sitio), aunque este supuesto ha sido cuestionado para algunos sitios de unión de ADN. ^[16] La información de frecuencia en una PSFM se puede interpretar formalmente en el marco de la Teoría de la Información , ^[17] lo que lleva a su representación gráfica como un logotipo de secuencia .

PSFM para el represor transcripcional LexA , derivado de 56 sitios de unión de LexA almacenados en Prodoric. Las frecuencias relativas se obtienen dividiendo los recuentos en cada célula por el recuento total (56)

Búsqueda computacional y descubrimiento de sitios de unión

En bioinformática , se pueden distinguir dos problemas separados con respecto a los sitios de unión del ADN: la búsqueda de miembros adicionales de un motivo de unión del ADN conocido (el problema de búsqueda del sitio) y el descubrimiento de nuevos motivos de unión del ADN en colecciones de secuencias funcionalmente relacionadas (el problema del descubrimiento del motivo de la secuencia ). ^[18] Se han propuesto muchos métodos diferentes para buscar sitios de unión. La mayoría de ellos se basan en los principios de la teoría de la información y tienen servidores web disponibles (Yellaboina) (Munch), mientras que otros autores han recurrido a métodos de aprendizaje automático , como las redes neuronales artificiales . ^[3]^[19]^[20] También hay una gran cantidad de algoritmos disponibles para el descubrimiento de motivos de secuencia . Estos métodos se basan en la hipótesis de que un conjunto de secuencias comparten un motivo de unión por razones funcionales. Los métodos de descubrimiento de motivos de unión se pueden dividir aproximadamente en enumerativos, deterministas y estocásticos. ^[21] MEME ^[22] y Consensus ^[23] son ejemplos clásicos de optimización determinista, mientras que el muestreador de Gibbs ^[24] es la implementación convencional de un método puramente estocástico para el descubrimiento de motivos de unión al ADN. Otro ejemplo de esta clase de métodos es SeSiMCMC ^[25] que se centra en sitios TFBS débiles con simetría. Mientras que los métodos enumerativos a menudo recurren a la representación de los sitios de unión mediante expresiones regulares , PSFM y su tratamiento formal bajo métodos de teoría de la información son la representación de elección tanto para métodos deterministas como estocásticos. Los métodos híbridos, por ejemplo ChIPMunk ^[26] que combina la optimización voraz con el submuestreo, también utilizan PSFM. Los avances recientes en secuenciación han llevado a la introducción de enfoques de genómica comparativa para el descubrimiento de motivos de unión al ADN, como lo ejemplifica PhyloGibbs. ^[27]^[28]

Los métodos más complejos para la búsqueda de sitios de unión y el descubrimiento de motivos se basan en el apilamiento de bases y otras interacciones entre bases de ADN, pero debido a los pequeños tamaños de muestra normalmente disponibles para los sitios de unión en el ADN, su eficiencia aún no se aprovecha por completo. Un ejemplo de dicha herramienta es el ULPB ^[29].

Véase también

Referencias

^ Halford ES; Marko JF (2004). "¿Cómo encuentran sus objetivos las proteínas de unión al ADN en sitios específicos?". Nucleic Acids Research . 32 (10): 3040–3052. doi :10.1093/nar/gkh624. PMC 434431 . PMID 15178741.
^ Borneman, AR; Gianoulis, TA; Zhang, ZD; Yu, H.; Rozowsky, J.; Seringhaus, MR; Wang, LY; Gerstein, M. y Snyder, M. (2007). "Divergencia de los sitios de unión de factores de transcripción en especies de levaduras relacionadas". Science . 317 (5839): 815–819. Bibcode :2007Sci...317..815B. doi :10.1126/science.1140748. PMID 17690298. S2CID 21535866.
^ abc Stormo GD (2000). "Sitios de unión del ADN: representación y descubrimiento". Bioinformática . 16 (1): 16–23. doi : 10.1093/bioinformatics/16.1.16 . PMID 10812473.
^ Pingoud A, Jeltsch A (1997). "Reconocimiento y escisión del ADN por endonucleasas de restricción de tipo II". Revista Europea de Bioquímica . 246 (1): 1–22. doi : 10.1111/j.1432-1033.1997.t01-6-00001.x . PMID 9210460.
^ Gyohda A, Komano T (2000). "Purificación y caracterización de la recombinasa específica de shufflon R64". Journal of Bacteriology . 182 (10): 2787–2792. doi :10.1128/JB.182.10.2787-2792.2000. PMC 101987 . PMID 10781547.
^ Birge, EA (2006). "15: Recombinación específica de sitio". Genética bacteriana y bacteriófaga (5.ª ed.). Springer. págs. 463–478. ISBN 978-0-387-23919-4.
^ Campbell A (1963). "Genética de la estructura fina y su relación con la función". Revisión anual de microbiología . 17 (1): 2787–2792. doi :10.1146/annurev.mi.17.100163.000405. PMID 14145311.
^ Jacob F, Monod J (1961). "Mecanismos reguladores genéticos en la síntesis de proteínas". Revista de Biología Molecular . 3 (3): 318–356. doi :10.1016/S0022-2836(61)80072-7. PMID 13718526. S2CID 19804795.
^ Gilbert W, Maxam A (1973). "La secuencia de nucleótidos del operador lac". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 70 (12): 3581–3584. Bibcode :1973PNAS...70.3581G. doi : 10.1073/pnas.70.12.3581 . PMC 427284 . PMID 4587255.
^ Maniatis T, Ptashne M, Barrell BG, Donelson J (1974). "Secuencia de un sitio de unión a un represor en el ADN del bacteriófago lambda". Nature . 250 (465): 394–397. Bibcode :1974Natur.250..394M. doi :10.1038/250394a0. PMID 4854243. S2CID 4204720.
^ Nash HA (1975). "Recombinación integradora del ADN del bacteriófago lambda in vitro". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 72 (3): 1072–1076. Bibcode :1975PNAS...72.1072N. doi : 10.1073/pnas.72.3.1072 . PMC 432468 . PMID 1055366.
^ Elnitski L, Jin VX, Farnham PJ, Jones SJ (2006). "Localización de sitios de unión de factores de transcripción en mamíferos: un estudio de técnicas computacionales y experimentales". Genome Research . 16 (12): 1455–1464. doi : 10.1101/gr.4140006 . PMID 17053094.
^ Baaske P, Wienken CJ, Reineck P, Duhr S, Braun D (febrero de 2010). "La termoforesis óptica cuantifica la dependencia del tampón de la unión de aptámeros". Angélica. Química. Int. Ed . 49 (12): 2238–41. doi :10.1002/anie.200903998. PMID 20186894. S2CID 42489892.
- "Un camino caliente hacia nuevos fármacos". Phys.org . 24 de febrero de 2010.
^ Wienken CJ; et al. (2010). "Ensayos de unión a proteínas en líquidos biológicos mediante termoforesis a microescala". Nature Communications . 1 (7): 100. Bibcode :2010NatCo...1..100W. doi : 10.1038/ncomms1093 . PMID 20981028.
^ Schneider TD (2002). "Secuencia de consenso Zen". Bioinformática Aplicada . 1 (3): 111–119. PMC 1852464 . PMID 15130839.
^ Bulyk ML; Johnson PL; Church GM (2002). "Los nucleótidos de los sitios de unión de los factores de transcripción ejercen efectos interdependientes sobre las afinidades de unión de los factores de transcripción". Nucleic Acids Research . 30 (5): 1255–1261. doi :10.1093/nar/30.5.1255. PMC 101241 . PMID 11861919.
^ Schneider TD, Stormo GD, Gold L, Ehrenfeucht A (1986). "Contenido de información de los sitios de unión en secuencias de nucleótidos". Journal of Molecular Biology . 188 (3): 415–431X. doi :10.1016/0022-2836(86)90165-8. PMID 3525846.
^ Erill I; O'Neill MC (2009). "Una reexaminación de los métodos basados en la teoría de la información para la identificación de sitios de unión al ADN". BMC Bioinformatics . 10 (1): 57. doi : 10.1186/1471-2105-10-57 . PMC 2680408 . PMID 19210776.
^ Bisant D, Maizel J (1995). "Identificación de sitios de unión de ribosomas en Escherichia coli utilizando modelos de redes neuronales". Nucleic Acids Research . 23 (9): 1632–1639. doi :10.1093/nar/23.9.1632. PMC 306908 . PMID 7784221.
^ O'Neill MC (1991). "Entrenamiento de redes neuronales de retropropagación para definir y detectar sitios de unión al ADN". Investigación de ácidos nucleicos . 19 (2): 133–318. doi :10.1093/nar/19.2.313. PMC 333596 . PMID 2014171.
^ Bailey TL (2008). "Descubrimiento de motivos de secuencia". Bioinformática (PDF) . Métodos en biología molecular. Vol. 452. págs. 231–251. doi :10.1007/978-1-60327-159-2_12. ISBN 978-1-58829-707-5. Número de identificación personal 18566768.
^ Bailey TL (2002). "Descubrimiento de nuevos motivos de secuencia con MEME". Protocolos actuales en bioinformática . 2 (4): 2.4.1–2.4.35. doi :10.1002/0471250953.bi0204s00. PMID 18792935. S2CID 205157795.
^ Stormo GD, Hartzell GW 3rd (1989). "Identificación de sitios de unión a proteínas a partir de fragmentos de ADN no alineados". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 86 (4): 1183–1187. Bibcode :1989PNAS...86.1183S. doi : 10.1073/pnas.86.4.1183 . PMC 286650 . PMID 2919167.
^ Lawrence CE, Altschul SF , Boguski MS , Liu JS, Neuwald AF, Wootton JC (1993). "Detección de señales de secuencia sutiles: una estrategia de muestreo de Gibbs para alineamiento múltiple". Science . 262 (5131): 208–214. Bibcode :1993Sci...262..208L. doi :10.1126/science.8211139. PMID 8211139. S2CID 3040614.
^ Favorov, AV; MS Gelfand; AV Gerasimova; DA Ravcheev; AA Mironov; VJ Makeev (15 de mayo de 2005). "Un muestreador de Gibbs para la identificación de motivos de ADN espaciados y estructurados simétricamente con una estimación mejorada de la longitud de la señal". Bioinformática . 21 (10): 2240–2245. doi : 10.1093/bioinformatics/bti336 . ISSN 1367-4803. PMID 15728117.
^ Kulakovskiy, IV; VA Boeva; AV Favorov; VJ Makeev (24 de agosto de 2010). "Excavación profunda y amplia en busca de motivos vinculantes en datos ChIP-Seq". Bioinformática . 26 (20): 2622–3. doi : 10.1093/bioinformática/btq488 . ISSN 1367-4811. PMID 20736340.
^ Das MK, Dai HK (2007). "Un estudio de algoritmos de búsqueda de motivos de ADN". BMC Bioinformatics . 8 (Supl 7): S21. doi : 10.1186/1471-2105-8-S7-S21 . PMC 2099490 . PMID 18047721.
^ Siddharthan R, Siggia ED, van Nimwegen E (2005). "PhyloGibbs: un buscador de motivos de muestreo de Gibbs que incorpora filogenia". PLOS Comput Biol . 1 (7): e67. Bibcode :2005PLSCB...1...67S. doi : 10.1371/journal.pcbi.0010067 . PMC 1309704 . PMID 16477324.
^ Salama RA, Stekel DJ (2010). "La inclusión de interdependencias de bases vecinas mejora sustancialmente la predicción del sitio de unión del factor de transcripción procariota en todo el genoma". Nucleic Acids Research . 38 (12): e135. doi :10.1093/nar/gkq274. PMC 2896541 . PMID 20439311.

Enlaces externos

Explorador de hilos ENCODE Motivos de factores de transcripción en la naturaleza
Motivos de unión TF seleccionados manualmente para 157 especies de plantas Archivado el 19 de octubre de 2016 en Wayback Machine