ADN no codificante

Las secuencias de ADN no codificante ( ADNnc ) son componentes del ADN de un organismo que no codifican secuencias de proteínas . Parte del ADN no codificante se transcribe en moléculas funcionales de ARN no codificante (p. ej., ARN de transferencia , microARN , piARN , ARN ribosómico y ARN reguladores ). Otras regiones funcionales de la fracción de ADN no codificante incluyen secuencias reguladoras que controlan la expresión génica ; regiones de unión al andamio ; orígenes de la replicación del ADN ; centrómeros ; y telómeros . Algunas regiones no codificantes parecen ser en su mayoría no funcionales, como los intrones , pseudogenes , ADN intergénico y fragmentos de transposones y virus . Las regiones que son completamente no funcionales se denominan ADN basura .

Fracción de ADN genómico no codificante.

En las bacterias , las regiones codificantes suelen ocupar el 88% del genoma. ^[1] El 12% restante no codifica proteínas, pero gran parte todavía tiene función biológica a través de genes donde el transcrito de ARN es funcional (genes no codificantes) y secuencias reguladoras, lo que significa que casi todo el genoma bacteriano tiene una función. . ^[1] La cantidad de ADN codificante en los eucariotas suele ser una fracción mucho menor del genoma porque los genomas eucariotas contienen grandes cantidades de ADN repetitivo que no se encuentra en los procariotas. El genoma humano contiene entre un 1 y un 2% de ADN codificante. ^[2]^[3] Se desconoce el número exacto porque existen disputas sobre el número de exones codificantes funcionales y sobre el tamaño total del genoma humano. Esto significa que entre el 98% y el 99% del genoma humano está formado por ADN no codificante y esto incluye muchos elementos funcionales, como genes no codificantes y secuencias reguladoras.

El tamaño del genoma en eucariotas puede variar en un amplio rango, incluso entre especies estrechamente relacionadas. Esta desconcertante observación se conoció originalmente como la paradoja del valor C, donde "C" se refiere al tamaño del genoma haploide. ^[4] La paradoja se resolvió con el descubrimiento de que la mayoría de las diferencias se debían a la expansión y contracción del ADN repetitivo y no al número de genes. Algunos investigadores especularon que este ADN repetitivo era en su mayor parte ADN basura . Las razones de los cambios en el tamaño del genoma aún se están investigando y este problema se llama Enigma del valor C. ^[5]

Esto llevó a la observación de que el número de genes no parece correlacionarse con las nociones percibidas de complejidad porque el número de genes parece ser relativamente constante, una cuestión denominada paradoja del valor G. ^[6] Por ejemplo, se ha informado que el genoma del unicelular Polychaos dubium (anteriormente conocido como Amoeba dubia ) contiene más de 200 veces la cantidad de ADN en humanos (es decir, más de 600 mil millones de pares de bases frente a un poco más de 3 mil millones en humanos). ^[7] El genoma del pez globo Takifugu rubripes tiene sólo aproximadamente una octava parte del tamaño del genoma humano, pero parece tener un número comparable de genes. Los genes ocupan aproximadamente el 30% del genoma del pez globo y el ADN codificante es aproximadamente el 10%. (ADN no codificante = 90%). El tamaño reducido del genoma del pez globo se debe a una reducción en la longitud de los intrones y a un ADN menos repetitivo. ^[8]^[9]

Utricularia gibba , unaplanta de vejiga , tiene un genoma nuclear muy pequeño (100,7 Mb) en comparación con la mayoría de las plantas.^[10]^[11] Probablemente evolucionó a partir de un genoma ancestral que tenía un tamaño de 1.500 Mb.^[11] El genoma de la vejiga tiene aproximadamente el mismo número de genes que otras plantas, pero la cantidad total de ADN codificante llega a aproximadamente el 30% del genoma.^[10]^[11]

El resto del genoma (70% de ADN no codificante) consta de promotores y secuencias reguladoras que son más cortas que las de otras especies de plantas. ^[10] Los genes contienen intrones, pero hay menos y son más pequeños que los intrones de otros genomas de plantas. ^[10] Hay genes no codificantes, incluidas muchas copias de genes de ARN ribosómico. ^[11] El genoma también contiene secuencias de telómeros y centrómeros como se esperaba. ^[11] Gran parte del ADN repetitivo observado en otros eucariotas ha sido eliminado del genoma de la vejiga desde que ese linaje se separó del de otras plantas. Aproximadamente el 59% del genoma de la vejiga consta de secuencias relacionadas con transposones, pero dado que el genoma es mucho más pequeño que otros genomas, esto representa una reducción considerable en la cantidad de este ADN. ^[11] Los autores del artículo original de 2013 señalan que las afirmaciones de elementos funcionales adicionales en el ADN no codificante de los animales no parecen aplicarse a los genomas de las plantas. ^[10]

Según un artículo del New York Times, durante la evolución de esta especie, "... la basura genética que no servía para ningún propósito fue eliminada y lo necesario se conservó". ^[12] Según Victor Albert de la Universidad de Buffalo, la planta es capaz de eliminar su llamado ADN basura y "tener una planta multicelular perfectamente buena con muchas células, órganos, tipos de tejidos y flores diferentes, y puedes hacerlo". sin la basura no es necesaria." ^[13]

Tipos de secuencias de ADN no codificantes

Genes no codificantes

Hay dos tipos de genes : genes codificantes de proteínas y genes no codificantes . ^[14] Los genes no codificantes son una parte importante del ADN no codificante e incluyen genes para el ARN de transferencia y el ARN ribosómico . Estos genes fueron descubiertos en la década de 1960. Los genomas procarióticos contienen genes para otros ARN no codificantes, pero los genes de ARN no codificantes son mucho más comunes en los eucariotas.

Las clases típicas de genes no codificantes en eucariotas incluyen genes para ARN nucleares pequeños (ARNsn), ARN nucleolares pequeños (ARNsno), microARN (miARN), ARN de interferencia cortos (ARNip), ARN que interactúan con PIWI (ARNpi) y ARN largos no codificantes ( lncRNA). Además, existen varios genes de ARN únicos que producen ARN catalíticos . ^[15]

Los genes no codificantes representan sólo un pequeño porcentaje de los genomas procarióticos ^[16] , pero pueden representar una fracción mucho mayor en los genomas eucariotas. ^[17] En los seres humanos, los genes no codificantes ocupan al menos el 6% del genoma, en gran parte porque hay cientos de copias de genes de ARN ribosómico. ^{[ cita necesaria ]} Los genes codificadores de proteínas ocupan aproximadamente el 38% del genoma; una fracción que es mucho mayor que la región codificante porque los genes contienen intrones grandes. ^{[ cita necesaria ]}

El número total de genes no codificantes en el genoma humano es controvertido. Algunos científicos piensan que sólo hay unos 5.000 genes no codificantes mientras que otros creen que puede haber más de 100.000 (ver el artículo sobre ARN no codificante ). La diferencia se debe en gran medida al debate sobre la cantidad de genes de lncRNA. ^[18]

Promotores y elementos regulatorios

Los promotores son segmentos de ADN cerca del extremo 5' del gen donde comienza la transcripción. Son los sitios donde se une la ARN polimerasa para iniciar la síntesis de ARN. Cada gen tiene un promotor no codificante.

Los elementos reguladores son sitios que controlan la transcripción de un gen cercano. Casi siempre son secuencias donde los factores de transcripción se unen al ADN y estos factores de transcripción pueden activar la transcripción (activadores) o reprimir la transcripción (represores). Los elementos reguladores se descubrieron en los años 1960 y sus características generales se determinaron en los años 1970 mediante el estudio de factores de transcripción específicos en bacterias y bacteriófagos . ^{[ cita necesaria ]}

Los promotores y las secuencias reguladoras representan una clase abundante de ADN no codificante, pero en su mayoría consisten en una colección de secuencias relativamente cortas, por lo que no ocupan una fracción muy grande del genoma. La cantidad exacta de ADN regulador en el genoma de los mamíferos no está clara porque es difícil distinguir entre sitios de unión de factores de transcripción falsos y aquellos que son funcionales. Las características de unión de las proteínas de unión al ADN típicas se caracterizaron en la década de 1970 y las propiedades bioquímicas de los factores de transcripción predicen que en células con genomas grandes, la mayoría de los sitios de unión no serán biológicamente funcionales. ^{[ cita necesaria ]}

Muchas secuencias reguladoras se encuentran cerca de los promotores, generalmente aguas arriba del sitio de inicio de la transcripción del gen. Algunos ocurren dentro de un gen y algunos se encuentran aguas abajo del sitio de terminación de la transcripción. En eucariotas, existen algunas secuencias reguladoras que se ubican a una distancia considerable de la región promotora. Estas secuencias reguladoras distantes a menudo se denominan potenciadores , pero no existe una definición rigurosa de potenciador que los distinga de otros sitios de unión de factores de transcripción. ^[19]^[20]

Intrones

Los intrones son las partes de un gen que se transcriben en la secuencia de ARN precursora , pero que finalmente se eliminan mediante el corte y empalme del ARN durante el procesamiento para convertirlo en ARN maduro. Los intrones se encuentran en ambos tipos de genes: genes codificadores de proteínas y genes no codificantes. Están presentes en procariotas pero son mucho más comunes en genomas eucariotas. ^{[ cita necesaria ]}

Los intrones del grupo I y del grupo II ocupan sólo un pequeño porcentaje del genoma cuando están presentes. Los intrones spliceosomales (ver Figura) solo se encuentran en eucariotas y pueden representar una proporción sustancial del genoma. En los seres humanos, por ejemplo, los intrones de los genes que codifican proteínas cubren el 37% del genoma. Combinando eso con aproximadamente el 1% de secuencias codificantes significa que los genes codificadores de proteínas ocupan aproximadamente el 38% del genoma humano. Los cálculos para los genes no codificantes son más complicados porque existe una considerable disputa sobre el número total de genes no codificantes, pero tomar sólo los ejemplos bien definidos significa que los genes no codificantes ocupan al menos el 6% del genoma. ^[21]^[2]

Regiones no traducidas

Los libros de texto estándar de bioquímica y biología molecular describen nucleótidos no codificantes en ARNm ubicados entre el extremo 5' del gen y el codón de inicio de la traducción. Estas regiones se denominan regiones 5' no traducidas o 5'-UTR. Al final del gen se encuentran regiones similares llamadas regiones 3' no traducidas (3'-UTR). Las 5'-UTR y 3'UTR son muy cortas en las bacterias, pero pueden tener varios cientos de nucleótidos de longitud en los eucariotas. Contienen elementos cortos que controlan el inicio de la traducción (5'-UTR) y la terminación de la transcripción (3'-UTR), así como elementos reguladores que pueden controlar la estabilidad, el procesamiento y la orientación del ARNm a diferentes regiones de la célula. ^[22]^[23]^[24]

Orígenes de la replicación

La síntesis de ADN comienza en sitios específicos llamados orígenes de replicación . Estas son regiones del genoma donde se ensambla la maquinaria de replicación del ADN y se desenrolla el ADN para comenzar la síntesis de ADN. En la mayoría de los casos, la replicación se produce en ambas direcciones desde el origen de la replicación.

Las características principales de los orígenes de replicación son secuencias a las que se unen proteínas de iniciación específicas. Un origen de replicación típico cubre entre 100 y 200 pares de bases de ADN. Los procariotas tienen un origen de replicación por cromosoma o plásmido, pero suele haber múltiples orígenes en los cromosomas eucariotas. El genoma humano contiene alrededor de 100.000 orígenes de replicación que representan aproximadamente el 0,3% del genoma. ^[25]^[26]^[27]

centrómeros

Los centrómeros son los sitios donde las fibras del huso se unen a los cromosomas recién replicados para segregarlos en células hijas cuando la célula se divide. Cada cromosoma eucariota tiene un único centrómero funcional que se ve como una región constreñida en un cromosoma en metafase condensado. El ADN centromérico consta de una serie de secuencias de ADN repetitivas que a menudo ocupan una fracción significativa del genoma porque cada centrómero puede tener millones de pares de bases de longitud. En humanos, por ejemplo, se han determinado las secuencias de los 24 centrómeros ^[29] y representan aproximadamente el 6% del genoma. Sin embargo, es poco probable que todo este ADN no codificante sea esencial, ya que existe una variación considerable en la cantidad total de ADN centromérico en diferentes individuos. ^[30] Los centrómeros son otro ejemplo de secuencias funcionales de ADN no codificante que se conocen desde hace casi medio siglo y es probable que sean más abundantes que el ADN codificante.

Telómeros

Los telómeros son regiones de ADN repetitivo al final de un cromosoma , que brindan protección contra el deterioro cromosómico durante la replicación del ADN . Estudios recientes han demostrado que los telómeros funcionan para ayudar a su propia estabilidad. El ARN que contiene repeticiones teloméricas (TERRA) son transcritos derivados de los telómeros. Se ha demostrado que TERRA mantiene la actividad de la telomerasa y alarga los extremos de los cromosomas. ^[31]

Regiones de unión al andamio

Tanto los genomas procarióticos como los eucaróticos están organizados en grandes bucles de ADN unido a proteínas. En eucariotas, las bases de los bucles se denominan regiones de unión a andamios (SAR) y consisten en tramos de ADN que se unen a un complejo de ARN/proteína para estabilizar el bucle. Hay alrededor de 100.000 bucles en el genoma humano y cada uno consta de aproximadamente 100 pb de ADN. La cantidad total de ADN dedicada a los SAR representa aproximadamente el 0,3% del genoma humano. ^[32]

Pseudogenes

Los pseudogenes son en su mayoría genes antiguos que han dejado de funcionar debido a una mutación, pero el término también se refiere a secuencias de ADN inactivas que se derivan de ARN producidos por genes funcionales ( pseudogenes procesados ). Los pseudogenes son sólo una pequeña fracción del ADN no codificante en los genomas procarióticos porque se eliminan mediante selección negativa. En algunos eucariotas, sin embargo, los pseudogenes pueden acumularse porque la selección no es lo suficientemente poderosa como para eliminarlos (ver Teoría casi neutral de la evolución molecular ).

El genoma humano contiene alrededor de 15.000 pseudogenes derivados de genes codificadores de proteínas y un número desconocido derivados de genes no codificantes. ^[33] Pueden cubrir una fracción sustancial del genoma (~5%) ya que muchos de ellos contienen secuencias de intrones anteriores.

Los pseudogenes son ADN basura por definición y evolucionan a un ritmo neutro como se espera del ADN basura. ^[34] Algunos pseudogenes anteriores han adquirido secundariamente una función y esto lleva a algunos científicos a especular que la mayoría de los pseudogenes no son basura porque tienen una función aún por descubrir. ^[35]

Secuencias repetidas, transposones y elementos virales.

Los transposones y retrotransposones son elementos genéticos móviles . Las secuencias repetidas de retrotransposones , que incluyen elementos nucleares intercalados largos (LINE) y elementos nucleares intercalados cortos (SINE), representan una gran proporción de las secuencias genómicas en muchas especies. Las secuencias Alu , clasificadas como elemento nuclear corto intercalado, son los elementos móviles más abundantes en el genoma humano. Se han encontrado algunos ejemplos de SINE que ejercen control transcripcional de algunos genes que codifican proteínas. ^[36]^[37]^[38]

Las secuencias endógenas de retrovirus son el producto de la transcripción inversa de genomas de retrovirus en genomas de células germinales . La mutación dentro de estas secuencias retrotranscritas puede inactivar el genoma viral. ^[39]

Más del 8% del genoma humano está formado por secuencias de retrovirus endógenos (en su mayoría descompuestas), como parte de la fracción de más del 42% que se deriva claramente de retrotransposones, mientras que otro 3% puede identificarse como restos de transposones de ADN . Se espera que gran parte de la mitad restante del genoma, que actualmente carece de un origen explicado, haya encontrado su origen en elementos transponibles que estuvieron activos hace tanto tiempo (> 200 millones de años) que mutaciones aleatorias los han vuelto irreconocibles. ^[40] La variación del tamaño del genoma en al menos dos tipos de plantas es principalmente el resultado de secuencias de retrotransposones. ^[41]^[42]

ADN altamente repetitivo

El ADN altamente repetitivo consiste en tramos cortos de ADN que se repiten muchas veces en tándem (uno tras otro). Los segmentos repetidos suelen tener entre 2 pb y 10 pb, pero se conocen otros más largos. El ADN altamente repetitivo es raro en procariotas pero común en eucariotas, especialmente aquellos con genomas grandes. A veces se le llama ADN satélite .

La mayor parte del ADN altamente repetitivo se encuentra en centrómeros y telómeros (ver arriba) y la mayor parte es funcional, aunque parte puede ser redundante. La otra fracción significativa reside en repeticiones cortas en tándem (STR; también llamadas microsatélites ) que consisten en tramos cortos de una repetición simple como ATC. Hay alrededor de 350.000 STR en el genoma humano y están dispersos por todo el genoma con una longitud promedio de aproximadamente 25 repeticiones. ^[43]^[44]

Las variaciones en el número de repeticiones STR pueden causar enfermedades genéticas cuando se encuentran dentro de un gen, pero la mayoría de estas regiones parecen ser ADN basura no funcional donde el número de repeticiones puede variar considerablemente de un individuo a otro. Esta es la razón por la que estas diferencias de longitud se utilizan ampliamente en la toma de huellas dactilares del ADN .

ADN basura

El ADN basura es ADN que no tiene ninguna función biológicamente relevante, como pseudogenes y fragmentos de transposones que alguna vez estuvieron activos. Los genomas de bacterias y virus tienen muy poco ADN basura ^[45]^[46], pero algunos genomas eucariotas pueden tener una cantidad sustancial de ADN basura. ^[47] No se ha determinado la cantidad exacta de ADN no funcional en humanos y otras especies con genomas grandes y existe una considerable controversia en la literatura científica. ^[48]^[49]

El ADN no funcional en los genomas bacterianos se encuentra principalmente en la fracción intergénica del ADN no codificante, pero en los genomas eucariotas también se puede encontrar dentro de los intrones . Hay muchos ejemplos de elementos de ADN funcionales en el ADN no codificante, y es erróneo equiparar el ADN no codificante con el ADN basura.

Estudios de asociación de todo el genoma (GWAS) y ADN no codificante

Los estudios de asociación de todo el genoma (GWAS) identifican vínculos entre alelos y rasgos observables como fenotipos y enfermedades. La mayoría de las asociaciones se dan entre polimorfismos de un solo nucleótido (SNP) y el rasgo que se examina y la mayoría de estos SNP se encuentran en ADN no funcional. La asociación establece un vínculo que ayuda a mapear la región del ADN responsable del rasgo, pero no necesariamente identifica las mutaciones que causan la enfermedad o la diferencia fenotípica. ^[50]^[51]^[52]^[53]^[54]

Los SNP que están estrechamente vinculados a rasgos son los que tienen más probabilidades de identificar una mutación causal. (La asociación se conoce como desequilibrio de vínculo estrecho ). Aproximadamente el 12% de estos polimorfismos se encuentran en regiones codificantes; alrededor del 40% se encuentran en intrones; y la mayoría del resto se encuentran en regiones intergénicas, incluidas secuencias reguladoras. ^[51]

Ver también

Referencias

^ ab Kirchberger PC, Schmidt ML y Ochman H (2020). "El ingenio de los genomas bacterianos". Revista Anual de Microbiología . 74 : 815–834. doi : 10.1146/annurev-micro-020518-115822. PMID 32692614. S2CID 220699395.
^ ab Piovesan A, Antonaros F, Vitale L, Strippoli P, Pelleri MC, Caracausi M (2019). "Genes codificadores de proteínas humanas y estadísticas de características genéticas en 2019". Notas de investigación de BMC . 12 (1): 315. doi : 10.1186/s13104-019-4343-8 . PMC 6549324 . PMID 31164174.
^ Presagio GS (2021). "Reflexiones sobre el Proyecto Proteoma Humano HUPO, el proyecto insignia de la Organización del Proteoma Humano, a 10 años". Proteómica molecular y celular . 20 : 100062. doi : 10.1016/j.mcpro.2021.100062. PMC 8058560 . PMID 33640492.
^ Thomas CA (1971). "La organización genética de los cromosomas". Revista Anual de Genética . 5 : 237–256. doi : 10.1146/annurev.ge.05.120171.001321. PMID 16097657.
^ Elliott TA, Gregory TR (2015). "¿Qué hay en un genoma? El enigma del valor C y la evolución del contenido del genoma eucariota". Fil. Trans. R. Soc. B . 370 (1678): 20140331. doi :10.1098/rstb.2014.0331. PMC 4571570 . PMID 26323762. S2CID 12095046.
^ Hahn MW, Wray GA (2002). "La paradoja del valor g". Evolución y Desarrollo . 4 (2): 73–75. doi :10.1046/j.1525-142X.2002.01069.x. PMID 12004964. S2CID 2810069.
^ Gregory TR, Hebert PD (abril de 1999). "La modulación del contenido del ADN: causas próximas y consecuencias últimas". Investigación del genoma . 9 (4): 317–324. doi : 10.1101/gr.9.4.317 . PMID 10207154. S2CID 16791399.
^ Aparicio S, Chapman J, Stupka E, Putnam N, Chia JM, Dehal P, Christoffels A, Rash S, Hoon S, Smit A (2002). "Ensamblaje de escopeta de genoma completo y análisis del genoma de Fugu rubripes". Ciencia . 297 (5585): 1301–1310. Código Bib : 2002 Ciencia... 297.1301A. doi : 10.1126/ciencia.1072104. PMID 12142439. S2CID 10310355.
^ Ohno S (1972). "Tanto ADN" basura "en nuestro genoma". Simposios de Brookhaven en biología . 23 : 366–370. OCLC 101819442. PMID 5065367.
^ abcde Ibarra-Laclette E, Lyons E, Hernández-Guzmán G, Pérez-Torres CA, Carretero-Paulet L, Chang TH, Lan T, Welch AJ, Juárez MJ, Simpson J, et al. (2013). "Arquitectura y evolución de un genoma vegetal diminuto". Naturaleza . 498 (7452): 94–98. Código Bib :2013Natur.498...94I. doi : 10.1038/naturaleza12132. PMC 4972453 . PMID 23665961. S2CID 18219754.
^ abcdef Lan T, Renner T, Ibarra-Laclette E, Farr KM, Chang TH, Cervantes-Pérez SA, Zheng C, Sankoff D, Tang H y Purbojati RW (2017). "La secuenciación de lectura larga descubre la topografía adaptativa del genoma de una planta carnívora". Actas de la Academia Nacional de Ciencias . 114 (22): E4435–E4441. Código Bib : 2017PNAS..114E4435L. doi : 10.1073/pnas.1702072114 . PMC 5465930 . PMID 28507139.
^ Klein J (19 de mayo de 2017). "La limpieza genética convirtió las vejigas jorobadas en plantas carnívoras". New York Times . Consultado el 30 de mayo de 2022 .
^ Hsu C y Stolte D (13 de mayo de 2013). "La planta carnívora arroja ADN 'basura'" (Presione soltar). Tucson, AZ, EE.UU.: Universidad de Arizona . Consultado el 29 de mayo de 2022 .
^ Kampurakis K (2017). Dar sentido a los genes . Cambridge Reino Unido: Cambridge University Press. ISBN 978-1-107-12813-2.^{[ página necesaria ]}
^ Cech TR, Steitz JA (2014). "La revolución del ARN no codificante: desechar viejas reglas para forjar otras nuevas". Celúla . 157 (1): 77–94. doi : 10.1016/j.cell.2014.03.008 . PMID 24679528. S2CID 14852160.
^ Rogozin IB, Makarova KS, Natale DA, Spiridonov AN, Tatusov RL, Wolf YI, et al. (octubre de 2002). "Evolución congruente de diferentes clases de ADN no codificante en genomas procarióticos". Investigación de ácidos nucleicos . 30 (19): 4264–4271. doi : 10.1093/nar/gkf549. PMC 140549 . PMID 12364605.
^ Bielawski JP, Jones C (2016). "Evolución molecular adaptativa: métodos de detección". Enciclopedia de biología evolutiva . págs. 16-25. doi :10.1016/B978-0-12-800049-6.00171-2. ISBN 978-0-12-800426-5.
^ Ponting CP y Haerty W (2022). "Análisis de todo el genoma de ARN largos no codificantes humanos: una revisión provocativa". Revista Anual de Genómica y Genética Humana . 23 : 153-172. doi : 10.1146/annurev-genom-112921-123710 . hdl : 20.500.11820/ede40d70-b99c-42b0-a378-3b9b7b256a1b . PMID 35395170. S2CID 248049706.
^ Compe E, Egly JM (2021). "El largo camino para comprender el inicio de la transcripción RNAPII y los síndromes relacionados". Revista Anual de Bioquímica . 90 : 193–219. doi :10.1146/annurev-biochem-090220-112253. PMID 34153211. S2CID 235595550.
^ Visel A, Rubin EM, Pennacchio LA (septiembre de 2009). "Vistas genómicas de potenciadores de acción a distancia". Naturaleza . 461 (7261): 199–205. Código Bib :2009Natur.461..199V. doi : 10.1038/naturaleza08451. PMC 2923221 . PMID 19741700.
^ Harrow J, Frankish A, González JM, Tapanari E, Diekhans M, Kokocinski F, Aken BL, Barrell D, Zadissa A, Searle S (2012). "GENCODE: la anotación del genoma humano de referencia para el proyecto ENCODE". Investigación del genoma . 22 (9): 1760-1774. doi :10.1101/gr.135350.111. PMC 3431492 . PMID 22955987.
^ Alberts B, Bray D, Lewis J, Raff M, Roberts K, Watson JD (1994). Biología Molecular de la Célula, 3ª edición . Londres, Reino Unido: Garland Publishing Inc.^{[ página necesaria ]}
^ Lewin B (2004). Genes VIII . Upper Saddle River, Nueva Jersey, EE.UU.: Pearson/Prentice Hall.^{[ página necesaria ]}
^ Moran L, Horton HR, Scrimgeour KG, Perry MD (2012). Principios de Bioquímica Quinta Edición . Upper Saddle River, Nueva Jersey, Estados Unidos: Pearson.^{[ página necesaria ]}
^ Leonard AC, Méchali M (2013). "Orígenes de la replicación del ADN". Perspectivas de Cold Spring Harbor en biología . 5 (10): a010116. doi : 10.1101/cshperspect.a010116. PMC 3783049 . PMID 23838439.
^ Urban JM, Foulk MS, Casella C, Gerbi SA (2015). "La búsqueda de los orígenes de la replicación del ADN en eucariotas multicelulares". Informes F1000Prime . 7 : 30. doi : 10.12703/P7-30 . PMC 4371235 . PMID 25926981.
^ Prioleau M, MacAlpine DM (2016). "Orígenes de la replicación del ADN: ¿por dónde empezamos?". Genes y desarrollo . 30 (15): 1683–1697. doi :10.1101/gad.285114.116. PMC 5002974 . PMID 27542827.
^ Romiguier J, Roux C (2017). "Sesgos analíticos asociados con el contenido de GC en la evolución molecular". Fronteras en genética . 8 : 16. doi : 10.3389/fgene.2017.00016 . PMC 5309256 . PMID 28261263.
^ Altemose N, Logsdon GA, Bzikadze AV, Sidhwani P, Langley SA, Caldas GV, et al. (2021). "Mapas genómicos y epigenéticos completos de centrómeros humanos". Ciencia . 376 (6588): 56. doi :10.1126/science.abl4178. PMC 9233505 . PMID 35357911. S2CID 247853627.
^ Miga KH (2019). "ADN satélite centromérico: variación de secuencia oculta en la población humana". Genes . 10 (5): 353. doi : 10.3390/genes10050352 . PMC 6562703 . PMID 31072070.
^ Cusanelli E, Chartrand P (mayo de 2014). "ARN telomérico no codificante: ARN que contiene repeticiones teloméricas en biología de los telómeros". Reseñas interdisciplinarias de Wiley. ARN . 5 (3): 407–419. doi :10.1002/wrna.1220. PMID 24523222. S2CID 36918311.
^ Mistreli T (2020). "El genoma autoorganizado: principios de la arquitectura y función del genoma". Celúla . 183 (1): 28–45. doi : 10.1016/j.cell.2020.09.014. PMC 7541718 . PMID 32976797.
^ "Conjunto del genoma humano de referencia GRCh38.p13".
^ Xu J, Zhang J (2015). "¿Son funcionales los pseudogenes traducidos por humanos?". Biología Molecular y Evolución . 33 (3): 755–760. doi :10.1093/molbev/msv268. PMC 5009996 . PMID 26589994.
^ Wen YZ, Zheng LL, Qu LH, Ayala FJ, Lun ZR (2012). "Los pseudogenes ya no son pseudogenes". Biología del ARN . 9 (1): 27–32. doi : 10.4161/rna.9.1.18277 . PMID 22258143. S2CID 13161678.
^ Ponicsan SL, Kugel JF, Goodrich JA (abril de 2010). "Joyas genómicas: los ARN SINE regulan la producción de ARNm". Opinión actual en genética y desarrollo . 20 (2): 149-155. doi :10.1016/j.gde.2010.01.004. PMC 2859989 . PMID 20176473.
^ Häsler J, Samuelsson T, Strub K (julio de 2007). "'Basura' útil: ARN de Alu en el transcriptoma humano". Ciencias biológicas celulares y moleculares (manuscrito enviado). 64 (14): 1793–1800. doi :10.1007/s00018-007-7084-0. PMC 11136058 . PMID 17514354. S2CID 5938630.
^ Walters RD, Kugel JF, Goodrich JA (agosto de 2009). "Basura invaluable: el impacto celular y la función de los ARN Alu y B2". Vida IUBMB . 61 (8): 831–837. doi :10.1002/iub.227. PMC 4049031 . PMID 19621349.
^ Nelson PN, Hooley P, Roden D, Davari Ejtehadi H, Rylance P, Warren P, et al. (octubre de 2004). "Retrovirus endógenos humanos: ¿elementos transponibles con potencial?". Inmunología Clínica y Experimental . 138 (1): 1–9. doi :10.1111/j.1365-2249.2004.02592.x. PMC 1809191 . PMID 15373898.
^ Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, et al. (Febrero de 2001). "Secuenciación inicial y análisis del genoma humano". Naturaleza . 409 (6822): 860–921. Código Bib :2001Natur.409..860L. doi : 10.1038/35057062 . hdl : 2027.42/62798 . PMID 11237011.
^ Piegu B, Guyot R, Picault N, Roulin A, Sanyal A, Saniyal A, et al. (octubre de 2006). "Duplicar el tamaño del genoma sin poliploidización: dinámica de expansiones genómicas impulsadas por retrotransposición en Oryza australiensis, un pariente silvestre del arroz". Investigación del genoma . 16 (10): 1262-1269. doi :10.1101/gr.5290206. PMC 1581435 . PMID 16963705.
^ Hawkins JS, Kim H, Nason JD, Wing RA, Wendel JF (octubre de 2006). "La amplificación diferencial específica del linaje de elementos transponibles es responsable de la variación del tamaño del genoma en Gossypium". Investigación del genoma . 16 (10): 1252-1261. doi :10.1101/gr.5282906. PMC 1581434 . PMID 16954538.
^ Gymrek M, Willems T, Guilmatre A, Zeng H, Markus B, Georgiev S, Daly MJ, Price AL, Pritchard JK, Sharp AJ, Erlich Y (2016). "Abundante contribución de repeticiones cortas en tándem a la variación de la expresión genética en humanos". Genética de la Naturaleza . 48 (1): 22-29. doi :10.1038/ng.3461. PMC 4909355 . PMID 26642241.
^ Kronenberg ZN, Fiddes IT, Gordon D, Murali S, Cantsilieris S, Meyerson OS, Underwood JG, Nelson BJ, Chaisson MJ, Dougherty ML (2018). "Análisis comparativo de alta resolución de genomas de grandes simios". Ciencia . 360 (6393): 1085. doi : 10.1126/science.aar6343. PMC 6178954 . PMID 29880660.
^ Gil R y Latorre A (2012). "Factores detrás del ADN basura en bacterias". Genes . 3 (4): 634–650. doi : 10.3390/genes3040634 . PMC 3899985 . PMID 24705080.
^ Brandes, Nadav; Linial, Michal (2016). "Superposición de genes y limitaciones de tamaño en el mundo viral". Biología Directa . 11 (1): 26. doi : 10.1186/s13062-016-0128-3 . ISSN 1745-6150. PMC 4875738 . PMID 27209091.
^ Palacio AF, Gregory TR (mayo de 2014). "El caso del ADN basura". PLOS Genética . 10 (5): e1004351. doi : 10.1371/journal.pgen.1004351 . PMC 4014423 . PMID 24809441.
^ Morange, Michel (2014). "El genoma como estructura multipropósito construida por la evolución" (PDF) . Perspectivas en Biología y Medicina . 57 (1): 162-171. doi :10.1353/pbm.2014.0008. PMID 25345709. S2CID 27613442.
^ Haerty W y Ponting CP (2014). "Ningún gen del genoma tiene sentido excepto a la luz de la evolución". Revista Anual de Genómica y Genética Humana . 25 : 71–92. doi : 10.1146/annurev-genom-090413-025621 . PMID 24773316.
^ Korte A, Farlwo A (2013). "Las ventajas y limitaciones del análisis de rasgos con GWAS: una revisión". Métodos vegetales . 9 : 29. doi : 10.1186/1746-4811-9-29 . PMC 3750305 . PMID 23876160. S2CID 206976469.
^ ab Manolio TA (julio de 2010). "Estudios de asociación del genoma y evaluación del riesgo de enfermedad". La Revista de Medicina de Nueva Inglaterra . 363 (2): 166–76. doi : 10.1056/NEJMra0905980 . PMID 20647212.
^ Visscher PV, Wray NR, Zhang Q, Sklar P, McCarthy MI, Brown MA, Yang J (2017). "Diez años de descubrimiento de GWAS: biología, función y traducción". Revista Estadounidense de Genética Humana . 101 (1): 5–22. doi :10.1016/j.ajhg.2017.06.005. PMC 5501872 . PMID 28686856.
^ Gallagher MD, Chen-Plotkin, AS (2018). "La era posterior a GWAS: de la asociación a la función". Revista Estadounidense de Genética Humana . 102 (5): 717–730. doi :10.1016/j.ajhg.2018.04.002. PMC 5986732 . PMID 29727686.
^ Marigorta UM, Rodríguez JA, Gibson G, Navarro A (2018). "Replicabilidad y predicción: lecciones y desafíos de GWAS". Tendencias en Genética . 34 (7): 504–517. doi :10.1016/j.tig.2018.03.005. PMC 6003860 . PMID 29716745.

Lectura adicional

Bennett MD, Leitch IJ (2005). "Evolución del tamaño del genoma en plantas". En Gregory RT (ed.). La evolución del genoma . San Diego: Elsevier. págs. 89-162. ISBN 978-0-08-047052-8.
Gregorio TR (2005). "Evolución del tamaño del genoma en animales". La evolución del genoma . págs. 3–87. doi :10.1016/B978-012301463-4/50003-6. ISBN 978-0-12-301463-4.
Shabalina SA, Spiridonov NA (2004). "El transcriptoma de los mamíferos y la función de las secuencias de ADN no codificantes". Biología del genoma . 5 (4): 105. doi : 10.1186/gb-2004-5-4-105 . PMC 395773 . PMID 15059247.
Castillo-Davis CI (octubre de 2005). "La evolución del ADN no codificante: ¿cuánta basura, cuánta función?". Tendencias en Genética . 21 (10): 533–536. doi :10.1016/j.tig.2005.08.001. PMID 16098630.

Enlaces externos

Base de datos de valores C del ADN vegetal en el Royal Botanic Gardens, Kew
Base de datos sobre el tamaño del genoma de hongos en el Instituto Estonio de Zoología y Botánica
ENCODE: La enciclopedia humana en Nature ENCODE