ADN no codificante

Las secuencias de ADN no codificante ( ncDNA ) son componentes del ADN de un organismo que no codifican secuencias de proteínas . Parte del ADN no codificante se transcribe en moléculas de ARN no codificante funcionales (por ejemplo, ARN de transferencia , microARN , piARN , ARN ribosómico y ARN reguladores ). Otras regiones funcionales de la fracción de ADN no codificante incluyen secuencias reguladoras que controlan la expresión génica ; regiones de unión del andamiaje ; orígenes de replicación del ADN ; centrómeros ; y telómeros . Algunas regiones no codificantes parecen ser en su mayoría no funcionales, como intrones , pseudogenes , ADN intergénico y fragmentos de transposones y virus . Las regiones que son completamente no funcionales se denominan ADN basura .

Fracción de ADN genómico no codificante

En las bacterias , las regiones codificantes ocupan típicamente el 88% del genoma. ^[1] El 12% restante no codifica proteínas, pero gran parte de él todavía tiene función biológica a través de genes donde la transcripción de ARN es funcional (genes no codificantes) y secuencias reguladoras, lo que significa que casi todo el genoma bacteriano tiene una función. ^[1] La cantidad de ADN codificante en eucariotas suele ser una fracción mucho menor del genoma porque los genomas eucariotas contienen grandes cantidades de ADN repetitivo que no se encuentra en procariotas. El genoma humano contiene entre un 1 y un 2% de ADN codificante. ^[2]^[3] El número exacto no se conoce porque existen disputas sobre el número de exones codificantes funcionales y sobre el tamaño total del genoma humano. Esto significa que el 98-99% del genoma humano consiste en ADN no codificante y esto incluye muchos elementos funcionales como genes no codificantes y secuencias reguladoras.

El tamaño del genoma en eucariotas puede variar en un amplio rango, incluso entre especies estrechamente relacionadas. Esta observación desconcertante se conoció originalmente como la paradoja del valor C , donde "C" se refiere al tamaño del genoma haploide. ^[4] La paradoja se resolvió con el descubrimiento de que la mayoría de las diferencias se debían a la expansión y contracción del ADN repetitivo y no al número de genes. Algunos investigadores especularon que este ADN repetitivo era en su mayoría ADN basura . Las razones de los cambios en el tamaño del genoma aún se están resolviendo y este problema se llama el enigma del valor C. ^[5]

Esto llevó a la observación de que el número de genes no parece correlacionarse con las nociones percibidas de complejidad porque el número de genes parece ser relativamente constante, un problema denominado la paradoja del valor G. ^[6] Por ejemplo, se ha informado que el genoma del unicelular Polychaos dubium (antes conocido como Amoeba dubia ) contiene más de 200 veces la cantidad de ADN en humanos (es decir, más de 600 mil millones de pares de bases frente a un poco más de 3 mil millones en humanos). ^[7] El genoma del pez globo Takifugu rubripes tiene solo una octava parte del tamaño del genoma humano, pero parece tener un número comparable de genes. Los genes ocupan aproximadamente el 30% del genoma del pez globo y el ADN codificante es aproximadamente el 10%. (ADN no codificante = 90%.) El tamaño reducido del genoma del pez globo se debe a una reducción en la longitud de los intrones y un ADN menos repetitivo. ^[8]^[9]

Utricularia gibba , una planta utricularia , tiene un genoma nuclear muy pequeño (100,7 Mb) en comparación con la mayoría de las plantas.^[10]^[11] Es probable que haya evolucionado a partir de un genoma ancestral que tenía un tamaño de 1.500 Mb.^[11] El genoma de la utricularia tiene aproximadamente la misma cantidad de genes que otras plantas, pero la cantidad total de ADN codificante llega a aproximadamente el 30% del genoma.^[10]^[11]

El resto del genoma (70% de ADN no codificante) consiste en promotores y secuencias reguladoras que son más cortas que las de otras especies de plantas. ^[10] Los genes contienen intrones, pero hay menos cantidad y son más pequeños que los intrones de otros genomas de plantas. ^[10] Hay genes no codificantes, incluidas muchas copias de genes de ARN ribosómico. ^[11] El genoma también contiene secuencias de telómeros y centrómeros, como se esperaba. ^[11] Gran parte del ADN repetitivo observado en otros eucariotas ha sido eliminado del genoma de la utricularia desde que ese linaje se separó de los de otras plantas. Alrededor del 59% del genoma de la utricularia consiste en secuencias relacionadas con transposones, pero dado que el genoma es mucho más pequeño que otros genomas, esto representa una reducción considerable en la cantidad de este ADN. ^[11] Los autores del artículo original de 2013 señalan que las afirmaciones de elementos funcionales adicionales en el ADN no codificante de los animales no parecen aplicarse a los genomas de las plantas. ^[10]

Según un artículo del New York Times, durante la evolución de esta especie, "... la basura genética que no servía para nada fue eliminada, y se conservó lo necesario". ^[12] Según Victor Albert, de la Universidad de Buffalo, la planta es capaz de eliminar su llamado ADN basura y "tener una planta multicelular perfectamente buena con muchas células, órganos, tipos de tejidos y flores diferentes, y se puede hacer sin la basura. La basura no es necesaria". ^[13]

Tipos de secuencias de ADN no codificantes

Genes no codificantes

Existen dos tipos de genes : los que codifican proteínas y los que no codifican . ^[14] Los genes que no codifican son una parte importante del ADN no codificante e incluyen los genes del ARN de transferencia y del ARN ribosómico . Estos genes se descubrieron en la década de 1960. Los genomas procariotas contienen genes para varios otros ARN no codificantes, pero los genes del ARN no codificante son mucho más comunes en los eucariotas.

Las clases típicas de genes no codificantes en eucariotas incluyen genes para ARN nucleares pequeños (snRNA), ARN nucleolares pequeños (sno RNA), microARN (miRNA), ARN interferentes cortos (siRNA), ARN que interactúan con PIWI (piRNA) y ARN no codificantes largos (lncRNA). Además, hay una serie de genes de ARN únicos que producen ARN catalíticos . ^[15]

Los genes no codificantes representan sólo un pequeño porcentaje de los genomas procariotas ^[16], pero pueden representar una fracción mucho mayor en los genomas eucariotas. ^[17] En los seres humanos, los genes no codificantes ocupan al menos el 6% del genoma, en gran medida porque hay cientos de copias de genes de ARN ribosómico. ^{[ cita requerida ]} Los genes codificantes de proteínas ocupan alrededor del 38% del genoma; una fracción que es mucho mayor que la región codificante porque los genes contienen intrones grandes. ^{[ cita requerida ]}

El número total de genes no codificantes en el genoma humano es controvertido. Algunos científicos creen que sólo hay unos 5.000 genes no codificantes, mientras que otros creen que puede haber más de 100.000 (véase el artículo sobre el ARN no codificante ). La diferencia se debe en gran medida al debate sobre el número de genes lncRNA. ^[18]

Promotores y elementos reguladores

Los promotores son segmentos de ADN que se encuentran cerca del extremo 5' del gen, donde comienza la transcripción. Son los sitios donde se une la ARN polimerasa para iniciar la síntesis de ARN. Cada gen tiene un promotor no codificante.

Los elementos reguladores son sitios que controlan la transcripción de un gen cercano. Casi siempre son secuencias donde los factores de transcripción se unen al ADN y estos factores de transcripción pueden activar la transcripción (activadores) o reprimirla (represores). Los elementos reguladores se descubrieron en la década de 1960 y sus características generales se determinaron en la década de 1970 mediante el estudio de factores de transcripción específicos en bacterias y bacteriófagos . ^{[ cita requerida ]}

Los promotores y las secuencias reguladoras representan una clase abundante de ADN no codificante, pero en su mayoría consisten en una colección de secuencias relativamente cortas, por lo que no ocupan una fracción muy grande del genoma. La cantidad exacta de ADN regulador en el genoma de los mamíferos no está clara porque es difícil distinguir entre los sitios de unión de factores de transcripción espurios y los que son funcionales. Las características de unión de las proteínas de unión al ADN típicas se caracterizaron en la década de 1970 y las propiedades bioquímicas de los factores de transcripción predicen que en células con genomas grandes, la mayoría de los sitios de unión no serán biológicamente funcionales. ^{[ cita requerida ]}

Muchas secuencias reguladoras se encuentran cerca de los promotores, generalmente aguas arriba del sitio de inicio de la transcripción del gen. Algunas se encuentran dentro de un gen y unas pocas se encuentran aguas abajo del sitio de terminación de la transcripción. En los eucariotas, hay algunas secuencias reguladoras que se encuentran a una distancia considerable de la región promotora. Estas secuencias reguladoras distantes a menudo se denominan potenciadores , pero no existe una definición rigurosa de potenciador que lo distinga de otros sitios de unión de factores de transcripción. ^[19]^[20]

Intrones

Los intrones son las partes de un gen que se transcriben en la secuencia de ARN precursor , pero que finalmente se eliminan mediante el empalme del ARN durante el procesamiento para obtener ARN maduro. Los intrones se encuentran en ambos tipos de genes: genes codificantes de proteínas y genes no codificantes. Están presentes en los procariotas, pero son mucho más comunes en los genomas eucariotas. ^{[ cita requerida ]}

Los intrones de los grupos I y II ocupan sólo un pequeño porcentaje del genoma cuando están presentes. Los intrones espliceosómicos (véase la figura) sólo se encuentran en eucariotas y pueden representar una proporción sustancial del genoma. En los seres humanos, por ejemplo, los intrones de los genes codificadores de proteínas cubren el 37% del genoma. Combinando eso con alrededor del 1% de secuencias codificantes significa que los genes codificadores de proteínas ocupan alrededor del 38% del genoma humano. Los cálculos para los genes no codificantes son más complicados porque existe una considerable controversia sobre el número total de genes no codificantes, pero tomando sólo los ejemplos bien definidos significa que los genes no codificantes ocupan al menos el 6% del genoma. ^[21]^[2]

Regiones no traducidas

Los libros de texto estándar de bioquímica y biología molecular describen nucleótidos no codificantes en el ARNm ubicados entre el extremo 5' del gen y el codón de inicio de la traducción. Estas regiones se denominan regiones 5' no traducidas o 5'-UTR. En el extremo del gen se encuentran regiones similares llamadas regiones 3' no traducidas (3'-UTR). Las 5'-UTR y 3'UTR son muy cortas en las bacterias, pero pueden tener varios cientos de nucleótidos de longitud en los eucariotas. Contienen elementos cortos que controlan el inicio de la traducción (5'-UTR) y la terminación de la transcripción (3'-UTR), así como elementos reguladores que pueden controlar la estabilidad, el procesamiento y la orientación del ARNm a diferentes regiones de la célula. ^[22]^[23]^[24]

Orígenes de la replicación

La síntesis de ADN comienza en sitios específicos llamados orígenes de replicación . Se trata de regiones del genoma donde se ensambla la maquinaria de replicación del ADN y se desenrolla el ADN para comenzar la síntesis de ADN. En la mayoría de los casos, la replicación se produce en ambas direcciones desde el origen de replicación.

Las características principales de los orígenes de replicación son secuencias donde se unen proteínas de iniciación específicas. Un origen de replicación típico cubre alrededor de 100-200 pares de bases de ADN. Los procariotas tienen un origen de replicación por cromosoma o plásmido, pero generalmente hay múltiples orígenes en los cromosomas eucariotas. El genoma humano contiene alrededor de 100.000 orígenes de replicación que representan aproximadamente el 0,3% del genoma. ^[25]^[26]^[27]

Centrómeros

Los centrómeros son los sitios donde las fibras del huso se unen a los cromosomas recién replicados para segregarlos en células hijas cuando la célula se divide. Cada cromosoma eucariota tiene un único centrómero funcional que se ve como una región constreñida en un cromosoma metafásico condensado. El ADN centromérico consiste en una serie de secuencias de ADN repetitivas que a menudo ocupan una fracción significativa del genoma porque cada centrómero puede tener millones de pares de bases de longitud. En los humanos, por ejemplo, se han determinado las secuencias de los 24 centrómeros ^[29] y representan aproximadamente el 6% del genoma. Sin embargo, es poco probable que todo este ADN no codificante sea esencial ya que existe una variación considerable en la cantidad total de ADN centromérico en diferentes individuos. ^[30] Los centrómeros son otro ejemplo de secuencias de ADN no codificante funcionales que se conocen desde hace casi medio siglo y es probable que sean más abundantes que el ADN codificante.

Telómeros

Los telómeros son regiones de ADN repetitivo en el extremo de un cromosoma , que brindan protección contra el deterioro cromosómico durante la replicación del ADN . Estudios recientes han demostrado que los telómeros funcionan para ayudar a su propia estabilidad. El ARN que contiene repeticiones teloméricas (TERRA) son transcripciones derivadas de los telómeros. Se ha demostrado que TERRA mantiene la actividad de la telomerasa y alarga los extremos de los cromosomas. ^[31]

Regiones de fijación del andamio

Tanto los genomas procariotas como los eucariotas están organizados en grandes bucles de ADN unido a proteínas. En los eucariotas, las bases de los bucles se denominan regiones de unión al andamiaje (SAR, por sus siglas en inglés) y consisten en tramos de ADN que se unen a un complejo ARN/proteína para estabilizar el bucle. Hay alrededor de 100.000 bucles en el genoma humano y cada uno consta de aproximadamente 100 pb de ADN. La cantidad total de ADN dedicado a las SAR representa aproximadamente el 0,3% del genoma humano. ^[32]

Pseudogenes

Los pseudogenes son en su mayoría genes antiguos que se han vuelto no funcionales debido a una mutación, pero el término también se refiere a secuencias de ADN inactivas que se derivan de ARN producidos por genes funcionales ( pseudogenes procesados ). Los pseudogenes son solo una pequeña fracción del ADN no codificante en los genomas procariotas porque se eliminan por selección negativa. Sin embargo, en algunos eucariotas, los pseudogenes pueden acumularse porque la selección no es lo suficientemente poderosa como para eliminarlos (véase Teoría casi neutral de la evolución molecular ).

El genoma humano contiene alrededor de 15.000 pseudogenes derivados de genes codificantes de proteínas y un número desconocido derivado de genes no codificantes. ^[33] Pueden cubrir una fracción sustancial del genoma (~5%) ya que muchos de ellos contienen antiguas secuencias de intrones.

Los pseudogenes son ADN basura por definición y evolucionan a un ritmo neutral como se espera para el ADN basura. ^[34] Algunos pseudogenes anteriores han adquirido una función de manera secundaria y esto lleva a algunos científicos a especular que la mayoría de los pseudogenes no son basura porque tienen una función aún por descubrir. ^[35]

Secuencias repetidas, transposones y elementos virales

Los transposones y retrotransposones son elementos genéticos móviles . Las secuencias repetidas de retrotransposones , que incluyen elementos nucleares intercalados largos (LINE) y elementos nucleares intercalados cortos (SINE), representan una gran proporción de las secuencias genómicas en muchas especies. Las secuencias Alu , clasificadas como un elemento nuclear intercalado corto, son los elementos móviles más abundantes en el genoma humano. Se han encontrado algunos ejemplos de SINE que ejercen control transcripcional de algunos genes codificadores de proteínas. ^[36]^[37]^[38]

Las secuencias de retrovirus endógenos son el producto de la transcripción inversa de los genomas de retrovirus en los genomas de las células germinales . La mutación dentro de estas secuencias retrotranscritas puede inactivar el genoma viral. ^[39]

Más del 8% del genoma humano está formado por secuencias de retrovirus endógenos (en su mayoría desintegradas), como parte de la fracción de más del 42% que se deriva reconociblemente de retrotransposones, mientras que otro 3% puede identificarse como restos de transposones de ADN . Se espera que gran parte de la mitad restante del genoma que actualmente no tiene un origen explicado haya encontrado su origen en elementos transponibles que estuvieron activos hace tanto tiempo (> 200 millones de años) que las mutaciones aleatorias los han vuelto irreconocibles. ^[40] La variación del tamaño del genoma en al menos dos tipos de plantas es principalmente el resultado de secuencias de retrotransposones. ^[41]^[42]

ADN altamente repetitivo

El ADN altamente repetitivo consiste en fragmentos cortos de ADN que se repiten muchas veces en tándem (uno tras otro). Los segmentos repetidos suelen tener entre 2 y 10 pb, pero se conocen otros más largos. El ADN altamente repetitivo es poco frecuente en procariotas, pero común en eucariotas, especialmente en aquellas con genomas grandes. A veces se lo denomina ADN satélite .

La mayor parte del ADN altamente repetitivo se encuentra en los centrómeros y los telómeros (ver arriba) y la mayor parte es funcional, aunque parte puede ser redundante. La otra fracción significativa reside en repeticiones cortas en tándem (STRs, también llamadas microsatélites ) que consisten en tramos cortos de una repetición simple como ATC. Hay alrededor de 350.000 STR en el genoma humano y están dispersos por todo el genoma con una longitud promedio de aproximadamente 25 repeticiones. ^[43]^[44]

Las variaciones en el número de repeticiones de STR pueden causar enfermedades genéticas cuando se encuentran dentro de un gen, pero la mayoría de estas regiones parecen ser ADN basura no funcional, en el que el número de repeticiones puede variar considerablemente de un individuo a otro. Por eso, estas diferencias de longitud se utilizan ampliamente en la identificación genética .

ADN basura

El ADN basura es ADN que no tiene una función biológicamente relevante, como los pseudogenes y los fragmentos de transposones que alguna vez estuvieron activos. Los genomas de bacterias y virus tienen muy poco ADN basura ^[45]^[46] pero algunos genomas eucariotas pueden tener una cantidad sustancial de ADN basura. ^[47] No se ha determinado la cantidad exacta de ADN no funcional en humanos y otras especies con genomas grandes y existe una considerable controversia en la literatura científica. ^[48]^[49]

El ADN no funcional en los genomas bacterianos se encuentra principalmente en la fracción intergénica del ADN no codificante, pero en los genomas eucariotas también puede encontrarse dentro de los intrones . Hay muchos ejemplos de elementos de ADN funcionales en el ADN no codificante, y es erróneo equiparar el ADN no codificante con el ADN basura.

Estudios de asociación de todo el genoma (GWAS) y ADN no codificante

Los estudios de asociación de todo el genoma (GWAS) identifican vínculos entre alelos y rasgos observables, como fenotipos y enfermedades. La mayoría de las asociaciones se dan entre polimorfismos de un solo nucleótido (SNP) y el rasgo que se examina, y la mayoría de estos SNP se encuentran en ADN no funcional. La asociación establece un vínculo que ayuda a mapear la región de ADN responsable del rasgo, pero no identifica necesariamente las mutaciones que causan la enfermedad o la diferencia fenotípica. ^[50]^[51]^[52]^[53]^[54]

Los SNP que están estrechamente vinculados a los rasgos son los que tienen más probabilidades de identificar una mutación causal. (La asociación se conoce como desequilibrio de ligamiento estrecho ). Alrededor del 12% de estos polimorfismos se encuentran en regiones codificantes; alrededor del 40% se encuentran en intrones; y la mayoría del resto se encuentra en regiones intergénicas, incluidas las secuencias reguladoras. ^[51]

Véase también

Referencias

^ ab Kirchberger PC, Schmidt ML y Ochman H (2020). "El ingenio de los genomas bacterianos". Revisión anual de microbiología . 74 : 815–834. doi :10.1146/annurev-micro-020518-115822. PMID 32692614. S2CID 220699395.
^ ab Piovesan A, Antonaros F, Vitale L, Strippoli P, Pelleri MC, Caracausi M (2019). "Genes codificadores de proteínas humanas y estadísticas de características genéticas en 2019". BMC Research Notes . 12 (1): 315. doi : 10.1186/s13104-019-4343-8 . PMC 6549324 . PMID 31164174.
^ Omenn GS (2021). "Reflexiones sobre el Proyecto del Proteoma Humano HUPO, el proyecto insignia de la Organización del Proteoma Humano, a los 10 años". Molecular & Cellular Proteomics . 20 : 100062. doi :10.1016/j.mcpro.2021.100062. PMC 8058560 . PMID 33640492.
^ Thomas CA (1971). "La organización genética de los cromosomas". Revista Anual de Genética . 5 : 237–256. doi :10.1146/annurev.ge.05.120171.001321. PMID 16097657.
^ Elliott TA, Gregory TR (2015). "¿Qué hay en un genoma? El enigma del valor C y la evolución del contenido del genoma eucariota". Phil. Trans. R. Soc. B. 370 ( 1678): 20140331. doi :10.1098/rstb.2014.0331. PMC 4571570. PMID 26323762. S2CID 12095046 .
^ Hahn MW, Wray GA (2002). "La paradoja del valor g". Evolución y desarrollo . 4 (2): 73–75. doi :10.1046/j.1525-142X.2002.01069.x. PMID 12004964. S2CID 2810069.
^ Gregory TR, Hebert PD (abril de 1999). "La modulación del contenido de ADN: causas próximas y consecuencias últimas". Genome Research . 9 (4): 317–324. doi : 10.1101/gr.9.4.317 . PMID 10207154. S2CID 16791399.
^ Aparicio S, Chapman J, Stupka E, Putnam N, Chia JM, Dehal P, Christoffels A, Rash S, Hoon S, Smit A (2002). "Ensamblaje de escopeta de genoma completo y análisis del genoma de Fugu rubripes". Science . 297 (5585): 1301–1310. Bibcode :2002Sci...297.1301A. doi :10.1126/science.1072104. PMID 12142439. S2CID 10310355.
^ Ohno S (1972). "Tanto ADN "basura" en nuestro genoma". Simposios de Brookhaven sobre biología . 23 : 366–370. OCLC 101819442. PMID 5065367.
^ abcde Ibarra-Laclette E, Lyons E, Hernández-Guzmán G, Pérez-Torres CA, Carretero-Paulet L, Chang TH, Lan T, Welch AJ, Juárez MJ, Simpson J, et al. (2013). "Arquitectura y evolución de un genoma vegetal diminuto". Naturaleza . 498 (7452): 94–98. Código Bib :2013Natur.498...94I. doi : 10.1038/naturaleza12132. PMC 4972453 . PMID 23665961. S2CID 18219754.
^ abcdef Lan T, Renner T, Ibarra-Laclette E, Farr KM, Chang TH, Cervantes-Pérez SA, Zheng C, Sankoff D, Tang H y Purbojati RW (2017). "La secuenciación de lectura larga descubre la topografía adaptativa del genoma de una planta carnívora". Actas de la Academia Nacional de Ciencias . 114 (22): E4435–E4441. Bibcode :2017PNAS..114E4435L. doi : 10.1073/pnas.1702072114 . PMC 5465930 . PMID 28507139.
^ Klein J (19 de mayo de 2017). "La limpieza genética convirtió a las utricularias jorobadas en plantas carnívoras". New York Times . Consultado el 30 de mayo de 2022 .
^ Hsu C y Stolte D (13 de mayo de 2013). "Planta carnívora arroja ADN 'basura'" (Comunicado de prensa). Tucson, AZ, EE. UU.: Universidad de Arizona . Consultado el 29 de mayo de 2022 .
^ Kampourakis K (2017). Dando sentido a los genes . Cambridge, Reino Unido: Cambridge University Press. ISBN 978-1-107-12813-2.^{[ página necesaria ]}
^ Cech TR, Steitz JA (2014). "La revolución del ARN no codificante: desechar las viejas reglas para forjar otras nuevas". Cell . 157 (1): 77–94. doi : 10.1016/j.cell.2014.03.008 . PMID 24679528. S2CID 14852160.
^ Rogozin IB, Makarova KS, Natale DA, Spiridonov AN, Tatusov RL, Wolf YI, et al. (octubre de 2002). "Evolución congruente de diferentes clases de ADN no codificante en genomas procariotas". Nucleic Acids Research . 30 (19): 4264–4271. doi :10.1093/nar/gkf549. PMC 140549 . PMID 12364605.
^ Bielawski JP, Jones C (2016). "Evolución molecular adaptativa: métodos de detección". Enciclopedia de biología evolutiva . págs. 16-25. doi :10.1016/B978-0-12-800049-6.00171-2. ISBN 978-0-12-800426-5.
^ Ponting CP y Haerty W (2022). "Análisis de todo el genoma de ARN humanos no codificantes largos: una revisión provocativa". Revisión anual de genómica y genética humana . 23 : 153–172. doi : 10.1146/annurev-genom-112921-123710 . hdl : 20.500.11820/ede40d70-b99c-42b0-a378-3b9b7b256a1b . PMID 35395170. S2CID 248049706.
^ Compe E, Egly JM (2021). "El largo camino hacia la comprensión de la iniciación de la transcripción de RNAPII y los síndromes relacionados". Revisión anual de bioquímica . 90 : 193–219. doi :10.1146/annurev-biochem-090220-112253. PMID 34153211. S2CID 235595550.
^ Visel A, Rubin EM, Pennacchio LA (septiembre de 2009). "Visiones genómicas de potenciadores de acción distante". Nature . 461 (7261): 199–205. Bibcode :2009Natur.461..199V. doi :10.1038/nature08451. PMC 2923221 . PMID 19741700.
^ Harrow J, Frankish A, Gonzalez JM, Tapanari E, Diekhans M, Kokocinski F, Aken BL, Barrell D, Zadissa A, Searle S (2012). "GENCODE: la anotación de referencia del genoma humano para el Proyecto ENCODE". Genome Research . 22 (9): 1760–1774. doi :10.1101/gr.135350.111. PMC 3431492 . PMID 22955987.
^ Alberts B, Bray D, Lewis J, Raff M, Roberts K, Watson JD (1994). Biología molecular de la célula, 3.ª edición . Londres, Reino Unido: Garland Publishing Inc.^{[ página necesaria ]}
^ Lewin B (2004). Genes VIII . Upper Saddle River, Nueva Jersey, EE. UU.: Pearson/Prentice Hall.^{[ página necesaria ]}
^ Moran L, Horton HR, Scrimgeour KG, Perry MD (2012). Principios de bioquímica, quinta edición . Upper Saddle River, NJ, EE. UU.: Pearson.^{[ página necesaria ]}
^ Leonard AC, Méchali M (2013). "Orígenes de la replicación del ADN". Cold Spring Harbor Perspectives in Biology . 5 (10): a010116. doi :10.1101/cshperspect.a010116. PMC 3783049 . PMID 23838439.
^ Urban JM, Foulk MS, Casella C, Gerbi SA (2015). "La búsqueda de los orígenes de la replicación del ADN en eucariotas multicelulares". F1000Prime Reports . 7 : 30. doi : 10.12703/P7-30 . PMC 4371235 . PMID 25926981.
^ Prioleau M, MacAlpine DM (2016). "Orígenes de la replicación del ADN: ¿por dónde empezamos?". Genes & Development . 30 (15): 1683–1697. doi :10.1101/gad.285114.116. PMC 5002974 . PMID 27542827.
^ Romiguier J, Roux C (2017). "Sesgos analíticos asociados con el contenido de GC en la evolución molecular". Frontiers in Genetics . 8 : 16. doi : 10.3389/fgene.2017.00016 . PMC 5309256 . PMID 28261263.
^ Altemose N, Logsdon GA, Bzikadze AV, Sidhwani P, Langley SA, Caldas GV, et al. (2021). "Mapas genómicos y epigenéticos completos de centrómeros humanos". Ciencia . 376 (6588): 56. doi :10.1126/science.abl4178. PMC 9233505 . PMID 35357911. S2CID 247853627.
^ Miga KH (2019). "ADN satélite centromérico: variación de secuencia oculta en la población humana". Genes . 10 (5): 353. doi : 10.3390/genes10050352 . PMC 6562703 . PMID 31072070.
^ Cusanelli E, Chartrand P (mayo de 2014). "ARN no codificante telomérico: ARN que contiene repeticiones teloméricas en la biología de los telómeros". Wiley Interdisciplinary Reviews. ARN . 5 (3): 407–419. doi :10.1002/wrna.1220. PMID 24523222. S2CID 36918311.
^ Mistreli T (2020). "El genoma autoorganizado: principios de la arquitectura y función del genoma". Cell . 183 (1): 28–45. doi :10.1016/j.cell.2020.09.014. PMC 7541718 . PMID 32976797.
^ "Conjunto de genoma de referencia humano GRCh38.p13".
^ Xu J, Zhang J (2015). "¿Son funcionales los pseudogenes humanos traducidos?". Biología molecular y evolución . 33 (3): 755–760. doi :10.1093/molbev/msv268. PMC 5009996 . PMID 26589994.
^ Wen YZ, Zheng LL, Qu LH, Ayala FJ, Lun ZR (2012). "Los pseudogenes ya no son pseudo". RNA Biology . 9 (1): 27–32. doi : 10.4161/rna.9.1.18277 . PMID 22258143. S2CID 13161678.
^ Ponicsan SL, Kugel JF, Goodrich JA (abril de 2010). "Joyas genómicas: los ARN SINE regulan la producción de ARNm". Current Opinion in Genetics & Development . 20 (2): 149–155. doi :10.1016/j.gde.2010.01.004. PMC 2859989 . PMID 20176473.
^ Häsler J, Samuelsson T, Strub K (julio de 2007). "Basura útil: ARN Alu en el transcriptoma humano". Cellular and Molecular Life Sciences (manuscrito enviado). 64 (14): 1793–1800. doi :10.1007/s00018-007-7084-0. PMC 11136058. PMID 17514354. S2CID 5938630 .
^ Walters RD, Kugel JF, Goodrich JA (agosto de 2009). "Basura invaluable: el impacto celular y la función de los ARN Alu y B2". IUBMB Life . 61 (8): 831–837. doi :10.1002/iub.227. PMC 4049031 . PMID 19621349.
^ Nelson PN, Hooley P, Roden D, Davari Ejtehadi H, Rylance P, Warren P, et al. (octubre de 2004). "Retrovirus endógenos humanos: ¿elementos transponibles con potencial?". Inmunología clínica y experimental . 138 (1): 1–9. doi :10.1111/j.1365-2249.2004.02592.x. PMC 1809191. PMID 15373898 .
^ Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, et al. (febrero de 2001). "Secuenciación inicial y análisis del genoma humano". Nature . 409 (6822): 860–921. Bibcode :2001Natur.409..860L. doi : 10.1038/35057062 . hdl : 2027.42/62798 . PMID 11237011.
^ Piegu B, Guyot R, Picault N, Roulin A, Sanyal A, Saniyal A, et al. (octubre de 2006). "Duplicación del tamaño del genoma sin poliploidización: dinámica de las expansiones genómicas impulsadas por retrotransposición en Oryza australiensis, un pariente silvestre del arroz". Genome Research . 16 (10): 1262–1269. doi :10.1101/gr.5290206. PMC 1581435 . PMID 16963705.
^ Hawkins JS, Kim H, Nason JD, Wing RA, Wendel JF (octubre de 2006). "La amplificación diferencial de elementos transponibles específicos de linaje es responsable de la variación del tamaño del genoma en Gossypium". Genome Research . 16 (10): 1252–1261. doi :10.1101/gr.5282906. PMC 1581434 . PMID 16954538.
^ Gymrek M, Willems T, Guilmatre A, Zeng H, Markus B, Georgiev S, Daly MJ, Price AL, Pritchard JK, Sharp AJ, Erlich Y (2016). "Contribución abundante de repeticiones cortas en tándem a la variación de la expresión génica en humanos". Nature Genetics . 48 (1): 22–29. doi :10.1038/ng.3461. PMC 4909355 . PMID 26642241.
^ Kronenberg ZN, Fiddes IT, Gordon D, Murali S, Cantsilieris S, Meyerson OS, Underwood JG, Nelson BJ, Chaisson MJ, Dougherty ML (2018). "Análisis comparativo de alta resolución de genomas de grandes simios". Science . 360 (6393): 1085. doi :10.1126/science.aar6343. PMC 6178954 . PMID 29880660.
^ Gil R y Latorre A (2012). "Factores detrás del ADN basura en bacterias". Genes . 3 (4): 634–650. doi : 10.3390/genes3040634 . PMC 3899985 . PMID 24705080.
^ Brandes, Nadav; Linial, Michal (2016). "Superposición de genes y restricciones de tamaño en el mundo viral". Biology Direct . 11 (1): 26. doi : 10.1186/s13062-016-0128-3 . ISSN 1745-6150. PMC 4875738 . PMID 27209091.
^ Palazzo AF, Gregory TR (mayo de 2014). "El caso del ADN basura". PLOS Genetics . 10 (5): e1004351. doi : 10.1371/journal.pgen.1004351 . PMC 4014423 . PMID 24809441.
^ Morange, Michel (2014). "El genoma como una estructura multipropósito construida por la evolución" (PDF) . Perspectivas en biología y medicina . 57 (1): 162–171. doi :10.1353/pbm.2014.0008. PMID 25345709. S2CID 27613442.
^ Haerty W y Ponting CP (2014). "Ningún gen del genoma tiene sentido excepto a la luz de la evolución". Revisión anual de genómica y genética humana . 25 : 71–92. doi : 10.1146/annurev-genom-090413-025621 . PMID: 24773316.
^ Korte A, Farlwo A (2013). "Las ventajas y limitaciones del análisis de rasgos con GWAS: una revisión". Plant Methods . 9 : 29. doi : 10.1186/1746-4811-9-29 . PMC 3750305 . PMID 23876160. S2CID 206976469.
^ ab Manolio TA (julio de 2010). "Estudios de asociación de todo el genoma y evaluación del riesgo de enfermedad". The New England Journal of Medicine . 363 (2): 166–76. doi : 10.1056/NEJMra0905980 . PMID 20647212.
^ Visscher PV, Wray NR, Zhang Q, Sklar P, McCarthy MI, Brown MA, Yang J (2017). "10 años de descubrimiento de GWAS: biología, función y traducción". American Journal of Human Genetics . 101 (1): 5–22. doi :10.1016/j.ajhg.2017.06.005. PMC 5501872 . PMID 28686856.
^ Gallagher MD, Chen-Plotkin, AS (2018). "La era post-GWAS: de la asociación a la función". Revista estadounidense de genética humana . 102 (5): 717–730. doi :10.1016/j.ajhg.2018.04.002. PMC 5986732 . PMID 29727686.
^ Marigorta UM, Rodríguez JA, Gibson G, Navarro A (2018). "Replicabilidad y predicción: lecciones y desafíos de GWAS". Tendencias en Genética . 34 (7): 504–517. doi :10.1016/j.tig.2018.03.005. PMC 6003860 . PMID 29716745.

Lectura adicional

Bennett MD, Leitch IJ (2005). "Evolución del tamaño del genoma en plantas". En Gregory RT (ed.). La evolución del genoma . San Diego: Elsevier. págs. 89–162. ISBN 978-0-08-047052-8.
Gregory TR (2005). "Evolución del tamaño del genoma en animales". La evolución del genoma . pp. 3–87. doi :10.1016/B978-012301463-4/50003-6. ISBN 978-0-12-301463-4.
Shabalina SA, Spiridonov NA (2004). "El transcriptoma de los mamíferos y la función de las secuencias de ADN no codificantes". Genome Biology . 5 (4): 105. doi : 10.1186/gb-2004-5-4-105 . PMC 395773 . PMID 15059247.
Castillo-Davis CI (octubre de 2005). "La evolución del ADN no codificante: ¿cuánto ADN basura, cuánto ADN funcional?". Trends in Genetics . 21 (10): 533–536. doi :10.1016/j.tig.2005.08.001. PMID 16098630.

Enlaces externos

Base de datos de valores C del ADN de plantas en el Real Jardín Botánico de Kew
Base de datos sobre el tamaño del genoma de los hongos en el Instituto de Zoología y Botánica de Estonia
ENCODE: La enciclopedia humana en Nature ENCODE