El ADN basura ( ADN no funcional ) es una secuencia de ADN que no tiene ninguna función biológica relevante. [1] [2] La mayoría de los organismos tienen algo de ADN basura en sus genomas , principalmente pseudogenes y fragmentos de transposones y virus, pero es posible que algunos organismos tengan cantidades sustanciales de ADN basura. [3]
Todas las regiones de los genes que codifican proteínas se consideran generalmente elementos funcionales en los genomas. Además, las regiones codificantes no proteicas, como los genes del ARN ribosomal y el ARN de transferencia, las secuencias reguladoras que controlan la expresión de esos genes, los elementos del genoma que implican orígenes de replicación (en todas las especies), centrómeros, telómeros y regiones de unión al andamio (en eucariotas) ) generalmente también se consideran elementos funcionales de los genomas. (Consulte ADN no codificante para obtener más información).
Es difícil determinar si otras regiones del genoma son funcionales o no funcionales. Existe una considerable controversia sobre qué criterios se deben utilizar para identificar la función. Muchos científicos tienen una visión evolutiva del genoma y prefieren criterios basados en si las secuencias de ADN se conservan mediante selección natural. [4] [5] [6] Otros científicos cuestionan este punto de vista o tienen diferentes interpretaciones de los datos. [7] [8] [9]
La idea de que sólo una fracción del genoma humano podría ser funcional se remonta a finales de los años cuarenta. La tasa de mutación estimada en humanos sugirió que si una gran fracción de esas mutaciones fueran perjudiciales, entonces la especie humana no podría sobrevivir a tal carga de mutaciones (carga genética). Esto llevó a predicciones a finales de la década de 1940 por uno de los fundadores de la genética de poblaciones, JBS Haldane , y por el premio Nobel, Hermann Muller , de que sólo un pequeño porcentaje del genoma humano contiene elementos funcionales del ADN (genes) que pueden ser destruidos por mutación. . [10] [11] (ver Carga genética para más información)
En 1966, Muller revisó estas predicciones y concluyó que el genoma humano sólo podría contener unos 30.000 genes basándose en el número de mutaciones nocivas que la especie podía tolerar. [12] Otros expertos destacados en evolución molecular hicieron predicciones similares y concluyeron que el genoma humano no podía contener más de 40.000 genes y que menos del 10% del genoma era funcional. [13] [14] [4] [15]
Se sabía que el tamaño de los genomas de diversas especies variaba considerablemente y no parecía haber una correlación entre el tamaño del genoma y la complejidad de la especie. Incluso especies estrechamente relacionadas podrían tener tamaños de genoma muy diferentes. Esta observación condujo a lo que se conoció como la paradoja del valor C. [16] La paradoja se resolvió con el descubrimiento del ADN repetitivo y la observación de que la mayoría de las diferencias en el tamaño del genoma podrían atribuirse al ADN repetitivo. [16] [17] Algunos científicos pensaron que la mayor parte del ADN repetitivo estaba involucrado en la regulación de la expresión genética, pero muchos científicos pensaron que el exceso de ADN repetitivo no era funcional. [18] [16] [19] [20] [21]
Aproximadamente al mismo tiempo (finales de la década de 1960), la técnica recientemente desarrollada de análisis C 0 t se perfeccionó para incluir la hibridación ARN:ADN, lo que llevó al descubrimiento de que considerablemente menos del 10% del genoma humano era complementario al ARNm y este ADN estaba en el fracción única (no repetitiva). Esto confirmó las predicciones hechas a partir de argumentos sobre la carga genética y fue consistente con la idea de que gran parte del ADN repetitivo no es funcional. [22] [23] [24]
La idea de que grandes cantidades de genomas eucariotas pudieran ser no funcionales entraba en conflicto con la visión predominante sobre la evolución en 1968, ya que parecía probable que el ADN no funcional sería eliminado por selección natural. El desarrollo de la teoría neutral y la teoría casi neutral proporcionó una salida a este problema, ya que permitió la preservación de ADN no funcional ligeramente nocivo de acuerdo con los principios fundamentales de la genética de poblaciones. [14] [13] [25]
El término "ADN basura" comenzó a utilizarse a finales de la década de 1950 [26] , pero Susumu Ohno popularizó el término en un artículo de 1972 titulado "Tanto ADN 'basura' en nuestro genoma" [27] donde resumió la evidencia actual que había acumulado hasta entonces. [27] En un segundo artículo ese mismo año, concluyó que el 90% de los genomas de los mamíferos consistían en ADN no funcional. [4] El argumento a favor del ADN basura se resumió en un extenso artículo de David Comings en 1972, donde enumeró cuatro razones para proponer el ADN basura: [28]
El descubrimiento de los intrones en la década de 1970 pareció confirmar las opiniones de los defensores del ADN basura porque significaba que los genes eran muy grandes e incluso los genomas enormes no podían acomodar una gran cantidad de genes. Los defensores del ADN basura tendían a descartar las secuencias de intrones como ADN en su mayoría no funcional (basura), pero los oponentes del ADN basura propusieron una serie de hipótesis que atribuyen funciones de diversos tipos a las secuencias de intrones. [29] [30] [31] [32] [33]
En 1980 era evidente que la mayor parte del ADN repetitivo del genoma humano estaba relacionado con transposones . Esto dio lugar a una serie de artículos y cartas que describían los transposones como ADN egoísta que actuaba como un parásito en los genomas y no producía ninguna ventaja de aptitud física para el organismo. [34] [35] [36] [37] [38]
Quienes se oponen al ADN basura interpretaron estos resultados como evidencia de que la mayor parte del genoma es funcional y desarrollaron varias hipótesis que defendían que las secuencias de transposones podrían beneficiar al organismo o a la especie. [39] El oponente más importante del ADN basura en ese momento fue Thomas Cavalier-Smith , quien argumentó que se necesitaba ADN adicional para aumentar el volumen del núcleo con el fin de promover un transporte más eficiente a través de la membrana nuclear. [40]
Las posiciones de los dos lados de la controversia se endurecieron: un lado creía que la evolución era consistente con grandes cantidades de ADN basura y el otro lado creía que la selección natural debería eliminar el ADN basura. Estos diferentes puntos de vista sobre la evolución fueron resaltados en una carta de Thomas Jukes , un defensor del ADN basura, a Francis Crick el 20 de diciembre de 1979: [41]
Querido Francis, estoy seguro de que te das cuenta de lo espantosamente enojada que se enojará mucha gente si dices que gran parte del ADN es basura. Los genetistas se enojarán porque piensan que el ADN es sagrado. Los evolucionistas darwinistas se indignarán porque creen que cada cambio en el ADN que se acepta en la evolución es necesariamente un cambio adaptativo. Sugerir cualquier otra cosa es un insulto a la sagrada memoria de Darwin.
El otro punto de vista lo expresaron Britten y Kohne en su artículo fundamental sobre el ADN repetitivo. [17]
Un concepto que nos repugna es que aproximadamente la mitad del ADN de los organismos superiores sea trivial o permanentemente inerte (en una escala de tiempo evolutiva).
Existe una considerable confusión en la prensa popular y en la literatura científica sobre la distinción entre ADN no codificante y ADN basura.
Según un artículo reciente publicado en American Scientist:
Cerca del 99 por ciento de nuestro genoma ha sido clasificado históricamente como ADN "basura" inútil y no codificante. En consecuencia, estas secuencias rara vez se estudiaron. [42]
Un libro reciente afirma:
Cuando se descubrió por primera vez, el ADN no genético a veces fue llamado (un tanto burlonamente por personas que no sabían nada mejor) "ADN basura" porque no tenía ninguna utilidad obvia, y tontamente asumieron que si no contenía información codificante debía ser inútil. basura. [43]
El tema común es que los defensores originales del ADN basura pensaban que todo el ADN no codificante era basura y generalmente lo ignoraban. [2] [6] Esta afirmación se ha atribuido a un artículo de David Comings en 1972 [28] donde se informa que dijo que el ADN basura se refiere a todo el ADN no codificante. [19] Pero Comings nunca dijo eso. En ese artículo, analiza los genes no codificantes del ARN ribosomal y los ARNt y el ADN regulador no codificante y propone varias funciones posibles para la mayor parte del ADN no codificante. [28] En otra publicación del mismo año, Comings vuelve a analizar el término ADN basura con el claro entendimiento de que no incluye secuencias reguladoras no codificantes. [44]
Estas declaraciones han sido criticadas por numerosos autores por distorsionar la historia del ADN basura; [1] [45] [46] [47] [2] por ejemplo:
Simplemente no es cierto que el ADN no codificante haya sido descartado durante mucho tiempo como basura sin valor y que sólo recientemente se hayan propuesto hipótesis funcionales, a pesar de la frecuencia con la que este cliché se repite en los informes de los medios y en la introducción de demasiados estudios científicos. [48]
Algunas de las críticas han sido fuertes:
Las afirmaciones revisionistas que equiparan el ADN no codificante con la basura simplemente revelan que las personas a las que se les permite exhibir su logorrea en Nature y otras revistas glamorosas son tan ignorantes como los peores creacionistas de la Tierra joven. [49]
Desde la década de 1960, los defensores del ADN basura conocían muy bien el ADN funcional no codificante e incluso discutieron posibles funciones cuando se identificaron nuevos tipos de secuencias no codificantes. [2] Por ejemplo, la existencia de elementos funcionales del ADN no codificante, como genes no codificantes, secuencias reguladoras, orígenes de replicación y centrómeros, eran bien conocidos a finales de la década de 1960, cuando se propuso la idea del ADN basura. [50] Muchos de los principales partidarios del ADN basura mencionaron explícitamente la importancia de las secuencias reguladoras (no codificantes) y abordaron la cuestión de si las secuencias reguladoras eran una parte menor del genoma funcional o si las secuencias reguladoras ocupaban la mayor parte del genoma humano. . [16] [44] [51] Los primeros defensores del ADN basura no basaron sus argumentos en la ignorancia; basaron sus argumentos en lo que se sabía sobre el tamaño del genoma, la duplicación de genes, la carga mutacional y la genética de poblaciones. [2] (Ver La historia del ADN basura).
Algunos han argumentado que el término "ADN no codificante" es desafortunado porque suena como "secuencia sin sentido que no hace nada en absoluto". Sugieren que esta frase engañosa sea reemplazada por "ADN no traducido". [52]
La expresión "ADN basura" es discutible, y las diferentes definiciones precisas (y los enfoques asociados) proporcionan estimaciones tremendamente dispares de su prevalencia. [6] Según algunos autores, la palabra sólo se utiliza en ciencia popular y ya no se utiliza en artículos de investigación profesionales. [53] También se ha observado que la etiqueta "basura" puede indicar que su acumulación es dañina, pero la mayoría de las secuencias no funcionales probablemente sean neutrales. [54] Fuertes objeciones al término "ADN basura" han llevado a algunos a abogar por una nomenclatura más neutral, como "ADN no funcional". [1]
Diferentes metodologías que se basan en diferentes definiciones implícitas producen diferentes estimaciones de la fracción no funcional del genoma. [6]
Por ejemplo, el 20% del ADN genómico humano no muestra actividad bioquímica detectable, [55] pero los métodos de genómica comparativa estiman una fracción no funcional del 85-92%. [56] [9] [57] En consecuencia, diferentes definiciones exactas de ADN basura producirían diferentes proporciones exactas. Cada método tiene limitaciones; por ejemplo, los enfoques genéticos pueden pasar por alto elementos funcionales que no se manifiestan físicamente en el organismo; los enfoques evolutivos tienen dificultades para utilizar alineamientos precisos de secuencias multiespecíficas, ya que los genomas incluso de especies estrechamente relacionadas varían considerablemente; y las firmas bioquímicas no siempre significan automáticamente una función. [9] En última instancia, los enfoques genéticos, evolutivos y bioquímicos pueden usarse de manera complementaria para identificar regiones que pueden ser funcionales en la biología y las enfermedades humanas. [9]
Un criterio que se ha utilizado para estimar elementos funcionales es la actividad bioquímica. [58] El proyecto Encyclopedia of DNA Elements ( ENCODE ) observó actividad bioquímica detectable (por ejemplo , transcripción , asociación de factores de transcripción , estructura de la cromatina y modificación de histonas ) en al menos el 80% del ADN genómico humano . [55] Esto constituye una estimación superior de la porción funcional del genoma humano, ya que la actividad bioquímica no es necesariamente una función biológica o una ventaja selectiva . [59] [1] [60] [2] [46] Por ejemplo, los sitios de unión de factores de transcripción son cortos y se pueden encontrar por casualidad en todo el genoma [61] y el 70% de las secuencias transcritas están por debajo de 1 transcrito por célula y por lo que puede tratarse de una transcripción de fondo espuria. [9]
Contribuye al debate que no hay consenso sobre lo que constituye un elemento "funcional" en el genoma, ya que los genetistas, biólogos evolutivos y biólogos moleculares emplean diferentes enfoques y definiciones de "función", [9] a menudo con una falta de claridad de lo que significan en la literatura. [62] Debido a la ambigüedad en la terminología, existen diferentes escuelas de pensamiento sobre este asunto. [63]
Sin embargo, se ha discutido que la transcripción y el empalme generalizados en el genoma humano son otro indicador de la función genética además de la conservación genómica que puede pasar por alto secuencias funcionales mal conservadas. [9] Y gran parte del ADN basura aparente está involucrado en la regulación epigenética y parece ser necesario para el desarrollo de organismos complejos. [64] [65] [66]
Algunos críticos han argumentado que la funcionalidad sólo puede evaluarse en referencia a una hipótesis nula apropiada . En este caso, la hipótesis nula sería que estas partes del genoma no son funcionales y tienen propiedades, ya sea sobre la base de la conservación o de la actividad bioquímica, que se esperarían de dichas regiones según nuestra comprensión general de la evolución molecular y bioquímica . Según estos críticos, hasta que se demuestre que una región en cuestión tiene características adicionales, más allá de lo que se espera de la hipótesis nula, debería etiquetarse provisionalmente como no funcional. [67]
Una indicación de la funcionalidad de una región genómica es si esa secuencia se ha mantenido mediante selección purificadora (o si mutar la secuencia es perjudicial para el organismo). Las estimaciones de la fracción funcionalmente restringida del genoma humano basadas en la conservación evolutiva utilizando genómica comparada oscilan entre el 8 y el 15%. [56] [9] [57] Estas aún pueden ser una subestimación cuando se incluyen restricciones específicas del linaje. Sin embargo, otros han argumentado en contra de confiar únicamente en estimaciones de genómica comparada debido a su alcance limitado, ya que se ha descubierto que el ADN no codificante está involucrado en la actividad epigenética y en redes complejas de interacciones genéticas y se explora en la biología del desarrollo evolutivo . [64] [9] [65] [66]
Las secuencias biológicamente funcionales también pueden tener diferentes impactos evolutivos en la secuencia misma o en el organismo en el que se encuentra. Gran parte del ADN en genomas grandes se origina a partir de una amplificación egoísta de elementos transponibles . Parte de esta secuencia tiene una función biológica (transposición y autorreplicación en el genoma del huésped) pero no proporciona una ventaja selectiva al organismo huésped. [68]
Una complicación adicional es que el gran conjunto de transcripciones de fondo no funcionales producidas por secuencias no funcionales pueden evolucionar hacia elementos funcionales de novo . [69] [70] Por lo tanto, una secuencia que se ajuste a una definición estricta de basura que no tiene función biológica ni efecto de aptitud aún puede tener importancia evolutiva a largo plazo. [71] [72]
Operacionalmente, los elementos funcionales se definen como características de secuencia discretas y ordenadas linealmente que especifican productos moleculares (por ejemplo, genes codificadores de proteínas o ARN no codificantes) o actividades bioquímicas con funciones mecanicistas en la regulación de genes o genoma (por ejemplo, promotores transcripcionales o potenciadores).