La evolución del genoma es el proceso por el cual un genoma cambia su estructura (secuencia) o tamaño a lo largo del tiempo. El estudio de la evolución del genoma involucra múltiples campos, como el análisis estructural del genoma, el estudio de parásitos genómicos, duplicaciones de genes y genomas antiguos, poliploidía y genómica comparativa . La evolución del genoma es un campo en constante cambio y evolución debido al número cada vez mayor de genomas secuenciados, tanto procariotas como eucariotas, disponibles para la comunidad científica y el público en general.
Desde que se dispuso de los primeros genomas secuenciados a finales de los años 1970, [1] los científicos han utilizado la genómica comparativa para estudiar las diferencias y similitudes entre varios genomas. La secuenciación de genomas ha avanzado con el tiempo para incluir genomas cada vez más complejos, incluida la secuenciación final del genoma humano completo en 2001. [2] Al comparar los genomas de parientes cercanos y ancestros lejanos, comenzaron a surgir las marcadas diferencias y similitudes entre las especies, así como los mecanismos por los cuales los genomas pueden evolucionar con el tiempo. [ cita requerida ]
Los genomas procariotas tienen dos mecanismos principales de evolución: mutación y transferencia horizontal de genes . [3] Un tercer mecanismo, la reproducción sexual , es prominente en eucariotas y también ocurre en bacterias. Los procariotas pueden adquirir material genético nuevo a través del proceso de conjugación bacteriana en el que tanto plásmidos como cromosomas completos pueden pasarse entre organismos. Un ejemplo citado a menudo de este proceso es la transferencia de resistencia a antibióticos utilizando ADN plasmídico. [4] Otro mecanismo de evolución del genoma es proporcionado por la transducción mediante la cual los bacteriófagos introducen ADN nuevo en un genoma bacteriano. El principal mecanismo de interacción sexual es la transformación genética natural que implica la transferencia de ADN de una célula procariota a otra a través del medio intermedio. La transformación es un modo común de transferencia de ADN y se sabe que al menos 67 especies procariotas son competentes para la transformación. [5]
La evolución del genoma en las bacterias es bien conocida debido a los miles de genomas bacterianos completamente secuenciados disponibles. Los cambios genéticos pueden conducir tanto a aumentos como a disminuciones de la complejidad genómica debido a la racionalización adaptativa del genoma y a la selección purificadora. [6] En general, las bacterias de vida libre han desarrollado genomas más grandes con más genes para poder adaptarse más fácilmente a las condiciones ambientales cambiantes. Por el contrario, la mayoría de las bacterias parásitas tienen genomas reducidos, ya que sus huéspedes les proporcionan muchos, si no la mayoría, de los nutrientes, de modo que su genoma no necesita codificar enzimas que produzcan estos nutrientes por sí mismos. [7] [ página necesaria ]
Los genomas eucariotas son generalmente más grandes que los de los procariotas. Mientras que el genoma de E. coli tiene una longitud de aproximadamente 4,6 Mb, [9] en comparación, el genoma humano es mucho más grande, con un tamaño de aproximadamente 3,2 Gb. [10] El genoma eucariota es lineal y puede estar compuesto de múltiples cromosomas, empaquetados en el núcleo de la célula. Las porciones no codificantes del gen, conocidas como intrones , que en gran medida no están presentes en los procariotas, se eliminan mediante el empalme del ARN antes de que pueda producirse la traducción de la proteína. Los genomas eucariotas evolucionan con el tiempo a través de muchos mecanismos, incluida la reproducción sexual, que introduce una diversidad genética mucho mayor en la descendencia que el proceso de replicación procariota habitual en el que la descendencia son, en teoría, clones genéticos de la célula parental. [ cita requerida ]
El tamaño del genoma se mide generalmente en pares de bases (o bases en ADN o ARN monocatenario ). El valor C es otra medida del tamaño del genoma. La investigación sobre genomas procariotas muestra que existe una correlación positiva significativa entre el valor C de los procariotas y la cantidad de genes que componen el genoma. [11] Esto indica que el número de genes es el principal factor que influye en el tamaño del genoma procariota. En los organismos eucariotas , se observa una paradoja, a saber, que el número de genes que componen el genoma no se correlaciona con el tamaño del genoma. En otras palabras, el tamaño del genoma es mucho mayor de lo que se esperaría dado el número total de genes codificadores de proteínas. [12]
El tamaño del genoma puede aumentar por duplicación , inserción o poliploidización . La recombinación puede provocar tanto pérdida como ganancia de ADN. Los genomas también pueden encogerse debido a deleciones . Un ejemplo famoso de tal descomposición genética es el genoma de Mycobacterium leprae , el agente causante de la lepra . M. leprae ha perdido muchos genes que alguna vez fueron funcionales con el tiempo debido a la formación de pseudogenes . [13] Esto es evidente al observar a su ancestro más cercano, Mycobacterium tuberculosis . [14] M. leprae vive y se replica dentro de un huésped y debido a esta disposición no necesita muchos de los genes que alguna vez portó y que le permitieron vivir y prosperar fuera del huésped. Por lo tanto, con el tiempo, estos genes han perdido su función a través de mecanismos como la mutación que hace que se conviertan en pseudogenes. Es beneficioso para un organismo deshacerse de los genes no esenciales porque hace que la replicación de su ADN sea mucho más rápida y requiere menos energía. [15]
Un ejemplo de aumento del tamaño del genoma a lo largo del tiempo se observa en los patógenos de plantas filamentosas. Estos genomas de patógenos de plantas han ido creciendo a lo largo de los años debido a la expansión impulsada por repeticiones. Las regiones ricas en repeticiones contienen genes que codifican proteínas de interacción con el huésped. Con la adición de cada vez más repeticiones a estas regiones, las plantas aumentan la posibilidad de desarrollar nuevos factores de virulencia a través de la mutación y otras formas de recombinación genética. De esta manera, es beneficioso para estos patógenos de plantas tener genomas más grandes. [16]
La evolución de los genomas se puede demostrar de forma impresionante mediante el cambio del número y la estructura de los cromosomas a lo largo del tiempo. Por ejemplo, los cromosomas ancestrales correspondientes a los cromosomas 2A y 2B del chimpancé se fusionaron para producir el cromosoma 2 humano . De manera similar, los cromosomas de especies más distantes muestran cromosomas que se han dividido en más partes a lo largo de la evolución. Esto se puede demostrar mediante hibridación in situ con fluorescencia . [17]
La duplicación de genes es el proceso por el cual se duplica una región de ADN que codifica un gen. Esto puede ocurrir como resultado de un error en la recombinación o a través de un evento de retrotransposición . Los genes duplicados a menudo son inmunes a la presión selectiva bajo la cual los genes existen normalmente. Como resultado, una gran cantidad de mutaciones pueden acumularse en el código del gen duplicado. Esto puede hacer que el gen no funcione o, en algunos casos, conferir algún beneficio al organismo. [18] [19]
De manera similar a la duplicación de genes, la duplicación de todo el genoma es el proceso por el cual se copia toda la información genética de un organismo, una o varias veces, lo que se conoce como poliploidía . [20] Esto puede proporcionar un beneficio evolutivo al organismo al proporcionarle múltiples copias de un gen, creando así una mayor posibilidad de genes funcionales y selectivamente favorecidos. Sin embargo, las pruebas de mayor tasa e innovación en peces teleósteos con genomas duplicados en comparación con sus parientes cercanos, los peces holosteos (sin genomas duplicados), encontraron que hubo poca diferencia entre ellos durante los primeros 150 millones de años de su evolución. [21]
En 1997, Wolfe y Shields dieron evidencia de una antigua duplicación del genoma de Saccharomyces cerevisiae ( levadura ). [22] Inicialmente se observó que este genoma de levadura contenía muchas duplicaciones de genes individuales. Wolfe y Shields plantearon la hipótesis de que esto era en realidad el resultado de una duplicación de todo el genoma en la distante historia evolutiva de la levadura. Encontraron 32 pares de regiones cromosómicas homólogas, que representan más de la mitad del genoma de la levadura. También notaron que, aunque había homólogos presentes, a menudo se ubicaban en diferentes cromosomas . Con base en estas observaciones, determinaron que Saccharomyces cerevisiae experimentó una duplicación de todo el genoma poco después de su separación evolutiva de Kluyveromyces , un género de levaduras ascomicetas. Con el tiempo, muchos de los genes duplicados se eliminaron y se volvieron no funcionales. Una serie de reordenamientos cromosómicos rompieron los cromosomas duplicados originales en la manifestación actual de regiones cromosómicas homólogas. Esta idea se consolidó aún más al observar el genoma del pariente cercano de la levadura, Ashbya gossypii . [23] La duplicación completa del genoma es común en hongos, así como en especies de plantas. Un ejemplo de duplicación extrema del genoma está representado por la espartina común ( Spartina anglica ), que es un dodecaploide, lo que significa que contiene 12 juegos de cromosomas, [24] en marcado contraste con la estructura diploide humana en la que cada individuo tiene solo dos juegos de 23 cromosomas.
Los elementos transponibles son regiones de ADN que pueden insertarse en el código genético mediante uno de dos mecanismos. Estos mecanismos funcionan de manera similar a las funciones de "cortar y pegar" y "copiar y pegar" de los programas de procesamiento de textos. El mecanismo de "cortar y pegar" funciona cortando ADN de un lugar del genoma e insertándolo en otro lugar del código. El mecanismo de "copiar y pegar" funciona haciendo una copia genética o copias de una región específica de ADN e insertando estas copias en otra parte del código. [25] [26] El elemento transponible más común en el genoma humano es la secuencia Alu , que está presente en el genoma más de un millón de veces. [27]
Las mutaciones espontáneas ocurren a menudo y pueden causar varios cambios en el genoma. [28] Las mutaciones pueden cambiar la identidad de uno o más nucleótidos, o resultar en la adición o eliminación de una o más bases de nucleótidos . Tales cambios pueden llevar a una mutación por desplazamiento del marco de lectura , haciendo que todo el código se lea en un orden diferente del original, lo que a menudo resulta en que una proteína se vuelva no funcional. [29] Una mutación en una región promotora , región potenciadora o región de unión de factores de transcripción también puede resultar en una pérdida de función, o una regulación positiva o negativa en la transcripción del gen objetivo de estos elementos reguladores. Las mutaciones ocurren constantemente en el genoma de un organismo y pueden causar un efecto negativo, un efecto positivo o un efecto neutral (ningún efecto en absoluto). [30] [31]
Los pseudogenes, que suelen ser el resultado de una mutación espontánea , son genes disfuncionales derivados de genes relacionados que anteriormente eran funcionales. Existen muchos mecanismos por los cuales un gen funcional puede convertirse en un pseudogen, incluida la eliminación o inserción de uno o varios nucleótidos . Esto puede dar como resultado un cambio en el marco de lectura , lo que hace que el gen ya no codifique la proteína esperada, introduzca un codón de terminación prematuro o una mutación en la región promotora . [32]
Entre los ejemplos de pseudogenes que se citan con frecuencia en el genoma humano se encuentran las familias de genes olfativos que alguna vez fueron funcionales . Con el tiempo, muchos genes olfativos del genoma humano se convirtieron en pseudogenes y ya no pudieron producir proteínas funcionales, lo que explica el pobre sentido del olfato que poseen los humanos en comparación con sus parientes mamíferos. [33] [34]
De manera similar, los pseudogenes bacterianos surgen comúnmente de la adaptación de bacterias de vida libre a estilos de vida parasitarios , de modo que muchos genes metabólicos se vuelven superfluos a medida que estas especies se adaptan a su anfitrión. Una vez que un parásito obtiene nutrientes (como aminoácidos o vitaminas ) de su anfitrión, no tiene necesidad de producir estos nutrientes por sí mismo y a menudo pierde los genes para producirlos. [ cita requerida ]
La reorganización de exones es un mecanismo por el cual se crean nuevos genes. Esto puede ocurrir cuando se combinan dos o más exones de diferentes genes o cuando se duplican los exones. La reorganización de exones da como resultado nuevos genes al alterar la estructura intrón-exón actual. Esto puede ocurrir por cualquiera de los siguientes procesos: reorganización mediada por transposones , recombinación sexual o recombinación no homóloga (también llamada recombinación ilegítima ). La reorganización de exones puede introducir nuevos genes en el genoma que pueden ser seleccionados en contra y eliminados o favorecidos selectivamente y conservados. [35] [36] [37]
Muchas especies presentan una reducción del genoma cuando ya no se necesitan subconjuntos de sus genes. Esto suele ocurrir cuando los organismos se adaptan a un estilo de vida parasitario, por ejemplo, cuando sus nutrientes son suministrados por un huésped. Como consecuencia, pierden los genes necesarios para producir estos nutrientes. En muchos casos, hay especies tanto de vida libre como parasitarias que se pueden comparar e identificar sus genes perdidos. Buenos ejemplos son los genomas de Mycobacterium tuberculosis y Mycobacterium leprae , este último con un genoma drásticamente reducido (véase la figura de pseudogenes más arriba).
Otro bello ejemplo son las especies endosimbiontes . Por ejemplo, Polynucleobacter necessarius fue descrito por primera vez como un endosimbionte citoplasmático del ciliado Euplotes aediculatus . Esta última especie muere poco después de ser curada del endosimbionte. En los pocos casos en los que P. necessarius no está presente, una bacteria diferente y más rara aparentemente cumple la misma función. Ningún intento de cultivar P. necessarius simbióticos fuera de sus hospedadores ha tenido éxito hasta ahora, lo que sugiere firmemente que la relación es obligada para ambos socios. Sin embargo, se han identificado parientes de vida libre estrechamente relacionados de P. necessarius. Los endosimbiontes tienen un genoma significativamente reducido en comparación con sus parientes de vida libre (1,56 Mbp frente a 2,16 Mbp). [38]
Una de las principales cuestiones de la biología evolutiva es cómo cambian los genomas para crear nuevas especies. La especiación requiere cambios en el comportamiento , la morfología , la fisiología o el metabolismo (o combinaciones de estos). La evolución de los genomas durante la especiación se ha estudiado solo muy recientemente con la disponibilidad de tecnologías de secuenciación de próxima generación . Por ejemplo, los peces cíclidos de los lagos africanos difieren tanto morfológicamente como en su comportamiento. Los genomas de 5 especies han revelado que tanto las secuencias como el patrón de expresión de muchos genes han cambiado rápidamente en un período de tiempo relativamente corto (100.000 a varios millones de años). En particular, el 20% de los pares de genes duplicados han adquirido un patrón de expresión específico de tejido completamente nuevo , lo que indica que estos genes también obtuvieron nuevas funciones. Dado que la expresión génica está impulsada por secuencias reguladoras cortas , esto demuestra que se requieren relativamente pocas mutaciones para impulsar la especiación. Los genomas de los cíclidos también mostraron mayores tasas evolutivas en los microARN que participan en la expresión génica. [39] [40]
Las mutaciones pueden provocar cambios en la función de los genes o, probablemente con más frecuencia, cambios en los patrones de expresión de los genes. De hecho, un estudio sobre 12 especies animales proporcionó pruebas sólidas de que la expresión de genes específicos de tejidos se conservaba en gran medida entre ortólogos de diferentes especies. Sin embargo, los parálogos dentro de la misma especie suelen tener un patrón de expresión diferente. Es decir, después de la duplicación de genes, a menudo cambian su patrón de expresión, por ejemplo, expresándose en otro tejido y adoptando así nuevas funciones. [41]
El código genético está formado por secuencias de cuatro bases de nucleótidos : adenina , guanina , citosina y timina , comúnmente denominadas A, G, C y T. El contenido de GC es el porcentaje de bases G y C dentro de un genoma. El contenido de GC varía mucho entre diferentes organismos. [42] Se ha demostrado que las regiones codificantes de genes tienen un mayor contenido de GC y cuanto más largo es el gen, mayor es el porcentaje de bases G y C presentes. Un mayor contenido de GC confiere un beneficio porque un enlace guanina-citosina está formado por tres enlaces de hidrógeno , mientras que un enlace adenina-timina está formado por solo dos. Por lo tanto, los tres enlaces de hidrógeno dan mayor estabilidad a la cadena de ADN. Por lo tanto, no es sorprendente que los genes importantes a menudo tengan un mayor contenido de GC que otras partes del genoma de un organismo. [43] Por esta razón, muchas especies que viven a temperaturas muy altas, como los ecosistemas que rodean los respiraderos hidrotermales, tienen un contenido de GC muy alto. También se observa un alto contenido de GC en secuencias reguladoras como los promotores que señalan el inicio de un gen. Muchos promotores contienen islas CpG , áreas del genoma donde un nucleótido de citosina aparece junto a un nucleótido de guanina en una mayor proporción. También se ha demostrado que una amplia distribución del contenido de GC entre especies dentro de un género muestra una ascendencia más antigua. Dado que las especies han tenido más tiempo para evolucionar, su contenido de GC ha divergido aún más. [ cita requerida ]
Los aminoácidos están formados por codones de tres bases de longitud y tanto la glicina como la alanina se caracterizan por codones con enlaces guanina-citosina en las dos primeras posiciones de base del codón. Este enlace GC proporciona más estabilidad a la estructura del ADN. Se ha planteado la hipótesis de que, a medida que los primeros organismos evolucionaron en un entorno de alta temperatura y presión, necesitaban la estabilidad de estos enlaces GC en su código genético. [44]
Los genes nuevos pueden surgir del ADN no codificante . El origen de novo de genes (codificadores de proteínas) solo requiere dos características, a saber, la generación de un marco de lectura abierto y la creación de un sitio de unión del factor de transcripción . Por ejemplo, Levine y colegas informaron el origen de cinco genes nuevos en el genoma de D. melanogaster a partir de ADN no codificante. [45] [46] Posteriormente, también se ha demostrado el origen de novo de genes en otros organismos como la levadura , [47] el arroz , [48] y los humanos . [49] Por ejemplo, Wu et al. (2011) informaron 60 supuestos genes humanos de novo, todos los cuales son cortos y consisten en un solo exón (excepto uno). [50] En las bacterias, los profagos "aterrizados" (es decir, fagos integrados que no pueden producir nuevos fagos) son zonas de amortiguación que tolerarían variaciones, aumentando así la probabilidad de formación de genes de novo. [51] Estos profagos arraigados y otros elementos genéticos similares son sitios donde los genes podrían adquirirse a través de la transferencia horizontal de genes (HGT).
Para entender cómo surgió el genoma, se requiere el conocimiento de las vías químicas que permiten la formación de los bloques de construcción clave del genoma en condiciones prebióticas plausibles . Según la hipótesis del mundo del ARN, los ribonucleótidos que flotaban libremente estaban presentes en la sopa primitiva. Estas fueron las moléculas fundamentales que se combinaron en serie para formar el genoma de ARN original . Moléculas tan complejas como el ARN deben haber surgido de pequeñas moléculas cuya reactividad estaba gobernada por procesos fisicoquímicos. El ARN está compuesto de nucleótidos de purina y pirimidina , ambos necesarios para la transferencia confiable de información y, por lo tanto, la selección natural y la evolución darwinianas . Nam et al. [52] demostraron la condensación directa de nucleobases con ribosa para dar ribonucleósidos en microgotas acuosas, un paso clave que conduce a la formación del genoma de ARN. Además, Becker et al. [53] presentaron un proceso prebiótico plausible para sintetizar ribonucleótidos de pirimidina y purina que conducen a la formación del genoma utilizando ciclos húmedos y secos.