La evolución del genoma es el proceso por el cual un genoma cambia en estructura (secuencia) o tamaño con el tiempo. El estudio de la evolución del genoma involucra múltiples campos como el análisis estructural del genoma, el estudio de parásitos genómicos, duplicaciones de genes y genomas antiguos, poliploidía y genómica comparada . La evolución del genoma es un campo en constante cambio y evolución debido al número cada vez mayor de genomas secuenciados, tanto procarióticos como eucariotas, disponibles para la comunidad científica y el público en general.
Desde que los primeros genomas secuenciados estuvieron disponibles a finales de la década de 1970, [1] los científicos han estado utilizando la genómica comparada para estudiar las diferencias y similitudes entre varios genomas. La secuenciación del genoma ha progresado con el tiempo hasta incluir genomas cada vez más complejos, incluida la secuenciación final del genoma humano completo en 2001. [2] Al comparar los genomas de parientes cercanos y ancestros lejanos, también comenzaron a surgir marcadas diferencias y similitudes entre especies. como los mecanismos por los cuales los genomas pueden evolucionar con el tiempo. [ cita necesaria ]
Los genomas procarióticos tienen dos mecanismos principales de evolución: mutación y transferencia horizontal de genes . [3] Un tercer mecanismo, la reproducción sexual , es prominente en los eucariotas y también ocurre en las bacterias. Los procariotas pueden adquirir material genético nuevo mediante el proceso de conjugación bacteriana en el que tanto plásmidos como cromosomas completos pueden transmitirse entre organismos. Un ejemplo citado a menudo de este proceso es la transferencia de resistencia a los antibióticos utilizando ADN plasmídico. [4] Otro mecanismo de evolución del genoma lo proporciona la transducción mediante la cual los bacteriófagos introducen ADN nuevo en un genoma bacteriano. El principal mecanismo de interacción sexual es la transformación genética natural que implica la transferencia de ADN de una célula procariótica a otra a través del medio intermedio. La transformación es un modo común de transferencia de ADN y se sabe que al menos 67 especies procarióticas son competentes para la transformación. [5]
La evolución del genoma de las bacterias se comprende bien gracias a los miles de genomas bacterianos completamente secuenciados disponibles. Los cambios genéticos pueden conducir a aumentos o disminuciones de la complejidad genómica debido a la racionalización y purificación de la selección adaptativa del genoma. [6] En general, las bacterias de vida libre han desarrollado genomas más grandes con más genes para que puedan adaptarse más fácilmente a las condiciones ambientales cambiantes. Por el contrario, la mayoría de las bacterias parásitas tienen genomas reducidos, ya que sus huéspedes suministran muchos, si no la mayoría, de los nutrientes, de modo que su genoma no necesita codificar enzimas que produzcan estos nutrientes por sí mismos. [7] [ página necesaria ]
Los genomas de los eucariotas son generalmente más grandes que los de los procariotas. Mientras que el genoma de E. coli tiene aproximadamente 4,6 Mb de longitud, [9] en comparación, el genoma humano es mucho más grande, con un tamaño de aproximadamente 3,2 Gb. [10] El genoma eucariota es lineal y puede estar compuesto por múltiples cromosomas, empaquetados en el núcleo de la célula. Las porciones no codificantes del gen, conocidas como intrones , que en gran medida no están presentes en los procariotas, se eliminan mediante corte y empalme del ARN antes de que pueda ocurrir la traducción de la proteína. Los genomas eucariotas evolucionan con el tiempo a través de muchos mecanismos, incluida la reproducción sexual, que introduce una diversidad genética mucho mayor en la descendencia que el proceso de replicación procariótico habitual en el que la descendencia es teóricamente clones genéticos de la célula parental. [ cita necesaria ]
El tamaño del genoma generalmente se mide en pares de bases (o bases en ADN o ARN monocatenario ). El valor C es otra medida del tamaño del genoma. La investigación sobre genomas procarióticos muestra que existe una correlación positiva significativa entre el valor C de los procariotas y la cantidad de genes que componen el genoma. [11] Esto indica que el número de genes es el principal factor que influye en el tamaño del genoma procariótico. En los organismos eucariotas se observa una paradoja: el número de genes que componen el genoma no se correlaciona con el tamaño del genoma. En otras palabras, el tamaño del genoma es mucho mayor de lo que cabría esperar dado el número total de genes que codifican proteínas. [12]
El tamaño del genoma puede aumentar por duplicación , inserción o poliploidización . La recombinación puede conducir tanto a la pérdida como a la ganancia de ADN. Los genomas también pueden reducirse debido a deleciones . Un ejemplo famoso de tal deterioro genético es el genoma de Mycobacterium leprae , el agente causante de la lepra . M. leprae ha perdido muchos genes que alguna vez fueron funcionales con el tiempo debido a la formación de pseudogenes . [13] Esto es evidente al observar su ancestro más cercano, Mycobacterium tuberculosis . [14] M. leprae vive y se replica dentro de un huésped y debido a esta disposición no necesita muchos de los genes que una vez portó y que le permitieron vivir y prosperar fuera del huésped. Así, con el tiempo estos genes han perdido su función a través de mecanismos como la mutación, lo que los convierte en pseudogenes. Es beneficioso para un organismo deshacerse de genes no esenciales porque hace que la replicación de su ADN sea mucho más rápida y requiere menos energía. [15]
Un ejemplo de aumento del tamaño del genoma con el tiempo se observa en los patógenos de plantas filamentosas. Estos genomas de patógenos vegetales han ido creciendo a lo largo de los años debido a la expansión impulsada por las repeticiones. Las regiones ricas en repeticiones contienen genes que codifican proteínas de interacción con el huésped. Con la adición de más y más repeticiones a estas regiones, las plantas aumentan la posibilidad de desarrollar nuevos factores de virulencia mediante mutaciones y otras formas de recombinación genética. De esta forma es beneficioso que estos fitopatógenos tengan genomas más grandes. [dieciséis]
La evolución de los genomas puede mostrarse de manera impresionante mediante el cambio en el número y la estructura de los cromosomas a lo largo del tiempo. Por ejemplo, los cromosomas ancestrales correspondientes a los cromosomas 2A y 2B del chimpancé se fusionaron para producir el cromosoma 2 humano . De manera similar, los cromosomas de especies relacionadas más lejanamente muestran cromosomas que se han dividido en más partes a lo largo de la evolución. Esto puede demostrarse mediante hibridación in situ por fluorescencia . [17]
La duplicación de genes es el proceso mediante el cual se duplica una región del ADN que codifica un gen. Esto puede ocurrir como resultado de un error en la recombinación o mediante un evento de retrotransposición . Los genes duplicados suelen ser inmunes a la presión selectiva bajo la cual normalmente existen los genes. Como resultado, se puede acumular una gran cantidad de mutaciones en el código genético duplicado. Esto puede hacer que el gen deje de funcionar o, en algunos casos, conferir algún beneficio al organismo. [18] [19]
Similar a la duplicación de genes, la duplicación del genoma completo es el proceso mediante el cual se copia toda la información genética de un organismo, una o varias veces, lo que se conoce como poliploidía . [20] Esto puede proporcionar un beneficio evolutivo al organismo al suministrarle múltiples copias de un gen, creando así una mayor posibilidad de genes funcionales y selectivamente favorecidos. Sin embargo, las pruebas de mayor tasa e innovación en peces teleósteos con genomas duplicados en comparación con sus parientes cercanos, los peces holosteos (sin genomas duplicados), encontraron que había poca diferencia entre ellos durante los primeros 150 millones de años de su evolución. [21]
En 1997, Wolfe & Shields dieron evidencia de una antigua duplicación del genoma de Saccharomyces cerevisiae ( levadura ). [22] Inicialmente se observó que este genoma de levadura contenía muchas duplicaciones de genes individuales. Wolfe & Shields planteó la hipótesis de que esto era en realidad el resultado de una duplicación completa del genoma en la lejana historia evolutiva de la levadura. Encontraron 32 pares de regiones cromosómicas homólogas, que representan más de la mitad del genoma de la levadura. También observaron que, aunque había homólogos presentes, a menudo estaban ubicados en cromosomas diferentes . Basándose en estas observaciones, determinaron que Saccharomyces cerevisiae experimentó una duplicación completa del genoma poco después de su separación evolutiva de Kluyveromyces , un género de levaduras ascomicetas. Con el tiempo, muchos de los genes duplicados fueron eliminados y dejaron de funcionar. Una serie de reordenamientos cromosómicos rompieron los cromosomas duplicados originales en la manifestación actual de regiones cromosómicas homólogas. Esta idea se solidificó aún más al observar el genoma del pariente cercano de la levadura, Ashbya gossypii . [23] La duplicación del genoma completo es común tanto en hongos como en especies de plantas. Un ejemplo de duplicación extrema del genoma está representado por el Cordgrass común ( Spartina anglica ), que es dodecaploide, lo que significa que contiene 12 conjuntos de cromosomas, [24] en marcado contraste con la estructura diploide humana en la que cada individuo tiene sólo dos conjuntos de cromosomas. 23 cromosomas.
Los elementos transponibles son regiones de ADN que pueden insertarse en el código genético mediante uno de dos mecanismos. Estos mecanismos funcionan de manera similar a las funciones de "cortar y pegar" y "copiar y pegar" en los programas de procesamiento de textos. El mecanismo de "cortar y pegar" funciona extirpando el ADN de un lugar del genoma e insertándolo en otra ubicación del código. El mecanismo de "copiar y pegar" funciona haciendo una copia o copias genéticas de una región específica del ADN e insertando estas copias en otra parte del código. [25] [26] El elemento transponible más común en el genoma humano es la secuencia Alu , que está presente en el genoma más de un millón de veces. [27]
A menudo se producen mutaciones espontáneas que pueden provocar diversos cambios en el genoma. [28] Las mutaciones pueden cambiar la identidad de uno o más nucleótidos, o dar como resultado la adición o eliminación de una o más bases de nucleótidos . Dichos cambios pueden provocar una mutación por cambio de marco , lo que hace que todo el código se lea en un orden diferente al original, lo que a menudo resulta en que una proteína deje de funcionar. [29] Una mutación en una región promotora , una región potenciadora o una región de unión al factor de transcripción también puede provocar una pérdida de función o una regulación positiva o negativa en la transcripción del gen al que se dirigen estos elementos reguladores. Las mutaciones ocurren constantemente en el genoma de un organismo y pueden causar un efecto negativo, un efecto positivo o un efecto neutral (ningún efecto). [30] [31]
A menudo son el resultado de una mutación espontánea , los pseudogenes son genes disfuncionales derivados de parientes de genes previamente funcionales. Existen muchos mecanismos por los cuales un gen funcional puede convertirse en un pseudogén, incluida la eliminación o inserción de uno o varios nucleótidos . Esto puede provocar un cambio en el marco de lectura , lo que hace que el gen ya no codifique la proteína esperada, introduzca un codón de parada prematuro o una mutación en la región promotora . [32]
Los ejemplos citados a menudo de pseudogenes dentro del genoma humano incluyen las familias de genes olfativos que alguna vez fueron funcionales . Con el tiempo, muchos genes olfativos del genoma humano se convirtieron en pseudogenes y ya no eran capaces de producir proteínas funcionales, lo que explica el pobre sentido del olfato que poseen los humanos en comparación con sus parientes mamíferos. [33] [34]
De manera similar, los pseudogenes bacterianos comúnmente surgen de la adaptación de bacterias de vida libre a estilos de vida parásitos , de modo que muchos genes metabólicos se vuelven superfluos a medida que estas especies se adaptan a su huésped. Una vez que un parásito obtiene nutrientes (como aminoácidos o vitaminas ) de su huésped, no necesita producirlos por sí mismo y, a menudo, pierde los genes necesarios para producirlos. [ cita necesaria ]
La mezcla de exones es un mecanismo mediante el cual se crean nuevos genes. Esto puede ocurrir cuando se combinan dos o más exones de diferentes genes o cuando se duplican los exones. La combinación de exones da como resultado nuevos genes al alterar la estructura actual intrón-exón. Esto puede ocurrir mediante cualquiera de los siguientes procesos: barajado mediado por transposones , recombinación sexual o recombinación no homóloga (también llamada recombinación ilegítima ). La combinación de exones puede introducir nuevos genes en el genoma que pueden seleccionarse y eliminarse o favorecerse y conservarse selectivamente. [35] [36] [37]
Muchas especies presentan una reducción del genoma cuando ya no se necesitan subconjuntos de sus genes. Esto suele ocurrir cuando los organismos se adaptan a un estilo de vida parásito, por ejemplo, cuando sus nutrientes son suministrados por un huésped. Como consecuencia, pierden los genes necesarios para producir estos nutrientes. En muchos casos, existen especies tanto de vida libre como parásitas que pueden compararse e identificarse sus genes perdidos. Buenos ejemplos son los genomas de Mycobacterium tuberculosis y Mycobacterium leprae , el último de los cuales tiene un genoma dramáticamente reducido (ver figura debajo de pseudogenes arriba).
Otro hermoso ejemplo son las especies endosimbiontes . Por ejemplo, Polynucleobacter necessarius se describió por primera vez como un endosimbionte citoplasmático del ciliado Euplotes aediculatus . Esta última especie muere poco después de curarse del endosimbionte. En los pocos casos en los que P. necessarius no está presente, una bacteria diferente y más rara aparentemente cumple la misma función. Ningún intento de cultivar P. necessarius simbiótico fuera de sus huéspedes ha tenido éxito todavía, lo que sugiere fuertemente que la relación es obligatoria para ambos socios. Sin embargo, se han identificado parientes cercanos y de vida libre de P. necessarius. Los endosimbiontes tienen un genoma significativamente reducido en comparación con sus parientes de vida libre (1,56 Mbp frente a 2,16 Mbp). [38]
Una cuestión importante de la biología evolutiva es cómo cambian los genomas para crear nuevas especies. La especiación requiere cambios en el comportamiento , la morfología , la fisiología o el metabolismo (o combinaciones de ellos). La evolución de los genomas durante la especiación se ha estudiado muy recientemente gracias a la disponibilidad de tecnologías de secuenciación de próxima generación . Por ejemplo, los peces cíclidos de los lagos africanos difieren tanto morfológicamente como en su comportamiento. Los genomas de cinco especies han revelado que tanto las secuencias como el patrón de expresión de muchos genes han cambiado rápidamente en un período de tiempo relativamente corto (de 100.000 a varios millones de años). En particular, el 20% de los pares de genes duplicados han adquirido un patrón de expresión específico de tejido completamente nuevo , lo que indica que estos genes también obtuvieron nuevas funciones. Dado que la expresión genética está impulsada por secuencias reguladoras cortas , esto demuestra que se requieren relativamente pocas mutaciones para impulsar la especiación. Los genomas de cíclidos también mostraron mayores tasas de evolución en los microARN que participan en la expresión genética. [39] [40]
Las mutaciones pueden conducir a cambios en la función genética o, probablemente más a menudo, a cambios en los patrones de expresión genética. De hecho, un estudio sobre 12 especies animales proporcionó pruebas sólidas de que la expresión de genes específicos de tejido se conservaba en gran medida entre ortólogos de diferentes especies. Sin embargo, los parálogos dentro de la misma especie suelen tener un patrón de expresión diferente. Es decir, después de la duplicación de genes, a menudo cambian su patrón de expresión, por ejemplo, expresándose en otro tejido y adoptando así nuevas funciones. [41]
El código genético se compone de secuencias de cuatro bases de nucleótidos : adenina , guanina , citosina y timina , comúnmente denominadas A, G, C y T. El contenido de GC es el porcentaje de bases G y C dentro de un genoma. El contenido de GC varía mucho entre diferentes organismos. [42] Se ha demostrado que las regiones codificantes de genes tienen un mayor contenido de GC y cuanto más largo es el gen, mayor es el porcentaje de bases G y C presentes. Un mayor contenido de GC confiere un beneficio porque un enlace guanina-citosina está formado por tres enlaces de hidrógeno, mientras que un enlace adenina-timina está formado por sólo dos. Así, los tres enlaces de hidrógeno dan mayor estabilidad a la cadena de ADN. Por tanto, no es sorprendente que genes importantes a menudo tengan un mayor contenido de GC que otras partes del genoma de un organismo. [43] Por esta razón, muchas especies que viven a temperaturas muy altas, como los ecosistemas que rodean los respiraderos hidrotermales, tienen un contenido de GC muy alto. También se observa un alto contenido de GC en secuencias reguladoras, como los promotores que señalan el inicio de un gen. Muchos promotores contienen islas CpG , áreas del genoma donde se encuentra un nucleótido de citosina junto a un nucleótido de guanina en mayor proporción. También se ha demostrado que una amplia distribución del contenido de GC entre especies dentro de un género muestra una ascendencia más antigua. Dado que las especies han tenido más tiempo para evolucionar, su contenido de GC se ha diferenciado aún más. [ cita necesaria ]
Los aminoácidos se componen de codones de tres bases de longitud y tanto la glicina como la alanina se caracterizan por codones con enlaces guanina-citosina en las dos primeras posiciones de las bases de los codones. Este enlace GC da más estabilidad a la estructura del ADN. Se ha planteado la hipótesis de que, cuando los primeros organismos evolucionaron en un entorno de alta presión y calor, necesitaban la estabilidad de estos enlaces GC en su código genético. [44]
Pueden surgir nuevos genes a partir de ADN no codificante . El origen de novo de los genes (que codifican proteínas) solo requiere dos características, a saber, la generación de un marco de lectura abierto y la creación de un sitio de unión del factor de transcripción . Por ejemplo, Levine y sus colegas informaron sobre el origen de cinco nuevos genes en el genoma de D. melanogaster a partir de ADN no codificante. [45] [46] Posteriormente, el origen de novo de los genes también se ha demostrado en otros organismos como la levadura , [47] el arroz [48] y los humanos . [49] Por ejemplo, Wu et al. (2011) informaron 60 genes putativos de novo específicos de humanos, todos los cuales son cortos y constan de un solo exón (excepto uno). [50] En las bacterias, los profagos "conectados" (es decir, fagos integrados que no pueden producir nuevos fagos) son zonas de amortiguamiento que tolerarían variaciones, aumentando así la probabilidad de formación de genes de novo. [51] Estos profagos conectados a tierra y otros elementos genéticos similares son sitios donde los genes podrían adquirirse mediante transferencia horizontal de genes (THG).
Para comprender cómo surgió el genoma, se requiere conocimiento de las vías químicas que permiten la formación de los componentes clave del genoma en condiciones prebióticas plausibles . Según la hipótesis del mundo del ARN, en la sopa primitiva había ribonucleótidos que flotaban libremente. Estas fueron las moléculas fundamentales que se combinaron en serie para formar el genoma de ARN original . Moléculas tan complejas como el ARN debieron surgir de pequeñas moléculas cuya reactividad estaba regida por procesos fisicoquímicos. El ARN está compuesto de nucleótidos de purina y pirimidina , los cuales son necesarios para la transferencia confiable de información y, por lo tanto, para la selección natural y la evolución darwiniana . Nam et al. [52] demostraron la condensación directa de nucleobases con ribosa para dar ribonucleósidos en microgotitas acuosas, un paso clave que conduce a la formación del genoma de ARN. Además, Becker et al. presentaron un proceso prebiótico plausible para sintetizar ribonucleótidos de pirimidina y purina que conducen a la formación del genoma mediante ciclos húmedo-seco. [53]