Los pseudogenes son segmentos no funcionales de ADN que se asemejan a genes funcionales . La mayoría surgen como copias superfluas de genes funcionales, ya sea directamente por duplicación génica o indirectamente por transcripción inversa de una transcripción de ARNm . Los pseudogenes se identifican generalmente cuando el análisis de la secuencia del genoma encuentra secuencias similares a genes que carecen de secuencias reguladoras necesarias para la transcripción o traducción , o cuyas secuencias codificantes son obviamente defectuosas debido a cambios de marco o codones de terminación prematuros . Los pseudogenes son un tipo de ADN basura .
La mayoría de los genomas no bacterianos contienen muchos pseudogenes, a menudo tantos como genes funcionales. Esto no es sorprendente, ya que se espera que diversos procesos biológicos creen pseudogenes accidentalmente, y no existen mecanismos especializados para eliminarlos de los genomas. Con el tiempo, los pseudogenes pueden eliminarse de sus genomas por casualidad debido a errores de replicación o reparación del ADN , o pueden acumular tantos cambios mutacionales que ya no sean reconocibles como genes anteriores. El análisis de estos eventos de degeneración ayuda a aclarar los efectos de los procesos no selectivos en los genomas.
Las secuencias pseudogénicas pueden transcribirse en ARN en niveles bajos, debido a elementos promotores heredados del gen ancestral o que surgen por nuevas mutaciones. Aunque la mayoría de estas transcripciones no tendrán mayor importancia funcional que las transcripciones aleatorias de otras partes del genoma, algunas han dado lugar a ARN reguladores beneficiosos y nuevas proteínas.
Los pseudogenes suelen caracterizarse por una combinación de similitud u homología con un gen conocido, junto con una pérdida de alguna funcionalidad. Es decir, aunque cada pseudogen tiene una secuencia de ADN similar a algún gen funcional, normalmente no son capaces de producir productos proteicos finales funcionales. [1] A veces, los pseudogenes son difíciles de identificar y caracterizar en los genomas, porque los dos requisitos de similitud y pérdida de funcionalidad suelen estar implícitos en los alineamientos de secuencias en lugar de demostrarse biológicamente.
Los pseudogenes de los genes del ARN suelen ser más difíciles de descubrir, ya que no necesitan ser traducidos y, por lo tanto, no tienen "marcos de lectura". Se han identificado varios pseudogenes del ARNr basándose en cambios en los extremos de la matriz del ADNr. [2]
Los pseudogenes pueden complicar los estudios genéticos moleculares. Por ejemplo, la amplificación de un gen mediante PCR puede amplificar simultáneamente un pseudogén que comparte secuencias similares. Esto se conoce como sesgo de PCR o sesgo de amplificación. De manera similar, los pseudogenes a veces se anotan como genes en las secuencias del genoma .
Los pseudogenes procesados suelen plantear un problema para los programas de predicción de genes , ya que suelen ser identificados erróneamente como genes o exones reales. Se ha propuesto que la identificación de pseudogenes procesados puede ayudar a mejorar la precisión de los métodos de predicción de genes. [3]
En 2014, se demostró que se traducían 140 pseudogenes humanos. [4] Sin embargo, se desconoce la función, si la hay, de los productos proteicos.
Existen cuatro tipos principales de pseudogenes, todos ellos con mecanismos de origen y características propias distintos. Las clasificaciones de los pseudogenes son las siguientes:
En eucariotas superiores , particularmente mamíferos , la retrotransposición es un evento bastante común que ha tenido un gran impacto en la composición del genoma. Por ejemplo, en algún lugar entre el 30 y el 44% del genoma humano consiste en elementos repetitivos como SINE y LINE (ver retrotransposones ). [7] [8] En el proceso de retrotransposición, una porción de la transcripción de ARNm o ARNhn de un gen se transcribe de manera inversa espontáneamente de nuevo en ADN y se inserta en el ADN cromosómico. Aunque los retrotransposones generalmente crean copias de sí mismos, se ha demostrado en un sistema in vitro que también pueden crear copias retrotranspuestas de genes aleatorios. [9] Una vez que estos pseudogenes se insertan de nuevo en el genoma, generalmente contienen una cola de poli-A y generalmente se les han quitado sus intrones ; ambas son características distintivas de los ADNc . Sin embargo, debido a que se derivan de un producto de ARN, los pseudogenes procesados también carecen de los promotores ascendentes de los genes normales; Por lo tanto, se consideran "muertos al llegar", convirtiéndose en pseudogenes no funcionales inmediatamente después del evento de retrotransposición. [10] Sin embargo, estas inserciones ocasionalmente aportan exones a genes existentes, generalmente a través de transcripciones empalmadas alternativamente . [11] Otra característica de los pseudogenes procesados es el truncamiento común del extremo 5' en relación con la secuencia original, que es el resultado del mecanismo de retrotransposición relativamente no procesivo que crea pseudogenes procesados. [12] Los pseudogenes procesados se crean continuamente en primates. [13] Las poblaciones humanas, por ejemplo, tienen conjuntos distintos de pseudogenes procesados a través de sus individuos. [14]
Se ha demostrado que los pseudogenes procesados acumulan mutaciones más rápidamente que los pseudogenes no procesados. [15]
La duplicación de genes es otro proceso común e importante en la evolución de los genomas. Una copia de un gen funcional puede surgir como resultado de un evento de duplicación de genes causado por recombinación homóloga en, por ejemplo, secuencias SINE repetitivas en cromosomas desalineados y posteriormente adquirir mutaciones que hacen que la copia pierda la función del gen original. Los pseudogenes duplicados generalmente tienen todas las mismas características que los genes, incluida una estructura exón - intrón intacta y secuencias reguladoras. La pérdida de la funcionalidad de un gen duplicado generalmente tiene poco efecto en la aptitud de un organismo , ya que todavía existe una copia funcional intacta. Según algunos modelos evolutivos, los pseudogenes duplicados compartidos indican la relación evolutiva de los humanos y los otros primates. [16] Si la pseudogenización se debe a la duplicación de genes, generalmente ocurre en los primeros millones de años después de la duplicación del gen, siempre que el gen no haya sido sometido a ninguna presión de selección . [17] La duplicación de genes genera redundancia funcional y normalmente no es ventajoso llevar dos genes idénticos. Las mutaciones que alteran la estructura o la función de cualquiera de los dos genes no son perjudiciales y no se eliminarán mediante el proceso de selección. Como resultado, el gen que ha sido mutado se convierte gradualmente en un pseudogén y no se expresará o no tendrá función. Este tipo de destino evolutivo se muestra mediante el modelado genético de poblaciones [18] [19] y también mediante el análisis del genoma . [17] [20] Según el contexto evolutivo, estos pseudogenes se eliminarán o se volverán tan distintos de los genes parentales que ya no serán identificables. Los pseudogenes relativamente jóvenes se pueden reconocer debido a su similitud de secuencia. [21]
Varias mutaciones (como indeles y mutaciones sin sentido ) pueden impedir que un gen se transcriba o traduzca normalmente , y por lo tanto el gen puede volverse menos o no funcional o "desactivado". Estos son los mismos mecanismos por los cuales los genes no procesados se convierten en pseudogenes, pero la diferencia en este caso es que el gen no se duplicó antes de la pseudogenización. Normalmente, sería poco probable que un pseudogén de este tipo se fijara en una población, pero varios efectos poblacionales, como la deriva genética , un cuello de botella poblacional o, en algunos casos, la selección natural , pueden conducir a la fijación. El ejemplo clásico de un pseudogén unitario es el gen que presumiblemente codifica la enzima L-gulono-γ-lactona oxidasa (GULO) en primates. En todos los mamíferos estudiados además de los primates (excepto los conejillos de indias), GULO ayuda en la biosíntesis de ácido ascórbico (vitamina C), pero existe como un gen deshabilitado (GULOP) en humanos y otros primates. [22] [23] Otro ejemplo más reciente de un gen deshabilitado vincula la desactivación del gen de la caspasa 12 (a través de una mutación sin sentido ) con la selección positiva en humanos. [24]
Si bien la gran mayoría de pseudogenes han perdido su función, han surgido algunos casos en los que un pseudogen recuperó su función original o una similar, o desarrolló una nueva función. En el genoma humano , se han identificado varios ejemplos que originalmente se clasificaron como pseudogenes, pero luego se descubrió que tenían un papel funcional, aunque no necesariamente codificador de proteínas. [25] [26]
Algunos ejemplos incluyen los siguientes:
La rápida proliferación de las tecnologías de secuenciación de ADN ha llevado a la identificación de muchos pseudogenes aparentes utilizando técnicas de predicción de genes . Los pseudogenes a menudo se identifican por la aparición de un codón de terminación prematuro en una secuencia de ARNm prevista, lo que, en teoría, impediría la síntesis ( traducción ) del producto proteico normal del gen original. Ha habido algunos informes de lectura de traducción de dichos codones de terminación prematuros en mamíferos. Como se alude en la figura anterior, una pequeña cantidad del producto proteico de dicha lectura de traducción puede aún ser reconocible y funcionar en algún nivel. Si es así, el pseudogén puede estar sujeto a la selección natural . Eso parece haber sucedido durante la evolución de las especies de Drosophila .
En 2016 se informó que cuatro pseudogenes predichos en múltiples especies de Drosophila en realidad codifican proteínas con funciones biológicamente importantes, [27] "lo que sugiere que tales 'pseudo-pseudogenes' podrían representar un fenómeno generalizado". Por ejemplo, la proteína funcional (un receptor olfativo de glutamato ) del gen Ir75a se encuentra solo en neuronas . Este hallazgo de genes biológicamente funcionales específicos de tejido que podrían haber sido clasificados como pseudogenes mediante análisis in silico complica el análisis de datos de secuencia. [27] Otro pseudo-pseudogén de Drosophila es jingwei , [28] [29] que codifica una enzima alcohol deshidrogenasa funcional in vivo . [30]
En 2012, se descubrió que había aproximadamente entre 12 000 y 14 000 pseudogenes en el genoma humano. [31] Un análisis proteogenómico de 2016 que utilizó espectrometría de masas de péptidos identificó al menos 19 262 proteínas humanas producidas a partir de 16 271 genes o grupos de genes, y se identificaron 8 nuevos genes codificadores de proteínas que anteriormente se consideraban pseudogenes. [32] Un análisis anterior descubrió que la PGAM4 humana (fosfoglicerato mutasa), [33] que anteriormente se pensaba que era un pseudogén, no solo es funcional, sino que también causa infertilidad si muta. [34] [35]
También se encontraron varios pseudo-pseudogenes en procariotas, donde algunas sustituciones de codones de terminación en genes esenciales parecen conservarse, incluso seleccionarse positivamente. [36] [37]
ARNi . Algunos ARNi endógenos parecen derivar de pseudogenes y, por lo tanto, algunos de ellos desempeñan un papel en la regulación de las transcripciones codificadoras de proteínas, como se ha analizado. [38] Uno de los muchos ejemplos es psiPPM1K. El procesamiento de los ARN transcritos a partir de psiPPM1K produce ARNi que pueden actuar para suprimir el tipo más común de cáncer de hígado, el carcinoma hepatocelular . [39] Esta y muchas otras investigaciones han generado un considerable entusiasmo sobre la posibilidad de dirigirse a los pseudogenes con/como agentes terapéuticos [40]
Los piRNAs son derivados de pseudogenes ubicados en grupos de piRNAs. [41] Estos piRNAs regulan los genes a través de la vía de los piRNAs en los testículos de los mamíferos y son cruciales para limitar el daño de los elementos transponibles al genoma. [42]
microARN . Existen muchos informes de transcripciones de pseudogenes que actúan como señuelos de microARN . Quizás el primer ejemplo definitivo de un pseudogen de este tipo involucrado en el cáncer es el pseudogen de BRAF . El gen BRAF es un protooncogén que, cuando muta, se asocia con muchos cánceres. Normalmente, la cantidad de proteína BRAF se mantiene bajo control en las células a través de la acción de miARN. En situaciones normales, la cantidad de ARN de BRAF y el pseudogén BRAFP1 compiten por miARN, pero el equilibrio de los 2 ARN es tal que las células crecen normalmente. Sin embargo, cuando la expresión de ARN de BRAFP1 aumenta (ya sea experimentalmente o por mutaciones naturales), hay menos miARN disponible para controlar la expresión de BRAF, y la mayor cantidad de proteína BRAF causa cáncer. [43] Este tipo de competencia por elementos reguladores por parte de ARN que son endógenos al genoma ha dado lugar al término ARN ce .
PTEN . El gen PTEN es un gen supresor de tumores conocido . El pseudogén PTEN, PTENP1 es un pseudogén procesado que es muy similar en su secuencia genética al gen de tipo salvaje. Sin embargo, PTENP1 tiene una mutación sin sentido que elimina el codón para la metionina iniciadora y, por lo tanto, evita la traducción de la proteína PTEN normal. [44] A pesar de eso, PTENP1 parece desempeñar un papel en la oncogénesis . El 3' UTR del ARNm de PTENP1 funciona como un señuelo del ARNm de PTEN al dirigirse a los micro ARN debido a su similitud con el gen PTEN, y la sobreexpresión del 3' UTR resultó en un aumento del nivel de proteína PTEN. [45] Es decir, la sobreexpresión del 3' UTR de PTENP1 conduce a una mayor regulación y supresión de tumores cancerosos. La biología de este sistema es básicamente la inversa del sistema BRAF descrito anteriormente.
Potogenes . Los pseudogenes pueden, a lo largo de escalas temporales evolutivas, participar en la conversión génica y otros eventos mutacionales que pueden dar lugar a genes nuevos o funcionales. Esto ha llevado al concepto de que los pseudogenes podrían considerarse potogenes : genes potenciales para la diversificación evolutiva. [46]
Los pseudogenes se encuentran en bacterias . [47] La mayoría se encuentran en bacterias que no son de vida libre; es decir, son simbiontes o parásitos intracelulares obligados . Por lo tanto, no requieren muchos genes que necesitan las bacterias de vida libre, como los genes asociados con el metabolismo y la reparación del ADN. Sin embargo, no hay un orden en el que los genes funcionales se pierdan primero. Por ejemplo, los pseudogenes más antiguos en Mycobacterium leprae están en las polimerasas de ARN y la biosíntesis de metabolitos secundarios , mientras que los más antiguos en Shigella flexneri y Shigella typhi están en la replicación , recombinación y reparación del ADN . [48]
Dado que la mayoría de las bacterias que portan pseudogenes son simbiontes o parásitos intracelulares obligados, el tamaño del genoma eventualmente se reduce. Un ejemplo extremo es el genoma de Mycobacterium leprae , un parásito obligado y agente causante de la lepra . Se ha informado que tiene 1.133 pseudogenes que dan lugar a aproximadamente el 50% de su transcriptoma . [48] El efecto de los pseudogenes y la reducción del genoma se puede ver aún más cuando se compara con Mycobacterium marinum , un patógeno de la misma familia. Mycobacteirum marinum tiene un genoma más grande en comparación con Mycobacterium leprae porque puede sobrevivir fuera del huésped; por lo tanto, el genoma debe contener los genes necesarios para hacerlo. [49]
Aunque la reducción del genoma se centra en los genes que no son necesarios eliminando los pseudogenes, las presiones selectivas del huésped pueden influir en lo que se conserva. En el caso de un simbionte del filo Verrucomicrobiota , hay siete copias adicionales del gen que codifica la vía de la mandelalida. [50] El huésped, especie de Lissoclinum , utiliza mandelalidas como parte de su mecanismo de defensa. [50]
La relación entre la epistasis y la teoría del dominó de la pérdida de genes se observó en Buchnera aphidicola . La teoría del dominó sugiere que si un gen de un proceso celular se inactiva, entonces la selección en otros genes involucrados se relaja, lo que lleva a la pérdida de genes. [48] Al comparar Buchnera aphidicola y Escherichia coli , se encontró que la epistasis positiva promueve la pérdida de genes mientras que la epistasis negativa la obstaculiza.