stringtranslate.com

lsm

El toro hexámero Hfq de la proteína LSm que muestra la columna vertebral del péptido, con cada proteína en un color diferente, representando cada hebra beta como una cinta, cada hélice alfa como un cilindro y el oligonucleótido de ARN como un arco de 300°.

En biología molecular , las proteínas LSm son una familia de proteínas de unión a ARN que se encuentran prácticamente en todos los organismos celulares . LSm es una contracción de 'like Sm', porque los primeros miembros identificados de la familia de proteínas LSm fueron las proteínas Sm . Las proteínas LSm se definen por una estructura tridimensional característica y su ensamblaje en anillos de seis o siete moléculas de proteína LSm individuales , y desempeñan una gran cantidad de funciones diversas en el procesamiento y la regulación del ARNm .

Las proteínas Sm se descubrieron por primera vez como antígenos dirigidos por los llamados anticuerpos anti-Sm en un paciente con una forma de lupus eritematoso sistémico (LES), una enfermedad autoinmune debilitante . Fueron nombradas proteínas Sm en honor a Stephanie Smith, una paciente que padecía LES. [1] Posteriormente se descubrieron otras proteínas con estructuras muy similares y se denominaron proteínas LSm. Se siguen identificando e informando nuevos miembros de la familia de proteínas LSm.

Las proteínas con estructuras similares se agrupan en una jerarquía de familias, superfamilias y pliegues de proteínas. La estructura de la proteína LSm es un ejemplo de una pequeña hoja beta plegada en un barril corto. Las proteínas LSm individuales se ensamblan en un anillo circular de seis o siete miembros (más propiamente denominado toro ), que generalmente se une a una pequeña molécula de ARN para formar un complejo de ribonucleoproteína . El toro LSm ayuda a la molécula de ARN a asumir y mantener su estructura tridimensional adecuada. Dependiendo de qué proteínas LSm y molécula de ARN estén involucradas, este complejo de ribonucleoproteína facilita una amplia variedad de procesamiento de ARN, incluida la degradación, edición, empalme y regulación.

Los términos alternativos para la familia LSm son LSm fold y Sm-like fold , y estilos de uso de mayúsculas alternativos como lsm , LSM y Lsm son comunes e igualmente aceptables.

Historia

Descubrimiento del antígeno Smith

La historia del descubrimiento de las primeras proteínas LSm comienza con una mujer joven, Stephanie Smith, a quien se le diagnosticó lupus eritematoso sistémico (LES) en 1959 , y finalmente sucumbió a complicaciones de la enfermedad en 1969, a la edad de 22 años. [1] Durante este período, fue tratada en el Hospital de la Universidad Rockefeller de Nueva York , bajo el cuidado del Dr. Henry Kunkel y el Dr. Eng Tan. Al igual que aquellos con una enfermedad autoinmune , los pacientes con LES producen anticuerpos contra antígenos en los núcleos de sus células , con mayor frecuencia contra su propio ADN . Sin embargo, Kunkel y Tan descubrieron en 1966 que Smith producía anticuerpos contra un conjunto de proteínas nucleares, a las que denominaron ' antígeno Smith ' ( Sm Ag ). [2] Alrededor del 30% de los pacientes con LES producen anticuerpos contra estas proteínas, a diferencia del ADN bicatenario. Este descubrimiento mejoró las pruebas de diagnóstico del LES, pero se desconocía la naturaleza y función de este antígeno.

Proteínas Sm, snRNP, el empalme y el empalme del ARN mensajero

La investigación continuó durante los años 1970 y principios de los 1980. Se descubrió que el antígeno de Smith era un complejo de moléculas de ácido ribonucleico ( ARN ) y múltiples proteínas. Un conjunto de pequeñas moléculas de ARN nuclear ( snRNA ) ricas en uridina formaba parte de este complejo y recibieron los nombres U1 , U2 , U4 , U5 y U6 . Se descubrió que cuatro de estos snRNA (U1, U2, U4 y U5) estaban estrechamente unidos a varias proteínas pequeñas, que se denominaron SmB , SmD, SmE , SmF y SmG en orden decreciente de tamaño. SmB tiene una variante empalmada alternativamente, SmB' , y una proteína muy similar, SmN , reemplaza a SmB'/B en ciertos tejidos (principalmente neurales). Más tarde se descubrió que SmD era una mezcla de tres proteínas, que se denominaron SmD1 , SmD2 y SmD3 . Estas nueve proteínas (SmB, SmB', SmN, SmD1, SmD2, SmD3, SmE, SmF y SmG) pasaron a ser conocidas como proteínas centrales Sm , o simplemente proteínas Sm . Los snRNA forman complejos con las proteínas centrales Sm y con otras proteínas para formar partículas en el núcleo de la célula llamadas pequeñas ribonucleoproteínas nucleares o snRNP . A mediados de la década de 1980, quedó claro que estos snRNP ayudan a formar un gran complejo ( peso molecular de 4,8 MD ), llamado espliceosoma , alrededor del pre-ARNm , escindiendo porciones del pre-ARNm llamadas intrones y uniendo las porciones codificantes ( exones ). juntos. [3] Después de algunas modificaciones más, el pre-ARNm empalmado se convierte en ARN mensajero (ARNm) que luego se exporta desde el núcleo y los ribosomas lo traducen en una proteína .

Descubrimiento de proteínas similares a las proteínas Sm

El snRNA U6 (a diferencia de U1, U2, U4 y U5) no se asocia con las proteínas Sm, aunque el snRNP U6 es un componente central en el espliceosoma . En 1999 se encontró un heterómero proteico que se une específicamente a U6 y estaba formado por siete proteínas claramente homólogas a las proteínas Sm. Estas proteínas se denominaron proteínas LSm (como Sm) ( LSm1 , LSm2 , LSm3 , LSm4 , LSm5 , LSm6 y LSm7 ), y la proteína similar LSm8 se identificó más adelante. En la bacteria Escherichia coli , la proteína HF-I similar a Sm codificada por el gen hfq se describió en 1968 como un factor huésped esencial para la replicación del bacteriófago del ARN . El genoma de Saccharomyces cerevisiae (levadura de panadería) se secuenció a mediados de la década de 1990, lo que proporcionó un rico recurso para identificar homólogos de estas proteínas humanas. Posteriormente, a medida que se secuenciaron más genomas de eucariotas , quedó claro que los eucariotas, en general, comparten homólogos del mismo conjunto de siete proteínas Sm y ocho LSm. [4] Poco después, se encontraron proteínas homólogas a estas proteínas LSm eucariotas en Archaea ( Sm1 y Sm2 ) y bacterias ( homólogos de Hfq e YlxS ). [5] Las proteínas LSm de arqueas son más similares a las proteínas LSm de eucariotas que a las proteínas LSm bacterianas. Las proteínas LSm descritas hasta ahora eran proteínas bastante pequeñas, que variaban desde 76 aminoácidos ( peso molecular de 8,7 kD ) para la SmG humana hasta 231 aminoácidos (peso molecular de 29 kD) para la SmB humana. Pero recientemente, se han descubierto proteínas más grandes que incluyen un dominio estructural LSm además de otros dominios estructurales de proteínas (como LSm10 , LSm11 , LSm12 , LSm13 , LSm14 , LSm15 , LSm16 , ataxina-2 , así como arquea Sm3 ).

Descubrimiento del pliegue LSm

Alrededor de 1995, las comparaciones entre los distintos homólogos de LSm identificaron dos motivos de secuencia , de 32 ácidos nucleicos de longitud (14 aminoácidos), que eran muy similares en cada homólogo de LSm y estaban separados por una región no conservada de longitud variable. Esto indicó la importancia de estos dos motivos de secuencia (llamados Sm1 y Sm2 ) y sugirió que todos los genes de la proteína LSm evolucionaron a partir de un único gen ancestral. [6] En 1999, se prepararon cristales de proteínas Sm recombinantes , lo que permitió la cristalografía de rayos X y la determinación de su estructura atómica en tres dimensiones. [7] Esto demostró que las proteínas LSm comparten un pliegue tridimensional similar de una hélice alfa corta y una hoja beta plegada de cinco hebras , posteriormente denominada pliegue LSm . Otras investigaciones encontraron que las proteínas LSm se ensamblan en un toro (anillo en forma de rosquilla) de seis o siete proteínas LSm, y que el ARN se une al interior del toro, con un nucleótido unido a cada proteína LSm.

Estructura

Estructura secundaria de LSm que muestra la hélice alfa N-terminal y la lámina beta antiparalela de cinco hebras
La proteína LSm Human SmD1 que muestra la descripción de la columna vertebral del péptido sándwich beta de ocho hebras. (La bisagra de plegado de la hoja beta corre a lo largo de la parte inferior de la imagen).

El uridina fosfato se une en las arqueas Sm1 entre el bucle β2b/β3a y el bucle β4b/β5. El uracilo se apila entre los residuos de histidina y arginina , se estabiliza mediante enlaces de hidrógeno a un residuo de asparagina y mediante enlaces de hidrógeno entre el residuo de aspartato y la ribosa . Las proteínas LSm se caracterizan por una lámina beta (la estructura secundaria ), plegada en el pliegue LSm (la estructura terciaria ), polimerización en un toro de seis o siete miembros (la estructura cuaternaria ) y unión a oligonucleótidos de ARN . [8] Un paradigma moderno clasifica las proteínas sobre la base de su estructura y es un campo actualmente activo, con tres enfoques principales, SCOP ( clasificación estructural de proteínas ) , CATH ( clase , arquitectura , topología , H superfamilia omóloga), y FSSP /DALI ( Familias de proteínas estructuralmente similares ) .

Secundario

La estructura secundaria de una proteína LSm es una pequeña lámina beta antiparalela de cinco hebras , con las hebras identificadas desde el extremo N-terminal hasta el extremo C-terminal como β1, β2, β3, β4, β5. La clase SCOP de Todas las proteínas beta y la clase CATH de Principalmente Beta se definen como estructuras proteicas que son principalmente láminas beta, por lo que incluyen LSm. El motivo de la secuencia SM1 corresponde a las cadenas β1, β2, β3, y el motivo de la secuencia SM2 corresponde a las cadenas β4 y β5. Las primeras cuatro hebras beta están adyacentes entre sí, pero β5 está adyacente a β1, lo que convierte la estructura general en un barril corto. Esta topología estructural se describe como 51234. Una hélice alfa N-terminal corta (de dos a cuatro vueltas) también está presente en la mayoría de las proteínas LSm. Las cadenas β3 y β4 son cortas en algunas proteínas LSm y están separadas por una espiral no estructurada de longitud variable. Las hebras β2, β3 y β4 están fuertemente dobladas alrededor de 120° grados en sus puntos medios. Las curvaturas en estas hebras suelen ser glicina , y las cadenas laterales internas del barril beta son a menudo los residuos hidrofóbicos valina , leucina , isoleucina y metionina .

Terciario

SCOP simplemente clasifica la estructura LSm como el pliegue tipo Sm , uno de los 149 pliegues diferentes de la proteína Beta, sin agrupaciones intermedias. La hoja beta de LSm está muy doblada y se describe como una arquitectura Roll en CATH (una de las 20 arquitecturas diferentes de proteína beta en CATH). Una de las hebras beta (β5 en LSm) cruza el borde abierto del rollo para formar una pequeña topología de barril tipo SH3 (una de las 33 topologías de rollo beta en CATH). CATH enumera 23 superfamilias homólogas con una topología de barril tipo SH3, una de las cuales es la estructura LSm ( proteína de unión a ARN en el sistema CATH). SCOP continúa su clasificación estructural después de Plegar en Superfamilia, Familia y Dominio, mientras que CATH continúa en Secuenciar Familia, pero estas divisiones se describen más apropiadamente en la sección "Evolución y filogenia".

La estructura terciaria de barril tipo SH3 del pliegue LSm está formada por las hebras β2, β3 y β4 fuertemente dobladas (aproximadamente 120°), con la estructura de barril cerrada por la hebra β5. Haciendo hincapié en la estructura terciaria, cada cadena beta doblada se puede describir como dos cadenas beta más cortas. El pliegue LSm puede verse como un sándwich beta antiparalelo de ocho hebras , con cinco hebras en un plano y tres hebras en un plano paralelo con un ángulo de paso de aproximadamente 45° entre las dos mitades del sándwich beta. La hélice alfa N-terminal corta (de dos a cuatro vueltas) se produce en un borde del sándwich beta. Esta hélice alfa y las hebras beta pueden etiquetarse (desde el extremo N hasta el extremo C ) α, β1, β2a, β2b, β3a, β3b, β4a, β4b, β5, donde a y b se refieren a las dos mitades. de una hebra doblada en la descripción de cinco hebras, o de las hebras individuales en la descripción de ocho hebras. Cada hebra (en la descripción de ocho hebras) está formada por cinco residuos de aminoácidos . Incluyendo las curvas y bucles entre las hebras y la hélice alfa, alrededor de 60 residuos de aminoácidos contribuyen al pliegue LSm, pero esto varía entre homólogos debido a la variación en los bucles entre hebras, la hélice alfa e incluso las longitudes de β3b y Hebras de β4a.

Cuaternario

Las proteínas LSm normalmente se ensamblan en un anillo LSm , un toro de seis o siete miembros , de aproximadamente 7  nanómetros de diámetro con un orificio de 2 nanómetros. La condición ancestral es un homohexámero u homoheptámero de subunidades LSm idénticas. Las proteínas LSm en eucariotas forman heteroheptámeros de siete subunidades LSm diferentes, como las proteínas Sm. La unión entre las proteínas LSm se comprende mejor con la descripción de ocho cadenas del pliegue LSm. La mitad de cinco hebras del sándwich beta de una subunidad se alinea con la mitad de tres hebras del sándwich beta de la subunidad adyacente, formando una lámina beta retorcida de 8 hebras Aβ4a/Aβ3b/Aβ2a/Aβ1/Aβ5/Bβ4b/Bβ3a/ Bβ2b, donde A y B se refieren a las dos subunidades diferentes. Además de los enlaces de hidrógeno entre las cadenas beta de Aβ5 y Bβ4b de las dos subunidades de la proteína LSm, existen contactos energéticamente favorables entre las cadenas laterales de aminoácidos hidrófobos en el interior del área de contacto, y contactos energéticamente favorables entre las cadenas laterales de aminoácidos hidrófilos alrededor del área de contacto. periferia del área de contacto.

Unión de oligonucleótidos de ARN

Los anillos LSm forman complejos de ribonucleoproteínas con oligonucleótidos de ARN cuya fuerza de unión varía desde complejos muy estables (como los snRNP de clase Sm) hasta complejos transitorios. Los oligonucleótidos de ARN generalmente se unen dentro del orificio (lumen) del toro LSm, un nucleótido por subunidad LSm, pero se han informado sitios de unión de nucleótidos adicionales en la parte superior ( lado de la hélice α ) del anillo. La naturaleza química exacta de esta unión varía, pero los motivos comunes incluyen el apilamiento de la base heterocíclica (a menudo uracilo ) entre cadenas laterales planas de dos aminoácidos, enlaces de hidrógeno con la base heterocíclica y/o la ribosa , y puentes salinos con el grupo fosfato .

Funciones

Los distintos tipos de anillos LSm funcionan como andamios o chaperonas para los oligonucleótidos de ARN , ayudando al ARN a asumir y mantener la estructura tridimensional adecuada. En algunos casos, esto permite que el ARN oligonucleotídico funcione catalíticamente como una ribozima . En otros casos, esto facilita la modificación o degradación del ARN, o el ensamblaje, almacenamiento y transporte intracelular de complejos de ribonucleoproteínas . [9]

anillo pequeño

El anillo Sm se encuentra en el núcleo de todos los eucariotas (aproximadamente 2,5 × 10 6 copias por célula humana en proliferación) y tiene las funciones mejor conocidas. El anillo Sm es un heteroheptámero . La molécula de ARNsn de clase Sm (en la dirección 5' a 3') ingresa al lumen (agujero de rosquilla) en la subunidad SmE y avanza secuencialmente en el sentido de las agujas del reloj (mirando desde el lado de la hélice α) dentro del lumen (agujero de rosquilla) para las subunidades SmG, SmD3, SmB, SmD1, SmD2, saliendo en la subunidad SmF. [10] (SmB puede ser reemplazado por la variante de empalme SmB' y por SmN en los tejidos neurales). El anillo Sm se une permanentemente a los snRNA U1, U2, U4 y U5 que forman cuatro de los cinco snRNP que constituyen el espliceosoma principal . El anillo Sm también se une permanentemente a los snRNA U11 , U12 y U4atac que forman cuatro de los cinco snRNP (incluido el snRNP U5) que constituyen el espliceosoma menor . Ambos esplicosomas son complejos centrales de procesamiento de ARN en la maduración del ARN mensajero a partir del pre-ARNm . También se ha informado que las proteínas Sm son parte del componente ribonucleoproteico de la telomerasa . [11]

anillo lsm2-8

Los dos snRNP Lsm2-8 (U6 y U6atac ) tienen la función catalítica clave en los espliceosomas mayor y menor. Estos snRNP no incluyen el anillo Sm, sino que utilizan el anillo heteroheptamérico Lsm2-8 . Los anillos LSm son aproximadamente 20 veces menos abundantes que los anillos Sm. Se desconoce el orden de estas siete proteínas LSm en este anillo, pero basándose en la homología de secuencia de aminoácidos con las proteínas Sm, se especula que el ARNsn (en la dirección 5' a 3') puede unirse primero a LSm5 y preceder a LSm5. secuencialmente en el sentido de las agujas del reloj hasta LSm7, LSm4, LSm8, LSm2, LSm3 y saliendo en la subunidad LSm6. Los experimentos con mutaciones de Saccharomyces cerevisiae (levadura en ciernes) sugieren que el anillo Lsm2-8 ayuda a la reasociación de los snRNP U4 y U6 en el di-snRNP U4/U6 . [12] (Después de completar la eliminación del exón y el empalme del intrón, estos dos snRNP deben reasociarse para que el espliceosoma inicie otro ciclo de empalme exón/intrón. En esta función, el anillo Lsm2-8 actúa como un acompañante de ARN en lugar de un andamio de ARN. ) El anillo Lsm2-8 también forma un snRNP con el pequeño ARN nucleolar U8 (snoRNA) que se localiza en el nucléolo . Este complejo de ribonucleoproteína es necesario para procesar el ARN ribosómico y transferir el ARN a sus formas maduras. [13] Se informa que el anillo Lsm2-8 tiene un papel en el procesamiento del ARN pre-P en ARNasa P. A diferencia del anillo Sm, el anillo Lsm2-8 no se une permanentemente a su snRNA y snoRNA.

Anillo Sm10/Sm11

Existe un segundo tipo de anillo Sm donde LSm10 reemplaza a SmD1 y LSm11 reemplaza a SmD2. LSm11 es una proteína de dos dominios, siendo el dominio C-terminal un dominio LSm. Este anillo de heteroheptámero se une al snRNA U7 en el snRNP U7 . El snRNP U7 media el procesamiento del bucle madre 3' UTR del ARNm de histonas en el núcleo. [14] Al igual que el anillo Sm, se ensambla en el citoplasma en el ARNsn U7 mediante un complejo SMN especializado.

anillo lsm1-7

Un segundo tipo de anillo Lsm es el anillo Lsm1-7 , que tiene la misma estructura que el anillo Lsm2-8 excepto que LSm1 reemplaza a LSm8. A diferencia del anillo Lsm2-8, el anillo Lsm1-7 se localiza en el citoplasma, donde ayuda a degradar el ARN mensajero en los complejos de ribonucleoproteínas . Este proceso controla la renovación del ARN mensajero de modo que la traducción ribosómica del ARNm a proteína responda rápidamente a los cambios en la transcripción del ADN a ARN mensajero por parte de la célula. Se ha demostrado que LSM1-7, junto con Pat1 , desempeña un papel en la formación de cuerpos P después de la desadenilación. [15]

Gemín6 y Gemín7

El complejo SMN (descrito en "Biogénesis de snRNP") está compuesto por la proteína SMN y Gemin2-8 . Se ha descubierto que dos de ellos, Gemin 6 y Gemin7, tienen la estructura LSm y forman un heterodímero. Estos pueden tener una función chaperona en el complejo SMN para ayudar a la formación del anillo Sm en los snRNA de clase Sm . [16] El complejo PRMT5 está compuesto por PRMT5 , pICln , WD45 (Mep50) . picln ayuda a formar el anillo abierto de Sm en el complejo SMN. El complejo SMN ayuda en el ensamblaje de snRNP donde el anillo Sm está en la conformación abierta en el complejo SMN y este anillo Sm se carga en el snRNA mediante el complejo SMN. [17]

LSm12-16 y otras proteínas LSm multidominio

Las proteínas LSm12-16 han sido descritas muy recientemente. Se trata de proteínas de dos dominios con un dominio LSm N-terminal y un dominio metil transferasa C-terminal . [18] Se sabe muy poco sobre la función de estas proteínas, pero presumiblemente son miembros de anillos de dominio LSm que interactúan con el ARN. Existe cierta evidencia de que LSm12 posiblemente esté involucrado en la degradación del ARNm y que LSm13-16 puede desempeñar funciones en la regulación de la mitosis . Inesperadamente, LSm12 estuvo recientemente implicado en la señalización del calcio al actuar como proteína de unión intermedia para el segundo mensajero del nucleótido, NAADP ( fosfato de dinucleótido de adenina del ácido nicotínico ) que activa los canales endolisosomales de Ca 2+ TPC ( canales de dos poros ). [19] Esto ocurrió mediante la unión de NAADP al dominio LSm, no al dominio AD. [19] Una proteína grande de función desconocida, la ataxina-2 , asociada con la enfermedad neurodegenerativa ataxia espinocerebelosa tipo 2 , también tiene un dominio LSm N-terminal.

Anillos Archaeal Sm

Dos proteínas LSm se encuentran en un segundo dominio de la vida, las Archaea . Estas son las proteínas Sm1 y Sm2 (que no deben confundirse con los motivos de secuencia Sm1 y Sm2 ) y, a veces, se identifican como proteínas arqueales de tipo Sm , SmAP1 y SmAP2 , por este motivo. [20] Sm1 y Sm2 generalmente forman anillos de homoheptámero , aunque se han observado anillos de homohexámero. Los anillos Sm1 son similares a los anillos Lsm de eucariotas en que se forman en ausencia de ARN, mientras que los anillos Sm2 son similares a los anillos Sm de eucariotas en que requieren ARN rico en uridina para su formación. Se ha informado que se asocian con el ARN de la RNasa P , lo que sugiere un papel en el procesamiento del ARN de transferencia , pero su función en las arqueas en este proceso (y posiblemente en el procesamiento de otro ARN como el ARN ribosómico ) se desconoce en gran medida. Una de las dos ramas principales de las arqueas, las crenarqueotas, tienen un tercer tipo conocido de proteína LSm de las arqueas, Sm3 . Se trata de una proteína de dos dominios con un dominio LSm N-terminal que forma un anillo de homoheptámero . No se sabe nada sobre la función de esta proteína LSm, pero presumiblemente interactúa con el ARN en estos organismos y probablemente ayuda a procesarlo.

Anillos LSm bacterianos

Se han informado varias proteínas LSm en el tercer dominio de la vida, las bacterias . La proteína Hfq forma anillos homohexámeros y originalmente se descubrió que era necesaria para la infección por el bacteriófago Qβ , aunque claramente esta no es la función nativa de esta proteína en las bacterias. No está universalmente presente en todas las bacterias, pero se ha encontrado en Pseudomonadota , Bacillota , Spirochaetota , Thermotogota , Aquificota y una especie de Archaea . (Este último caso es probablemente un caso de transferencia horizontal de genes ). Hfq es pleiotrópico con una variedad de interacciones, generalmente asociadas con la regulación de la traducción . Estos incluyen el bloqueo de la unión de los ribosomas al ARNm , el marcado del ARNm para su degradación mediante la unión a sus colas poli-A y la asociación con pequeños ARN reguladores bacterianos (como el ARN DsrA) que controlan la traducción mediante la unión a ciertos ARNm. [21] [22] Una segunda proteína LSm bacteriana es YlxS (a veces también llamada YhbC), que se identificó por primera vez en la bacteria del suelo Bacillus subtilis . Se trata de una proteína de dos dominios con un dominio LSm N-terminal . Se desconoce su función, pero hasta la fecha se encuentran homólogos de secuencia de aminoácidos en prácticamente todos los genomas bacterianos , y puede ser una proteína esencial. [23] El dominio medio del canal mecanosensible de conductancia pequeña MscS en Escherichia coli forma un anillo homoheptamérico. [24] Este dominio LSm no tiene una función aparente de unión a ARN, pero el toro homoheptamérico es parte del canal central de esta proteína de membrana.

Evolución y filogenia

Los homólogos de LSm se encuentran en los tres dominios de la vida e incluso pueden encontrarse en todos los organismos . Se utilizan métodos filogenéticos computacionales para inferir relaciones filogenéticas . La herramienta adecuada para ello es el alineamiento de secuencias entre los distintos homólogos de LSm, como el alineamiento de secuencias múltiples de la estructura primaria (secuencia de aminoácidos) y el alineamiento estructural de la estructura terciaria (estructura tridimensional). Se plantea la hipótesis de que un gen para una proteína LSm estaba presente en el último ancestro universal de toda la vida. [25] Basándose en las funciones de las proteínas LSm conocidas, esta proteína LSm original puede haber ayudado a las ribozimas en el procesamiento del ARN para sintetizar proteínas como parte de la hipótesis del mundo del ARN en la vida temprana. Según este punto de vista, este gen se transmitió de ancestros a descendientes, con frecuentes mutaciones , duplicaciones genéticas y ocasionales transferencias horizontales de genes . En principio, este proceso se puede resumir en un árbol filogenético con la raíz en el último ancestro universal (o anterior), y con las puntas representando el universo de genes LSm que existen en la actualidad.

Anillos homoméricos LSm en bacterias y arqueas.

Según la estructura, las proteínas LSm conocidas se dividen en un grupo formado por las proteínas LSm bacterianas (Hfq, YlxS y MscS) y un segundo grupo con todas las demás proteínas LSm, de acuerdo con los árboles filogenéticos publicados más recientemente . [26] Las tres proteínas LSm de arqueas (Sm1, Sm2 y Sm3) también se agrupan como un grupo, distinto de las proteínas LSm de eucariotas. Tanto las proteínas LSm bacterianas como las de arqueas se polimerizan en anillos homoméricos, que es la condición ancestral.

Anillos heteroméricos LSm en eucariotas

Una serie de duplicaciones genéticas de un solo gen eucariota LSm dieron como resultado la mayoría (si no todos) de los genes eucariotas LSm conocidos. Cada una de las siete proteínas Sm tiene una mayor homología de secuencia de aminoácidos con una proteína Lsm correspondiente que con las otras proteínas Sm. Esto sugiere que un gen LSm ancestral se duplicó varias veces, lo que dio como resultado siete parálogos . Posteriormente, estos divergieron entre sí de modo que el anillo ancestral del homoheptámero LSm se convirtió en un anillo de heteroheptámero. Según las funciones conocidas de las proteínas LSm en eucariotas y arqueas, la función ancestral puede haber sido el procesamiento del ARN prerribosómico , el ARN previo a la transferencia y la preRNasa P. Luego, según esta hipótesis, los siete genes LSm eucariotas ancestrales se duplicaron nuevamente en siete pares de parálogos Sm/LSm; LSm1/SmB, LSm2/SmD1, LSm3/SmD2, LSm4/SmD3, LSm5/SmE, LSm6/SmF y LSm7/SmG. Estos dos grupos de siete genes LSm (y los dos tipos correspondientes de anillos LSm) evolucionaron a un anillo Sm (que requiere ARN) y un anillo Lsm (que se forma sin ARN). El par parálogo LSm1/LSm8 también parece haberse originado antes del último ancestro eucariota común, para un total de al menos 15 genes de la proteína LSm. El par parálogo SmD1/LSm10 y el par parálogo SmD2/LSm11 existen sólo en animales , hongos y amebozoos (a veces identificados como el clado unikont ) y parecen estar ausentes en el clado bikont ( cromalveolados , excavados , plantas y rizaria ). Por lo tanto, estas dos duplicaciones de genes son anteriores a esta división fundamental en el linaje eucariota. El par parálogo SmB/SmN se ve sólo en los mamíferos placentarios , lo que data esta duplicación del gen LSm.

Biogénesis de snRNP

Las pequeñas ribonucleoproteínas nucleares (snRNP) se ensamblan en un proceso estrechamente orquestado y regulado que involucra tanto al núcleo celular como al citoplasma . [27]

Referencias

  1. ^ ab Reeves WH, Narain S, Satoh M (2003). "Henry Kunkel, Stephanie Smith, inmunología clínica y genes divididos". Lupus . 12 (3): 213–7. doi :10.1191/0961203303lu360xx. PMID  12708785. S2CID  33112464.
  2. ^ Tan EM, Kunkel HG (marzo de 1966). "Características de un antígeno nuclear soluble que precipita con sueros de pacientes con lupus eritematoso sistémico". J. Inmunol . 96 (3): 464–71. doi : 10.4049/jimmunol.96.3.464 . PMID  5932578. S2CID  30325463.
  3. ^ Will CL, Lührmann R (junio de 2001). "Biogénesis, estructura y función spliceosomal UsnRNP". actual. Opinión. Biol celular . 13 (3): 290–301. doi :10.1016/S0955-0674(00)00211-8. hdl : 11858/00-001M-0000-0012-F770-0 . PMID  11343899.
  4. ^ Él W, Parker R (junio de 2000). "Funciones de las proteínas Lsm en la degradación y empalme del ARNm". actual. Opinión. Biol celular . 12 (3): 346–50. doi :10.1016/S0955-0674(00)00098-3. PMID  10801455.
  5. ^ Törö I, Thore S, Mayer C, Basquin J, Séraphin B, Suck D (mayo de 2001). "Unión de ARN en un dominio central de Sm: estructura de rayos X y análisis funcional de un complejo proteico Sm de arqueas". EMBO J. 20 (9): 2293–303. doi :10.1093/emboj/20.9.2293. PMC 125243 . PMID  11331594. 
  6. ^ Hermann H, Fabrizio P, Raker VA, Foulaki K, Hornig H, Brahms H, Lührmann R (mayo de 1995). "Las proteínas snRNP Sm comparten dos motivos de secuencia conservados evolutivamente que están involucrados en las interacciones proteína-proteína Sm". EMBO J. 14 (9): 2076–88. doi :10.1002/j.1460-2075.1995.tb07199.x. PMC 398308 . PMID  7744013. 
  7. ^ Kambach C, Walke S, Young R, Avis JM, de la Fortelle E, Raker VA, Lührmann R, Li J, Nagai K (febrero de 1999). "Estructuras cristalinas de dos complejos de proteínas Sm y sus implicaciones para el ensamblaje de los snRNP espliceosómicos". Celúla . 96 (3): 375–87. doi : 10.1016/S0092-8674(00)80550-4 . PMID  10025403. S2CID  17379935.
  8. ^ Códigos PDB de la base de datos de estructura de información del Centro Nacional de Biotecnología 1B34, 1D3B, 1I5L, 1KQ2, 1N9S, 1IB8.
  9. ^ Khusial P, Plaag R, Zieve GW (septiembre de 2005). "Las proteínas LSm forman anillos heptaméricos que se unen al ARN mediante motivos repetidos". Tendencias Bioquímica. Ciencia . 30 (9): 522–8. doi :10.1016/j.tibs.2005.07.006. PMID  16051491.
  10. ^ Urlaub H, Raker VA, Kostka S, Lührmann R (enero de 2001). "Interacciones de ARN proteína Sm-sitio Sm dentro del anillo interno de la estructura central spliceosomal snRNP". EMBO J. 20 (1–2): 187–96. doi :10.1093/emboj/20.1.187. PMC 140196 . PMID  11226169. 
  11. ^ Seto AG, Zaug AJ, Sobel SG, Wolin SL, Cech TR (septiembre de 1999). "La telomerasa de Saccharomyces cerevisiae es una pequeña partícula de ribonucleoproteína nuclear Sm". Naturaleza . 401 (6749): 177–80. Código Bib :1999Natur.401..177S. doi :10.1038/43694. PMID  10490028. S2CID  4414530.
  12. ^ Beggs JD (junio de 2005). "Proteínas Lsm y procesamiento de ARN". Bioquímica. Soc. Trans . 33 (Parte 3): 433–8. doi :10.1042/BST0330433. PMID  15916535.
  13. ^ Kufel J, Allmang C, Petfalski E, Beggs J, Tollervey D (enero de 2003). "Las proteínas Lsm son necesarias para el procesamiento normal y la estabilidad de los ARN ribosómicos". J. Biol. química . 278 (4): 2147–56. doi : 10.1074/jbc.M208856200 . PMID  12438310.
  14. ^ Schümperli D, Pillai RS (octubre de 2004). "La estructura central especial Sm del snRNP U7: importancia de gran alcance de una pequeña ribonucleoproteína nuclear" (PDF) . Celúla. Mol. Ciencias de la vida . 61 (19–20): 2560–70. doi :10.1007/s00018-004-4190-0. PMID  15526162. S2CID  5780814.
  15. ^ Decker, CJ; Parker, R. (3 de julio de 2012). "Cuerpos P y gránulos de estrés: posibles funciones en el control de la traducción y la degradación del ARNm". Perspectivas de Cold Spring Harbor en biología . 4 (9): a012286. doi : 10.1101/cshperspect.a012286. ISSN  1943-0264. PMC 3428773 . PMID  22763747. 
  16. ^ Ma Y, Dostie J, Dreyfuss G, Van Duyne GD (junio de 2005). "El heterodímero Gemin6-Gemin7 del complejo de supervivencia de neuronas motoras tiene una estructura similar a la proteína Sm". Estructura . 13 (6): 883–92. doi : 10.1016/j.str.2005.03.014 . PMID  15939020.
  17. ^ Chari A, Golas MM, Klingenhäger M, Neuenkirchen N, Sander B, Englbrecht C, Sickmann A, Stark H, Fischer U (31 de octubre de 2008). "Un acompañante de asamblea colabora con el complejo SMN para generar SnRNP spliceosomales". Celúla . 135 (3): 497–509. doi :10.1016/j.cell.2008.09.020. hdl : 11858/00-001M-0000-0010-93A3-A . PMID  18984161. S2CID  119444.
  18. ^ Albrecht M, Lengauer T (julio de 2004). "Nuevas proteínas similares a Sm con largas colas C-terminales y metiltransferasas asociadas". FEBS Lett . 569 (1–3): 18–26. doi : 10.1016/j.febslet.2004.03.126 . PMID  15225602. S2CID  37187215.
  19. ^ ab Zhang, Jiyuan; Guan, Xin; Shah, Kunal; Yan, Jiusheng (6 de agosto de 2021). "Lsm12 es un receptor NAADP y una proteína reguladora del canal de dos poros necesaria para la movilización de calcio a partir de orgánulos ácidos". Comunicaciones de la naturaleza . 12 (1): 4739. Código bibliográfico : 2021NatCo..12.4739Z. doi :10.1038/s41467-021-24735-z. ISSN  2041-1723. PMC 8346516 . PMID  34362892. 
  20. ^ Mura C, Kozhukhovsky A, Gingery M, Phillips M, Eisenberg D (abril de 2003). "Las propiedades de oligomerización y unión de ligandos de proteínas arqueales similares a Sm (SmAP)". Ciencia de las proteínas . 12 (4): 832–47. doi :10.1110/ps.0224703. PMC 2323858 . PMID  12649441. 
  21. ^ Schumacher MA, Pearson RF, Møller T, Valentin-Hansen P, Brennan RG (julio de 2002). "Estructuras del regulador traduccional pleiotrópico Hfq y un complejo Hfq-ARN: una proteína bacteriana similar a Sm". EMBO J. 21 (13): 3546–56. doi :10.1093/emboj/cdf322. PMC 126077 . PMID  12093755. 
  22. ^ Arrendamiento RA, Woodson SA (diciembre de 2004). "Ciclo de la proteína Hfq similar a Sm en el pequeño ARN regulador de DsrA". J. Mol. Biol . 344 (5): 1211–23. doi :10.1016/j.jmb.2004.10.006. PMID  15561140.
  23. ^ Yu L, Gunasekera AH, Mack J, Olejniczak ET, Chovan LE, Ruan X, Towne DL, Lerner CG, Fesik SW (agosto de 2001). "Estructura de la solución y función de una proteína conservada SP14.3 codificada por un gen esencial de Streptococcus pneumoniae". J. Mol. Biol . 311 (3): 593–604. doi :10.1006/jmbi.2001.4894. PMID  11493012.
  24. ^ Bass RB, Strop P, Barclay M, Rees DC (noviembre de 2002). "Estructura cristalina de Escherichia coli MscS, un canal mecanosensible y modulado por voltaje" (PDF) . Ciencia . 298 (5598): 1582–7. Código bibliográfico : 2002 Ciencia... 298.1582B. doi : 10.1126/ciencia.1077945. PMID  12446901. S2CID  15945269.
  25. ^ Achsel T, Stark H, Lührmann R (marzo de 2001). "El dominio Sm es un antiguo motivo de unión a ARN con especificidad oligo (U)". Proc. Nacional. Acad. Ciencia. EE.UU . 98 (7): 3685–9. Código bibliográfico : 2001PNAS...98.3685A. doi : 10.1073/pnas.071033998 . PMC 31112 . PMID  11259661. 
  26. ^ Ciccarelli FD, Doerks T, von Mering C, Creevey CJ, Snel B, Bork P (marzo de 2006). "Hacia la reconstrucción automática de un árbol de la vida altamente resuelto". Ciencia . 311 (5765): 1283–7. Código bibliográfico : 2006 Ciencia... 311.1283C. CiteSeerX 10.1.1.381.9514 . doi : 10.1126/ciencia.1123061. PMID  16513982. S2CID  1615592. 
  27. ^ Beso T (diciembre de 2004). "Biogénesis de pequeñas RNP nucleares". J. Ciencia celular . 117 (parte 25): 5949–51. doi :10.1242/jcs.01487. PMID  15564372. S2CID  10316639.

enlaces externos