LOC101059915 es una proteína que en los humanos está codificada por el gen LOC101059915 . Se encuentra en el cromosoma X y tiene expresión restringida en los testículos.
El gen LOC101059915 tiene dos alias conocidos como marco de lectura abierto tipo 49 del cromosoma X y BX276092.6. [3]
LOC101059915 está ubicado en el cromosoma X en el locus Xq13.1. Tiene 1.831 pares de bases de largo y la secuencia del gen tiene 6 exones . [4] LOC101059915 también tiene una transcripción codificante de proteína.
La región promotora de LOC101059915 está ubicada en la cadena sentido del ADN y entre los pares de bases 71666098 y 71667904 en el cromosoma X. Se extiende hasta 1.806 pb. [5] Sin embargo, la expresión de LOC101059915 es relativamente baja en células humanas y se limita principalmente a los testículos. [6]
La proteína tiene 518 aminoácidos y una masa molecular de 55,1 kDa. [7] El punto isoeléctrico es 8,15. En comparación con otras proteínas humanas, LOC101059915 es rica en glicina , prolina y serina , pero la proteína tiene niveles más bajos de tirosina . [8]
El dominio de función desconocida , DUF4641, cubre casi toda la proteína. Es parte de pfam15483. [9] Tiene 410 aminoácidos de longitud, desde el aminoácido 85 hasta el aminoácido número 495. [10]
Se ha demostrado que la estructura secundaria de LOC101059915 consiste principalmente en hélices alfa, según lo determinado por modelos realizados en I-TASSER y análisis utilizando herramientas ExPASy. [11]
Se prevé que LOC101055915 contenga muchas modificaciones postraduccionales diferentes. Esto incluye sitios para la fosforilación (NetPhos 2.0 [12] ) y sumoilación (Programa de análisis SUMOplot [13] ).
Se ha predicho que la proteína LOC101059915 estará ubicada en el núcleo celular (PSORT II). [14]
CXorf49 y CXorf49B son parálogos de LOC101059915. Comparten más del 78% de similitud con LOC101059915 y probablemente pasaron por un evento de duplicación genética relativamente recientemente, en términos evolutivos, debido al alto grado de conservación entre las tres secuencias.
CXorf49 es especialmente interesante debido a que se ha demostrado que participa como uno de los componentes de un pequeño grupo del proteoma de las células HL-60 que son más propensos a formar aductos de 4-hidroxi-2-nonenal (HNE), tras la exposición a sustancias no tóxicas ( 10 μM) concentraciones de HNE, junto con choque térmico de proteína 1 de 60 kDa. [15]
Usando BLAST [16] no se encuentran ortólogos para LOC101059915 en organismos unicelulares, hongos o plantas cuyos genomas hayan sido secuenciados. Para los organismos multicelulares, los ortólogos se encuentran en los mamíferos, excepto los monotremas . La siguiente tabla muestra una muestra representativa de 20 de los ortólogos de LOC101059915. La tabla está organizada según el tiempo de divergencia con los humanos en millones de años (MYA). En los casos en los que el período de divergencia es el mismo, los ortólogos se ordenan por identidad (%).
El ortólogo más distante de LOC101059915 es de la especie Sarcrophilus harrisii , comúnmente conocida como el diablo de Tasmania, que data de hace más de 159,0 millones de años.