CXorf49 es una proteína que en los humanos está codificada por el gen del marco de lectura abierto 49 del cromosoma X (CXorf49).
El gen CXorf49 tiene un alias CXorf49B. [1] El nuevo nombre A8MYA2 también se refiere a la proteína codificada por CXorf49 o CXorf49B. [2]
CXorf49 se encuentra en el cromosoma X en Xq13.1. Tiene 3912 pares de bases de largo y la secuencia del gen tiene 6 exones . [3] CXorf49 tiene una transcripción codificante de proteínas. [4]
La proteína tiene 514 aminoácidos y una masa molecular de 54,4 kDa. [5] El punto isoeléctrico es 9,3. En comparación con otras proteínas humanas, CXorf49 es rica en glicina y prolina , pero la proteína tiene niveles más bajos de asparagina , isoleucina , tirosina y treonina (Análisis estadístico de secuencias de proteínas, SAPS [6] ).
El dominio de función desconocida , DUF4641, es casi la proteína completa. Tiene 433 aminoácidos de longitud, desde el aminoácido 80 hasta el aminoácido número 512. [7] DUF4641 es parte de pfam15483. [8] El dominio es rico en prolina y arginina, pero DUF4641 tiene niveles más bajos de isoleucina, tirosina y treonina en comparación con otras proteínas en humanos (Análisis de secuencias de proteínas, SAPS [6] ). DUF4641 tiene un espacio inusual entre los residuos de lisina y los aminoácidos con carga positiva (Análisis de secuencias de proteínas, SAPS [6] ).
Se predice que CXorf49 tendrá varios sitios postraduccionales. Esto incluye sitios para N-acetiltransferasa (NetAcet 1- [9] ), glicación de grupos ε amino de lisinas (NetGlycate 1.0 [10] ), O-glicosilación de GalNAc tipo mucina (NetOgluc 4.0 [11] ), fosforilación (NetPhos 2.0 [ 12] ), sumoilación (Programa de análisis SUMOplot [13] ) y unión O-ß-GlcNAc (YinOYang WWW [14] ).
Se ha predicho que la proteína CXorf49 se ubicará en el núcleo celular (PSORT II [15] ).
La región promotora de CXorf49 se encuentra entre el par de bases 71718051 y 71718785 en la cadena negativa del cromosoma X y tiene 735 pb de largo (programa ElDorado de Genomatix [16] ). Uno de los sitios de unión del factor de transcripción más frecuentes en la región promotora son los sitios para el factor de unión de la caja Y.
Aunque la expresión de CXorf49 es muy baja en células humanas, es algo mayor en tejidos conectivos , testículos y útero (NCBI-Unigene [17] ).
Aún no se ha demostrado que la proteína CXorf49 interactúe con otras proteínas (PSICQUIC [18] ).
Se descubre que CXorf49 es uno de los componentes de un pequeño grupo del proteoma de las células HL-60 que eran más propensos a formar aductos de 4-hidroxi-2-nonenal (HNE), tras la exposición a concentraciones de HNE no tóxicas (10 μM), junto con con choque térmico proteína 1 de 60 kDa. [19]
Usando BLAST [20] no se encuentran ortólogos para CXorf49 en organismos unicelulares, hongos o plantas cuyos genomas hayan sido secuenciados. Para los organismos multicelulares, los ortólogos se encuentran en los mamíferos. La siguiente tabla muestra una selección de los ortólogos de mamíferos. Se enumeran después de un tiempo de divergencia con los humanos.
CXorf49 se ha desarrollado desde los osos hormigueros hasta la proteína humana hace más de 105,0 millones de años.