El gen LOC644249 no caracterizado , [1] también conocido como RP11-195B21.3, tiene una longitud de aproximadamente 1058 pares de bases y se encuentra en el Homo sapiens en el cromosoma 9q 12. Más específicamente, la secuencia se encuentra en el cromosoma: 9; NC_000009.11 (67977457..67987991 pb). El producto proteico de este gen es la "proteína 29 que contiene el dominio de bobina superenrollada", que tiene una longitud de 291 aminoácidos y puede contener un dominio conservado en la superfamilia , pfam 12001. En particular, este dominio conservado contiene el dominio de función desconocida DUF3496, que tiene una longitud de aproximadamente 110 aminoácidos, no está caracterizado funcionalmente y se encuentra en eucariotas . [2] Existen otros motivos posibles para el producto proteico, pero el DUF3496 sigue siendo el más probable. [3] Esta proteína puede desempeñar un papel como proteína transmembrana. [4]
En los humanos, este gen se encuentra en el cromosoma 9q 12 (67977457..67987991) pb. [1]
Se predice que el promotor tiene una longitud de aproximadamente 601 pb y se encuentra aproximadamente 100 pb aguas arriba del sitio de inicio de la transcripción de la transcripción primaria. [5]
Se predice que este gen tiene 4 exones, con un 3'UTR muy pequeño que está cubierto con una cola de poli A muy poco tiempo después del cuarto exón. [6]
El producto proteico es la proteína 29 que contiene el dominio de hélice superenrollada, abreviada como CCDC29, tiene una longitud de aproximadamente 291 aminoácidos y contiene el motivo DUF3496. Además, también se predice que esta proteína tiene un posible sitio transmembrana en aproximadamente 284 - 291 aa. [4]
1 0000000000 0--0-000-0 +0-00+0-00 0++0+0+0-- 000-+-0000 +00000+-00 61 0000-0000+ +00000-+0- --++00+--0 000+000-00 +0-00+00-0 +0-0--+000 121 00-+0--000 0-0000-+00 -000+-0000 00++-000+- 0-0+00-0+0 00–000-0- 181 -0+-000000 +000000++0 0+00++0000 00+000-+-0 0+00000000 ++-0-0000- 241 00000000++ 0000000+00 0000000000 +000000000 0000000000 0 [4]
El motivo DUF3496 [2] tiene una longitud de aproximadamente 110 aa y se conserva en eucariotas. Como su nombre lo indica, actualmente se desconoce su función, pero se puede encontrar en diferentes especies. En CCDC 29, su ubicación relativa es de aproximadamente 153 a 259 aa.
Este perfil GEO de LOC644249 se incluyó en un perfil de expresión génica que se realizó en un estudio [7] que analizó los tejidos adiposos de sujetos con riesgo de síndrome metabólico. Este perfil GEO puede sugerir que LOC644249 se expresa de forma ubicua en el tejido adiposo, pero no se puede establecer una correlación directa de los efectos de los niveles de expresión de LOC644249 con el tejido adiposo. [4]
Se predijo que podrían aparecer solo dos variantes de transcripción. Una variante de transcripción predijo la pérdida del exón 4. La pérdida del exón 4 conduciría a la pérdida de aproximadamente la mitad del DUF3496 y a la pérdida total del dominio transmembrana. La otra variante de transcripción predijo la pérdida del exón 2, que no conduciría a la pérdida del DUF3496 y dejaría el marco de lectura relativamente intacto. [4] [8]
Los ortólogos de CCDC29 parecen estar limitados únicamente a los primates, como se muestra en la tabla siguiente. Un parálogo de CCDC29 que no está limitado únicamente a los primates, la proteína 26 que contiene el dominio de repetición de anquirina, mostró que este parálogo está reservado únicamente a los animales vertebrados. Se descubrió que el ortólogo más distante de la proteína 26 que contiene el dominio de repetición de anquirina era la especie Gallus gallus.
Se predijo un posible sitio de N- glicosilación , pero no se detectó un péptido señal . Por lo tanto, es posible que CCDC29 no experimente esta modificación particular a pesar de que tiene el sitio posible. [9]
Se predijeron un total de 13 sitios de fosforilación probables: Ser: 5 Thr: 6 Tyr: 2
La concentración principal de los sitios de fosforilación parece estar localizada dentro del motivo DUF3496 y el extremo 3' de la proteína. [10]
Se cree que el CCDC29, como su nombre lo indica, tiene el motivo de espiral superenrollada . El software de predicción de la estructura de proteínas confirma este motivo con un 97,6 % de confianza. [11]
Se predice que CCDC29 tiene una hélice transmembrana ubicada en la terminal N 270. [12]
Actualmente desconocido a fecha de 09/05/2013.