CXorf66, también conocido como marco de lectura abierto 66 del cromosoma X , es una proteína 361aa en humanos que está codificada por el gen CXorf66 . Se predice que la proteína codificada será una proteína transmembrana de tipo 1 ; sin embargo, actualmente se desconoce su función exacta. [5]
Existe una patente para CXorf66 con el archivo US 8586006 del Institute for Systems Biology and Integrated Diagnostics, Inc. [6]
La proteína CXorf66 es un posible nuevo biomarcador de cáncer . [7]
CXorf66 se encuentra en el cromosoma X en Xq27.1 y está en la cadena del complemento. [8] El gen CXorf66 se encuentra entre ATP11C ATPasa, MIR505 y HNRNPA3P3. [8] Además de esto, según OMIM, CXorf66 se posiciona entre SOX3 , SPANXB1 y CDR1 . [9]
CXorf66 solo consta de una variante de empalme conocida con tres exones (1-117, 118-271 y 272-1288 pb) y dos intrones . [10] Las ubicaciones de las uniones ocurren en 30aa [G] y 81aa [M]. [10]
Solo se ha descubierto que CXorf66 tiene un solo sitio de poliadenilación . [11]
Con 57 serinas y 42 lisinas, la proteína CXorf66 es rica en serina y lisina . [12] CXorf66 tiene un peso molecular de 39,9 kdal y un punto isoeléctrico de 9,89. [12]
La proteína CXorf66 tiene un péptido señal predicho de 1-19aa, un dominio topológico de 20-47aa, un dominio transmembrana de 48-68aa y un segundo dominio topológico de 69-361aa. [13] Se predice que se producirá un sitio de escisión del péptido señal entre los 17-18aa. [14] Al analizar la composición de la proteína (rica en serina y lisina) y las modificaciones postraduccionales (altos niveles de fosforilación), se predice que el primer dominio topológico [20-47aa] es extracelular , mientras que el dominio topológico [69-361aa ] ] es citoplasmático . Una imagen se puede ver en la Figura II . [15]
Se han encontrado tres motivos repetidos de DKPV [31-34 y 204-207aa], SEAK [97-100 y 287-290aa] y PKRS [161-164 y 245-248aa] en la proteína CXorf66 humana. Estas repeticiones se conservan en otros primates como Gorilla gorilla gorilla y Macaca mulatta , pero no están presentes en otros mamíferos. [dieciséis]
Hay una variante natural de la población (frecuencia 0,436) en 233aa de prolina a leucina en la proteína CXorf66, siendo la prolina el aminoácido codificado ancestral. No se han observado efectos con esta mutación sin sentido . [13] [17]
Según la interacción proteica prevista por STRING , CXorf66 tiene una puntuación de nivel medio por estar vinculado a las proteínas enumeradas en la Figura III . [18] Es importante señalar que todas las proteínas enumeradas no se determinan experimentalmente.
Sólo hay un promotor conocido predicho por Genomatix para la proteína CXorf66 en la cadena negativa de 139047554-139048298 que tiene 745 pb de longitud. [19] Cuando se utilizó BLAT Search Alignment para el promotor CXorf66 generado, se recuperaron numerosos resultados con alta identidad para varios genes en diferentes cromosomas. Los siguientes son algunos de los resultados de búsqueda generados con mayor puntuación que comparten un alto porcentaje de identidad: [20]
Excepcionalmente, TESK2 es una proteína quinasa específica de los testículos, que se correlaciona con la expresión tisular prevista de CXorf66.
Mediante el uso de Genomatix, se generó una tabla de los 20 factores de transcripción principales y sus sitios de unión en el promotor CXorf66 (ver Figura IV ). [19]
CXorf66 tiene dos miARN , hsa-mir-1290 Archivado el 5 de marzo de 2021 en Wayback Machine y hsa-miR-4446-5p Archivado el 4 de marzo de 2016 en Wayback Machine, se prevé que se unirá a la región 3 'UTR del ARNm. . [21]
NetNGlyc de Expasy ha predicho un sitio de N-glicosilación en NGSS [24aa] y también es posible un sitio secundario en NGTN [21aa]. [22] Utilizando NetPhos, se ha predicho un total de 48 sitios de fosforilación (41 serinas , 2 treoninas y 5 tirosinas ), todos los cuales ocurren después del dominio transmembrana predicho, lo que sugiere una topología citoplasmática. [23] Utilizando YinOYang, se han predicho muchos sitios O-GlcNAc. Todo lo que incluye alto potencial ocurre después de la región transmembrana 48-68aa. [24] Un análisis SUMOplot realizado de la proteína CXorf66 de Homo sapiens descubrió una alta probabilidad de un motivo de sumoilación en la posición K241, junto con motivos de baja probabilidad en K316 y K186. Dado que la sumoilación tiene un papel en varios procesos celulares como el transporte nuclear-citosólico y la regulación transcripcional, se espera que CXorf66 sea modificado por una proteína SUMO postraduccional. [25]
Usando PSORT II, hay una señal de localización nuclear de PYKKKHL en 268aa. [26] Se puede observar que esta señal se conserva en otras especies de primates; sin embargo, no está presente en otros mamíferos. Además de esto, siguiendo la predicción SAPS kNN de Biology Workbench de SDSC, la proteína CXorf66 para humanos y el homólogo de ratón tienen un 47,8% de probabilidad de terminar en la región nuclear de una célula. Sin embargo, para homólogos más distantes, como Bos taurus, que no tienen señales de localización nuclear, CXorf66 tiene un 34,8% de probabilidad de terminar en el extracelular, incluida la región de la pared celular o las regiones de la membrana plasmática. [12] [26] Para ver varios homólogos y sus señales de localización nuclear, consulte la Figura V.
CXorf66 no tiene parálogos conocidos en humanos; sin embargo, CXorf66 ha conservado homólogos en todo el reino Mammalia . Altamente conservado en primates, se ha observado una evolución rápida y notable para CXorf66, ver Figura VI , lo que explica el mayor número de ortólogos en mamíferos, en lugar de en invertebrados, aves y reptiles. [27]
Según la visualización de abundancia de tejido de ADNc EST y el Atlas de proteínas de Unigene, CXorf66 tiene niveles de expresión moderadamente altos en los testículos, además de niveles de expresión más altos en el tejido fetal en comparación con otras etapas de desarrollo. [29] [30] La proteína CXorf66 también tiene una presencia baja notable tanto en el ARN total del endometrio de control como en el ARN total de la endometriosis . [31] Se ha demostrado que CXorf66 tiene una presencia notable en el plasma y las plaquetas . [5] Según los datos de PaxDb, se ha encontrado que CXorf66 se ubica en el 5 % superior en un estudio de plasma humano y en el 25 % superior en otro estudio realizado con plaquetas humanas. [32] Además de esto, ha habido una presencia notable de proteína CXorf66 del 60 al 100% en el tejido del tabique de la miocardiopatía dilatada y no fallida . [33] Además, CXorf66 tiene una presencia de proteína de ~75% en las células mononucleares de sangre periférica . [34]
{{cite journal}}
: Mantenimiento CS1: varios nombres: lista de autores ( enlace )