stringtranslate.com

CXorf66

CXorf66, también conocido como marco de lectura abierto 66 del cromosoma X , es una proteína 361aa en humanos que está codificada por el gen CXorf66 . Se predice que la proteína codificada será una proteína transmembrana de tipo 1 ; sin embargo, actualmente se desconoce su función exacta. [5]

Existe una patente para CXorf66 con el archivo US 8586006 del Institute for Systems Biology and Integrated Diagnostics, Inc. [6]

La proteína CXorf66 es un posible nuevo biomarcador de cáncer . [7]

Gene

CXorf66 se encuentra en el cromosoma X en Xq27.1 y está en la cadena del complemento. [8] El gen CXorf66 se encuentra entre ATP11C ATPasa, MIR505 y HNRNPA3P3. [8] Además de esto, según OMIM, CXorf66 se posiciona entre SOX3 , SPANXB1 y CDR1 . [9]

Locus genético del gen humano CXorf66 en el cromosoma X

ARNm

Variantes de empalme

CXorf66 solo consta de una variante de empalme conocida con tres exones (1-117, 118-271 y 272-1288 pb) y dos intrones . [10] Las ubicaciones de las uniones ocurren en 30aa [G] y 81aa [M]. [10]

Empalme del gen CXorf66

Solo se ha descubierto que CXorf66 tiene un solo sitio de poliadenilación . [11]

Proteína

Composición

Con 57 serinas y 42 lisinas, la proteína CXorf66 es rica en serina y lisina . [12] CXorf66 tiene un peso molecular de 39,9 kdal y un punto isoeléctrico de 9,89. [12]

Dominios

La proteína CXorf66 tiene un péptido señal predicho de 1-19aa, un dominio topológico de 20-47aa, un dominio transmembrana de 48-68aa y un segundo dominio topológico de 69-361aa. [13] Se predice que se producirá un sitio de escisión del péptido señal entre los 17-18aa. [14] Al analizar la composición de la proteína (rica en serina y lisina) y las modificaciones postraduccionales (altos niveles de fosforilación), se predice que el primer dominio topológico [20-47aa] es extracelular , mientras que el dominio topológico [69-361aa ] ] es citoplasmático . Una imagen se puede ver en la Figura II . [15]

Figura I. Sitios de fosforilación candidatos en la proteína CXorf66 humana
Figura II. Predicción SOSUI de la topología transmembrana de la proteína CXorf66

Se han encontrado tres motivos repetidos de DKPV [31-34 y 204-207aa], SEAK [97-100 y 287-290aa] y PKRS [161-164 y 245-248aa] en la proteína CXorf66 humana. Estas repeticiones se conservan en otros primates como Gorilla gorilla gorilla y Macaca mulatta , pero no están presentes en otros mamíferos. [dieciséis]

SNP

Hay una variante natural de la población (frecuencia 0,436) en 233aa de prolina a leucina en la proteína CXorf66, siendo la prolina el aminoácido codificado ancestral. No se han observado efectos con esta mutación sin sentido . [13] [17]

Proteínas que interactúan

Según la interacción proteica prevista por STRING , CXorf66 tiene una puntuación de nivel medio por estar vinculado a las proteínas enumeradas en la Figura III . [18] Es importante señalar que todas las proteínas enumeradas no se determinan experimentalmente.

Regulación

Transcripción

Promotor

Sólo hay un promotor conocido predicho por Genomatix para la proteína CXorf66 en la cadena negativa de 139047554-139048298 que tiene 745 pb de longitud. [19] Cuando se utilizó BLAT Search Alignment para el promotor CXorf66 generado, se recuperaron numerosos resultados con alta identidad para varios genes en diferentes cromosomas. Los siguientes son algunos de los resultados de búsqueda generados con mayor puntuación que comparten un alto porcentaje de identidad: [20]

Excepcionalmente, TESK2 es una proteína quinasa específica de los testículos, que se correlaciona con la expresión tisular prevista de CXorf66.

Factores de transcripción

Mediante el uso de Genomatix, se generó una tabla de los 20 factores de transcripción principales y sus sitios de unión en el promotor CXorf66 (ver Figura IV ). [19]

Figura IV: Lista generada de sitios de unión de factores de transcripción en el promotor CXorf66

Traducción

CXorf66 tiene dos miARN , hsa-mir-1290 Archivado el 5 de marzo de 2021 en Wayback Machine y hsa-miR-4446-5p Archivado el 4 de marzo de 2016 en Wayback Machine, se prevé que se unirá a la región 3 'UTR del ARNm. . [21]

Modificaciones postraduccionales

NetNGlyc de Expasy ha predicho un sitio de N-glicosilación en NGSS [24aa] y también es posible un sitio secundario en NGTN [21aa]. [22] Utilizando NetPhos, se ha predicho un total de 48 sitios de fosforilación (41 serinas , 2 treoninas y 5 tirosinas ), todos los cuales ocurren después del dominio transmembrana predicho, lo que sugiere una topología citoplasmática. [23] Utilizando YinOYang, se han predicho muchos sitios O-GlcNAc. Todo lo que incluye alto potencial ocurre después de la región transmembrana 48-68aa. [24] Un análisis SUMOplot realizado de la proteína CXorf66 de Homo sapiens descubrió una alta probabilidad de un motivo de sumoilación en la posición K241, junto con motivos de baja probabilidad en K316 y K186. Dado que la sumoilación tiene un papel en varios procesos celulares como el transporte nuclear-citosólico y la regulación transcripcional, se espera que CXorf66 sea modificado por una proteína SUMO postraduccional. [25]

localización subcelular

Figura V. Señales de localización nuclear CXorf66 entre homólogos

Usando PSORT II, ​​hay una señal de localización nuclear de PYKKKHL en 268aa. [26] Se puede observar que esta señal se conserva en otras especies de primates; sin embargo, no está presente en otros mamíferos. Además de esto, siguiendo la predicción SAPS kNN de Biology Workbench de SDSC, la proteína CXorf66 para humanos y el homólogo de ratón tienen un 47,8% de probabilidad de terminar en la región nuclear de una célula. Sin embargo, para homólogos más distantes, como Bos taurus, que no tienen señales de localización nuclear, CXorf66 tiene un 34,8% de probabilidad de terminar en el extracelular, incluida la región de la pared celular o las regiones de la membrana plasmática. [12] [26] Para ver varios homólogos y sus señales de localización nuclear, consulte la Figura V.

Homología

CXorf66 no tiene parálogos conocidos en humanos; sin embargo, CXorf66 ha conservado homólogos en todo el reino Mammalia . Altamente conservado en primates, se ha observado una evolución rápida y notable para CXorf66, ver Figura VI , lo que explica el mayor número de ortólogos en mamíferos, en lugar de en invertebrados, aves y reptiles. [27]

Figura VI. Divergencia del homólogo de la proteína CXorf66

Expresión

Según la visualización de abundancia de tejido de ADNc EST y el Atlas de proteínas de Unigene, CXorf66 tiene niveles de expresión moderadamente altos en los testículos, además de niveles de expresión más altos en el tejido fetal en comparación con otras etapas de desarrollo. [29] [30] La proteína CXorf66 también tiene una presencia baja notable tanto en el ARN total del endometrio de control como en el ARN total de la endometriosis . [31] Se ha demostrado que CXorf66 tiene una presencia notable en el plasma y las plaquetas . [5] Según los datos de PaxDb, se ha encontrado que CXorf66 se ubica en el 5 % superior en un estudio de plasma humano y en el 25 % superior en otro estudio realizado con plaquetas humanas. [32] Además de esto, ha habido una presencia notable de proteína CXorf66 del 60 al 100% en el tejido del tabique de la miocardiopatía dilatada y no fallida . [33] Además, CXorf66 tiene una presencia de proteína de ~75% en las células mononucleares de sangre periférica . [34]

Datos de expresión tisular Unigene EST para la proteína CXorf66 humana
GeneCards predijo la expresión tisular de la proteína CXorf66 humana

Referencias

  1. ^ abc GRCh38: Ensembl lanzamiento 89: ENSG00000203933 - Ensembl , mayo de 2017
  2. ^ abc GRCm38: Ensembl lanzamiento 89: ENSMUSG00000079583 - Ensembl , mayo de 2017
  3. ^ "Referencia humana de PubMed:". Centro Nacional de Información Biotecnológica, Biblioteca Nacional de Medicina de EE. UU .
  4. ^ "Referencia de PubMed del ratón:". Centro Nacional de Información Biotecnológica, Biblioteca Nacional de Medicina de EE. UU .
  5. ^ ab GeneCard para CXorf66
  6. ^ Leroy capucha; Patricia M. Beckmann; Richard Johnson; Marcello Marelli; Xiaojun Li. "Proteínas específicas de órganos y métodos de su uso". Patente US8586006 . Instituto de Biología de Sistemas, Integrated Diagnostics, Inc. Consultado el 11 de marzo de 2015 .
  7. ^ Delgado AP, Hamid S, Brandao P, Narayanan R (2014). "Un nuevo biomarcador de cáncer de glicoproteína transmembrana presente en el cromosoma X". Genómica y proteómica del cáncer . 11 (2): 81–92. PMID  24709545.
  8. ^ ab "Proteína NCBI CXorf66". Base de datos de dominio conservada . Centro Nacional de Información Biotecnológica . Consultado el 11 de marzo de 2015 .
  9. ^ "Proteína OMIM CXorf66". Base de datos de dominio conservada . Centro Nacional de Información Biotecnológica . Consultado el 11 de marzo de 2015 .
  10. ^ ab "Proteína NCBI AceView CXorf66". Base de datos de dominio conservada . Centro Nacional de Información Biotecnológica . Consultado el 11 de marzo de 2015 .
  11. ^ "Bayas blandas". Softberry.com . Consultado el 11 de marzo de 2015 .
  12. ^ abc Departamento de Bioingeniería. "Banco de trabajo de biología SDSC". Universidad de California, San Diego . Consultado el 11 de marzo de 2015 .
  13. ^ ab "UniProtKB/Swiss-Prot Q5JRM2". Consorcio UniProt . Consultado el 11 de marzo de 2015 .
  14. ^ Thomas Nordahl Petersen; Søren Brunak; Gunnar von Heijne ; Henrik Nielsen. "SignalP 4.0: discriminación de péptidos señal de regiones transmembrana". Métodos de la naturaleza . Consultado el 11 de marzo de 2015 .
  15. ^ Hirokawa T.; Boon-Chieng S.; Mitaku S. (1998). "SOSUI: sistema de clasificación y predicción de estructuras secundarias para proteínas de membrana". Bioinformática . 14 (4). Revista de Bioinformática: 378–379. doi : 10.1093/bioinformática/14.4.378 . PMID  9632836 . Consultado el 11 de marzo de 2015 .
  16. ^ Brendel, V., Bucher, P., Nourbakhsh, IR, Blaisdell, BE y Karlin, S. (1992). "Métodos y algoritmos para el análisis estadístico de secuencias de proteínas". SAPS (Análisis Estadístico de PS) . 89 (6). Proc. Nacional. Acad. Ciencia. Estados Unidos: 2002-2006. Código bibliográfico : 1992PNAS...89.2002B. doi : 10.1073/pnas.89.6.2002 . PMC 48584 . PMID  1549558 . Consultado el 11 de marzo de 2015 . {{cite journal}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )
  17. ^ "dbSNP". Base de datos de dominio conservada . Centro Nacional de Información Biotecnológica . Consultado el 11 de marzo de 2015 .
  18. ^ "Interacciones de la proteína CXorf66". STRING: Interacciones proteína-proteína conocidas y previstas . String-db.org . Consultado el 11 de marzo de 2015 .
  19. ^ ab Software Genomatix. "Genomatix El Dorado". Archivado desde el original el 2 de diciembre de 2021 . Consultado el 11 de marzo de 2015 .
  20. ^ Jim Kent. "BLAT". Bioinformática del genoma UCSC . Consultado el 11 de marzo de 2015 .
  21. ^ "miRBase: la base de datos de microARN". Universidad de Manchester . Consultado el 11 de marzo de 2015 .
  22. ^ Blom, N.; Gammeltoft, S. y Brunak, S. (1999). "Predicción basada en secuencia y estructura de sitios de fosforilación de proteínas eucariotas". Revista de biología molecular . 294 (5): 1351-1362. doi :10.1006/jmbi.1999.3310. PMID  10600390 . Consultado el 11 de marzo de 2015 .
  23. ^ R Gupta. "Predicción de sitios de glicosilación en proteomas: de modificaciones postraduccionales a la función de las proteínas". Cbs.dtu.dk. ​Consultado el 11 de marzo de 2015 .
  24. ^ Qi Zhao; Yubin Xie; Yueyuan Zheng; Shuai Jiang; Wenzhong Liu; Weiping Mu; Yong Zhao; Yu Xue; Jian Ren. "GPS-SUMO: una herramienta para la predicción de sitios de sumoilación y motivos de interacción SUMO". Investigación de ácidos nucleicos. Archivado desde el original el 10 de mayo de 2013.
  25. ^ ab Paul Horton. "PSORTE II". Psort.hgc.jp . Consultado el 11 de marzo de 2015 .
  26. ^ "BLAST: herramienta básica de búsqueda de alineación local". Base de datos de dominio conservada . Centro Nacional de Información Biotecnológica . Consultado el 11 de marzo de 2015 .
  27. ^ "La escala de tiempo de la vida". Árbol del tiempo . Consultado el 11 de marzo de 2015 .
  28. ^ "Unigene". Base de datos de dominio conservada . Centro Nacional de Información Biotecnológica . Consultado el 11 de marzo de 2015 .
  29. ^ Uhlen M, Oksvold P, Fagerberg L, Lundberg E, Jonasson K, Forsberg M, Zwahlen M, Kampf C, Wester K, Hober S, Wernerus H, Björling L, Ponten F (2010). "Hacia un atlas de proteínas humanas basado en el conocimiento". El Atlas de las proteínas humanas . 28 (12). Biotecnología nacional: 1248-1250. doi :10.1038/nbt1210-1248. PMID  21139605. S2CID  26688909 . Consultado el 11 de marzo de 2015 .
  30. ^ "CXorf66 -Endometriosis". Perfil NCBI GEO . Centro Nacional de Información Biotecnológica . Consultado el 11 de marzo de 2015 .
  31. ^ Wang, M.; et al. "PaxDb CXorf66". PaxDb: abundancia de proteínas en todos los organismos . Proteómica de células Mol . Consultado el 11 de marzo de 2015 .
  32. ^ "CXorf66 - Miocardiopatía dilatada: tabique". Perfil NCBI GEO . Centro Nacional de Información Biotecnológica . Consultado el 11 de marzo de 2015 .
  33. ^ "Exposición ocupacional al benceno: células mononucleares de sangre periférica (HumanRef-8)". Perfil NCBI GEO . Centro Nacional de Información Biotecnológica . Consultado el 11 de marzo de 2015 .

enlaces externos