stringtranslate.com

C2orf16

C2orf16 es una proteína que en los seres humanos está codificada por el gen C2orf16. La isoforma 2 de esta proteína (NCBI ID: CAH18189.1 [4] de ahora en adelante denominada C2orf16) tiene una longitud de 1984 aminoácidos. [5] El gen contiene 1 exón y está ubicado en 2p23.3. [6] Los alias para C2orf16 incluyen Marco de lectura abierto 16 en el cromosoma 2 y secuencias que contienen repeticiones PSERSHHS. [7]

Se conocen 68 ortólogos de este gen, incluso en ratones y ovejas, pero no se han encontrado parálogos . [8]

Gene

La isoforma 2 de C2orf16 es un gen de 6,2 kb y 1 exón en el locus 2p23.3, y contiene repeticiones PSERSHHS en el lado C-terminal del gen desde el aminoácido 1.559 hasta el 1.903. Estas repeticiones parecen haber surgido de un elemento transponible . Los primates muestran más repeticiones PSERSHHS que otros ortólogos mamíferos . [6]

Expresión

Se ha descubierto que C2orf16 se expresa en gran medida en los testículos [9] y en una línea de células madre embrionarias humanas tratadas con ácido retinoico y mitógeno , [10] pero no se sabe que se exprese de manera diferente en función de la edad o los fenotipos de la enfermedad . [11] También se ha observado que C2orf16 tiene una alta expresión en el embrión de preimplantación desde la etapa de embrión de 4 células hasta la etapa de blastocisto . [12]

No se ha observado que C2orf16 tenga una expresión sensible a la rapamicina . [13] También se ha observado que C2orf16 aumenta significativamente la expresión en células de cáncer de mama con inactivación de c-MYC . [14]

ARNm

Isoformas

Existen dos isoformas de C2orf16. La isoforma 1 tiene una longitud de 5388 aminoácidos codificados en 5 exones sobre 16 401 pares de bases . La isoforma 2 utiliza un sitio de inicio de transcripción alternativo y es considerablemente más corta, con 1984 aminoácidos codificados en 1 exón sobre 6200 pares de bases. [8]

Regulación de la expresión

Se predice que un miRNA se une al 3'UTR de C2orf16, número de acceso MI0005564. [15] [16]

Proteína

C2orf16 tiene un peso molecular previsto de 224 kD y un punto isoeléctrico previsto de 10,08, [17] valores que son relativamente constantes entre ortólogos. La proteína incluye una composición de serina, histidina y arginina superior a la media y una composición de alanina inferior a la media. [18]

Características compositivas

Se encuentra un grupo de carga positiva desde los residuos de aminoácidos 1.274 a 1.302. [18]

Una región rica en arginina se encuentra entre los aminoácidos 1.545 y 1.933, una región rica en serina se encuentra entre los aminoácidos 1.568 y 1.934, y una región rica en histidina se encuentra entre los aminoácidos 1.630 y 1.853. [18]

Un análisis de matriz de puntos [19] revela una región muy repetida desde aproximadamente el residuo 1.500 hasta el 1.984, siendo esta la repetición PSERSHHS. una pequeña banda de puntos aproximadamente en el aminoácido 1.200 denota media repetición de la secuencia PSERSHHS.

Análisis de matriz de puntos de la isoforma 2 de la proteína no caracterizada C2orf16. La secuencia de repetición PSERSHHS se visualiza a través del área más oscura de la matriz desde el aminoácido 1500 hasta 1984, y la mitad de la secuencia de repetición PSERSHHS se ve como una banda cerca del aminoácido 1200.

La isoforma 2 de C2orf16 no tiene dominios transmembrana [ 20] y se predice que se localizará en el núcleo después de la traducción debido a dos secuencias de localización nuclear predichas en los residuos 1233 y 1281. [21] No se conserva ninguna secuencia de exportación nuclear entre los ortólogos, [22] lo que sugiere que C2orf16 no está destinado a abandonar el núcleo después de la importación. No se predijeron modificaciones en los extremos N o C. [23] [24] [25] [26]

Localización subcelular

Se predice que C2orf16 se localizará en el núcleo después de la transcripción. [8]

Estructura

Estructura tridimensional predicha de la isoforma 2 de C2orf16 que muestra los tres dominios principales de la proteína. El dominio 3 contiene la secuencia repetida PSERSHHS.

Se predice que la estructura 3D de C2orf16 tiene tres dominios principales. El dominio 1 va de los aminoácidos 1 a 662, el dominio 2 va de los aminoácidos 674 a 1.487 y el dominio 3 va de los aminoácidos 1.488 a 1.984. [27] Se predice que los dominios 1 y 2 están conectados a través de un tramo de 12 aminoácidos que no están organizados de otra manera en una estructura secundaria que permite flexibilidad entre los dominios 1 y 2. Se predice que el dominio 2 tiene dominios de interacción de proteínas para factores de transcripción . [27] Se predice que el dominio 3 sigue una estructura de "bolas en una cuerda" [27] y tiene muchos sitios para una posible fosforilación. [28]

Interacciones de proteínas

Se ha demostrado que C2orf16 tiene una interacción física con el protooncogén Myc mediante purificación por afinidad en tándem . [29]

Filogenia del ortólogo

Se conocen 68 ortólogos de C2orf16. [8] La proteína parece haber aparecido en la historia evolutiva de los mamíferos hace 320 millones de años, cerca de la divergencia de los mamíferos de los reptiles. Esta historia explicaría por qué no existen ortólogos en anfibios , reptiles , aves ni otras especies más distantemente relacionadas. [30]

Es probable que cualquier ortólogo de especies más distantes de los humanos que otros mamíferos no esté relacionado funcionalmente, sin embargo, la repetición PSERSHHS está presente en peces óseos , crustáceos , stramenopiles (incluido el tizón de la papa) , plantae y procariotas . [30]

Es posible que la repetición del transposón haya sido reintroducida en los mamíferos mediante un vector viral .

Repetir secuencia

Logotipo de secuencia repetida de PSERSHHS

Se observa que la secuencia de repetición PSERSHHS se conserva en ortólogos para C2orf16, y se conserva en organismos tan distantemente relacionados como el moho mucilaginoso oomiceto [31] y plantas, incluidos los cloroplastos de la acacia de Ashby . [32] Se observa que la porción SPSER de la repetición es la más importante para la conservación, como se ve por la alineación con estos ortólogos y por la creación de un Logo. [33]

El análisis de conservación de la repetición muestra que el SPS inicial está altamente conservado, posiblemente para la fosforilación (S) y la estructura (P), y el R está casi completamente conservado, mutando a una lisina en algunos ortólogos, [32] lo que implica que la carga positiva es necesaria para el propósito de la repetición.

La forma 3D de la secuencia repetida no está clara, ya que se ha predicho que tendrá una estructura de bolas en una cuerda [34] o de lámina beta antiparalela [6] .

Función

Se predice que la isoforma 2 de C2orf16 tiene una posible función en la regulación de la mitosis a través de su localización nuclear, [8] [21] sitio de unión del factor de transcripción predicho, [27] asociación física con Myc , [29] y mayor expresión en células de cáncer de mama con supresión de c-MYC. [14]

Importancia clínica

Hay cuatro patentes registradas para C2orf16, una de ellas involucra: mutaciones cancerosas PPP2RIA y ARID1A , [35] predisposición al Alzheimer , [36] diversidad de vacunas virales , [37] y relación de variación del número de copias con inmunodeficiencia variable común . [38] También se ha demostrado que C2orf16 tiene una mayor expresión en algunas líneas de cáncer de mama, [14] además de estar involucrado con Myc [29] que es un oncogén común , lo que hace que C2orf16 sea un posible oncogén al que apuntar en tratamientos contra el cáncer.

Referencias

  1. ^ abc GRCh38: Lanzamiento de Ensembl 89: ENSG00000221843 – Ensembl , mayo de 2017
  2. ^ "Referencia de PubMed humana:". Centro Nacional de Información Biotecnológica, Biblioteca Nacional de Medicina de EE. UU .
  3. ^ "Referencia PubMed de ratón:". Centro Nacional de Información Biotecnológica, Biblioteca Nacional de Medicina de EE. UU . .
  4. ^ "Proteína hipotética [Homo sapiens] – Proteína – NCBI". www.ncbi.nlm.nih.gov . Consultado el 2 de mayo de 2019 .
  5. ^ "Gen C2orf16". Base de datos de genes humanos GeneCards . Instituto Weizmann de Ciencias, Life Map Sciences . Consultado el 5 de febrero de 2019 .
  6. ^ abc «C2orf16 – Proteína no caracterizada C2orf16 – Homo sapiens (humano) – Gen y proteína C2orf16». www.uniprot.org . Consultado el 2019-05-02 .
  7. ^ "Gen C2orf16". Base de datos de genes humanos GeneCards . Instituto Weizmann de Ciencias, Life Map Sciences . Consultado el 5 de febrero de 2019 .
  8. ^ abcde Zerbino DR, Achuthan P, Akanni W, Amode MR, Barrell D, Bhai J, et al. (Enero de 2018). "Conjunto 2018". Investigación de ácidos nucleicos . 46 (D1): D754–D761. doi :10.1093/nar/gkx1098. PMC 5753206 . PMID  29155950. 
  9. ^ Johnson JM, Castle J, Garrett-Engele P, Kan Z, Loerch PM, Armour CD, Santos R, Schadt EE, Stoughton R, Shoemaker DD (diciembre de 2003). "Estudio de todo el genoma sobre empalme alternativo de pre-ARNm humano con microarreglos de unión de exones". Science . 302 (5653): 2141–4. Bibcode :2003Sci...302.2141J. doi :10.1126/science.1090100. PMID  14684825. S2CID  10007258.
  10. ^ "Gen C2orf16 del Homo sapiens, que codifica el marco de lectura abierto 16 del cromosoma 2". AceView . NCBI Instituto Nacional de Salud . Consultado el 5 de febrero de 2019 .
  11. ^ "EST Profile – Hs.131021" (Perfil EST – Hs.131021). www.ncbi.nlm.nih.gov . Consultado el 2 de mayo de 2019 .
  12. ^ Xie D, Chen CC, Ptaszek LM, Xiao S, Cao X, Fang F, Ng HH, Lewin HA, Cowan C, Zhong S (junio de 2010). "Redes reguladoras de genes reconectables en el desarrollo embrionario preimplantacional de tres especies de mamíferos". Genome Research . 20 (6): 804–15. doi :10.1101/gr.100594.109. PMC 2877577 . PMID  20219939. 
  13. ^ Petrich AM, Leshchenko V, Kuo PY, Xia B, Thirukonda VK, Ulahannan N, Gordon S, Fazzari MJ, Ye BH, Sparano JA, Parekh S (mayo de 2012). "Los inhibidores de Akt MK-2206 y nelfinavir superan la resistencia a los inhibidores de mTOR en el linfoma difuso de células B grandes". Investigación clínica del cáncer . 18 (9): 2534–44. doi :10.1158/1078-0432.CCR-11-1407. PMC 3889476 . PMID  22338016. 
  14. ^ abc Cappellen D, Schlange T, Bauer M, Maurer F, Hynes NE (enero de 2007). "Nuevos genes diana de c-MYC median efectos diferenciales en la proliferación y migración celular". EMBO Reports . 8 (1): 70–6. doi :10.1038/sj.embor.7400849. PMC 1796762 . PMID  17159920. 
  15. ^ Agarwal V, Bell GW, Nam JW, Bartel DP (agosto de 2015). Izaurralde E (ed.). "Predicción de sitios diana de microARN eficaces en ARNm de mamíferos". eLife . 4 : e05005. doi : 10.7554/eLife.05005 . PMC 4532895 . PMID  26267216. 
  16. ^ "Entrada de miRNA para MI0005564". www.mirbase.org . Archivado desde el original el 23 de septiembre de 2020 . Consultado el 5 de mayo de 2019 .
  17. ^ "ExPASy – Compute pI/Mw tool" (Herramienta para calcular pI/Mw de ExPASy). web.expasy.org . Consultado el 2 de mayo de 2019 .
  18. ^ abc Madeira F, Park YM, Lee J, Buso N, Gur T, Madhusoodanan N, Basutkar P, Tivey AR, Potter SC, Finn RD, Lopez R (abril de 2019). "Las API de las herramientas de búsqueda y análisis de secuencias EMBL-EBI en 2019". Nucleic Acids Research . 47 (W1): W636–W641. doi :10.1093/nar/gkz268. PMC 6602479 . PMID  30976793. 
  19. ^ "EMBOSS: dotmatcher". www.bioinformatics.nl . Consultado el 2 de mayo de 2019 .
  20. ^ Cserzö M, Eisenhaber F, Eisenhaber B, Simon I (septiembre de 2002). "Sobre el filtrado de predicciones de proteínas transmembrana con resultados falsos positivos". Ingeniería de proteínas . 15 (9): 745–52. doi : 10.1093/protein/15.9.745 . PMID  12456873.
  21. ^ ab Sigrist CJ, Cerutti L, de Castro E, Langendijk-Genevaux PS, Bulliard V, Bairoch A, Hulo N (enero de 2010). "PROSITE, una base de datos de dominios de proteínas para anotación y caracterización funcional". Investigación de ácidos nucleicos . 38 (Problema de base de datos): D161-6. doi : 10.1093/nar/gkp885. PMC 2808866 . PMID  19858104. 
  22. ^ la Cour T, Kiemer L, Mølgaard A, Gupta R, Skriver K, Brunak S (junio de 2004). "Análisis y predicción de señales de exportación nuclear ricas en leucina". Ingeniería, diseño y selección de proteínas . 17 (6): 527–36. doi : 10.1093/protein/gzh062 . PMID:  15314210.
  23. ^ Kiemer L, Bendtsen JD, Blom N (abril de 2005). "NetAcet: predicción de sitios de acetilación N-terminal". Bioinformática . 21 (7): 1269–70. doi : 10.1093/bioinformatics/bti130 . PMID  15539450.
  24. ^ Bolonia G, Yvon C, Duvaud S, Veuthey AL (junio de 2004). "Predicciones de miristoilación N-terminal mediante conjuntos de redes neuronales". Proteómica . 4 (6): 1626–32. doi :10.1002/pmic.200300783. PMID  15174132. S2CID  20289352.
  25. ^ Chuang GY, Boyington JC, Joyce MG, Zhu J, Nabel GJ, Kwong PD, Georgiev I (septiembre de 2012). "Predicción computacional de la glicosilación ligada a N que incorpora propiedades y patrones estructurales". Bioinformática . 28 (17): 2249–55. doi :10.1093/bioinformatics/bts426. PMC 3426846 . PMID  22782545. 
  26. ^ Julenius K (agosto de 2007). "NetCGlyc 1.0: predicción de sitios de C-manosilación en mamíferos". Glycobiology . 17 (8): 868–76. doi : 10.1093/glycob/cwm050 . PMID  17494086.
  27. ^ abcd Yang J, Zhang Y (julio de 2015). "Servidor I-TASSER: nuevo desarrollo para predicciones de la estructura y función de proteínas". Nucleic Acids Research . 43 (W1): W174-81. doi :10.1093/nar/gkv342. PMC 4489253 . PMID  25883148. 
  28. ^ Blom N, Gammeltoft S, Brunak S (diciembre de 1999). "Predicción basada en la secuencia y la estructura de los sitios de fosforilación de proteínas eucariotas". Journal of Molecular Biology . 294 (5): 1351–62. doi :10.1006/jmbi.1999.3310. PMID  10600390.
  29. ^ abc "PSICQUIC View". www.ebi.ac.uk . Consultado el 2 de mayo de 2019 .
  30. ^ ab Madden, Tom (13 de agosto de 2003). La herramienta de análisis de secuencias BLAST. Centro Nacional de Información Biotecnológica (EE. UU.).
  31. ^ "Proteína precursora de repetición ácida específica para la germinación de quistes [Phytophthora infestans]". NCBI . Consultado el 2 de mayo de 2019 .
  32. ^ ab "accD (cloroplasto) [Acacia ashbyae] – Proteína – NCBI". www.ncbi.nlm.nih.gov . Consultado el 2 de mayo de 2019 .
  33. ^ "WebLogo – Crear logotipos secuenciales". weblogo.berkeley.edu . Consultado el 2 de mayo de 2019 .
  34. ^ Zhang Y (enero de 2008). "Servidor I-TASSER para predicción de la estructura 3D de proteínas". BMC Bioinformatics . 9 (1): 40. doi : 10.1186/1471-2105-9-40 . PMC 2245901 . PMID  18215316. 
  35. ^ US 9982304, Vogelstein, Bert; Kinzler, Kenneth W.; Velculescu, Victor; Papadopoulos, Nickolas; Jones, Sian, "Mutaciones ARID1A y PPP2R1A en el cáncer", publicado el 29 de mayo de 2018 
  36. ^ US 9944986, Nagy, Zsuzsanna, "Objetivos terapéuticos para la enfermedad de Alzheimer", publicado el 29 de mayo de 2018 
  37. ^ US 9439960, Shenk, Thomas y Wang Dai, "Vacunas contra el citomegalovirus y métodos de producción", publicado el 13 de septiembre de 2016 
  38. ^ Estados Unidos 9109254, Hakonarson, Hakon; Glessner, José; Orange, Jordania, publicado el 18 de agosto de 2015