Gen codificador de proteínas en la especie Homo sapiens
C2orf16 es una proteína que en los seres humanos está codificada por el gen C2orf16. La isoforma 2 de esta proteína (NCBI ID: CAH18189.1 [4] de ahora en adelante denominada C2orf16) tiene una longitud de 1984 aminoácidos. [5] El gen contiene 1 exón y está ubicado en 2p23.3. [6] Los alias para C2orf16 incluyen Marco de lectura abierto 16 en el cromosoma 2 y secuencias que contienen repeticiones PSERSHHS. [7]
Se conocen 68 ortólogos de este gen, incluso en ratones y ovejas, pero no se han encontrado parálogos . [8]
Gene
La isoforma 2 de C2orf16 es un gen de 6,2 kb y 1 exón en el locus 2p23.3, y contiene repeticiones PSERSHHS en el lado C-terminal del gen desde el aminoácido 1.559 hasta el 1.903. Estas repeticiones parecen haber surgido de un elemento transponible . Los primates muestran más repeticiones PSERSHHS que otros ortólogos mamíferos . [6]
No se ha observado que C2orf16 tenga una expresión sensible a la rapamicina . [13] También se ha observado que C2orf16 aumenta significativamente la expresión en células de cáncer de mama con inactivación de c-MYC . [14]
ARNm
Isoformas
Existen dos isoformas de C2orf16. La isoforma 1 tiene una longitud de 5388 aminoácidos codificados en 5 exones sobre 16 401 pares de bases . La isoforma 2 utiliza un sitio de inicio de transcripción alternativo y es considerablemente más corta, con 1984 aminoácidos codificados en 1 exón sobre 6200 pares de bases. [8]
Regulación de la expresión
Se predice que un miRNA se une al 3'UTR de C2orf16, número de acceso MI0005564. [15] [16]
Proteína
C2orf16 tiene un peso molecular previsto de 224 kD y un punto isoeléctrico previsto de 10,08, [17] valores que son relativamente constantes entre ortólogos. La proteína incluye una composición de serina, histidina y arginina superior a la media y una composición de alanina inferior a la media. [18]
Características compositivas
Se encuentra un grupo de carga positiva desde los residuos de aminoácidos 1.274 a 1.302. [18]
Una región rica en arginina se encuentra entre los aminoácidos 1.545 y 1.933, una región rica en serina se encuentra entre los aminoácidos 1.568 y 1.934, y una región rica en histidina se encuentra entre los aminoácidos 1.630 y 1.853. [18]
Un análisis de matriz de puntos [19] revela una región muy repetida desde aproximadamente el residuo 1.500 hasta el 1.984, siendo esta la repetición PSERSHHS. una pequeña banda de puntos aproximadamente en el aminoácido 1.200 denota media repetición de la secuencia PSERSHHS.
La isoforma 2 de C2orf16 no tiene dominios transmembrana [ 20] y se predice que se localizará en el núcleo después de la traducción debido a dos secuencias de localización nuclear predichas en los residuos 1233 y 1281. [21] No se conserva ninguna secuencia de exportación nuclear entre los ortólogos, [22] lo que sugiere que C2orf16 no está destinado a abandonar el núcleo después de la importación. No se predijeron modificaciones en los extremos N o C. [23] [24] [25] [26]
Localización subcelular
Se predice que C2orf16 se localizará en el núcleo después de la transcripción. [8]
Estructura
Se predice que la estructura 3D de C2orf16 tiene tres dominios principales. El dominio 1 va de los aminoácidos 1 a 662, el dominio 2 va de los aminoácidos 674 a 1.487 y el dominio 3 va de los aminoácidos 1.488 a 1.984. [27] Se predice que los dominios 1 y 2 están conectados a través de un tramo de 12 aminoácidos que no están organizados de otra manera en una estructura secundaria que permite flexibilidad entre los dominios 1 y 2. Se predice que el dominio 2 tiene dominios de interacción de proteínas para factores de transcripción . [27] Se predice que el dominio 3 sigue una estructura de "bolas en una cuerda" [27] y tiene muchos sitios para una posible fosforilación. [28]
Se conocen 68 ortólogos de C2orf16. [8] La proteína parece haber aparecido en la historia evolutiva de los mamíferos hace 320 millones de años, cerca de la divergencia de los mamíferos de los reptiles. Esta historia explicaría por qué no existen ortólogos en anfibios , reptiles , aves ni otras especies más distantemente relacionadas. [30]
Es posible que la repetición del transposón haya sido reintroducida en los mamíferos mediante un vector viral .
Repetir secuencia
Se observa que la secuencia de repetición PSERSHHS se conserva en ortólogos para C2orf16, y se conserva en organismos tan distantemente relacionados como el moho mucilaginoso oomiceto [31] y plantas, incluidos los cloroplastos de la acacia de Ashby . [32] Se observa que la porción SPSER de la repetición es la más importante para la conservación, como se ve por la alineación con estos ortólogos y por la creación de un Logo. [33]
El análisis de conservación de la repetición muestra que el SPS inicial está altamente conservado, posiblemente para la fosforilación (S) y la estructura (P), y el R está casi completamente conservado, mutando a una lisina en algunos ortólogos, [32] lo que implica que la carga positiva es necesaria para el propósito de la repetición.
La forma 3D de la secuencia repetida no está clara, ya que se ha predicho que tendrá una estructura de bolas en una cuerda [34] o de lámina beta antiparalela [6] .
Función
Se predice que la isoforma 2 de C2orf16 tiene una posible función en la regulación de la mitosis a través de su localización nuclear, [8] [21] sitio de unión del factor de transcripción predicho, [27] asociación física con Myc , [29] y mayor expresión en células de cáncer de mama con supresión de c-MYC. [14]
Importancia clínica
Hay cuatro patentes registradas para C2orf16, una de ellas involucra: mutaciones cancerosas PPP2RIA y ARID1A , [35] predisposición al Alzheimer , [36] diversidad de vacunas virales , [37] y relación de variación del número de copias con inmunodeficiencia variable común . [38] También se ha demostrado que C2orf16 tiene una mayor expresión en algunas líneas de cáncer de mama, [14] además de estar involucrado con Myc [29] que es un oncogén común , lo que hace que C2orf16 sea un posible oncogén al que apuntar en tratamientos contra el cáncer.
Referencias
^ abc GRCh38: Lanzamiento de Ensembl 89: ENSG00000221843 – Ensembl , mayo de 2017
^ "Referencia de PubMed humana:". Centro Nacional de Información Biotecnológica, Biblioteca Nacional de Medicina de EE. UU .
^ "Referencia PubMed de ratón:". Centro Nacional de Información Biotecnológica, Biblioteca Nacional de Medicina de EE. UU . .
^ "Proteína hipotética [Homo sapiens] – Proteína – NCBI". www.ncbi.nlm.nih.gov . Consultado el 2 de mayo de 2019 .
^ "Gen C2orf16". Base de datos de genes humanos GeneCards . Instituto Weizmann de Ciencias, Life Map Sciences . Consultado el 5 de febrero de 2019 .
^ abc «C2orf16 – Proteína no caracterizada C2orf16 – Homo sapiens (humano) – Gen y proteína C2orf16». www.uniprot.org . Consultado el 2019-05-02 .
^ "Gen C2orf16". Base de datos de genes humanos GeneCards . Instituto Weizmann de Ciencias, Life Map Sciences . Consultado el 5 de febrero de 2019 .
^ abcde Zerbino DR, Achuthan P, Akanni W, Amode MR, Barrell D, Bhai J, et al. (Enero de 2018). "Conjunto 2018". Investigación de ácidos nucleicos . 46 (D1): D754–D761. doi :10.1093/nar/gkx1098. PMC 5753206 . PMID 29155950.
^ Johnson JM, Castle J, Garrett-Engele P, Kan Z, Loerch PM, Armour CD, Santos R, Schadt EE, Stoughton R, Shoemaker DD (diciembre de 2003). "Estudio de todo el genoma sobre empalme alternativo de pre-ARNm humano con microarreglos de unión de exones". Science . 302 (5653): 2141–4. Bibcode :2003Sci...302.2141J. doi :10.1126/science.1090100. PMID 14684825. S2CID 10007258.
^ "Gen C2orf16 del Homo sapiens, que codifica el marco de lectura abierto 16 del cromosoma 2". AceView . NCBI Instituto Nacional de Salud . Consultado el 5 de febrero de 2019 .
^ "EST Profile – Hs.131021" (Perfil EST – Hs.131021). www.ncbi.nlm.nih.gov . Consultado el 2 de mayo de 2019 .
^ Xie D, Chen CC, Ptaszek LM, Xiao S, Cao X, Fang F, Ng HH, Lewin HA, Cowan C, Zhong S (junio de 2010). "Redes reguladoras de genes reconectables en el desarrollo embrionario preimplantacional de tres especies de mamíferos". Genome Research . 20 (6): 804–15. doi :10.1101/gr.100594.109. PMC 2877577 . PMID 20219939.
^ Petrich AM, Leshchenko V, Kuo PY, Xia B, Thirukonda VK, Ulahannan N, Gordon S, Fazzari MJ, Ye BH, Sparano JA, Parekh S (mayo de 2012). "Los inhibidores de Akt MK-2206 y nelfinavir superan la resistencia a los inhibidores de mTOR en el linfoma difuso de células B grandes". Investigación clínica del cáncer . 18 (9): 2534–44. doi :10.1158/1078-0432.CCR-11-1407. PMC 3889476 . PMID 22338016.
^ abc Cappellen D, Schlange T, Bauer M, Maurer F, Hynes NE (enero de 2007). "Nuevos genes diana de c-MYC median efectos diferenciales en la proliferación y migración celular". EMBO Reports . 8 (1): 70–6. doi :10.1038/sj.embor.7400849. PMC 1796762 . PMID 17159920.
^ Agarwal V, Bell GW, Nam JW, Bartel DP (agosto de 2015). Izaurralde E (ed.). "Predicción de sitios diana de microARN eficaces en ARNm de mamíferos". eLife . 4 : e05005. doi : 10.7554/eLife.05005 . PMC 4532895 . PMID 26267216.
^ "Entrada de miRNA para MI0005564". www.mirbase.org . Archivado desde el original el 23 de septiembre de 2020 . Consultado el 5 de mayo de 2019 .
^ "ExPASy – Compute pI/Mw tool" (Herramienta para calcular pI/Mw de ExPASy). web.expasy.org . Consultado el 2 de mayo de 2019 .
^ abc Madeira F, Park YM, Lee J, Buso N, Gur T, Madhusoodanan N, Basutkar P, Tivey AR, Potter SC, Finn RD, Lopez R (abril de 2019). "Las API de las herramientas de búsqueda y análisis de secuencias EMBL-EBI en 2019". Nucleic Acids Research . 47 (W1): W636–W641. doi :10.1093/nar/gkz268. PMC 6602479 . PMID 30976793.
^ "EMBOSS: dotmatcher". www.bioinformatics.nl . Consultado el 2 de mayo de 2019 .
^ Cserzö M, Eisenhaber F, Eisenhaber B, Simon I (septiembre de 2002). "Sobre el filtrado de predicciones de proteínas transmembrana con resultados falsos positivos". Ingeniería de proteínas . 15 (9): 745–52. doi : 10.1093/protein/15.9.745 . PMID 12456873.
^ ab Sigrist CJ, Cerutti L, de Castro E, Langendijk-Genevaux PS, Bulliard V, Bairoch A, Hulo N (enero de 2010). "PROSITE, una base de datos de dominios de proteínas para anotación y caracterización funcional". Investigación de ácidos nucleicos . 38 (Problema de base de datos): D161-6. doi : 10.1093/nar/gkp885. PMC 2808866 . PMID 19858104.
^ la Cour T, Kiemer L, Mølgaard A, Gupta R, Skriver K, Brunak S (junio de 2004). "Análisis y predicción de señales de exportación nuclear ricas en leucina". Ingeniería, diseño y selección de proteínas . 17 (6): 527–36. doi : 10.1093/protein/gzh062 . PMID: 15314210.
^ Kiemer L, Bendtsen JD, Blom N (abril de 2005). "NetAcet: predicción de sitios de acetilación N-terminal". Bioinformática . 21 (7): 1269–70. doi : 10.1093/bioinformatics/bti130 . PMID 15539450.
^ Bolonia G, Yvon C, Duvaud S, Veuthey AL (junio de 2004). "Predicciones de miristoilación N-terminal mediante conjuntos de redes neuronales". Proteómica . 4 (6): 1626–32. doi :10.1002/pmic.200300783. PMID 15174132. S2CID 20289352.
^ Chuang GY, Boyington JC, Joyce MG, Zhu J, Nabel GJ, Kwong PD, Georgiev I (septiembre de 2012). "Predicción computacional de la glicosilación ligada a N que incorpora propiedades y patrones estructurales". Bioinformática . 28 (17): 2249–55. doi :10.1093/bioinformatics/bts426. PMC 3426846 . PMID 22782545.
^ Julenius K (agosto de 2007). "NetCGlyc 1.0: predicción de sitios de C-manosilación en mamíferos". Glycobiology . 17 (8): 868–76. doi : 10.1093/glycob/cwm050 . PMID 17494086.
^ abcd Yang J, Zhang Y (julio de 2015). "Servidor I-TASSER: nuevo desarrollo para predicciones de la estructura y función de proteínas". Nucleic Acids Research . 43 (W1): W174-81. doi :10.1093/nar/gkv342. PMC 4489253 . PMID 25883148.
^ Blom N, Gammeltoft S, Brunak S (diciembre de 1999). "Predicción basada en la secuencia y la estructura de los sitios de fosforilación de proteínas eucariotas". Journal of Molecular Biology . 294 (5): 1351–62. doi :10.1006/jmbi.1999.3310. PMID 10600390.
^ abc "PSICQUIC View". www.ebi.ac.uk . Consultado el 2 de mayo de 2019 .
^ ab Madden, Tom (13 de agosto de 2003). La herramienta de análisis de secuencias BLAST. Centro Nacional de Información Biotecnológica (EE. UU.).
^ "Proteína precursora de repetición ácida específica para la germinación de quistes [Phytophthora infestans]". NCBI . Consultado el 2 de mayo de 2019 .
^ ab "accD (cloroplasto) [Acacia ashbyae] – Proteína – NCBI". www.ncbi.nlm.nih.gov . Consultado el 2 de mayo de 2019 .
^ "WebLogo – Crear logotipos secuenciales". weblogo.berkeley.edu . Consultado el 2 de mayo de 2019 .
^ Zhang Y (enero de 2008). "Servidor I-TASSER para predicción de la estructura 3D de proteínas". BMC Bioinformatics . 9 (1): 40. doi : 10.1186/1471-2105-9-40 . PMC 2245901 . PMID 18215316.
^ US 9982304, Vogelstein, Bert; Kinzler, Kenneth W.; Velculescu, Victor; Papadopoulos, Nickolas; Jones, Sian, "Mutaciones ARID1A y PPP2R1A en el cáncer", publicado el 29 de mayo de 2018
^ US 9944986, Nagy, Zsuzsanna, "Objetivos terapéuticos para la enfermedad de Alzheimer", publicado el 29 de mayo de 2018
^ US 9439960, Shenk, Thomas y Wang Dai, "Vacunas contra el citomegalovirus y métodos de producción", publicado el 13 de septiembre de 2016
^ Estados Unidos 9109254, Hakonarson, Hakon; Glessner, José; Orange, Jordania, publicado el 18 de agosto de 2015