La TSBP1 es una proteína que en los humanos está codificada por el gen TSBP1 . [3] [4] La TSBP1 se conocía anteriormente como C6orf10 . C6orf10 es un marco de lectura abierto en el cromosoma 6 que contiene una proteína que se expresa de forma ubicua en niveles bajos en el genoma adulto y puede desempeñar un papel durante el desarrollo fetal. Se ha descubierto que C6orf10 está vinculada a enfermedades neurodegenerativas y autoinmunes en adultos. La expresión de este gen es más alta en los testículos , pero también se observa en otros tipos de tejidos como el cerebro , el cristalino del ojo y el bulbo raquídeo . [5] [6] [7]
Esta isoforma contiene dos regiones transmembrana cerca del comienzo de la secuencia de aminoácidos. [13] La primera región transmembrana se extiende desde el residuo 6 hasta el residuo 25 (19 residuos en total) y tiene un punto isoeléctrico de 5. La segunda región transmembrana se extiende desde el residuo 100 hasta el residuo 119 (19 residuos en total) y tiene un punto isoeléctrico de 8. La isoforma a contiene un dominio PTZ00121 [14] que comienza con el residuo 221 y continúa hasta el final de la proteína. Hay varias secuencias repetitivas dentro de este dominio.
Estructura secundaria
La TSBP1 se compone principalmente de hélices alfa y espirales aleatorias. [15] Solo hay unas pocas regiones que contienen láminas beta . [16] [17]
Localización subcelular
Se predice que TSBP1 se localiza en el núcleo y el retículo endoplasmático. [13] Hay un sitio de escisión del péptido señal entre los aminoácidos 30 y 31 [18] que incluye el primer dominio transmembrana. Esta región N-terminal de C6orf10 probablemente se localiza en el retículo endoplasmático. La región C-terminal de la proteína contiene dos señales de localización nuclear de los aminoácidos 489-505 y 513-529, lo que indica que la sección de la proteína después del sitio de escisión del péptido señal se localiza en el núcleo.
Expresión
El gen TSBP1 se expresa de forma ubicua en niveles bajos en el genoma humano adulto . En los adultos, la expresión de este gen es más alta en los testículos. [19] El gen C6orf10 se expresa en niveles más altos en los tejidos fetales y embrionarios . Esto indica que el gen C6orf10 puede desempeñar un papel en el desarrollo.
Perfil de expresión tisular del gen C6orf10 en embriones preimplantadosPerfil de expresión tisular de C6orf10 en adultos. Los puntos naranjas indican un nivel de expresión muy bajo, mientras que la barra azul indica una expresión alta. [19]
Regulación de la expresión
Transcripcional
TSBP1 tiene un promotor de 1206 bases de longitud. [20] Este promotor se superpone con el UTR 3' pero termina antes del primer codón . Este promotor está bastante bien conservado en los primates , excepto por una región de 136 nucleótidos a mitad de camino y al final de la región promotora. [21] Los primates tienen inserciones en estas dos regiones que los humanos no tienen. Esto puede sugerir que estas regiones del promotor no son esenciales para los humanos.
Factores de transcripción
La transcripción de TSBP1 está regulada por la unión de muchos factores de transcripción a la región promotora. La proteína de unión CCAAT y la caja TATA son regiones altamente conservadas que son importantes en el inicio de la transcripción . Varios de los factores de transcripción, incluidos EH1 , NACA , NKX5-2, SIX4 , VCR, etc., están involucrados en las vías de desarrollo. [20]
Interacciones de proteínas
La mayoría de las interacciones de proteínas predichas con C6orf10 se basan únicamente en minería de texto e información recopilada de estudios de asociación de todo el genoma . Las dos proteínas con las puntuaciones de interacción más altas fueron la proteína similar a butirofilina 2 ( BTNL2 ) y el dominio de repetición de tetratricopéptido que contiene TTC32 . [22] BTNL2 es un regulador negativo de la actividad de las células T y miembro de la superfamilia de inmunoglobulinas . BTNL2 se encuentra en el vecindario del gen C6orf10. TTC32 es de una familia de proteínas de motivos de repetición estructural que median las interacciones proteína-proteína en la formación de complejos proteína-proteína. [23] Esto puede indicar el potencial de C6orf10 para interactuar con otra proteína para formar un complejo .
Al buscar interacciones proteína-proteína en la base de datos NCBI BLAST [30] , se encontró que C6orf10 es una proteína que solo se encuentra en mamíferos . La base de datos BLAST encontró el mayor número de homólogos en Primates , Artiodactyla y Carnivora . Solo hubo un par de homólogos en los órdenes taxonómicos de Rodentia , Chiroptera y Perissodactyla . En los órdenes de Scandentia , Eulipotyphyla , Tubulidentata y sirenia solo hubo un homólogo completo, pero existen algunas secuencias parciales. Hubo secuencias de proteínas parciales en Lagomorpha , Dermoptera y Macroscelidea y no hubo ortólogos en Diprotodontia , Didelphimorphia , Cetacea , Dasyuromorphia , Pilosa , Monotremata y Proboscidea . No se encontraron homólogos fuera de los mamíferos.
Ortólogos de la isoforma X4 de C6orf10
Parálogos
C6orf10 tiene un parálogo que divergió hace unos 135,6 millones de años. Este parálogo se llama proteína 2 que contiene el dominio de tiorredoxina (TXNDC2). [30]
[1] BLAST: herramienta de búsqueda de alineamiento local básico. Centro Nacional de Información Biotecnológica. Disponible en: https://blast.ncbi.nlm.nih.gov/Blast.cgi. Fecha de acceso: 4 de marzo de 2019.
Referencias
^ abc ENSG00000236672, ENSG00000204296, ENSG00000206310, ENSG00000234280, ENSG00000237881, ENSG00000232106, ENSG00000226892 GRCh38: Versión 89 de Ensembl: ENSG00000206245, ENSG00000236672, ENSG00000204296, ENSG00000206310, ENSG00000234280, ENSG00000237881, ENSG00000232106, ENSG00000226892 – Ensembl Mayo de 2017
^ "Referencia de PubMed humana:". Centro Nacional de Información Biotecnológica, Biblioteca Nacional de Medicina de EE. UU .
^ Stammers M, Rowen L, Rhodes D, Trowsdale J, Beck S (abril de 2000). "BTL-II: un locus polimórfico con homología con la familia de genes de la butirofilina, ubicado en el límite de las regiones de clase II y clase III del complejo mayor de histocompatibilidad en humanos y ratones". Inmunogenética . 51 (4–5): 373–82. doi :10.1007/s002510050633. PMID 10803852. S2CID 31938388.
^ "Gen Entrez: C6orf10 cromosoma 6 marco de lectura abierto 10".
^ "AceView: Gene:C6orf10, una anotación completa de genes humanos, de ratones y de gusanos con ARNm o ESTsAceView". www.ncbi.nlm.nih.gov . Consultado el 25 de febrero de 2019 .
^ "Proteína básica 1 expresada en testículos TSBP1 [Homo sapiens (humano)] - Gen - NCBI". www.ncbi.nlm.nih.gov . Consultado el 25 de febrero de 2019 .
^ "Expresión tisular de C6orf10 - Resumen - Atlas de proteínas humanas" www.proteinatlas.org . Consultado el 25 de febrero de 2019 .
^ "Clustal Omega < Multiple Sequence Alignment < EMBL-EBI" (en inglés). www.ebi.ac.uk. Consultado el 6 de mayo de 2019 .
^ "MView < Multiple Sequence Alignment < EMBL-EBI" (MView < Alineación de secuencias múltiples < EMBL-EBI) en www.ebi.ac.uk. Consultado el 6 de mayo de 2019 .
^ "El servidor web Mfold | mfold.rit.albany.edu". unafold.rna.albany.edu . Consultado el 5 de mayo de 2019 .
^ "SAPS < Sequence Statistics < EMBL-EBI" (en inglés). www.ebi.ac.uk. Consultado el 6 de mayo de 2019 .
^ "ExPASy - Compute pI/Mw tool" (Herramienta para calcular pI/Mw de ExPASy). web.expasy.org . Consultado el 6 de mayo de 2019 .
^ ab "Predicción PSORT II". psort.hgc.jp . Consultado el 6 de mayo de 2019 .
^ "NCBI CDD CDD Conserved Protein Domain Neuromodulin_N" (Dominio proteico conservado de la neuromodulina N del CDD del NCBI). www.ncbi.nlm.nih.gov . Consultado el 6 de mayo de 2019 .
^ "Salida de bobinas". embnet.vital-it.ch . Consultado el 6 de mayo de 2019 .
^ "CFSSP: Servidor de predicción de estructura secundaria de Chou & Fasman" www.biogem.org . Consultado el 6 de mayo de 2019 .
^ "Archivado". Archivado desde el original el 6 de mayo de 2019. Consultado el 30 de mayo de 2023 .[ enlace muerto ]
^ "Servidor ProP 1.0: resultados de predicción" www.cbs.dtu.dk . Consultado el 6 de mayo de 2019 .
^ ab "Proteína básica 1 expresada en testículos TSBP1 [Homo sapiens (humano)] - Gen - NCBI". www.ncbi.nlm.nih.gov . Consultado el 6 de mayo de 2019 .
^ ab "Genomatix - Análisis de datos NGS y medicina personalizada". www.genomatix.de . Consultado el 6 de mayo de 2019 .
^ "Búsqueda BLAT humana". genome.ucsc.edu . Consultado el 6 de mayo de 2019 .
^ "STRING: redes funcionales de asociación de proteínas". string-db.org . Consultado el 6 de mayo de 2019 .
^ Zeytuni N, Zarivach R (marzo de 2012). "Discusión estructural y funcional de la repetición tetra-trico-peptídica, un módulo de interacción proteica". Structure . 20 (3): 397–405. doi : 10.1016/j.str.2012.01.006 . PMID 22404999.
^ abcde Zhang M, Ferrari R, Tartaglia MC, Keith J, Surace EI, Wolf U, et al. (octubre de 2018). "Un locus C6orf10/LOC101929163 está asociado con la edad de aparición en portadores de C9orf72". Brain . 141 (10): 2895–2907. doi :10.1093/brain/awy238. PMC 6158742 . PMID 30252044.
^ Verma A, Basile AO, Bradford Y, Kuivaniemi H, Tromp G, Carey D, Gerhard GS, Crowe JE, Ritchie MD, Pendergrass SA (2016). "Estudio de asociación de todo el fenoma para explorar las relaciones entre los loci genéticos relacionados con el sistema inmunitario y los rasgos y enfermedades complejos". PLOS ONE . 11 (8): e0160573. Bibcode :2016PLoSO..1160573V. doi : 10.1371/journal.pone.0160573 . PMC 4980020 . PMID 27508393.
^ Zheng W, Rao S (agosto de 2015). "Análisis basado en el conocimiento de las asociaciones genéticas de la artritis reumatoide para informar los estudios que buscan genes pleiotrópicos: una revisión de la literatura y un análisis de redes". Arthritis Research & Therapy . 17 (1): 202. doi : 10.1186/s13075-015-0715-1 . PMC 4529690 . PMID 26253105.
^ ab Malavia TA, Chaparala S, Wood J, Chowdari K, Prasad KM, McClain L, Jegga AG, Ganapathiraju MK, Nimgaonkar VL (2017). "Generación de hipótesis comprobables para la patogénesis de la esquizofrenia y la artritis reumatoide mediante la integración de datos epidemiológicos, genómicos y de interacción proteica". npj Schizophrenia . 3 : 11. doi :10.1038/s41537-017-0010-z. PMC 5441529 . PMID 28560257.
^ Feng BJ, Sun LD, Soltani-Arabshahi R, Bowcock AM, Nair RP, Stuart P, Elder JT, Schrodi SJ, Begovich AB, Abecasis GR, Zhang XJ, Callis-Duffin KP, Krueger GG, Goldgar DE (agosto de 2009). "Múltiples loci dentro del complejo mayor de histocompatibilidad confieren riesgo de psoriasis". PLOS Genetics . 5 (8): e1000606. doi : 10.1371/journal.pgen.1000606 . PMC 2718700 . PMID 19680446.
^ Lin X, Deng FY, Mo XB, Wu LF, Lei SF (enero de 2015). "Relevancia funcional de las variantes genéticas asociadas a la esclerosis múltiple". Inmunogenética . 67 (1): 7–14. doi :10.1007/s00251-014-0803-4. PMID 25308886. S2CID 16113524.
^ ab "BLAST: herramienta básica de búsqueda de alineaciones locales". blast.ncbi.nlm.nih.gov . Consultado el 6 de mayo de 2019 .
Ficarro S, Chertihin O, Westbrook VA, White F, Jayes F, Kalab P, Marto JA, Shabanowitz J, Herr JC, Hunt DF, Visconti PE (marzo de 2003). "Análisis del fosfoproteoma de espermatozoides humanos capacitados. Evidencia de fosforilación de tirosina de una proteína de anclaje de quinasa 3 y proteína/p97 que contiene valosina durante la capacitación". The Journal of Biological Chemistry . 278 (13): 11579–89. doi : 10.1074/jbc.M202325200 . PMID 12509440.
Suzuki Y, Yoshitomo-Nakagawa K, Maruyama K, Suyama A, Sugano S (octubre de 1997). "Construcción y caracterización de una biblioteca de ADNc enriquecida en longitud completa y enriquecida en el extremo 5'". Gene . 200 (1–2): 149–56. doi :10.1016/S0378-1119(97)00411-3. PMID 9373149.
Maruyama K, Sugano S (enero de 1994). "Oligo-capping: un método simple para reemplazar la estructura de capuchón de los ARNm eucariotas con oligorribonucleótidos". Gene . 138 (1–2): 171–4. doi :10.1016/0378-1119(94)90802-8. PMID 8125298.