El componente 4 del complemento ( C4 ), en los seres humanos, es una proteína que participa en el intrincado sistema del complemento y que se origina a partir del sistema del antígeno leucocitario humano (HLA). Cumple una serie de funciones críticas en la inmunidad, la tolerancia y la autoinmunidad con los otros numerosos componentes. Además, es un factor crucial en la conexión de las vías de reconocimiento del sistema general instigadas por los complejos anticuerpo-antígeno (Ab-Ag) con las otras proteínas efectoras de la respuesta inmunitaria innata. Por ejemplo, la gravedad de un sistema del complemento disfuncional puede provocar enfermedades e infecciones fatales. Las variaciones complejas de este también pueden provocar esquizofrenia . [1] Se pensaba que la proteína C4 derivaba de un modelo alélico simple de dos locus, que sin embargo ha sido reemplazado por un modelo complejo de genes RCCX multimodular mucho más sofisticado que contiene formas largas y cortas de los genes C4A o C4B , generalmente en casetes RCCX en tándem con variación en el número de copias, que de alguna manera es paralelo a la variación en los niveles de sus respectivas proteínas dentro de una población junto con CYP21 en algunos casos dependiendo del número de casetes y si contiene el gen funcional en lugar de pseudogenes o fragmentos. [2] Originalmente definido en el contexto del sistema de grupos sanguíneos Chido/Rodgers, el modelo genético C4A-C4B está bajo investigación por su posible papel en el riesgo y desarrollo de la esquizofrenia .
Uno de los primeros estudios genéticos sobre la proteína C4 identificó dos grupos diferentes, encontrados dentro de un suero humano, llamados grupos sanguíneos Chido/Rogers (Ch/Rg). O'Neill et al. han demostrado que dos loci C4 diferentes expresan los diferentes antígenos Ch/Rg en las membranas de los eritrocitos. [3] Más específicamente, las dos proteínas, Ch y Rg, funcionan juntas como un medio para la interacción entre el complejo Ab-Ag y otros componentes del complemento. [4] Además, los dos loci están vinculados al HLA, o el análogo humano del complejo mayor de histocompatibilidad (MHC) en el brazo corto del cromosoma 6, mientras que anteriormente se creía que habían sido expresados por dos alelos codominantes en un solo locus. [3] [5] En estudios de electroforesis en gel, O'Neill et al. Se han identificado dos variantes genéticas: F, que significa la presencia (F+) o ausencia (f0/f0) de cuatro bandas de movimiento rápido, y S, que significa la presencia (S+) o ausencia (s0/s0) de cuatro bandas de movimiento lento. [3] La homogeneidad o heterogeneidad de los dos loci, con la adición de estos genes nulos (f0, s0), permiten la duplicación/no duplicación de los loci C4. [6] Por lo tanto, tener loci separados para C4, C4F y C4S (más tarde identificados como C4A o C4B, respectivamente), posiblemente explique la producción de múltiples formas alélicas, lo que lleva a la gran variación en el tamaño y el número de copias . [ cita requerida ]
Dos importantes colaboradores, Carroll y Porter, en su estudio de clonación del gen C4 humano mostraron que los seis clones contenían el mismo gen C4. [7] La proteína C4 consta de 3 subunidades (α, β y γ) que tienen pesos moleculares (PM) de ~95.000, 78.000 y 31.000, respectivamente, y todas están unidas por puentes disulfuro entre cadenas. [7] [8] [9] [10] En un estudio de Roos et al., se encontró que las cadenas α entre C4A y C4B eran ligeramente diferentes (PM de ~96.000 y 94.000, respectivamente), lo que demuestra que en realidad hay una diferencia estructural entre las dos variantes. [9] Además, implicaron que una falta de actividad C4 podría atribuirse a las diferencias estructurales entre las cadenas α. [9] Sin embargo, Carroll y Porter demostraron que hay una región de 1.500 pb que actúa como un intrón en la secuencia genómica, que creían que era la región C4d conocida, un subproducto de la actividad de C4. [7] Carroll et al. publicaron posteriormente un trabajo que caracterizaba la estructura y organización de los genes C4, que están situados en la región HLA de clase III y vinculados con C2 y el factor B en el cromosoma. [11] A través de experimentos que incluían mapeo de restricción, análisis de secuencia de nucleótidos e hibridación con C4A y C4B, encontraron que los genes son en realidad bastante similares aunque tienen sus diferencias. [11] Por ejemplo, se detectaron polimorfismos de un solo nucleótido, lo que permitió que fueran diferencias de clase entre C4A y C4B. [11] Además, las diferencias de clase y alélicas afectarían el rendimiento de las proteínas C4 con el complejo inmune. [11] Finalmente, al superponer fragmentos clonados de ADNc, pudieron determinar que los loci C4, de una longitud estimada de 16 kilobases (kb), están espaciados por 10 kb y alineados a 30 kb del locus del factor B. [10] [11]
En el mismo año, estudios relacionados identificaron una región de 98 kb del cromosoma donde los cuatro genes de clase III (que expresan C4A, C4B, C2 y factor B) están estrechamente vinculados, lo que no permite que se produzcan entrecruzamientos. [10] Utilizando variantes de proteínas visualizadas por electroforesis, los cuatro genes estructurales se localizaron entre HLA-B y HLA-D. [10] Más específicamente, verificaron el mapa molecular propuesto en el que el orden de los genes iba del factor B , C4B, C4A y C2, siendo C2 el más cercano a HLA-B. [10] En otro estudio, Law et al. continuaron profundizando, esta vez comparando las propiedades tanto de C4A como de C4B, ambos actores importantes en el sistema inmunológico humano. [12] A través de métodos que incluyen incubación, diferentes niveles de pH y tratamiento con metilamina, habían ilustrado bioquímicamente las diferentes reactividades de los genes C4. [12] Más específicamente, se ha demostrado que el C4B reacciona de manera mucho más eficiente y efectiva a pesar de la diferencia de 7 kb entre C4A y C4B. En suero completo, los alelos C4B se comportaron a una velocidad varias veces mayor durante la actividad hemolítica, en comparación directa con los alelos C4A. [12] Bioquímicamente, también encontraron que C4A reaccionaba de manera más constante con las cadenas laterales de aminoácidos de un anticuerpo y los antígenos que son grupos amino, mientras que C4B reaccionaba mejor con los grupos hidroxilo de carbohidratos. [12] Por lo tanto, al analizar las diferentes reactividades, propusieron que el polimorfismo excepcional de los genes C4 puede generar algunas ventajas biológicas (es decir, la activación del complemento con una gama más amplia de complejos Ab-Ag formados tras las infecciones). [12] Aunque en este momento, la secuencia de aminoácidos genómica y derivada de C4A o C4B aún no se había determinado. [ cita requerida ]
Los primeros estudios ampliaron enormemente el conocimiento del complejo C4, sentando las bases que allanaron el camino para descubrir las estructuras de los genes y las proteínas. C. Yu determinó con éxito la secuencia completa del gen C4A, componente del complemento humano. [4] En los hallazgos, se encontró que todo el genoma tenía 41 exones, con un total de 1744 residuos (a pesar de evitar la secuencia de un gran intrón 9). [4] La proteína C4 se sintetiza en un precursor de cadena única, que luego sufre una escisión proteolítica en tres cadenas (en orden de cómo están encadenadas, β-α-γ). [4]
La cadena β consta de 656 residuos, codificados por los exones 1-16. [4] El aspecto más destacado de la cadena β es la presencia de un intrón grande, que varía de seis a siete kilobases en tamaño. [4] Está presente en el primer locus (que codifica C4A) para todos los genes C4 y en el segundo locus (que codifica C4B) solo en unos pocos genes C4. [4] La cadena α consta de los residuos 661-1428, que codifican los exones 16-33. [ 4] Dentro de esta cadena, dos sitios de escisión marcados por los exones 23 y 30 producen el fragmento C4d (donde se encuentran el tioéster, los antígenos Ch/Rg y los residuos isotípicos); además, la mayoría de los sitios polimórficos se agrupan en esta región. [4] La cadena γ consta de 291 residuos, que codifican los exones 33-41. [4] Desafortunadamente, no se ha atribuido ninguna función específica a la cadena γ. [4]
El estudio completado por Vaishnaw et al. buscó identificar la región clave y los factores relacionados con los esfuerzos de expresión génica del gen C4. [13] Su investigación concluyó con el hecho de que el sitio de unión Sp1 (ubicado en -59 a -49) juega un papel importante en el inicio preciso de la transcripción basal de C4. [13] La utilización de ensayos de cambio de electromovilidad y análisis de la huella de DNasa I demostró correlaciones específicas de ADN-proteína del promotor C4 en el factor nuclear 1, dos dominios de unión de caja E (-98 a -93 y -78 a -73) y Sp1. [13] Estos hallazgos se agregaron más tarde en otro estudio extenso, que encontró un tercer sitio de caja E. [14] Además, los mismos hallazgos postularon que dos entidades físicas dentro de la secuencia genética podrían tener un papel en los niveles de expresión de C4A y C4B humanos, que incluyen la presencia del retrovirus endógeno que puede tener influencias reguladoras positivas o negativas que afectan la transcripción de C4 y el entorno genético variable (dependiendo de qué componente modular genético esté presente) más allá de la posición -1524. [14]
Para proporcionar más contexto, en el último estudio, la estructura bimodular observada anteriormente (C4A-C4B) se ha actualizado a una estructura cuadrimodular de uno a cuatro segmentos discretos, que contienen uno o más módulos RP-C4-CYP21-TNX ( RCCX ). [2] El tamaño del gen C4A o C4B puede ser de 21 kb (largo, L) o 14,6 kb (corto, S). Además, el gen C4 largo contiene de forma única un retrovirus HERV-K(C4) en su intrón 9 que impone la transcripción de 6,36 kb adicionales, de ahí la cadena de genes "más larga". [2] [14] Por lo tanto, los genes C4 tienen un patrón complejo de variación en el tamaño del gen, el número de copias y los polimorfismos. [2] [14] Ejemplos de estas estructuras mono-, bi-, tri- y cuatri-modulares incluyen: L o S (monomodular con un gen C4 largo o corto), LL o LS o SS (bimodular con una combinación de genes L o S homocigotos o heterocigotos), LLL o LLS o LSS (RCCX trimodular con tres genes C4 L o S), LLLL (estructura cuatrimodular con cuatro genes C4 L o S). [14] No todos los grupos estructurales tienen el mismo porcentaje de apariencia, posiblemente incluso más diferencias dentro de grupos étnicos separados. Por ejemplo, la población caucásica estudiada mostró 69% de configuración bimodular (C4A-C4B, C4A-C4A o C4B-C4B) y 31% de configuración trimodular (igualmente dividida entre LLL como C4A-C4A-C4B o LSS como C4A-C4B-C4B). [14] En cuanto al polimorfismo de la secuencia de la proteína C4, se encontró un total de 24 residuos polimórficos. Entre ellos, la cadena β expresó cinco, mientras que la cadena α y la cadena γ produjeron 18 y uno, respectivamente. Estos polimorfismos se pueden clasificar además en grupos: 1) cuatro residuos isotípicos en posiciones específicas, 2) determinantes antigénicos Ch/Rg en posiciones específicas, 3) sitios de unión de C5, 4) residuos alélicos privados. [14]
Además, el mismo estudio identificó la expresión de las transcripciones del complemento C4 humano en múltiples tejidos. Los resultados de un análisis de transferencia Northern, utilizando una sonda C4d y una sonda RD como control positivo, mostraron que el hígado contiene la mayoría de las transcripciones en todo el cuerpo. [14] Aun así, se expresaron cantidades moderadas en las cortezas suprarrenales/médula, tiroides y riñones. [14]
Como se ha señalado, C4 (mezcla de C4A y C4B) participa en las tres vías del complemento (clásica, alternativa y de lectina); la vía alternativa se "activa espontáneamente", mientras que las vías clásica y de lectina se desencadenan en respuesta al reconocimiento de microbios particulares. [16] Las tres vías convergen en un paso en el que la proteína del complemento C3 se escinde en las proteínas C3a y C3b, lo que da lugar a una vía lítica y a la formación de un conjunto macromolecular de múltiples proteínas, denominado complejo de ataque a la membrana (MAC), que actúa como un poro en la membrana del patógeno objetivo, lo que conduce a la disrupción de la célula invasora y a la lisis final. [16]
En la vía clásica, el componente del complemento (abreviado en adelante con la "C" que precede al número de proteína), denominado C1s, una serina proteasa , se activa mediante pasos anteriores de la vía, lo que da como resultado la escisión de la proteína C4 nativa, progenitora, de ~200 kilodalton (kDa), compuesta de tres cadenas. [16] : 288 La proteasa escinde la C4 en dos partes, un péptido C4a (pequeño de ~9 kDa y anafilotóxico ) y la proteína C4b de mayor peso molecular, de aproximadamente 190 kDa. [17] La escisión del C4 da como resultado que C4b tenga un grupo funcional tioéster [-SC(O)-]: el trabajo en la década de 1980 en C3, y luego en C4, indicó la presencia, dentro de las estructuras parentales C3 y C4, de una modificación proteica única, un anillo de tionolactona de 15 átomos (15 miembros) que sirve para conectar la cadena lateral tiol del aminoácido cisteína (Cys) en una secuencia -Cys-Gly-Glu-Glx- con un grupo acilo de la cadena lateral de lo que comenzó como una cadena lateral de glutamina (Glx, aquí) que residía tres residuos de aminoácidos corriente abajo (donde los átomos restantes de los 15 eran átomos de la cadena principal y lateral); [17] [18] tras la escisión, esta estructura única de anillo de tionolactona queda expuesta en la superficie de la nueva proteína C4b. [16] [17] [18] Debido a la proximidad a la superficie microbiana, una parte de las proteínas C4b liberadas, con esta tionolactona reactiva, reaccionan con las cadenas laterales de aminoácidos nucleofílicos y otros grupos en la superficie celular del microbio extraño, lo que resulta en la unión covalente de la proteína C4b ligeramente modificada a la superficie celular, a través del residuo Glx original de C4. [16] [17] [18]
La proteína C4b tiene otras funciones. Interactúa con la proteína C2; la misma proteasa que se utilizó antes, C1s, divide la proteína C2 en dos partes, denominadas C2a y C2b, y la C2b se libera y la C2a permanece asociada a la proteína C4b; el complejo C4b-C2a de las dos proteínas muestra entonces otra actividad de proteasa asociada al sistema hacia la proteína C3 (dividándola), con la consiguiente liberación de ambas proteínas, C4b y C2a, de su complejo (con lo cual la C4b puede unirse a otra proteína C2 y realizar estos pasos de nuevo). [16] Debido a que la proteína C4b se regenera y se crea un ciclo, el complejo C4b-C2a con actividad de proteasa se ha denominado convertasa C3. [16] La proteína 4b puede dividirse aún más en 4c y 4d. [19]
Aunque se han implicado otras enfermedades (es decir, lupus eritematoso sistémico ), también se está investigando el gen C4 por el papel que puede desempeñar en el riesgo y desarrollo de esquizofrenia. En el estudio de Wu et al., utilizaron la reacción en cadena de la polimerasa en tiempo real (rt-PCR) como un ensayo para determinar la varianza del número de copias (CNV) o la diversidad genética de C4. [20] En consecuencia, con estos resultados, los pronósticos futuros, los brotes y las remisiones serán más factibles de determinar. Los resultados muestran básicamente variantes del número de copias como un mecanismo para afectar la diversidad genética. Como se discutió antes, los diferentes fenotipos permitidos por la variedad genética variable del complemento C4 incluyen una amplia gama de proteínas C4 plasmáticas o séricas entre dos isotipos, C4A y C4B, con múltiples alotipos de proteínas que pueden tener funciones fisiológicas únicas. [20] Las CNV son fuentes de diversidad genética inherente y participan en la interacción gen-ambiente. [20] Las CNV (y los polimorfismos asociados) desempeñan un papel en llenar el vacío hacia la comprensión de la base genética de los rasgos cuantitativos y las diferentes susceptibilidades a las enfermedades autoinmunes y neurobiológicas. [ cita requerida ]
Se han recopilado y analizado datos sustanciales de todo el mundo para determinar que la esquizofrenia, de hecho, tiene una fuerte relación genética con una región del locus MHC en el brazo cromosómico 6. [21] [1]
Los datos y la información recopilados a nivel internacional pueden arrojar luz sobre los misterios de la esquizofrenia . Sekar et al. analizaron polimorfismos de un solo nucleótido (SNP) de 40 cohortes en 22 países, que en total sumaron casi 29.000 casos. [1] Descubrieron dos características: 1) Una gran cantidad de SNP que alcanzan solo 2 Mb en el extremo, 2) pico de asociación centrado en C4, lo que predice que los niveles de expresión de C4A están más fuertemente correlacionados con la esquizofrenia. [1] Además, han descubierto un mecanismo por el cual la esquizofrenia podría surgir de la predisposición genética del complemento humano C4. [1] Como se muestra en la Figura 1, cuatro variaciones estructurales comunes descubiertas en estudios de asociación de todo el genoma (GWAS) han señalado la alta tasa de esquizofrenia. [1] Posiblemente, los mayores niveles de expresión de la proteína C4 debido al patrón de variantes del gen C4, permiten el aumento no deseado de la poda sináptica (un efecto producido por las proteínas efectoras del sistema del complemento en el que participa el C4).