Una isoforma de proteína , o " variante de proteína ", [1] es un miembro de un conjunto de proteínas altamente similares que se originan a partir de un solo gen o familia de genes y son el resultado de diferencias genéticas. [2] Si bien muchas desempeñan funciones biológicas iguales o similares, algunas isoformas tienen funciones únicas. Un conjunto de isoformas de proteína puede formarse a partir de empalmes alternativos , uso variable del promotor u otras modificaciones postranscripcionales de un solo gen; las modificaciones postranscripcionales generalmente no se consideran. (Para eso, consulte Proteoformas ). A través de los mecanismos de empalme de ARN , el ARNm tiene la capacidad de seleccionar diferentes segmentos codificadores de proteínas ( exones ) de un gen, o incluso diferentes partes de exones del ARN para formar diferentes secuencias de ARNm. Cada secuencia única produce una forma específica de una proteína.
El descubrimiento de isoformas podría explicar la discrepancia entre el pequeño número de regiones codificantes de proteínas de los genes revelados por el proyecto genoma humano y la gran diversidad de proteínas observadas en un organismo: diferentes proteínas codificadas por el mismo gen podrían aumentar la diversidad del proteoma . Las isoformas a nivel de ARN se caracterizan fácilmente mediante estudios de transcripción de ADNc . Muchos genes humanos poseen isoformas de empalme alternativo confirmadas . Se ha estimado que se pueden identificar ~100.000 etiquetas de secuencia expresada ( EST ) en humanos. [1] Las isoformas a nivel de proteína pueden manifestarse en la eliminación de dominios completos o bucles más cortos, generalmente ubicados en la superficie de la proteína. [3]
Un solo gen tiene la capacidad de producir múltiples proteínas que difieren tanto en estructura como en composición; [4] [5] este proceso está regulado por el empalme alternativo del ARNm, aunque no está claro en qué medida dicho proceso afecta la diversidad del proteoma humano, ya que la abundancia de isoformas de transcripción del ARNm no se correlaciona necesariamente con la abundancia de isoformas de proteína. [6] Las comparaciones de la estructura tridimensional de la proteína se pueden utilizar para ayudar a determinar qué isoformas, si las hay, representan productos proteicos funcionales, y la estructura de la mayoría de las isoformas en el proteoma humano ha sido predicha por AlphaFold y publicada públicamente en isoform.io. [7] La especificidad de las isoformas traducidas se deriva de la estructura/función de la proteína, así como del tipo de célula y la etapa de desarrollo durante la cual se producen. [4] [5] Determinar la especificidad se vuelve más complicado cuando una proteína tiene múltiples subunidades y cada subunidad tiene múltiples isoformas.
Por ejemplo, la proteína quinasa activada por AMP 5' (AMPK), una enzima que desempeña diferentes funciones en las células humanas, tiene 3 subunidades: [8]
En el músculo esquelético humano, la forma preferida es α2β2γ1. [8] Pero en el hígado humano, la forma más abundante es α1β2γ1. [8]
Los mecanismos primarios que producen isoformas de proteínas son el empalme alternativo y el uso variable del promotor, aunque las modificaciones debidas a cambios genéticos, como mutaciones y polimorfismos , a veces también se consideran isoformas distintas. [9]
El empalme alternativo es el principal proceso de modificación postranscripcional que produce isoformas de transcripción del ARNm y es un mecanismo molecular importante que puede contribuir a la diversidad de proteínas. [5] El espliceosoma , una gran ribonucleoproteína , es la máquina molecular dentro del núcleo responsable de la escisión y ligadura del ARN , eliminando segmentos no codificantes de proteínas ( intrones ). [10]
Debido a que el empalme es un proceso que ocurre entre la transcripción y la traducción , sus efectos primarios se han estudiado principalmente a través de técnicas genómicas ; por ejemplo, se han utilizado análisis de microarrays y secuenciación de ARN para identificar transcripciones empalmadas alternativamente y medir sus abundancias. [9] La abundancia de transcripciones se utiliza a menudo como un indicador de la abundancia de isoformas de proteínas, aunque los experimentos de proteómica que utilizan electroforesis en gel y espectrometría de masas han demostrado que la correlación entre las transcripciones y los recuentos de proteínas suele ser baja, y que una isoforma de proteína suele ser dominante. [11] Un estudio de 2015 afirma que la causa de esta discrepancia probablemente ocurre después de la traducción, aunque el mecanismo es esencialmente desconocido. [12] En consecuencia, aunque el empalme alternativo se ha implicado como un vínculo importante entre la variación y la enfermedad, no hay evidencia concluyente de que actúe principalmente produciendo nuevas isoformas de proteínas. [11]
El empalme alternativo generalmente describe un proceso estrictamente regulado en el que las transcripciones alternativas son generadas intencionalmente por la maquinaria de empalme. Sin embargo, dichas transcripciones también son producidas por errores de empalme en un proceso llamado "empalme ruidoso", y también son potencialmente traducidas en isoformas de proteínas. Aunque se cree que aproximadamente el 95% de los genes multiexónicos son empalmados alternativamente, un estudio sobre empalme ruidoso observó que la mayoría de las diferentes transcripciones de baja abundancia son ruido, y predice que la mayoría de las transcripciones alternativas e isoformas de proteínas presentes en una célula no son funcionalmente relevantes. [13]
Otros pasos reguladores transcripcionales y postranscripcionales también pueden producir diferentes isoformas de proteínas. [14] El uso variable del promotor ocurre cuando la maquinaria transcripcional de una célula ( ARN polimerasa , factores de transcripción y otras enzimas ) comienza la transcripción en diferentes promotores (la región de ADN cerca de un gen que sirve como sitio de unión inicial), lo que da como resultado transcripciones e isoformas de proteínas ligeramente modificadas.
En general, una isoforma de proteína se etiqueta como la secuencia canónica en función de criterios como su prevalencia y similitud con secuencias ortólogas (o funcionalmente análogas) en otras especies. [15] Se supone que las isoformas tienen propiedades funcionales similares, ya que la mayoría tienen secuencias similares y comparten algunos o la mayoría de los exones con la secuencia canónica. Sin embargo, algunas isoformas muestran una divergencia mucho mayor (por ejemplo, a través del trans-splicing ) y pueden compartir pocos o ningún exón con la secuencia canónica. Además, pueden tener diferentes efectos biológicos (por ejemplo, en un caso extremo, la función de una isoforma puede promover la supervivencia celular, mientras que otra promueve la muerte celular) o pueden tener funciones básicas similares pero diferir en su localización subcelular. [16] Sin embargo, un estudio de 2016 caracterizó funcionalmente todas las isoformas de 1492 genes y determinó que la mayoría de las isoformas se comportan como "aloformas funcionales". Los autores llegaron a la conclusión de que las isoformas se comportan como proteínas distintas después de observar que las funciones de la mayoría de las isoformas no se superponían. [17] Debido a que el estudio se realizó en células in vitro , no se sabe si las isoformas en el proteoma humano expresado comparten estas características. Además, debido a que la función de cada isoforma generalmente debe determinarse por separado, la mayoría de las isoformas identificadas y predichas aún tienen funciones desconocidas.
Una glicoforma es una isoforma de una proteína que difiere solo con respecto al número o tipo de glicano unido . Las glicoproteínas a menudo consisten en varias glicoformas diferentes, con alteraciones en el sacárido u oligosacárido unido . Estas modificaciones pueden resultar de diferencias en la biosíntesis durante el proceso de glicosilación , o debido a la acción de glicosidasas o glicosiltransferasas . Las glicoformas se pueden detectar a través de un análisis químico detallado de glicoformas separadas, pero se detectan más convenientemente a través de una reacción diferencial con lectinas , como en la cromatografía de afinidad de lectina y la electroforesis de afinidad de lectina . Ejemplos típicos de glicoproteínas que consisten en glicoformas son las proteínas sanguíneas como orosomucoide , antitripsina y haptoglobina . Una variación inusual de glicoforma se observa en la molécula de adhesión celular neuronal, NCAM que involucra ácidos polisiálicos, PSA .
La monoaminooxidasa , una familia de enzimas que catalizan la oxidación de monoaminas, existe en dos isoformas, MAO-A y MAO-B.