stringtranslate.com

Secuenciación de proteínas

Uso de un secuenciador de proteínas y péptidos Beckman-Spinco, 1970

La secuenciación de proteínas es el proceso práctico de determinar la secuencia de aminoácidos de todo o parte de una proteína o péptido . Esto puede servir para identificar la proteína o caracterizar sus modificaciones postraduccionales . Normalmente, la secuenciación parcial de una proteína proporciona información suficiente (una o más etiquetas de secuencia) para identificarla con referencia a bases de datos de secuencias de proteínas derivadas de la traducción conceptual de genes .

Los dos principales métodos directos de secuenciación de proteínas son la espectrometría de masas y la degradación de Edman utilizando un secuenciador de proteínas (secuenciador). Los métodos de espectrometría de masas son ahora los más utilizados para la secuenciación e identificación de proteínas, pero la degradación de Edman sigue siendo una herramienta valiosa para caracterizar el extremo N de una proteína .

Determinación de la composición de aminoácidos.

Interpretación de la secuencia de proteínas: un esquema de nueva proteína que se diseñará en una levadura

A menudo es deseable conocer la composición desordenada de aminoácidos de una proteína antes de intentar encontrar la secuencia ordenada, ya que este conocimiento puede usarse para facilitar el descubrimiento de errores en el proceso de secuenciación o para distinguir entre resultados ambiguos. El conocimiento de la frecuencia de ciertos aminoácidos también puede usarse para elegir qué proteasa usar para la digestión de la proteína. También se puede determinar la incorporación errónea de niveles bajos de aminoácidos no estándar (por ejemplo, norleucina) a las proteínas. [1] Un método generalizado a menudo denominado análisis de aminoácidos [2] para determinar la frecuencia de aminoácidos es el siguiente:

  1. Hidrolizar una cantidad conocida de proteína en sus aminoácidos constituyentes.
  2. Separar y cuantificar los aminoácidos de alguna forma.

Hidrólisis

La hidrólisis se realiza calentando una muestra de proteína en ácido clorhídrico 6 M a 100-110 °C durante 24 horas o más. Las proteínas con muchos grupos hidrofóbicos voluminosos pueden requerir períodos de calentamiento más prolongados. Sin embargo, estas condiciones son tan vigorosas que algunos aminoácidos ( serina , treonina , tirosina , triptófano , glutamina y cisteína ) se degradan. Para evitar este problema, Biochemistry Online sugiere calentar muestras separadas en tiempos diferentes, analizar cada solución resultante y extrapolar a cero el tiempo de hidrólisis. Rastall sugiere una variedad de reactivos para prevenir o reducir la degradación, como reactivos de tiol o fenol para proteger el triptófano y la tirosina del ataque del cloro y la cisteína preoxidante. También sugiere medir la cantidad de amoníaco desprendido para determinar el grado de hidrólisis de la amida .

Separación y cuantificación.

Los aminoácidos pueden separarse mediante cromatografía de intercambio iónico y luego derivatizarse para facilitar su detección. Más comúnmente, los aminoácidos se derivatizan y luego se resuelven mediante HPLC de fase reversa .

El NTRC proporciona un ejemplo de cromatografía de intercambio iónico utilizando poliestireno sulfonado como matriz, agregando los aminoácidos en una solución ácida y haciendo pasar un tampón de pH en constante aumento a través de la columna. Los aminoácidos se eluyen cuando el pH alcanza sus respectivos puntos isoeléctricos . Una vez separados los aminoácidos se determinan sus respectivas cantidades añadiendo un reactivo que formará un derivado coloreado. Si las cantidades de aminoácidos superan los 10 nmol, se puede utilizar para ello ninhidrina ; Da un color amarillo cuando reacciona con prolina y un color púrpura vivo con otros aminoácidos. La concentración de aminoácido es proporcional a la absorbancia de la solución resultante. Con cantidades muy pequeñas, de hasta 10 pmol, se pueden formar derivados fluorescentes utilizando reactivos como el ortoftaldehído (OPA) o la fluorescamina .

La derivatización previa a la columna puede utilizar el reactivo de Edman para producir un derivado que se detecta mediante luz ultravioleta. Se logra una mayor sensibilidad utilizando un reactivo que genera un derivado fluorescente. Los aminoácidos derivatizados se someten a cromatografía de fase inversa, normalmente utilizando una columna de sílice C8 o C18 y un gradiente de elución optimizado . Los aminoácidos eluidos se detectan utilizando un detector de UV o fluorescencia y las áreas de los picos se comparan con las de los estándares derivatizados para cuantificar cada aminoácido en la muestra.

Análisis de aminoácidos N -terminales

Método de Sanger de análisis de grupos terminales de péptidos: A derivatización del extremo N -terminal con reactivo de Sanger (DNFB), B hidrólisis ácida total del péptido dinitrofenilo

Determinar qué aminoácido forma el extremo N de una cadena peptídica es útil por dos razones: para ayudar a ordenar las secuencias de los fragmentos peptídicos individuales en una cadena completa, y porque la primera ronda de degradación de Edman a menudo está contaminada por impurezas y, por lo tanto, no no proporciona una determinación precisa del aminoácido N -terminal. A continuación se muestra un método generalizado para el análisis de aminoácidos N -terminales:

  1. Reacciona el péptido con un reactivo que marcará selectivamente el aminoácido terminal.
  2. Hidrolizar la proteína.
  3. Determinar el aminoácido mediante cromatografía y comparación con estándares.

Hay muchos reactivos diferentes que pueden usarse para marcar aminoácidos terminales. Todos reaccionan con grupos amina y, por lo tanto, también se unirán a grupos amina en las cadenas laterales de aminoácidos como la lisina; por esta razón, es necesario tener cuidado al interpretar los cromatogramas para garantizar que se elija el lugar correcto. Dos de los reactivos más comunes son el reactivo de Sanger ( 1-fluoro-2,4-dinitrobenceno ) y los derivados de dansilo como el cloruro de dansilo . También se puede utilizar fenilisotiocianato , el reactivo para la degradación de Edman. Aquí se aplican las mismas preguntas que en la determinación de la composición de aminoácidos, con la excepción de que no se necesita tinción, ya que los reactivos producen derivados coloreados y solo se requiere un análisis cualitativo. Por lo tanto, no es necesario eluir el aminoácido de la columna de cromatografía, sino simplemente compararlo con un estándar. Otra consideración a tener en cuenta es que, dado que cualquier grupo amina habrá reaccionado con el reactivo de marcado, no se puede utilizar la cromatografía de intercambio iónico y, en su lugar, se debe utilizar la cromatografía de capa fina o la cromatografía líquida de alta presión .

Análisis de aminoácidos C-terminales.

La cantidad de métodos disponibles para el análisis de aminoácidos C-terminal es mucho menor que la cantidad de métodos disponibles para el análisis de N-terminal. El método más común es agregar carboxipeptidasas a una solución de proteína, tomar muestras a intervalos regulares y determinar el aminoácido terminal analizando un gráfico de concentraciones de aminoácidos en función del tiempo. Este método será muy útil en el caso de polipéptidos y extremos N bloqueados por proteínas. La secuenciación C-terminal sería de gran ayuda para verificar las estructuras primarias de las proteínas predichas a partir de secuencias de ADN y para detectar cualquier procesamiento postraduccional de productos genéticos a partir de secuencias de codones conocidas.

degradación de edman

La degradación de Edman es una reacción muy importante para la secuenciación de proteínas, porque permite descubrir la composición ordenada de aminoácidos de una proteína. Los secuenciadores automatizados Edman se utilizan ahora de forma generalizada y pueden secuenciar péptidos de hasta aproximadamente 50 aminoácidos de longitud. A continuación se muestra un esquema de reacción para secuenciar una proteína mediante la degradación de Edman; Algunos de los pasos se detallan más adelante.

  1. Rompe los puentes disulfuro en la proteína con un agente reductor como el 2-mercaptoetanol . Puede ser necesario un grupo protector como el ácido yodoacético para evitar que se vuelvan a formar los enlaces.
  2. Separar y purificar las cadenas individuales del complejo proteico, si hay más de una.
  3. Determine la composición de aminoácidos de cada cadena.
  4. Determine los aminoácidos terminales de cada cadena.
  5. Rompe cada cadena en fragmentos de menos de 50 aminoácidos de largo.
  6. Separar y purificar los fragmentos.
  7. Determinar la secuencia de cada fragmento.
  8. Repita con un patrón diferente de escote.
  9. Construya la secuencia de la proteína general.

Digestión en fragmentos de péptidos.

Los péptidos de más de 50 a 70 aminoácidos no pueden secuenciarse de manera confiable mediante la degradación de Edman. Debido a esto, las largas cadenas de proteínas deben dividirse en pequeños fragmentos que luego pueden secuenciarse individualmente. La digestión se realiza mediante endopeptidasas como la tripsina o la pepsina o mediante reactivos químicos como el bromuro de cianógeno . Diferentes enzimas dan diferentes patrones de escisión y la superposición entre fragmentos se puede utilizar para construir una secuencia general.

Reacción

El péptido a secuenciar se adsorbe sobre una superficie sólida. Un sustrato común es la fibra de vidrio recubierta con polibreno , un polímero catiónico . Se añade el reactivo de Edman, fenilisotiocianato (PITC), al péptido adsorbido, junto con una solución tampón ligeramente básica de trimetilamina al 12% . Éste reacciona con el grupo amino del aminoácido N-terminal.

A continuación, el aminoácido terminal puede separarse selectivamente mediante la adición de ácido anhidro . Luego, el derivado se isomeriza para dar una feniltiohidantoína sustituida, que puede eliminarse por lavado e identificarse mediante cromatografía, y puede repetirse el ciclo. La eficiencia de cada paso es de aproximadamente el 98%, lo que permite determinar de manera confiable aproximadamente 50 aminoácidos.

Una máquina de secuenciación de proteínas Beckman-Coulter Porton LF3000G

Secuenciador de proteínas

Un secuenciador de proteínas [3] es una máquina que realiza la degradación de Edman de forma automatizada. Se inmoviliza una muestra de la proteína o péptido en el recipiente de reacción del secuenciador de proteínas y se realiza la degradación de Edman. Cada ciclo libera y derivatiza un aminoácido del extremo N de la proteína o péptido y luego el derivado de aminoácido liberado se identifica mediante HPLC. El proceso de secuenciación se realiza de forma repetitiva para todo el polipéptido hasta que se establece toda la secuencia mensurable o durante un número predeterminado de ciclos.

Identificación por espectrometría de masas.

La identificación de proteínas es el proceso de asignar un nombre a una proteína de interés (POI), en función de su secuencia de aminoácidos. Normalmente, sólo es necesario determinar experimentalmente una parte de la secuencia de la proteína para identificar la proteína con referencia a bases de datos de secuencias de proteínas deducidas de las secuencias de ADN de sus genes. La caracterización adicional de proteínas puede incluir la confirmación de los extremos N y C reales del POI, la determinación de variantes de secuencia y la identificación de cualquier modificación postraduccional presente.

Digeridos proteolíticos

Se describe un esquema general para la identificación de proteínas. [4] [5]

  1. El PDI se aísla, normalmente mediante SDS-PAGE o cromatografía .
  2. El POI aislado puede modificarse químicamente para estabilizar los residuos de cisteína (por ejemplo, S-amidometilación o S-carboximetilación).
  3. El POI se digiere con una proteasa específica para generar péptidos. La tripsina , que escinde selectivamente en el lado C-terminal de los residuos de lisina o arginina, es la proteasa más utilizada. Sus ventajas incluyen i) la frecuencia de los residuos Lys y Arg en las proteínas, ii) la alta especificidad de la enzima, iii) la estabilidad de la enzima y iv) la idoneidad de los péptidos trípticos para espectrometría de masas.
  4. Los péptidos pueden desalinizarse para eliminar contaminantes ionizables y someterse a espectrometría de masas MALDI-TOF . La medición directa de las masas de los péptidos puede proporcionar información suficiente para identificar la proteína (consulte Huellas digitales de masas de péptidos ), pero a menudo se utiliza una mayor fragmentación de los péptidos dentro del espectrómetro de masas para obtener información sobre las secuencias de los péptidos. Alternativamente, los péptidos pueden desalinizarse y separarse mediante HPLC de fase inversa e introducirse en un espectrómetro de masas mediante una fuente ESI . LC-ESI-MS puede proporcionar más información que MALDI-MS para la identificación de proteínas, pero utiliza más tiempo del instrumento.
  5. Dependiendo del tipo de espectrómetro de masas, la fragmentación de iones peptídicos puede ocurrir mediante una variedad de mecanismos, como la disociación inducida por colisión (CID) o la desintegración posterior a la fuente (PSD). En cada caso, el patrón de los iones fragmentados de un péptido proporciona información sobre su secuencia.
  6. La información que incluye la masa medida de los supuestos iones peptídicos y los de sus iones fragmentados se compara con los valores de masa calculados a partir de la proteólisis conceptual (in-silico) y la fragmentación de bases de datos de secuencias de proteínas. Se encontrará una coincidencia exitosa si su puntuación excede un umbral basado en los parámetros de análisis. Incluso si la proteína real no está representada en la base de datos, la coincidencia tolerante a errores permite la supuesta identificación de una proteína basándose en la similitud con proteínas homólogas . Hay una variedad de paquetes de software disponibles para realizar este análisis.
  7. Los paquetes de software generalmente generan un informe que muestra la identidad (código de acceso) de cada proteína identificada, su puntuación de coincidencia y proporcionan una medida de la fuerza relativa de la coincidencia cuando se identifican múltiples proteínas.
  8. A menudo se utiliza un diagrama de los péptidos coincidentes en la secuencia de la proteína identificada para mostrar la cobertura de la secuencia (% de la proteína detectada como péptidos). Cuando se cree que el PDI es significativamente más pequeño que la proteína coincidente, el diagrama puede sugerir si el PDI es un fragmento N o C-terminal de la proteína identificada.

Secuenciación de novo

El patrón de fragmentación de un péptido permite la determinación directa de su secuencia mediante secuenciación de novo . Esta secuencia se puede utilizar para hacer coincidir bases de datos de secuencias de proteínas o para investigar modificaciones químicas o postraduccionales . Puede proporcionar evidencia adicional para las identificaciones de proteínas realizadas como se indicó anteriormente.

Terminales N y C

Los péptidos emparejados durante la identificación de proteínas no incluyen necesariamente los extremos N o C previstos para la proteína emparejada. Esto puede deberse a que los péptidos N- o C-terminales son difíciles de identificar mediante MS (por ejemplo, son demasiado cortos o demasiado largos), están modificados postraduccionalmente (por ejemplo, acetilación N-terminal) o realmente difieren de la predicción. Las modificaciones postraduccionales o los términos truncados pueden identificarse mediante un examen más detenido de los datos (es decir, secuenciación de novo ). También puede ser útil una digestión repetida utilizando una proteasa de diferente especificidad.

Modificaciones postraduccionales

Si bien se puede usar una comparación detallada de los datos de MS con predicciones basadas en la secuencia de proteínas conocida para definir modificaciones postraduccionales, también se pueden usar enfoques específicos para la adquisición de datos. Por ejemplo, el enriquecimiento específico de fosfopéptidos puede ayudar a identificar sitios de fosforilación en una proteína. Los métodos alternativos de fragmentación de péptidos en el espectrómetro de masas, como ETD o ECD , pueden proporcionar información de secuencia complementaria.

Determinación de masa entera

La masa total de la proteína es la suma de las masas de sus residuos de aminoácidos más la masa de una molécula de agua y se ajusta a cualquier modificación postraduccional. Aunque las proteínas se ionizan menos bien que los péptidos derivados de ellas, una proteína en solución puede someterse a ESI-MS y medirse su masa con una precisión de 1 parte en 20.000 o mejor. Esto suele ser suficiente para confirmar los extremos (por lo tanto, que la masa medida de la proteína coincide con la predicha a partir de su secuencia) e inferir la presencia o ausencia de muchas modificaciones postraduccionales.

Limitaciones

La proteólisis no siempre produce un conjunto de péptidos fácilmente analizables que cubren toda la secuencia de POI. La fragmentación de péptidos en el espectrómetro de masas a menudo no produce los iones correspondientes a la escisión en cada enlace peptídico. Por tanto, la secuencia deducida para cada péptido no es necesariamente completa. Los métodos estándar de fragmentación no distinguen entre residuos de leucina e isoleucina ya que son isoméricos.

Debido a que la degradación de Edman procede del extremo N de la proteína, no funcionará si el extremo N ha sido modificado químicamente (por ejemplo, mediante acetilación o formación de ácido piroglutámico). La degradación de Edman generalmente no es útil para determinar las posiciones de los puentes disulfuro. También requiere cantidades de péptidos de 1 picomol o más para obtener resultados discernibles, lo que la hace menos sensible que la espectrometría de masas.

Predecir a partir de secuencias de ADN/ARN

En biología, las proteínas se producen mediante la traducción del ARN mensajero (ARNm) y la secuencia de la proteína deriva de la secuencia de codones del ARNm. El propio ARNm se forma mediante la transcripción de genes y puede modificarse aún más. Estos procesos se conocen lo suficiente como para utilizar algoritmos informáticos para automatizar las predicciones de secuencias de proteínas a partir de secuencias de ADN, como las de proyectos de secuenciación de ADN de genoma completo, y han llevado a la generación de grandes bases de datos de secuencias de proteínas como UniProt . Las secuencias de proteínas previstas son un recurso importante para la identificación de proteínas mediante espectrometría de masas.

Históricamente, las secuencias de proteínas cortas (de 10 a 15 residuos) determinadas por la degradación de Edman se traducían hacia atrás en secuencias de ADN que podían usarse como sondas o cebadores para aislar clones moleculares del gen correspondiente o del ADN complementario. Luego se determinó la secuencia del ADN clonado y se utilizó para deducir la secuencia completa de aminoácidos de la proteína.

Herramientas bioinformáticas

Existen herramientas bioinformáticas para ayudar con la interpretación de espectros de masas (ver secuenciación de péptidos de novo ), para comparar o analizar secuencias de proteínas (ver análisis de secuencias ) o buscar bases de datos utilizando secuencias de péptidos o proteínas (ver BLAST ).

Aplicaciones a la criptografía

La dificultad de la secuenciación de proteínas se propuso recientemente como base para crear programas de k tiempos, programas que se ejecutan exactamente k veces antes de autodestruirse. Es imposible construir algo así únicamente en software porque todo el software es inherentemente clonable un número ilimitado de veces.

Ver también

Referencias

  1. ^ Bogosian G, Violand BN, Dorward-King EJ, Workman WE, Jung PE, Kane JF (enero de 1989). "Biosíntesis e incorporación a proteína de norleucina por Escherichia coli". La Revista de Química Biológica . 264 (1): 531–9. doi : 10.1016/S0021-9258(17)31291-7 . PMID  2642478.
  2. ^ Michael A. Alterman; Peter Hunziker (2 de diciembre de 2011). Análisis de aminoácidos: métodos y protocolos. Prensa Humana. ISBN 978-1-61779-444-5.
  3. ^ Edman P, Begg G (marzo de 1967). "Un secuenciador de proteínas". Revista europea de bioquímica . 1 (1): 80–91. doi : 10.1111/j.1432-1033.1967.tb00047.x . PMID  6059350.
  4. ^ Shevchenko A, Tomas H, Havlis J, Olsen JV, Mann M (2006). "Digestión en gel para la caracterización espectrométrica de masas de proteínas y proteomas". Protocolos de la Naturaleza . 1 (6): 2856–60. doi :10.1038/nprot.2006.468. PMID  17406544. S2CID  8248224.
  5. ^ Gundry RL, White MY, Murray CI, Kane LA, Fu Q, Stanley BA, Van Eyk JE (octubre de 2009). "Preparación de proteínas y péptidos para análisis de espectrometría de masas en un flujo de trabajo de proteómica ascendente". Protocolos actuales en biología molecular . Capítulo 10: Unidad 10.25. doi :10.1002/0471142727.mb1025s88. ISBN 978-0471142720. PMC  2905857 . PMID  19816929.

Otras lecturas