stringtranslate.com

Secuencia de consenso

En biología molecular y bioinformática , la secuencia consenso (o secuencia canónica ) es la secuencia calculada de los residuos más frecuentes, ya sea de nucleótidos o de aminoácidos , que se encuentran en cada posición en un alineamiento de secuencia . Representa los resultados de múltiples alineamientos de secuencias en los que se comparan secuencias relacionadas entre sí y se calculan motivos de secuencia similares. Esta información es importante cuando se consideran enzimas dependientes de secuencia como la ARN polimerasa . [1]

Importancia biológica

Un sitio de unión a proteínas, representado por una secuencia consenso, puede ser una secuencia corta de nucleótidos que se encuentra varias veces en el genoma y se cree que desempeña el mismo papel en sus diferentes ubicaciones. Por ejemplo, muchos factores de transcripción reconocen patrones particulares en los promotores de los genes que regulan. Del mismo modo, las enzimas de restricción suelen tener secuencias consenso palindrómicas , que suelen corresponder al sitio donde cortan el ADN. Los transposones actúan de manera muy similar en la identificación de secuencias diana para la transposición. Finalmente, los sitios de empalme (secuencias que rodean inmediatamente los límites exón - intrón ) también pueden considerarse secuencias consenso.

Así, una secuencia consenso es un modelo para un supuesto sitio de unión al ADN : se obtiene alineando todos los ejemplos conocidos de un determinado sitio de reconocimiento y se define como la secuencia idealizada que representa la base predominante en cada posición. Todos los ejemplos reales no deberían diferir del consenso en más de unas pocas sustituciones, pero contar las discrepancias de esta manera puede generar inconsistencias. [2]

Cualquier mutación que permita que un nucleótido mutado en la secuencia del promotor central se parezca más a la secuencia consenso se conoce como mutación ascendente . Este tipo de mutación generalmente fortalecerá el promotor y, por lo tanto, la ARN polimerasa forma una unión más estrecha con el ADN que desea transcribir y la transcripción se regula positivamente. Por el contrario, las mutaciones que destruyen nucleótidos conservados en la secuencia consenso se conocen como mutaciones descendentes . Estos tipos de mutaciones regulan a la baja la transcripción, ya que la ARN polimerasa ya no puede unirse tan estrechamente a la secuencia promotora central.

Análisis de secuencia

El desarrollo de software para el reconocimiento de patrones es un tema importante en genética , biología molecular y bioinformática . Motivos de secuencia específicos pueden funcionar como secuencias reguladoras que controlan la biosíntesis, o como secuencias señal que dirigen una molécula a un sitio específico dentro de la célula o regulan su maduración. Dado que la función reguladora de estas secuencias es importante, se cree que se conservan durante largos períodos de evolución . En algunos casos, la relación evolutiva puede estimarse por el grado de conservación de estos sitios.

Notación

Los motivos de secuencia conservados se denominan secuencias consenso y muestran qué residuos están conservados y cuáles son variables. Considere el siguiente ejemplo de secuencia de ADN :

A[CT]N{A}AÑO

En esta notación , A significa que siempre se encuentra una A en esa posición; [CT] significa C o T; N representa cualquier base; y {A} significa cualquier base excepto A. Y representa cualquier pirimidina y R indica cualquier purina . En este ejemplo, la notación [CT] no da ninguna indicación de la frecuencia relativa de C o T que ocurre en esa posición. Y no es posible escribirlo como una secuencia de consenso única, por ejemplo, ACNCCA. Un método alternativo para representar una secuencia de consenso utiliza un logotipo de secuencia . Esta es una representación gráfica de la secuencia consenso, en la que el tamaño de un símbolo está relacionado con la frecuencia con la que un nucleótido (o aminoácido) determinado aparece en una posición determinada. En los logos de secuencia, cuanto más conservado es el residuo, más grande se dibuja el símbolo de ese residuo; cuanto menos frecuente, más pequeño es el símbolo. Los logotipos de secuencia se pueden generar usando WebLogo o usando Gestalt Workbench, una herramienta de visualización disponible públicamente escrita por Gustavo Glusman en el Instituto de Biología de Sistemas. [2]

Software

Las herramientas bioinformáticas son capaces de calcular y visualizar secuencias consenso. Ejemplos de herramientas son JalView y UGENE .

Ver también

Referencias

  1. ^ Pierce, Benjamin A. 2002. Genética: un enfoque conceptual. 1ª edición. Nueva York: WH Freeman and Co.
  2. ^ ab Schneider TD (2002). "Secuencia de consenso Zen". Appl Bioinform . 1 (3): 111-119. PMC  1852464 . PMID  15130839.