stringtranslate.com

Huella filogenética

Huella filogenética del gen HOXA5

La huella filogenética es una técnica utilizada para identificar sitios de unión de factores de transcripción (TFBS) dentro de una región no codificante de ADN de interés comparándola con la secuencia ortóloga en diferentes especies . Cuando esta técnica se utiliza con una gran cantidad de especies estrechamente relacionadas, esto se denomina sombreado filogenético . [1]

Los investigadores han descubierto que fragmentos de ADN no codificantes contienen sitios de unión para proteínas reguladoras que gobiernan la expresión espaciotemporal de los genes . Estos sitios de unión de factores de transcripción (TFBS), o motivos reguladores, han resultado difíciles de identificar, principalmente porque son cortos y pueden mostrar variación de secuencia . La importancia de comprender la regulación transcripcional en muchos campos de la biología ha llevado a los investigadores a desarrollar estrategias para predecir la presencia de TFBS, muchas de las cuales han dado lugar a bases de datos disponibles públicamente. Una de esas técnicas es la huella filogenética .

La huella filogenética se basa en dos conceptos principales:

  1. "La función y las preferencias de unión al ADN de los factores de transcripción están bien conservadas entre diversas especies ".
  2. Importantes secuencias de ADN no codificantes que son esenciales para regular la expresión genética mostrarán una presión selectiva diferencial. Se produce una tasa de cambio más lenta en TFBS que en otras partes menos críticas del genoma no codificante. [2]

Historia

La huella filogenética fue utilizada y publicada por primera vez por Tagle et al. en 1988, lo que permitió a los investigadores predecir elementos reguladores cis conservados evolutivamente responsables de la expresión de los genes embrionarios de globulina ε y γ en primates. [3]

Antes de la huella filogenética, se utilizaba la huella de DNasa , donde la proteína se unía a los sitios de unión del factor de transcripción del ADN (TFBS) protegiéndola de la digestión de la DNasa. Uno de los problemas de esta técnica era la cantidad de tiempo y mano de obra que requeriría. A diferencia de la huella de DNasa, la huella filogenética se basa en limitaciones evolutivas dentro del genoma, y ​​las partes "importantes" de la secuencia se conservan entre las diferentes especies. [4]

Protocolo

Protocolo de la técnica de Huella Filogenética

Al utilizar esta técnica, es importante decidir con qué genoma debe alinearse su secuencia. Las especies más divergentes tendrán menos similitud de secuencia entre genes ortólogos. Por lo tanto, la clave es elegir especies que estén lo suficientemente relacionadas como para detectar homología, pero lo suficientemente divergentes como para maximizar el "ruido" de no alineación. El enfoque paso a paso para la huella filogenética consiste en:

  1. Hay que decidir sobre el gen de interés.
  2. Elija cuidadosamente especies con genes ortólogos.
  3. Decida la longitud de la región aguas arriba o quizá aguas abajo que se va a examinar.
  4. Alinea las secuencias.
  5. Busque regiones conservadas y analícelas.

No se encuentran todos los TFBS

No todos los sitios de unión de la transcripción se pueden encontrar mediante la huella filogenética debido a la naturaleza estadística de esta técnica. Aquí hay varias razones por las que no se encuentran algunos TFBS:

Sitios de unión específicos de cada especie

Algunos sitios de unión parecen no tener coincidencias significativas en la mayoría de las otras especies. Por lo tanto, detectar estos sitios mediante huellas filogenéticas probablemente sea imposible a menos que esté disponible una gran cantidad de especies estrechamente relacionadas.

Sitios de unión muy cortos

Algunos sitios de unión muestran una excelente conservación, pero en una región más corta que las buscadas. Estos motivos cortos (p. ej., GC-box) suelen aparecer por casualidad en secuencias no funcionales y detectar estos motivos puede resultar un desafío.

Factores de unión menos específicos

Algunos sitios de unión muestran cierta conservación pero han tenido inserciones o eliminaciones. No es obvio si estas secuencias con inserciones o eliminaciones siguen siendo funcionales. Aunque aún pueden ser funcionales si el factor vinculante es menos específico (o menos "quisquilloso", por así decirlo). Debido a que las eliminaciones e inserciones son raras en los sitios de unión, considerar las inserciones y eliminaciones en la secuencia detectaría algunos TFBS verdaderos más, pero probablemente podría incluir muchos más falsos positivos.

No hay suficientes datos

Algunos motivos están bastante bien conservados, pero son estadísticamente insignificantes en un conjunto de datos específico. El motivo podría haber aparecido por casualidad en diferentes especies. Estos motivos podrían detectarse si se dispone de secuencias de más organismos. Así que esto será un problema menor en el futuro.

Regiones de unión compuestas

Algunos factores de transcripción se unen como dímeros. Por tanto, sus sitios de unión pueden consistir en dos regiones conservadas, separadas por unos pocos nucleótidos variables. Debido a la secuencia interna variable, el motivo no puede detectarse. Sin embargo, si pudiéramos usar un programa para buscar motivos que contengan una secuencia variable en el medio, sin contar las mutaciones, se podrían descubrir estos motivos.

Exactitud

Es importante tener en cuenta que no todas las secuencias conservadas están bajo presión de selección. Para eliminar los falsos positivos se debe realizar un análisis estadístico que muestre que los motivos informados tienen una tasa de mutación significativamente menor que la de la secuencia no funcional circundante.

Además, los resultados podrían ser más precisos si se considera el conocimiento previo sobre la secuencia. Por ejemplo, algunos elementos reguladores se repiten 15 veces en una región promotora (por ejemplo, algunos promotores de metalotioneína tienen hasta 15 elementos de respuesta a metales (MRE)). Por lo tanto, para eliminar motivos falsos con orden inconsistente entre especies, la orientación y el orden de los elementos reguladores en una región promotora deben ser los mismos en todas las especies. Este tipo de información podría ayudarnos a identificar elementos regulatorios que no se conservan adecuadamente pero que ocurren en varias copias en la secuencia de entrada. [5]

Referencias

  1. ^ Sombreado filogenético de secuencias de primates para encontrar regiones funcionales del genoma humano doi :10.1126/science.1081331
  2. ^ Neph, S. y Tompa, M. 2006. MicroFootPrinter: una herramienta para la huella filogenética en genomas procarióticos. Investigación de ácidos nucleicos . 34: 366-368
  3. ^ Tagle, DA, Koop, BF, Goodman, M., Slightom, JL, Hess, D. y Jones, RT 1988. Genes embrionarios de globina ε y γ de un primate prosimio (Galago crassicaudatis): secuencias de nucleótidos y aminoácidos, regulación del desarrollo y huellas filogenéticas. J. Mol. Biol. 203:439-455.
  4. ^ Zhang, Z. y Gerstein, M. 2003. De ratones y hombres: la huella filogenética ayuda al descubrimiento de elementos reguladores. J. Biol. 2:11-11.4
  5. ^ Blanchette, M. y Tompa, M. 2002. Descubrimiento de elementos reguladores mediante un método computacional para la huella filogenética. Genoma Res. 12: 739-748