HomoloGene , una herramienta del Centro Nacional de Información Biotecnológica de los Estados Unidos (NCBI), es un sistema para la detección automatizada de homólogos (similitud atribuible a la descendencia de un ancestro común) entre los genes anotados de varios genomas eucariotas completamente secuenciados. [1]
El procesamiento de HomoloGene consiste en el análisis de proteínas de los organismos de entrada. Las secuencias se comparan utilizando blastp, luego se emparejan y se colocan en grupos, utilizando un árbol taxonómico construido a partir de la similitud de secuencias, donde los organismos más relacionados se emparejan primero y luego se agregan más organismos al árbol. Las alineaciones de proteínas se mapean nuevamente a sus secuencias de ADN correspondientes y luego se pueden calcular las métricas de distancia como distancias moleculares Jukes y Cantor (1969) , la relación Ka/Ks .
Las secuencias se emparejan mediante un algoritmo heurístico para maximizar la puntuación globalmente, en lugar de localmente, en una comparación bipartita (ver gráfico bipartito completo ). Luego, se calcula la significancia estadística de cada comparación. Se establecen valores de corte por posición y se establecen valores K para evitar que se agrupen "ortólogos" falsos. Los "parálogos" se identifican al encontrar secuencias que están más cerca dentro de la especie que dentro de otras especies.
Este recurso dejó de actualizarse en 2014. [2]
" Homo sapiens , Pan troglodytes , Mus musculus , Rattus norvegicus , Canis lupus familiaris , Bos taurus , Gallus gallus , Xenopus tropicalis , Danio rerio "
" Drosophila melanogaster , Anopheles gambiae , Caenorhabditis elegans "
" Saccharomyces cerevisiae , Schizosaccharomyces pombe , Kluyveromyces lactis , Eremothecium gossypii , Magnaporthe grisea , Neurospora crassa "
" Oryza sativa "
HomoloGene está vinculado a todas las bases de datos de Entrez y se basa en la información de homología y fenotipo de estos enlaces:
Como resultado, HomoloGene muestra información sobre genes, proteínas, fenotipos y dominios conservados.