Base de datos de dominio conservada

La base de datos de dominios conservados ( CDD ) es una base de datos de modelos de alineación de secuencias múltiples bien anotados y modelos de búsqueda de bases de datos derivados, para dominios antiguos y proteínas de longitud completa. ^[1]

Filosofía

Los dominios pueden considerarse unidades funcionales y/o estructurales distintas de una proteína. De hecho, estas dos clasificaciones coinciden con bastante frecuencia, y lo que se encuentra como una unidad de plegamiento independiente de una cadena polipeptídica también tiene una función específica. Los dominios a menudo se identifican como unidades recurrentes (de secuencia o estructura), que pueden existir en diversos contextos. En la evolución molecular, dichos dominios pueden haberse utilizado como bloques de construcción y pueden haberse recombinado en diferentes disposiciones para modular la función de las proteínas. CDD define dominios conservados como unidades recurrentes en la evolución molecular, cuya extensión puede determinarse mediante análisis de secuencia y estructura.

El objetivo del proyecto de conservación de dominios conservados del NCBI es proporcionar a los usuarios de bases de datos información sobre cómo los patrones de conservación y divergencia de residuos en una familia se relacionan con las propiedades funcionales, y proporcionar enlaces útiles a información más detallada que pueda ayudar a comprender esas secuencias/estructuras. / relaciones de función. Para hacer esto, los curadores de CDD incluyen los siguientes tipos de información para complementar y enriquecer los alineamientos de secuencias múltiples tradicionales que forman la base de los modelos de dominio: estructuras tridimensionales y motivos centrales conservados, características/sitios conservados, organización filogenética, enlaces a Recursos de literatura electrónica.

Contenido

El contenido de CDD incluye modelos de dominio seleccionados manualmente por NCBI y modelos de dominio importados de varias bases de datos de fuentes externas ( Pfam , SMART, COG, PRK, TIGRFAMs ). Lo que es único acerca de los dominios seleccionados por el NCBI es que utilizan información de estructura 3D para definir explícitamente los límites del dominio, alinear bloques, modificar detalles de alineación y proporcionar información sobre las relaciones de secuencia/estructura/función. Los modelos seleccionados manualmente se organizan jerárquicamente si describen familias de dominios que están claramente relacionadas por descendencia común. Para proporcionar una vista no redundante de los datos, CDD agrupa modelos de dominio similares de varias fuentes en superfamilias.

Buscando en la base de datos

La colección también forma parte del sistema de consulta y recuperación Entrez del NCBI , y está vinculado a muchos otros recursos. CDD proporciona anotaciones de huellas de dominio y sitios funcionales conservados en secuencias de proteínas. La anotación de dominio precalculada se puede recuperar para secuencias de proteínas rastreadas en el sistema Entrez del NCBI, y la colección de modelos de CDD se puede consultar con secuencias de proteínas novedosas a través de * "el servicio CD-Search". Centro Nacional de Información Biotecnológica de Estados Unidos., o en* "la búsqueda de CD por lotes". Centro Nacional de Información Biotecnológica de Estados Unidos., que permite el cálculo y la descarga de anotaciones para grandes conjuntos de consultas de proteínas.

Referencias

^ ab Marchler-Bauer, A.; Zheng, C.; Chitsaz, F.; Derbyshire, MK; Geer, LY; Geer, RC; González, NR; Gwadz, M.; Hurwitz, DI; Lanczycki, CJ; Lu, F.; Lu, S.; Marchler, GH; Canción, JS; Gracias, N.; Yamashita, RA; Zhang, D.; Bryant, SH (2012). "CDD: dominios conservados y estructura tridimensional de proteínas". Investigación de ácidos nucleicos . 41 (Problema de la base de datos): D348 – D352. doi : 10.1093/nar/gks1243. PMC 3531192 . PMID 23197659.

enlaces externos

"Base de datos de dominios conservados (CDD) y grupo de recursos". Centro Nacional de Información Biotecnológica de Estados Unidos.