stringtranslate.com

base de datos cath

Representación esquemática de los tres niveles superiores del esquema de clasificación CATH. [2]

La base de datos de clasificación de estructuras de proteínas CATH es un recurso en línea gratuito y disponible públicamente que proporciona información sobre las relaciones evolutivas de los dominios de proteínas . Fue creado a mediados de la década de 1990 por la profesora Christine Orengo y colegas como Janet Thornton y David Jones , [2] y continúa siendo desarrollado por el grupo Orengo del University College de Londres . CATH comparte muchas características generales con el recurso SCOP ; sin embargo, también hay muchas áreas en las que la clasificación detallada difiere mucho. [3] [4] [5] [6]

Organización jerárquica

Las estructuras tridimensionales de proteínas determinadas experimentalmente se obtienen del Protein Data Bank y se dividen en sus cadenas polipeptídicas consecutivas , cuando corresponde. Los dominios de proteínas se identifican dentro de estas cadenas mediante una combinación de métodos automáticos y curación manual. [ cita necesaria ]

Luego, los dominios se clasifican dentro de la jerarquía estructural CATH: en el nivel Clase (C), los dominios se asignan según el contenido de su estructura secundaria , es decir, todo alfa , todo beta , una mezcla de alfa y beta, o poca estructura secundaria; en el nivel Arquitectura (A), se utiliza para la asignación información sobre la disposición de la estructura secundaria en el espacio tridimensional; en el nivel de Topología/pliegue (T), se utiliza información sobre cómo se conectan y organizan los elementos de la estructura secundaria; Las asignaciones se realizan al nivel de superfamilia homóloga (H) si hay buena evidencia de que los dominios están relacionados por evolución [2] , es decir, son homólogos.

El recurso hermano de CATH, Gene3D, proporciona datos de secuencia adicionales para dominios sin estructuras determinadas experimentalmente, que se utilizan para poblar las superfamilias homólogas. Las secuencias de proteínas de UniProtKB y Ensembl se escanean frente a CATH HMM para predecir los límites de las secuencias de dominio y realizar asignaciones de superfamilias homólogas.

Lanzamientos

El equipo CATH tiene como objetivo proporcionar publicaciones oficiales de la clasificación CATH cada 12 meses. Este proceso de publicación es importante porque permite proporcionar validación interna, anotaciones y análisis adicionales. Sin embargo, puede significar que hay un retraso entre la aparición de nuevas estructuras en el PDB y la última versión oficial de CATH, [ cita necesaria ]

Para abordar este problema: CATH-B proporciona una cantidad limitada de información sobre las anotaciones de dominio más recientes (por ejemplo, límites de dominio y clasificaciones de superfamilias).

La última versión de CATH-Gene3D (v4.3) se lanzó en diciembre de 2020 y consta de:

Software de código abierto

CATH es un proyecto de software de código abierto , en el que los desarrolladores desarrollan y mantienen una serie de herramientas de código abierto. [7] CATH mantiene una lista de tareas pendientes en GitHub para permitir a los usuarios externos crear y realizar un seguimiento de los problemas relacionados con la clasificación de la estructura de la proteína CATH. [ cita necesaria ]

Referencias

  1. ^ abcde Dawson NL, Lewis TE, Das S, Lees JG, Lee D, Ashford P, et al. (Enero de 2017). "CATH: un recurso ampliado para predecir la función de las proteínas a través de la estructura y secuencia". Investigación de ácidos nucleicos . 45 (D1): D289-D295. doi :10.1093/nar/gkw1098. PMC  5210570 . PMID  27899584.
  2. ^ abc Orengo CA, Michie AD, Jones S, Jones DT, Swindells MB, Thornton JM (agosto de 1997). "CATH: una clasificación jerárquica de estructuras de dominios de proteínas". Estructura . 5 (8). Londres, Inglaterra: 1093–108. doi : 10.1016/s0969-2126(97)00260-8 . PMID  9309224.
  3. ^ "CATH: base de datos de clasificación de estructuras de proteínas en UCL". Cathdb.info . Consultado el 9 de marzo de 2017 .
  4. ^ "CATO". Cathdb.info . Consultado el 9 de marzo de 2017 .
  5. ^ "Base de datos CATH (@CATHDatabase)". Gorjeo . Consultado el 9 de marzo de 2017 .
  6. ^ Pearl FM, Bennett CF, Bray JE, Harrison AP, Martin N, Shepherd A, et al. (Enero de 2003). "La base de datos CATH: un recurso de familia de proteínas extendida para genómica estructural y funcional". Investigación de ácidos nucleicos . 31 (1): 452–455. doi :10.1093/nar/gkg062. PMC 165509 . PMID  12520050. 
  7. ^ "Herramientas". cathdb.info . Consultado el 18 de diciembre de 2016 .