Las propiedades estructurales y físicas del ADN proporcionan restricciones importantes sobre los sitios de unión formados en las superficies de las proteínas de unión al ADN . Las características de dichos sitios de unión pueden usarse para predecir los sitios de unión al ADN a partir de las propiedades estructurales e incluso de secuencia de las proteínas no unidas. Este enfoque se ha implementado con éxito para predecir la interfaz proteína-proteína. Aquí, este enfoque se adopta para predecir los sitios de unión al ADN en las proteínas de unión al ADN. El primer intento de usar características secuenciales y evolutivas para predecir los sitios de unión al ADN en las proteínas fue realizado por Ahmad et al. (2004) y Ahmad y Sarai (2005). [1] Algunos métodos usan información estructural para predecir los sitios de unión al ADN y, por lo tanto, requieren una estructura tridimensional de la proteína, mientras que otros usan solo información de secuencia y no requieren la estructura de la proteína para hacer una predicción.
La predicción basada en la estructura y la secuencia de los sitios de unión del ADN en las proteínas de unión al ADN se puede realizar en varios servidores web que se enumeran a continuación. DISIS predice los sitios de unión del ADN directamente a partir de la secuencia de aminoácidos y, por lo tanto, es aplicable para todas las proteínas conocidas. Se basa en las propiedades químico-físicas del residuo y su entorno, las características estructurales predichas y los datos evolutivos. Utiliza algoritmos de aprendizaje automático . [2] DISIS2 recibe la secuencia de aminoácidos sin procesar y genera todas las características a partir de ella, como la estructura secundaria , la accesibilidad al disolvente , el desorden, el valor b , la interacción proteína-proteína, las bobinas enrolladas y los perfiles evolutivos , etc. La cantidad de características predichas es mucho mayor que la de DISIS (versión anterior). Finalmente, DISIS2 puede predecir los residuos de unión al ADN a partir de la secuencia de proteínas de las proteínas de unión al ADN. DNABindR predice los sitios de unión al ADN a partir de las secuencias de aminoácidos utilizando algoritmos de aprendizaje automático. [3] DISPLAR hace una predicción basada en las propiedades de la estructura de la proteína. Se requiere conocimiento de la estructura de la proteína [4] BindN hace una predicción basada en las propiedades químicas de la secuencia de proteína de entrada. No se requiere conocimiento de la estructura de la proteína. [5] BindN+ es una versión mejorada de BindN que aplica máquinas de vectores de soporte (SVM) a la predicción basada en secuencias de residuos de unión de ADN o ARN a partir de características bioquímicas e información evolutiva. [6] DP-Bind combina múltiples métodos para hacer una predicción de consenso basada en el perfil de conservación evolutiva y las propiedades de la secuencia de proteína de entrada. El perfil de conservación evolutiva es generado automáticamente por el servidor web. No se requiere conocimiento de la estructura de la proteína. [7] DBS-PSSM [1] y DBS-Pred [8] predicen la unión de ADN en una proteína a partir de su información de secuencia.