La base de datos de proteínas de unión a ARN (RBPDB) es una base de datos biológica de especificidades de proteínas de unión a ARN que incluye observaciones experimentales de sitios de unión a ARN. Los resultados experimentales incluidos son tanto in vitro como in vivo de la literatura primaria. [1] Incluye cuatro especies de metazoos , que son Homo sapiens , Mus musculus , Drosophila melanogaster y Caenorhabditis elegans . Los dominios de unión a ARN incluidos en esta base de datos son el motivo de reconocimiento de ARN, la homología K, el dedo de zinc CCCH y más dominios. A partir de 2021 [actualizar], la última versión de RBPDB (v1.3, septiembre de 2012) incluye 1171 proteínas de unión a ARN. [2]
Los procesos de transcripción y traducción son diferentes en procariotas y eucariotas. A diferencia de los procariotas, estos dos procesos ocurren por separado en el núcleo y el citoplasma de los eucariotas. Debido a esto, los eucariotas aplican una estrategia llamada modificación postranscripcional que incluye corte y empalme, edición y poliadenilación para procesar el pre-ARNm. Las proteínas de unión a ARN (RBP) desempeñan un papel fundamental durante este proceso. Todas las RBP pueden unirse al ARN dependiendo de diferentes especificidades y afinidades. [3] [4] [5] Las RBP contienen al menos un dominio de unión a ARN y, por lo general, tienen múltiples dominios de unión. Dominio de unión a ARN (RBD, también conocido como dominio RNP y motivo de reconocimiento de ARN, RRM), dominio de homología K (KH) (tipo I y tipo II), caja RGG (Arg-Gly-Gly) , dominio Sm; Caja DEAD/DEAH, dedo de zinc (ZnF, principalmente C-x8-X-x5-X-x3-H), dominio de unión a ARN bicatenario (dsRBD), dominio de choque por frío; El dominio Pumilio/FBF (PUF o Pum-HD) y el dominio Piwi/Argonaute/Zwille (PAZ) se han caracterizado bien. [6] [7]
Las RBP están construidas por múltiples dominios de unión. Estos dominios contienen algunas unidades modulares básicas. En comparación con un solo motivo, las RBP pueden reconocer una extensión mucho más larga de ácidos nucleicos con esos múltiples motivos. Mientras tanto, las RBP se unen al ARN formando interacciones débiles. Estos motivos aumentan considerablemente la superficie de interacción débil. Como resultado, las RBP pueden unirse al ARN con mayor especificidad y afinidad que el dominio único. [8] La base de datos de proteínas de unión a ARN tiene tres categorías específicas principales. Son motivo de reconocimiento de ARN (RRM), dominio de homología K (dominio KH) y dedos de zinc.
En el artículo de Lunde, su grupo ha introducido diferentes tipos de motivos proteicos de unión a ARN y sus funciones específicas. [7]
El ARN de reconocimiento (RRM) contiene alrededor de 80 a 90 aminoácidos que forman una hoja β antiparalela de cuatro cadenas con dos hélices (topología βαββαβ). La hoja β desempeña un papel fundamental en el reconocimiento del ARN. Normalmente, tres residuos conservados en la hoja β son muy importantes para este proceso de reconocimiento. Específicamente, un residuo de Arg o Lys forma un puente salino con la cadena principal de fosfodiéster y otros dos residuos aromáticos realizan interacciones de apilamiento con las nucleobases. Cada una de estas cuatro hojas β reconoce un nucleótido. Sin embargo, con bucles expuestos y una estructura secundaria adicional, RRM puede reconocer hasta 8 nucleótidos. [7] [9]
El dominio de homología K (dominio KH) fue el primero identificado en humanos. Proviene de la ribonucleoproteína nuclear heterogénea (hnRNP) K. Por lo tanto, los dominios de unión que pertenecen a esta familia se denominan dominio de homología K. Es un dominio que se une tanto al ssDNA como al ssRNA. Los eucariotas, eubacterias y arqueas suelen tener este tipo de dominios. El dominio contiene alrededor de 70 aminoácidos. La secuencia de firma importante de este dominio es (I/L/V)IGXXGXX(I/L/V). Todos los dominios KH contienen láminas β de tres cadenas y tres hélices α. Hay dos subfamilias de este dominio. Dominio KH tipo I (topología βααββα) y dominio KH tipo II (topología αββααβ). Para ambas clases, el bucle GXXG, las hélices flanqueantes, la cadena β y el bucle variable entre β2 y β3 (tipo I) o entre α2 y β2 (tipo II) juegan un papel muy importante en el reconocimiento del ARN. [7] [10]
Los dedos de zinc son los dominios que contienen residuos coordinados de zinc. Hay tres tipos principales de este dominio que son Cys2His2 (CCHH), CCCH o CCHC. Generalmente, hay varias repeticiones de este dominio que trabajan juntas en una proteína. Cuando el dedo de zinc CCHH se une al ADN, los residuos en su hélice α de reconocimiento forman enlaces de hidrógeno con los pares de bases de Watson-Crick en el surco principal. Cuando se une al ARN, los mismos residuos utilizados para reconocer el ADN aún pueden usarse para reconocer el ARN. La estrategia utilizada por la figura del zinc para distinguir estos dos tipos de nucleótidos puede contener una disposición estructural distinta de este dominio. Los dedos de zinc CCCH y CCHC se unen a un elemento de ARN rico en AU. A diferencia de la cifra de zinc CCHH, la forma de la proteína es el principal determinante de la especificidad. [7] [11]
En el artículo de Ray y Kazan, abordan la cuestión de la preferencia de secuencia de las RBP. En su investigación, se incuba un único RBP con un gran exceso molar de un conjunto complejo de ARN. La proteína se recupera mediante selección por afinidad y los ARN asociados se interrogan mediante microarrays y análisis computacionales. Sus resultados muestran que las proteínas de unión a ARN tienen preferencia de secuencia y que las RBP idénticas o estrechamente relacionadas se unirán a una secuencia de ARN similar específica. [12]
En este momento, la base de datos de proteínas de unión a ARN (RBPDB) contiene 1171 proteínas de unión a ARN de Homo sapiens , Mus musculus , Drosophila melanogaster y Caenorhabditis elegans . Las proteínas se pueden buscar por dominio o especie. Ambas formas conducirán a la lista de información detallada de proteínas que incluye símbolo del gen, ID de anotación, sinónimos, descripción del gen, especie, dominio de unión al ARN, número de experimento y homólogos. El enlace sobre el número de experimentos conduce a los artículos de investigación relacionados con la proteína. Además, en esta base de datos los usuarios pueden buscar experimentos relacionados con una secuencia de unión de ARN específica. Además, este sitio puede ayudar a los usuarios a predecir los sitios de unión de una secuencia.