Un dominio de función desconocida (DUF) es un dominio proteico que no tiene una función caracterizada. Estas familias se han recopilado en la base de datos Pfam utilizando el prefijo DUF seguido de un número, siendo algunos ejemplos DUF2992 y DUF1220 . En 2019, hay casi 4000 familias DUF dentro de la base de datos Pfam que representan más del 22 % de las familias conocidas. Algunos DUF no se nombran utilizando la nomenclatura debido al uso popular, pero no obstante son DUF. [1]
La designación DUF es tentativa, y dichas familias tienden a renombrarse con un nombre más específico (o fusionarse con un dominio existente) después de que se identifica una función. [2] [3]
El esquema de denominación DUF fue introducido por Chris Ponting, mediante la adición de DUF1 y DUF2 a la base de datos SMART . [4] Se descubrió que estos dos dominios estaban ampliamente distribuidos en las proteínas de señalización bacterianas. Posteriormente, se identificaron las funciones de estos dominios y desde entonces se los ha renombrado como dominio GGDEF y dominio EAL respectivamente. [2]
Los programas de genómica estructural han intentado comprender la función de las DUF a través de la determinación de la estructura. Se han resuelto las estructuras de más de 250 familias de DUF. Este trabajo (2009) mostró que aproximadamente dos tercios de las familias de DUF tenían una estructura similar a una resuelta previamente y, por lo tanto, era probable que fueran miembros divergentes de superfamilias de proteínas existentes, mientras que aproximadamente un tercio poseía un nuevo plegamiento de proteína. [5]
Algunas familias de DUF comparten homología de secuencia remota con dominios que tienen una función caracterizada. El trabajo computacional se puede utilizar para vincular estas relaciones. Un trabajo de 2015 logró asignar el 20% de los DUF a superfamilias estructurales caracterizadas. [6] Pfam también realiza continuamente la asignación (verificada manualmente) en las entradas de la superfamilia "clan". [1]
En 2013, más del 20% de todos los dominios proteicos se anotaron como DUF. Se encuentran alrededor de 2700 DUF en bacterias, en comparación con poco más de 1500 en eucariotas. Más de 800 DUF son compartidos entre bacterias y eucariotas, y alrededor de 300 de estos también están presentes en arqueas. Un total de 2786 dominios Pfam bacterianos se encuentran incluso en animales, incluidos 320 DUF. [7]
Muchos DUF están altamente conservados, lo que indica un papel importante en biología. Sin embargo, muchos de estos DUF no son esenciales, por lo que su papel biológico a menudo permanece desconocido. Por ejemplo, DUF143 está presente en la mayoría de las bacterias y genomas eucariotas . [8] Sin embargo, cuando se eliminó en Escherichia coli no se detectó ningún fenotipo obvio . Más tarde se demostró que las proteínas que contienen DUF143, son factores de silenciamiento ribosómico que bloquean el ensamblaje de las dos subunidades ribosómicas. [8] Si bien esta función no es esencial, ayuda a las células a adaptarse a condiciones de bajos nutrientes al detener la biosíntesis de proteínas. Como resultado, estas proteínas y el DUF solo se vuelven relevantes cuando las células mueren de hambre. [8] Por lo tanto, se cree que muchas DUF (o proteínas de función desconocida, PUF) solo son necesarias en ciertas condiciones.
Goodacre et al. identificaron 238 DUF en 355 proteínas esenciales (en 16 especies bacterianas modelo), la mayoría de las cuales representan proteínas de dominio único, lo que establece claramente la esencialidad biológica de las DUF. Estas DUF se denominan "DUF esenciales" o eDUF. [7]