Un dominio de función desconocida (DUF) es un dominio proteico que no tiene una función caracterizada. Estas familias se han recopilado juntas en la base de datos de Pfam utilizando el prefijo DUF seguido de un número, siendo los ejemplos DUF2992 y DUF1220 . En 2019, hay casi 4000 familias DUF en la base de datos de Pfam, lo que representa más del 22 % de las familias conocidas. Algunos DUF no se nombran utilizando la nomenclatura debido al uso popular, pero, no obstante, son DUF. [1]
La designación DUF es provisional y estas familias tienden a cambiar de nombre a un nombre más específico (o fusionarse con un dominio existente) después de que se identifica una función. [2] [3]
Chris Ponting introdujo el esquema de nombres DUF mediante la adición de DUF1 y DUF2 a la base de datos SMART . [4] Se descubrió que estos dos dominios estaban ampliamente distribuidos en las proteínas de señalización bacterianas. Posteriormente, se identificaron las funciones de estos dominios y desde entonces se les cambió el nombre a dominio GGDEF y dominio EAL respectivamente. [2]
Los programas de genómica estructural han intentado comprender la función de los DUF mediante la determinación de la estructura. Se han solucionado las estructuras de más de 250 familias DUF. Este trabajo (2009) mostró que aproximadamente dos tercios de las familias DUF tenían una estructura similar a una previamente resuelta y, por lo tanto, probablemente eran miembros divergentes de superfamilias de proteínas existentes, mientras que aproximadamente un tercio poseía un nuevo pliegue proteico. [5]
Algunas familias DUF comparten homología de secuencia remota con dominios que han caracterizado su función. El trabajo computacional se puede utilizar para vincular estas relaciones. Un trabajo de 2015 logró asignar el 20% de los DUF a superfamilias estructurales caracterizadas. [6] Pfam también realiza continuamente la asignación (verificada manualmente) en entradas de superfamilia de "clan". [1]
Más del 20% de todos los dominios proteicos fueron anotados como DUF en 2013. Alrededor de 2700 DUF se encuentran en bacterias en comparación con poco más de 1500 en eucariotas. Más de 800 DUF se comparten entre bacterias y eucariotas, y alrededor de 300 de ellos también están presentes en arqueas. Incluso se producen un total de 2.786 dominios Pfam bacterianos en animales, incluidos 320 DUF. [7]
Muchos DUF están altamente conservados, lo que indica un papel importante en la biología. Sin embargo, muchos de estos DUF no son esenciales, por lo que su función biológica a menudo sigue siendo desconocida. Por ejemplo, DUF143 está presente en la mayoría de las bacterias y genomas de eucariotas . [8] Sin embargo, cuando se eliminó en Escherichia coli no se detectó ningún fenotipo obvio . Posteriormente se demostró que las proteínas que contienen DUF143, son factores silenciadores ribosómicos que bloquean el ensamblaje de las dos subunidades ribosómicas. [8] Si bien esta función no es esencial, ayuda a las células a adaptarse a condiciones de escasez de nutrientes al cerrar la biosíntesis de proteínas. Como resultado, estas proteínas y el DUF sólo se vuelven relevantes cuando las células mueren de hambre. [8] Por lo tanto, se cree que muchas DUF (o proteínas de función desconocida, PUF) solo se requieren bajo ciertas condiciones.
Goodacre et al. identificaron 238 DUF en 355 proteínas esenciales (en 16 especies bacterianas modelo), la mayoría de las cuales representan proteínas de dominio único, estableciendo claramente la esencialidad biológica de las DUF. Estos DUF se denominan "DUF esenciales" o eDUF. [7]