Estas herramientas están abocadas a generar material para las bases terminológicas y que requieren del análisis y evaluación del usuario para la inclusión definitiva en la base de datos.
Sin embargo, la automatización de la extracción de los términos se enfrenta a problemas consustanciales a la propia naturaleza lingüística de los términos, así como a su variación denominativa.
Estos problemas estriban ante todo en identificar y separar los términos de los no términos, tanto simples como compuestos.
De esta manera se podrá hacer legible por la máquina.
Asimismo se puede dotar de conocimiento sintáctico etiquetando los textos para basar una extracción en algoritmos formales de composición gramatical.