Clasificación de documentos

Se define como la tarea de asignar valores booleanos a cada par

{\displaystyle \langle d_{j},c_{i}\rangle }

pertenecientes a

{\displaystyle D}

es el dominio de los documentos y

es una colección de categorías predefinidas.

T (verdadero) indica archivar un documento

, mientras F (falso) indica no archivar

Entre las aplicaciones que encuentra la clasificación de documentos se tienen los filtros de correo electrónico (spam / no spam) Las medidas de evaluación utilizadas en la clasificación de documentos son principalmente precisión, cobertura y F-1.