La clasificación de datos es el proceso de organizar los datos en categorías según atributos como el tipo de archivo, el contenido o los metadatos . A continuación, se asignan a los datos etiquetas de clase que describen un conjunto de atributos para los conjuntos de datos correspondientes . El objetivo es proporcionar atributos de clase significativos a la información anterior menos estructurada.
La clasificación de datos puede verse como una multitud de etiquetas que se utilizan para definir el tipo de datos, especialmente en cuestiones de confidencialidad e integridad. [1] La clasificación de datos suele ser un proceso manual; sin embargo, existen herramientas que pueden ayudar a recopilar información sobre los datos. [2] A menudo se propone considerar los niveles de sensibilidad de los datos. [2]
Una política de clasificación de datos corporativos establece cómo deben tratar los empleados los diferentes tipos de datos que manejan. En ocasiones, se aplican técnicas de clasificación automatizada mediante algoritmos de software basados en palabras clave o frases del contenido para analizarlo y clasificarlo. Puede utilizarse para informes generados por sistemas ERP o cuando los datos incluyen información personal específica que se identifica. En algunos casos, los empleados pueden ser responsables de decidir qué etiqueta es la adecuada. [3]