La anonimización de datos es un tipo de desinfección de la información cuyo objetivo es la protección de la privacidad . Es el proceso de eliminar información de identificación personal de conjuntos de datos , de modo que las personas que describen los datos permanezcan en el anonimato .
La anonimización de datos se ha definido como un "proceso mediante el cual los datos personales se modifican de tal manera que un interesado ya no puede ser identificado directa o indirectamente, ya sea por el controlador de datos solo o en colaboración con cualquier otra parte". [1] La anonimización de datos puede permitir la transferencia de información a través de una frontera, como entre dos departamentos dentro de una agencia o entre dos agencias, al tiempo que reduce el riesgo de divulgación no intencionada, y en ciertos entornos de una manera que permite la evaluación y el análisis post- anonimización.
En el contexto de los datos médicos , los datos anonimizados se refieren a datos a partir de los cuales el destinatario de la información no puede identificar al paciente. Se deben eliminar el nombre, la dirección y el código postal completo, junto con cualquier otra información que, junto con otros datos en poder del destinatario o revelados a él, pueda identificar al paciente. [2]
Siempre existirá el riesgo de que los datos anonimizados no permanezcan anónimos con el tiempo. Emparejar el conjunto de datos anónimos con otros datos, técnicas inteligentes y potencia bruta son algunas de las formas en que conjuntos de datos que antes eran anónimos se han vuelto anonimizados; Los interesados ya no son anónimos.
La anonimización es el proceso inverso en el que los datos anónimos se cruzan con otras fuentes de datos para volver a identificar la fuente de datos anónima. [3] La generalización y la perturbación son los dos enfoques populares de anonimización para datos relacionales. [4] El proceso de ocultar datos con la capacidad de volver a identificarlos más tarde también se llama seudonimización y es una forma en que las empresas pueden almacenar datos de una manera que cumpla con HIPAA .
Sin embargo, según el GRUPO DE TRABAJO SOBRE PROTECCIÓN DE DATOS DEL ARTÍCULO 29, la Directiva 95/46/CE hace referencia a la anonimización en el considerando 26 "significa que para anonimizar cualquier dato, los datos deben ser despojados de elementos suficientes para que el interesado ya no pueda ser identificado. Más precisamente, esos datos deben procesarse de tal manera que ya no puedan usarse para identificar a una persona física utilizando “todos los medios que razonablemente puedan ser utilizados” ni por el controlador ni por un tercero. Un factor importante es que. el procesamiento debe ser irreversible. La Directiva no aclara cómo debe o podría realizarse dicho proceso de desidentificación. La atención se centra en el resultado: que los datos deben ser tales que no permitan que el interesado sea identificado a través de “todos”. "probable" y "razonable" significan que se hace referencia a los códigos de conducta como una herramienta para establecer posibles mecanismos de anonimización, así como la retención en una forma en la que la identificación del interesado "ya no sea posible" [5] .
Hay cinco tipos de operaciones de anonimización de datos: generalización, supresión, anatomización, permutación y perturbación. [6]
El Reglamento General de Protección de Datos (GDPR) de la Unión Europea exige que los datos almacenados sobre personas en la UE se sometan a un proceso de anonimización o de seudonimización . [7] El considerando (26) del RGPD establece un listón muy alto para lo que constituyen datos anónimos, eximiendo así a los datos de los requisitos del RGPD, es decir, "... información que no se relaciona con una persona física identificada o identificable o con datos personales proporcionados". anónimo de tal manera que el interesado no sea o ya no sea identificable”. El Supervisor Europeo de Protección de Datos (SEPD) y la Agencia Española de Protección de Datos (AEPD) han emitido una guía conjunta relacionada con los requisitos de anonimato y la exención de los requisitos del RGPD. Según el SEPD y la AEPD, nadie, incluido el responsable del tratamiento, debería poder volver a identificar a los interesados en un conjunto de datos debidamente anonimizado. [8] Investigaciones realizadas por científicos de datos del Imperial College de Londres y de la UCLouvain de Bélgica, [9] así como una sentencia del juez Michal Agmon-Gonen del Tribunal de Distrito de Tel Aviv, [10] ponen de relieve las deficiencias de la "anonimización" en la sociedad actual. mundo de los grandes datos . La anonimización refleja un enfoque obsoleto de la protección de datos que se desarrolló cuando el procesamiento de datos se limitaba a aplicaciones aisladas (en silos), antes de la popularidad del procesamiento de big data que implicaba compartir y combinar datos de manera generalizada. [11]
Datos estructurados:
Datos no estructurados:
{{cite book}}
: Mantenimiento CS1: falta el editor de la ubicación ( enlace )