La anonimización de datos es un tipo de desinfección de la información cuyo objetivo es proteger la privacidad . Es el proceso de eliminar información de identificación personal de los conjuntos de datos , de modo que las personas a las que se refieren los datos permanezcan anónimas .
La anonimización de datos se ha definido como un "proceso mediante el cual se modifican los datos personales de tal manera que el titular de los datos ya no puede ser identificado directa o indirectamente, ya sea por el responsable del tratamiento de datos solo o en colaboración con cualquier otra parte". [1] La anonimización de datos puede permitir la transferencia de información a través de una frontera, como entre dos departamentos dentro de una agencia o entre dos agencias, al tiempo que reduce el riesgo de divulgación no intencionada, y en ciertos entornos de una manera que permite la evaluación y el análisis posteriores a la anonimización.
En el contexto de los datos médicos , los datos anonimizados son aquellos que no permiten identificar al paciente. Deben eliminarse el nombre, la dirección y el código postal completo, así como cualquier otra información que, en combinación con otros datos que el destinatario tenga o le haya comunicado, pueda identificar al paciente. [2]
Siempre existirá el riesgo de que los datos anonimizados no sigan siendo anónimos con el tiempo. La combinación de conjuntos de datos anonimizados con otros datos, técnicas inteligentes y potencia bruta son algunas de las formas en que los conjuntos de datos que antes eran anónimos han pasado a ser anónimos; los interesados ya no son anónimos.
La desanonimización es el proceso inverso en el que los datos anónimos se cruzan con otras fuentes de datos para volver a identificar la fuente de datos anónimos. [3] La generalización y la perturbación son los dos enfoques de anonimización más populares para los datos relacionales. [4] El proceso de ocultar los datos con la capacidad de volver a identificarlos más tarde también se denomina seudonimización y es una forma en que las empresas pueden almacenar datos de una manera que cumpla con la HIPAA .
Sin embargo, según el GRUPO DE TRABAJO SOBRE PROTECCIÓN DE DATOS DEL ARTÍCULO 29, la Directiva 95/46/CE se refiere a la anonimización en el Considerando 26, lo que significa que "para anonimizar cualquier dato, los datos deben despojarse de elementos suficientes para que el interesado ya no pueda ser identificado". Más concretamente, los datos deben procesarse de tal manera que ya no puedan utilizarse para identificar a una persona física utilizando "todos los medios que puedan emplearse razonablemente" el responsable del tratamiento o un tercero. Un factor importante es que el procesamiento debe ser irreversible. La Directiva no aclara cómo debería o podría llevarse a cabo dicho proceso de desidentificación. La atención se centra en el resultado: los datos deben ser tales que no permitan identificar al interesado a través de "todos" los medios "probables" y "razonables". Se hace referencia a los códigos de conducta como herramienta para establecer posibles mecanismos de anonimización, así como la conservación en una forma en la que la identificación del interesado "ya no sea posible". [5]
Hay cinco tipos de operaciones de anonimización de datos: generalización, supresión, anatomización, permutación y perturbación. [6]
El Reglamento General de Protección de Datos (RGPD) de la Unión Europea exige que los datos almacenados sobre personas en la UE se sometan a un proceso de anonimización o seudonimización . [7] El considerando (26) del RGPD establece un listón muy alto para lo que constituyen datos anónimos, eximiendo así a los datos de los requisitos del RGPD, a saber, “…información que no se refiera a una persona física identificada o identificable o a datos personales anonimizados de tal manera que el interesado no sea o haya dejado de ser identificable”. El Supervisor Europeo de Protección de Datos (SEPD) y la Agencia Española de Protección de Datos (AEPD) han publicado una guía conjunta relacionada con los requisitos de anonimato y la exención de los requisitos del RGPD. Según el SEPD y la AEPD, nadie, incluido el responsable del tratamiento de datos, debería poder volver a identificar a los interesados en un conjunto de datos debidamente anonimizados. [8] La investigación realizada por científicos de datos del Imperial College de Londres y de la UCLouvain de Bélgica, [9] así como una sentencia del juez Michal Agmon-Gonen del Tribunal de Distrito de Tel Aviv, [10] ponen de relieve las deficiencias de la "anonimización" en el mundo actual de los macrodatos . La anonimización refleja un enfoque obsoleto de la protección de datos que se desarrolló cuando el procesamiento de datos se limitaba a aplicaciones aisladas (en silos), antes de la popularidad del procesamiento de macrodatos que implicaba el intercambio y la combinación generalizados de datos. [11]
Datos estructurados:
Datos no estructurados:
Eliminar metadatos de identificación de los archivos informáticos es importante para anonimizarlos. Las herramientas de eliminación de metadatos son útiles para lograrlo.
{{cite book}}
: Mantenimiento de CS1: falta la ubicación del editor ( enlace )