Anonimización de datos

La anonimización de datos es un tipo de desinfección de la información cuyo objetivo es proteger la privacidad . Es el proceso de eliminar información de identificación personal de los conjuntos de datos , de modo que las personas a las que se refieren los datos permanezcan anónimas .

Descripción general

La anonimización de datos se ha definido como un "proceso mediante el cual se modifican los datos personales de tal manera que el titular de los datos ya no puede ser identificado directa o indirectamente, ya sea por el responsable del tratamiento de los datos solo o en colaboración con cualquier otra parte". ^[1] La anonimización de datos puede permitir la transferencia de información a través de una frontera, como entre dos departamentos dentro de una agencia o entre dos agencias, al tiempo que reduce el riesgo de divulgación no intencionada, y en ciertos entornos de una manera que permite la evaluación y el análisis posteriores a la anonimización.

En el contexto de los datos médicos , los datos anonimizados son aquellos que no permiten identificar al paciente. Deben eliminarse el nombre, la dirección y el código postal completo, así como cualquier otra información que, en combinación con otros datos que el destinatario tenga o le haya comunicado, pueda identificar al paciente. ^[2]

Siempre existirá el riesgo de que los datos anonimizados no sigan siendo anónimos con el tiempo. La combinación de conjuntos de datos anonimizados con otros datos, técnicas inteligentes y potencia bruta son algunas de las formas en que los conjuntos de datos que antes eran anónimos han pasado a ser anónimos; los interesados ya no son anónimos.

La desanonimización es el proceso inverso en el que los datos anónimos se cruzan con otras fuentes de datos para volver a identificar la fuente de datos anónimos. ^[3] La generalización y la perturbación son los dos enfoques de anonimización más populares para los datos relacionales. ^[4] El proceso de ocultar los datos con la capacidad de volver a identificarlos más tarde también se denomina seudonimización y es una forma en que las empresas pueden almacenar datos de una manera que cumpla con la HIPAA .

Sin embargo, según el GRUPO DE TRABAJO SOBRE PROTECCIÓN DE DATOS DEL ARTÍCULO 29, la Directiva 95/46/CE se refiere a la anonimización en el Considerando 26, lo que significa que "para anonimizar cualquier dato, los datos deben despojarse de elementos suficientes para que el interesado ya no pueda ser identificado". Más concretamente, los datos deben procesarse de tal manera que ya no puedan utilizarse para identificar a una persona física utilizando "todos los medios que razonablemente puedan emplearse" ni el responsable del tratamiento ni un tercero. Un factor importante es que el procesamiento debe ser irreversible. La Directiva no aclara cómo debería o podría realizarse dicho proceso de desidentificación. La atención se centra en el resultado: que los datos deben ser tales que no permitan identificar al interesado a través de "todos" los medios "probables" y "razonables". Se hace referencia a los códigos de conducta como herramienta para establecer posibles mecanismos de anonimización, así como la conservación en una forma en la que la identificación del interesado "ya no sea posible". ^[5]

Hay cinco tipos de operaciones de anonimización de datos: generalización, supresión, anatomización, permutación y perturbación. ^[6]

Requisitos del RGPD

El Reglamento General de Protección de Datos (RGPD) de la Unión Europea exige que los datos almacenados sobre personas en la UE se sometan a un proceso de anonimización o seudonimización . ^[7] El considerando (26) del RGPD establece un listón muy alto para lo que constituyen datos anónimos, eximiendo así a los datos de los requisitos del RGPD, a saber, “…información que no se refiera a una persona física identificada o identificable o a datos personales anonimizados de tal manera que el interesado no sea o haya dejado de ser identificable”. El Supervisor Europeo de Protección de Datos (SEPD) y la Agencia Española de Protección de Datos (AEPD) han publicado una guía conjunta relacionada con los requisitos de anonimato y la exención de los requisitos del RGPD. Según el SEPD y la AEPD, nadie, incluido el responsable del tratamiento de datos, debería poder volver a identificar a los interesados en un conjunto de datos debidamente anonimizados. ^[8] La investigación realizada por científicos de datos del Imperial College de Londres y de la UCLouvain de Bélgica, ^[9] así como una sentencia del juez Michal Agmon-Gonen del Tribunal de Distrito de Tel Aviv, ^[10] ponen de relieve las deficiencias de la "anonimización" en el mundo actual de los macrodatos . La anonimización refleja un enfoque obsoleto de la protección de datos que se desarrolló cuando el procesamiento de datos se limitaba a aplicaciones aisladas (en silos), antes de la popularidad del procesamiento de macrodatos que implicaba el intercambio y la combinación generalizados de datos. ^[11]

Anonimización de diferentes tipos de datos

Datos estructurados:

Bases de datos

Datos no estructurados:

Archivos PDF - Anonimización de texto, tablas, imágenes, páginas escaneadas.
DICOM - Metadatos de anonimización, datos de píxeles, datos de superposición, documentos encapsulados. ^[12]
Imágenes

Eliminar metadatos de identificación de los archivos informáticos es importante para anonimizarlos. Las herramientas de eliminación de metadatos son útiles para lograrlo.

Véase también

Referencias

^ ISO 25237:2017 Informática de la salud -- Seudonimización. ISO. 2017. p. 7.
^ "Anonimización de datos". Diccionario médico gratuito . Consultado el 17 de enero de 2014 .
^ "Desanonimización". Whatis.com . Consultado el 17 de enero de 2014 .
^ Bin Zhou; Jian Pei; WoShun Luk (diciembre de 2008). "Una breve encuesta sobre técnicas de anonimización para preservar la privacidad de la publicación de datos de redes sociales" (PDF) . Boletín informativo ACM SIGKDD Explorations Newsletter . 10 (2): 12–22. doi :10.1145/1540276.1540279. S2CID 609178.
^ "Dictamen 05/2014 sobre técnicas de anonimización" (PDF) . Comisión Europea . 10 de abril de 2014 . Consultado el 31 de diciembre de 2023 .
^ Eyupoglu, Can; Aydin, Muhammed; Zaim, Abdul; Sertbas, Ahmet (17 de mayo de 2018). "Un algoritmo de anonimización de big data eficiente basado en técnicas de caos y perturbación". Entropy . 20 (5): 373. Bibcode :2018Entrp..20..373E. doi : 10.3390/e20050373 . ISSN 1099-4300. PMC 7512893 . PMID 33265463. El texto fue copiado de esta fuente, que está disponible bajo una Licencia Creative Commons Atribución 4.0 Internacional.
^ Skiera, Bernd (2022). El impacto del RGPD en el mercado de la publicidad online. Klaus Miller, Yuxi Jin, Lennart Kraft, René Laub, Julia Schmitt. Frankfurt am Main. ISBN 978-3-9824173-0-1.OCLC 1303894344 .{{cite book}}: Mantenimiento de CS1: falta la ubicación del editor ( enlace )
^ "Introducción a la Función Hash como Técnica de Seudonimización de Datos Personales" (PDF) . Autoridad Española de Protección de Datos. Octubre de 2019 . Consultado el 31 de diciembre de 2023 .
^ Kolata, Gina (23 de julio de 2019). "¿Sus datos fueron 'anónimos'? Estos científicos aún pueden identificarlo". The New York Times .
^ "Attm (TA) 28857-06-17 Nursing Companies Association v. Ministry of Defense" (en idish). Pearl Cohen. 2019. Consultado el 31 de diciembre de 2023 .
^ Solomon, S. (31 de enero de 2019). "Los datos están en juego bajo la anticuada ley de privacidad israelí, dice un grupo de expertos". The Times of Israel . Consultado el 31 de diciembre de 2023 .
^ "Desidentificación/anonimización DICOM: protección de la privacidad del paciente en imágenes médicas". 2024.

Lectura adicional

Raghunathan, Balaji (junio de 2013). El libro completo sobre anonimización de datos: desde la planificación hasta la implementación . CRC Press. ISBN 9781482218565.
Khaled El Emam , Luk Arbuckle (agosto de 2014). Anonimización de datos sanitarios: estudios de casos y métodos para empezar . O'Reilly Media. ISBN 978-1-4493-6307-9.
Rolf H. Weber, Ulrike I. Heinrich (2012). Anonimización: SpringerBriefs in Cybersecurity . Saltador. ISBN 9781447140665.
Aris Gkoulalas-Divanis, Grigorios Loukides (2012). Anonimización de registros médicos electrónicos para respaldar el análisis clínico (SpringerBriefs in Electrical and Computer Engineering) . Springer. ISBN 9781461456674.
Pete Warden. "Por qué no se pueden anonimizar los datos". O'Reilly Media, Inc. Archivado desde el original el 9 de enero de 2014. Consultado el 17 de enero de 2014 .

Enlaces externos

Sobre la anonimización del tráfico de Internet: lista de lectura sobre intercambio de datos y anonimización