Anonimización de datos

La anonimización de datos es un tipo de desinfección de la información cuyo objetivo es la protección de la privacidad . Es el proceso de eliminar información de identificación personal de conjuntos de datos , de modo que las personas que describen los datos permanezcan en el anonimato .

Descripción general

La anonimización de datos se ha definido como un "proceso mediante el cual los datos personales se modifican de tal manera que un interesado ya no puede ser identificado directa o indirectamente, ya sea por el controlador de datos solo o en colaboración con cualquier otra parte". ^[1] La anonimización de datos puede permitir la transferencia de información a través de una frontera, como entre dos departamentos dentro de una agencia o entre dos agencias, al tiempo que reduce el riesgo de divulgación no intencionada, y en ciertos entornos de una manera que permite la evaluación y el análisis post- anonimización.

En el contexto de los datos médicos , los datos anonimizados se refieren a datos a partir de los cuales el destinatario de la información no puede identificar al paciente. Se deben eliminar el nombre, la dirección y el código postal completo, junto con cualquier otra información que, junto con otros datos en poder del destinatario o revelados a él, pueda identificar al paciente. ^[2]

Siempre existirá el riesgo de que los datos anonimizados no permanezcan anónimos con el tiempo. Emparejar el conjunto de datos anónimos con otros datos, técnicas inteligentes y potencia bruta son algunas de las formas en que conjuntos de datos que antes eran anónimos se han vuelto anonimizados; Los interesados ya no son anónimos.

La anonimización es el proceso inverso en el que los datos anónimos se cruzan con otras fuentes de datos para volver a identificar la fuente de datos anónima. ^[3] La generalización y la perturbación son los dos enfoques populares de anonimización para datos relacionales. ^[4] El proceso de ocultar datos con la capacidad de volver a identificarlos más tarde también se llama seudonimización y es una forma en que las empresas pueden almacenar datos de una manera que cumpla con HIPAA .

Sin embargo, según el GRUPO DE TRABAJO SOBRE PROTECCIÓN DE DATOS DEL ARTÍCULO 29, la Directiva 95/46/CE hace referencia a la anonimización en el considerando 26 "significa que para anonimizar cualquier dato, los datos deben ser despojados de elementos suficientes para que el interesado ya no pueda ser identificado. Más precisamente, esos datos deben procesarse de tal manera que ya no puedan usarse para identificar a una persona física utilizando “todos los medios que razonablemente puedan ser utilizados” ni por el controlador ni por un tercero. Un factor importante es que. el procesamiento debe ser irreversible. La Directiva no aclara cómo debe o podría realizarse dicho proceso de desidentificación. La atención se centra en el resultado: que los datos deben ser tales que no permitan que el interesado sea identificado a través de “todos”. "probable" y "razonable" significan que se hace referencia a los códigos de conducta como una herramienta para establecer posibles mecanismos de anonimización, así como la retención en una forma en la que la identificación del interesado "ya no sea posible" ^{[5] .}

Hay cinco tipos de operaciones de anonimización de datos: generalización, supresión, anatomización, permutación y perturbación. ^[6]

Requisitos del RGPD

El Reglamento General de Protección de Datos (GDPR) de la Unión Europea exige que los datos almacenados sobre personas en la UE se sometan a un proceso de anonimización o de seudonimización . ^[7] El considerando (26) del RGPD establece un listón muy alto para lo que constituyen datos anónimos, eximiendo así a los datos de los requisitos del RGPD, es decir, "... información que no se relaciona con una persona física identificada o identificable o con datos personales proporcionados". anónimo de tal manera que el interesado no sea o ya no sea identificable”. El Supervisor Europeo de Protección de Datos (SEPD) y la Agencia Española de Protección de Datos (AEPD) han emitido una guía conjunta relacionada con los requisitos de anonimato y la exención de los requisitos del RGPD. Según el SEPD y la AEPD, nadie, incluido el responsable del tratamiento, debería poder volver a identificar a los interesados en un conjunto de datos debidamente anonimizado. ^[8] Investigaciones realizadas por científicos de datos del Imperial College de Londres y de la UCLouvain de Bélgica, ^[9] así como una sentencia del juez Michal Agmon-Gonen del Tribunal de Distrito de Tel Aviv, ^[10] ponen de relieve las deficiencias de la "anonimización" en la sociedad actual. mundo de los grandes datos . La anonimización refleja un enfoque obsoleto de la protección de datos que se desarrolló cuando el procesamiento de datos se limitaba a aplicaciones aisladas (en silos), antes de la popularidad del procesamiento de big data que implicaba compartir y combinar datos de manera generalizada. ^[11]

Anonimización de diferentes tipos de datos.

Datos estructurados:

Bases de datos

Datos no estructurados:

Archivos PDF : anonimización de texto, tablas, imágenes y páginas escaneadas.
DICOM : metadatos de anonimización, datos de píxeles, datos superpuestos, documentos encapsulados. ^[12]
Imágenes

Ver también

Referencias

^ ISO 25237:2017 Informática de la salud - Seudonimización. YO ASI. 2017. pág. 7.
^ "Anonimización de datos". El diccionario médico gratuito . Consultado el 17 de enero de 2014 .
^ "Desanonimización". Whatis.com . Consultado el 17 de enero de 2014 .
^ Bin Zhou; Jian Pei; WoShun Luk (diciembre de 2008). "Una breve encuesta sobre técnicas de anonimización para preservar la privacidad en la publicación de datos de redes sociales" (PDF) . Boletín Boletín de Exploraciones ACM SIGKDD . 10 (2): 12-22. doi :10.1145/1540276.1540279. S2CID 609178.
↑ «Dictamen 05/2014 sobre Técnicas de Anonimización» (PDF) . Comisión de la UE . 10 de abril de 2014 . Consultado el 31 de diciembre de 2023 .
^ Eyupoglu, puede; Aydin, Mahoma; Zaim, Abdul; Sertbas, Ahmet (17 de mayo de 2018). "Un algoritmo eficiente de anonimización de big data basado en técnicas de caos y perturbación". Entropía . 20 (5): 373. Bibcode : 2018Entrp..20..373E. doi : 10.3390/e20050373 . ISSN 1099-4300. PMC 7512893 . PMID 33265463. El texto se copió de esta fuente, que está disponible bajo una licencia internacional Creative Commons Attribution 4.0.
^ Skiera, Bernd (2022). El impacto del RGPD en el mercado de la publicidad online. Klaus Miller, Yuxi Jin, Lennart Kraft, René Laub, Julia Schmitt. Fráncfort del Meno. ISBN 978-3-9824173-0-1. OCLC 1303894344.{{cite book}}: Mantenimiento CS1: falta el editor de la ubicación ( enlace )
^ "Introducción a la función Hash como técnica de seudonimización de datos personales" (PDF) . Autoridad Española de Protección de Datos. Octubre de 2019 . Consultado el 31 de diciembre de 2023 .
^ Kolata, Gina (23 de julio de 2019). "¿Sus datos fueron 'anonimizados'? Estos científicos aún pueden identificarlo". Los New York Times .
^ "Attm (TA) 28857-06-17 Asociación de empresas de enfermería contra el Ministerio de Defensa" (en yiddish). Perla Cohen. 2019 . Consultado el 31 de diciembre de 2023 .
^ Salomón, S. (31 de enero de 2019). "Los datos están en juego según la obsoleta ley de privacidad israelí, dice un grupo de expertos". Los tiempos de Israel . Consultado el 31 de diciembre de 2023 .
^ "Desidentificación/anonimización DICOM: protección de la privacidad del paciente en imágenes médicas". 2024.

Otras lecturas

Raghunathan, Balaji (junio de 2013). El libro completo sobre la anonimización de datos: desde la planificación hasta la implementación . Prensa CRC. ISBN 9781482218565.
Khaled El Emam , Luk Arbuckle (agosto de 2014). Anonimización de datos de salud: estudios de casos y métodos para comenzar . Medios O'Reilly. ISBN 978-1-4493-6307-9.
Rolf H. Weber, Ulrike I. Heinrich (2012). Anonimización: SpringerBriefs in Cybersecurity . Saltador. ISBN 9781447140665.
Aris Gkoulalas-Divanis, Grigorios Loukides (2012). Anonimización de registros médicos electrónicos para respaldar el análisis clínico (SpringerBriefs in Electrical and Computer Engineering) . Saltador. ISBN 9781461456674.
Pete Guardián. "Por qué realmente no puedes anonimizar tus datos". O'Reilly Media, Inc. Archivado desde el original el 9 de enero de 2014 . Consultado el 17 de enero de 2014 .

enlaces externos

Sobre la anonimización del tráfico de Internet: lista de lectura sobre intercambio de datos y anonimización