La ética de los macrodatos , también conocida simplemente como ética de los datos , se refiere a la sistematización, defensa y recomendación de conceptos de conducta correcta e incorrecta en relación con los datos , en particular los datos personales . [1] Desde los albores de Internet, la gran cantidad y calidad de los datos ha aumentado drásticamente y sigue haciéndolo exponencialmente. Los macrodatos describen esta gran cantidad de datos que son tan voluminosos y complejos que el software de aplicación de procesamiento de datos tradicional es inadecuado para tratarlos. Las innovaciones recientes en la investigación médica y la atención médica, como la secuenciación genómica de alto rendimiento, las imágenes de alta resolución, los registros médicos electrónicos de pacientes y una plétora de dispositivos de salud conectados a Internet, han desencadenado un diluvio de datos que alcanzará el rango de exabytes en un futuro cercano. La ética de los datos es cada vez más relevante a medida que aumenta la cantidad de datos debido a la escala del impacto.
La ética de los macrodatos se diferencia de la ética de la información porque el enfoque de la ética de la información se centra más en cuestiones de propiedad intelectual y preocupaciones relacionadas con bibliotecarios, archivistas y profesionales de la información, mientras que la ética de los macrodatos se centra más en los recopiladores y diseminadores de datos estructurados o no estructurados , como los corredores de datos , los gobiernos y las grandes corporaciones. Sin embargo, dado que los sistemas de inteligencia artificial o aprendizaje automático se construyen regularmente utilizando grandes conjuntos de datos, las discusiones en torno a la ética de los datos a menudo se entrelazan con las de la ética de la inteligencia artificial. [2] Más recientemente, las cuestiones de la ética de los macrodatos también se han investigado en relación con otras áreas de la ética de la tecnología y la ciencia, incluida la ética en matemáticas y la ética de la ingeniería , ya que muchas áreas de las matemáticas aplicadas y la ingeniería utilizan conjuntos de datos cada vez más grandes.
La ética de los datos se ocupa de los siguientes principios: [3]
La propiedad de los datos implica determinar derechos y deberes sobre la propiedad, como la capacidad de ejercer control individual sobre (incluso limitar el intercambio de) datos personales que comprenden la identidad digital de una persona. La cuestión de la propiedad de los datos surge cuando alguien registra observaciones sobre una persona individual. Tanto el observador como el observado declaran un derecho sobre los datos. También surgen preguntas sobre las responsabilidades que el observador y el observado tienen en relación con el otro. Estas preguntas han adquirido cada vez mayor relevancia con la ampliación de la escala y la sistematización de la observación de las personas y sus pensamientos a través de Internet. La cuestión de la propiedad de los datos personales se relaciona con cuestiones de propiedad corporativa y propiedad intelectual. [4]
En la Unión Europea, algunas personas sostienen que el Reglamento General de Protección de Datos indica que los individuos son dueños de sus datos personales, aunque esto es discutido. [5]
Se han planteado inquietudes acerca de cómo los sesgos pueden integrarse en el diseño de algoritmos, dando como resultado una opresión sistemática. [6]
En términos de gobernanza, la ética del big data se ocupa de qué tipos de inferencias y predicciones se deben realizar utilizando tecnologías de big data como los algoritmos. [7]
La gobernanza anticipatoria es la práctica de utilizar análisis predictivos para evaluar posibles comportamientos futuros. [8] Esto tiene implicaciones éticas porque permite identificar grupos y lugares específicos que pueden fomentar el prejuicio y la discriminación. [8] Por ejemplo, la vigilancia predictiva destaca ciertos grupos o vecindarios que deben ser vigilados más de cerca que otros, lo que conduce a más sanciones en estas áreas y a una vigilancia más estrecha de quienes encajan en los mismos perfiles que los sancionados. [9]
El término "expansión del control" se refiere a datos que se han generado con un propósito particular en mente pero que se reutilizan. [8] Esta práctica se observa en los datos de la industria aérea que se han reutilizado para elaborar perfiles y gestionar los riesgos de seguridad en los aeropuertos. [8]
La privacidad se ha presentado como una limitación al uso de datos que también podría considerarse poco ética. [10] Por ejemplo, compartir datos de atención médica puede arrojar luz sobre las causas de las enfermedades, los efectos de los tratamientos y puede permitir análisis personalizados en función de las necesidades de las personas. [10] Esto tiene importancia ética en el campo de la ética de los macrodatos porque, si bien muchos valoran la privacidad, las ventajas de compartir datos también son bastante valiosas, aunque pueden contradecir la concepción que uno tiene de la privacidad. Las actitudes contra el intercambio de datos pueden basarse en una pérdida percibida de control sobre los datos y un miedo a la explotación de los datos personales. [10] Sin embargo, es posible extraer el valor de los datos sin comprometer la privacidad.
Algunos académicos como Jonathan H. King y Neil M. Richards están redefiniendo el significado tradicional de privacidad, y otros se preguntan si la privacidad todavía existe o no. [7] En un artículo de 2014 para Wake Forest Law Review , King y Richard argumentan que la privacidad en la era digital puede entenderse no en términos de secreto sino en términos de regulaciones que gobiernan y controlan el uso de la información personal. [7] En la Unión Europea, el derecho al olvido faculta a los países de la UE a forzar la eliminación o desvinculación de datos personales de las bases de datos a petición de un individuo si la información se considera irrelevante o desactualizada. [11] Según Andrew Hoskins, esta ley demuestra el pánico moral de los miembros de la UE por la pérdida percibida de privacidad y la capacidad de gobernar los datos personales en la era digital. [12] En los Estados Unidos, los ciudadanos tienen derecho a eliminar los datos enviados voluntariamente. [11] Esto es muy diferente del derecho al olvido porque gran parte de los datos producidos utilizando tecnologías y plataformas de big data no se envían voluntariamente. [11] Si bien las nociones tradicionales de privacidad están bajo escrutinio, los diferentes marcos legales relacionados con la privacidad en la UE y los EE. UU. demuestran cómo los países están lidiando con estas preocupaciones en el contexto de los macrodatos. Por ejemplo, el "derecho al olvido" en la UE y el derecho a eliminar datos entregados voluntariamente en los EE. UU. ilustran los diferentes enfoques de la regulación de la privacidad en la era digital. [13]
La diferencia de valor entre los servicios que prestan las empresas tecnológicas y el valor patrimonial de estas empresas tecnológicas es la diferencia entre el tipo de cambio que se ofrece al ciudadano y el "tipo de mercado" del valor de sus datos. Desde el punto de vista científico, este cálculo rudimentario tiene muchas lagunas: las cifras financieras de las empresas que evaden impuestos no son fiables, podrían ser más apropiadas las de ingresos o las de beneficios, cómo se define a un usuario, se necesita una gran cantidad de personas para que los datos sean valiosos, posibles precios diferenciados para distintas personas en distintos países, etc. Aunque estos cálculos son rudimentarios, sirven para hacer más tangible el valor monetario de los datos. Otro enfoque consiste en averiguar los tipos de cambio de los datos en el mercado negro. RSA publica anualmente una lista de compras de ciberseguridad que adopta este enfoque. [14]
Esto plantea la cuestión económica de si los servicios tecnológicos gratuitos a cambio de datos personales constituyen un intercambio implícito que vale la pena para el consumidor. En el modelo de comercio de datos personales, en lugar de que las empresas vendan los datos, el propietario puede vender sus datos personales y quedarse con las ganancias. [15]
La idea de los datos abiertos se centra en el argumento de que los datos deberían estar disponibles libremente y no deberían tener restricciones que prohibieran su uso, como las leyes de derechos de autor. A partir de 2014, [update]muchos gobiernos habían comenzado a avanzar hacia la publicación de conjuntos de datos abiertos con el propósito de lograr transparencia y rendición de cuentas. [16] Este movimiento ha ganado fuerza a través de los "activistas de datos abiertos" que han pedido a los gobiernos que pongan a disposición los conjuntos de datos para permitir que los ciudadanos extraigan significado de los datos y realicen controles y contrapesos por sí mismos. [16] [7] King y Richards han argumentado que este llamado a la transparencia incluye una tensión entre la apertura y el secreto. [7]
Los activistas y académicos también han argumentado que, debido a que este modelo de evaluación de datos de código abierto se basa en la participación voluntaria, la disponibilidad de conjuntos de datos abiertos tiene un efecto democratizador en una sociedad, permitiendo que cualquier ciudadano participe. [17] Para algunos, la disponibilidad de ciertos tipos de datos se considera un derecho y una parte esencial de la capacidad de acción de un ciudadano. [17]
La Open Knowledge Foundation (OKF) enumera varios tipos de conjuntos de datos que, según su opinión, los gobiernos deberían proporcionar para que sean verdaderamente abiertos. [18] La OKF tiene una herramienta llamada Global Open Data Index (GODI), una encuesta de colaboración colectiva para medir la apertura de los gobiernos, [18] basada en su Definición Abierta . GODI tiene como objetivo ser una herramienta para proporcionar retroalimentación a los gobiernos sobre la calidad de sus conjuntos de datos abiertos. [19]
La disposición a compartir datos varía de persona a persona. Se han realizado estudios preliminares sobre los determinantes de la disposición a compartir datos. Por ejemplo, algunos han sugerido que los baby boomers están menos dispuestos a compartir datos que los millennials. [20]