Los estudios críticos de datos son la exploración y el compromiso con los desafíos sociales, culturales y éticos que surgen al trabajar con big data. Es a través de diversas perspectivas únicas y adoptando un enfoque crítico que se puede practicar esta forma de estudio. [1] Como su nombre lo indica, los estudios críticos de datos se basan en gran medida en la influencia de la teoría crítica , que se centra en abordar la organización de las estructuras de poder. Esta idea luego se aplica al estudio de los datos.
El interés en este campo único de estudios críticos de datos comenzó en 2011 cuando los académicos Danah Boyd y Kate Crawford plantearon varias preguntas para el estudio crítico de los macrodatos y reconocieron sus posibles impactos amenazantes en la sociedad y la cultura. [2] No fue hasta 2014, y después de más exploraciones y conversaciones, que los académicos Craig Dalton y Jim Thatcher acuñaron oficialmente el término estudios críticos de datos. [1] Pusieron un gran énfasis en comprender el contexto de los macrodatos para abordarlos de manera más crítica. Investigadores como Daniel Ribes, Robert Soden, Seyram Avle, Sarah E. Fox y Phoebe Sengers se centran en comprender los datos como un artefacto histórico y adoptar un enfoque interdisciplinario hacia los estudios críticos de datos. [3] Otros académicos clave en esta disciplina incluyen a Rob Kitchin y Tracey P. Lauriault, quienes se centran en la reevaluación de los datos a través de diferentes esferas. [4]
Entre los diversos marcos fundamentales que se pueden aplicar para analizar los macrodatos se incluyen los de la ciencia de datos feminista, antirracista, queer, indígena, descolonial, anticapacitista, simbólica y sintética. Estos marcos ayudan a dar sentido a los datos al abordar cuestiones relacionadas con el poder, los sesgos, la privacidad, el consentimiento y la subrepresentación o tergiversación que existen en los datos, así como a abordar y analizar estos datos con una mentalidad más equitativa.
En su artículo en el que acuñan el término "estudios de datos críticos", Dalton y Thatcher también proporcionan varias justificaciones de por qué los estudios de datos son una disciplina digna de un enfoque crítico. [5] En primer lugar, el "big data" es un aspecto importante de la sociedad del siglo XXI, y el análisis de "big data" permite una comprensión más profunda de lo que está sucediendo y por qué razones. [1] El big data es importante para los estudios de datos críticos porque es el tipo de datos que se utilizan en este campo. El big data no se refiere necesariamente a un gran conjunto de datos, puede tener un conjunto de datos con millones de filas, pero también un conjunto de datos que solo tiene una amplia variedad y un alcance expansivo de datos con un tipo de conjunto de datos más pequeño. Además de tener poblaciones enteras en el conjunto de datos y no solo tamaños de muestra . Además, el big data como herramienta tecnológica y la información que produce no son neutrales, según Dalton y Thatcher, lo que lo hace digno de un análisis crítico para identificar y abordar sus sesgos. Partiendo de esta idea, otra justificación para un enfoque crítico es que la relación entre el big data y la sociedad es importante y, por lo tanto, digna de estudio. [1]
Ribes et. al. sostienen que es necesario llegar a una comprensión interdisciplinaria de los datos como artefacto histórico como aspecto motivador de los estudios de datos críticos. El consenso general en el campo del Trabajo Cooperativo Asistido por Computadora (CSCW) es que las personas deben hablar por los datos y no dejar que los datos hablen por sí mismos.
Las fuentes de big data y su relación con diversos metadatos pueden ser complicadas, lo que conduce al desorden de los datos y a la necesidad de un análisis ético. [6] Además, Iliadis y Russo (2016) han pedido que se estudien los conjuntos de datos . [6] Es decir, los datos tienen historias tecnológicas, políticas, sociales y económicas innatas que deben tenerse en cuenta. Kitchin sostiene que los datos casi nunca son crudos y casi siempre están cocinados, lo que significa que siempre hablan por ellos los científicos de datos que los utilizan. Por lo tanto, el Big Data debe estar abierto a una variedad de perspectivas, especialmente las de naturaleza cultural y filosófica. Además, los datos contienen historias, ideologías y filosofías ocultas. [6]
La tecnología de big data puede causar cambios significativos en la estructura de la sociedad y en la vida cotidiana de las personas [1] y, al ser un producto de la sociedad, la tecnología de big data es digna de investigación sociológica [1] . Además, los conjuntos de datos casi nunca están completamente libres de influencia. Más bien, los datos están moldeados por la visión o los objetivos de quienes los recopilan, y durante el proceso de recopilación de datos, el equipo de investigación cuantifica, almacena, clasifica e incluso descarta ciertas cosas [7] . Por lo tanto, es necesario un enfoque crítico para comprender y revelar la intención detrás de la información que se presenta. Uno de estos enfoques críticos ha sido a través de los estudios de datos feministas. Este método aplica principios feministas a los estudios críticos y la recopilación y análisis de datos. El objetivo de esto es abordar el desequilibrio de poder en la ciencia de datos y la sociedad. Según Catherine D'Ignazio y Lauren F. Klein, un análisis de poder se puede realizar examinando el poder, desafiándolo, evaluando la emoción y la encarnación, repensando los binarios y las jerarquías, abrazando el pluralismo, considerando el contexto y haciendo visible el trabajo. [8] Los estudios de datos feministas son parte del movimiento que busca que los datos beneficien a todos y no aumenten las desigualdades existentes. Además, los datos por sí solos no pueden hablar por sí mismos; para tener un significado concreto, los datos deben ir acompañados de una perspectiva teórica o de medidas de investigación cuantitativas o cualitativas alternativas. [1] [9] Basados en diferentes temas sociales, como los estudios de datos antirracistas, los estudios de datos críticos se centran en aquellas cuestiones sociales relacionadas con los datos. Específicamente, en los estudios de datos antirracistas, utilizan un enfoque de clasificación para obtener representación de aquellos dentro de esa comunidad. Desmond Upton Patton y otros utilizaron su propio sistema de clasificación en las comunidades de Chicago para ayudar a identificar y reducir la violencia con adolescentes jóvenes en Twitter. Hicieron que los estudiantes de esas comunidades los ayudaran a descifrar la terminología y los emojis de estos adolescentes para identificar el lenguaje utilizado en los tuits que siguieron con violencia fuera de las pantallas de las computadoras. [10] Este es solo un ejemplo del mundo real de los estudios de datos críticos y su aplicación. Dalton y Thatcher argumentan que si uno solo pensara en los datos en términos de su poder de explotación, no hay posibilidad de utilizarlos con fines revolucionarios y liberadores. [1] Finalmente, Dalton y Thatcher proponen que un enfoque crítico en el estudio de los datos permite combinar los “grandes datos” con los “pequeños datos” más antiguos, y así crear una investigación más exhaustiva, abriendo más oportunidades, preguntas y temas para explorar. [1] [11]
Los datos desempeñan un papel fundamental en la emergente economía del conocimiento, impulsando la productividad, la competitividad, la eficiencia, la sostenibilidad y la acumulación de capital. Las dimensiones éticas, políticas y económicas de los datos evolucionan dinámicamente en el espacio y el tiempo, influenciadas por regímenes, tecnologías y prioridades cambiantes. Desde el punto de vista técnico, el enfoque se centra en el manejo, almacenamiento y análisis de grandes conjuntos de datos, utilizando la minería y el análisis de datos basados en el aprendizaje automático. Este avance tecnológico plantea inquietudes sobre la calidad de los datos, que abarca la validez, la fiabilidad, la autenticidad, la facilidad de uso y el linaje. [12]
El uso de datos en la sociedad moderna genera nuevas formas de comprender y medir el mundo, pero también trae consigo ciertas preocupaciones o problemas. [13] Los investigadores de datos intentan sacar a la luz algunas de estas cuestiones en su intento de ser críticos con los datos.
Entre los problemas técnicos y organizativos se puede incluir el alcance del conjunto de datos, es decir, que haya muy pocos o demasiados datos con los que trabajar, lo que conduce a resultados inexactos. Es fundamental que los investigadores críticos de datos consideren cuidadosamente la idoneidad del volumen de datos para sus análisis.
La calidad de los datos en sí es otro aspecto que preocupa. Los datos en sí pueden ser de mala calidad, como un conjunto de datos incompleto o desordenado con valores faltantes o inexactos. Esto llevaría a los investigadores a tener que hacer ediciones y suposiciones sobre los datos en sí. Para abordar estas cuestiones, a menudo los académicos deben hacer ediciones y suposiciones sobre los datos para garantizar su fiabilidad y relevancia.
Los científicos de datos podrían tener acceso indebido al conjunto de datos reales, lo que limitaría su capacidad para analizarlos. Linnet Taylor explica cómo pueden surgir lagunas en los datos cuando personas de distintos niveles de poder tienen ciertos derechos sobre sus fuentes de datos. Estas personas en el poder pueden controlar qué datos se recopilan, cómo se muestran y cómo se analizan. [14]
Las capacidades del equipo de investigación también desempeñan un papel crucial en la calidad del análisis de datos. El equipo de investigación puede tener habilidades o capacidades organizativas inadecuadas, lo que hace que el análisis real realizado sobre el conjunto de datos esté sesgado. Esto también puede dar lugar a falacias ecológicas , es decir, se hace una suposición sobre un individuo basándose en datos o resultados de un grupo más grande de personas. [13]
Estos desafíos técnicos y organizativos resaltan la complejidad de trabajar con datos y enfatizan la necesidad de que los académicos naveguen en un panorama donde las cuestiones relacionadas con el alcance de los datos, la calidad, el acceso y las capacidades del equipo están intrincadamente entrelazadas.
Algunas de las preocupaciones normativas y éticas abordadas por Kitchin incluyen la vigilancia a través de los datos de uno, ( dataveillance [7] ) la privacidad de los datos de uno se hace referencia en este artículo y uno de los principales puntos clave que toca la National Cybersecurity Alliance es cómo los datos se están convirtiendo rápidamente en una necesidad a medida que las empresas los reconocen como un activo y se dan cuenta del valor potencial de recopilarlos, usarlos y compartirlos (National Cyber Security Alliance]), la propiedad de los datos de uno en el que Scassa escribe sobre cómo los debates sobre los derechos de propiedad de los datos se han estado calentando. En Europa, los responsables políticos han planteado la posibilidad de crear derechos de propiedad sui generis en los datos (Data Ownership), la seguridad de los datos de uno en la que las violaciones de datos representan una amenaza tanto para las personas como para las organizaciones. Obtenga más información sobre las violaciones de seguridad de datos y lo que hacen los profesionales de la ciberseguridad para prevenirlas (Data Security breach), gobernanza anticipatoria o corporativa en la que los datos corporativos y la información se usan indistintamente, pero no son los mismos términos. Existen diferencias entre estos, y su propósito también difiere. Los datos corporativos son una forma cruda de información sin significado o utilidad adecuados a menos que se procesen y transformen en formas significativas (Datos corporativos e información) y se perfilen a las personas a partir de sus datos. [5] Esto se enfatiza mucho en el colonialismo de datos (Colonialismo de datos), donde se fomenta la soberanía de los datos para las personas que están siendo perjudicadas, porque puede ser una herramienta poderosa para quienes esos datos representan. Un tema común en estos enfoques de la soberanía de los datos es cuándo y cómo recopilar, proteger y compartir datos solo con aquellos que tienen una necesidad legítima o apropiada de acceder a ellos. Los académicos de datos deben tener en cuenta todas estas preocupaciones en su objetivo de ser críticos. "Las etiquetas que asignamos a los datos siempre serán más crudas y menos representativas de lo que describen de lo que nos gustaría que fueran. Tratar a los candidatos bajo una sola etiqueta, ya sea una etiqueta de género, ya sea una etiqueta de género, ya sea un grupo de edad, ya sean consumidores de un producto en particular o personas que padecen una enfermedad en particular, puede hacer que las personas sean tratadas como puntos de datos intercambiables y fungibles. Cada uno de esos individuos con esa etiqueta es único y tiene derecho a ser respetado como persona” (Vallor: Data Ethics). Los estudiosos de los datos deben tener en cuenta todas estas preocupaciones en su objetivo de ser críticos.
Siguiendo la tradición de los estudios urbanos críticos, [15] otros académicos han planteado preocupaciones similares en torno a los datos y las tecnologías de información digital en el contexto urbano. [16] [17] [18] Por ejemplo, Joe Shaw y Mark Graham las han examinado a la luz del " derecho a la ciudad " de Henri Lefebvre . [19]
La aplicación más práctica y preocupante de los estudios de datos críticos es la combinación entre ética y privacidad . Tendler, Hong, Kane, Kopaczynski, Terry y Emanuel explican que en una época en la que las instituciones privadas utilizan los datos de los clientes para comercializar, realizar investigaciones sobre los deseos y necesidades de los clientes y más, es vital proteger los datos recopilados. Al analizar el campo de los estudios médicos, un pequeño paso para proteger a los participantes es el consentimiento informado. [20]
Existen muchos sesgos algorítmicos y discriminación en los datos. Muchos enfatizan la importancia de esto en el campo de la atención médica debido a la gravedad de los resultados de las decisiones basadas en datos sobre la atención al paciente y cómo se utilizan los datos y por qué se recopilan estos datos. Las instituciones y las empresas pueden garantizar la equidad y luchar contra el racismo sistémico mediante el uso de estudios de datos críticos para resaltar el sesgo algorítmico en la toma de decisiones basada en datos. Nong explica cómo un ejemplo muy popular de esto son los algoritmos de seguros y el acceso a la atención médica. Las compañías de seguros utilizan algoritmos para asignar recursos de atención a los clientes. Los algoritmos utilizados demostraron "un claro sesgo racial contra los pacientes negros" que provocó que "los gastos de salud estimados [se basaran] en datos históricos estructurados por el racismo sistémico y perpetuaran ese sesgo en el acceso a la gestión de la atención" [21].
En muchos modelos de aprendizaje automático y modelos artificiales entrenados, no existe un procedimiento estándar de presentación de informes de modelos para documentar adecuadamente las características de rendimiento. [22] Cuando estos modelos se aplican a escenarios de la vida real, las consecuencias tienen efectos importantes en el mundo real, sobre todo en el contexto de la atención sanitaria, la educación y la aplicación de la ley. Timnit Gebru explica cómo la falta de documentación suficiente para estos modelos hace que sea un desafío para los usuarios evaluar su idoneidad para contextos específicos; aquí es donde entra en juego el uso de tarjetas de modelos. Las tarjetas de modelos pueden proporcionar registros breves para acompañar a los modelos de aprendizaje automático con el fin de proporcionar información sobre las características de los modelos, los usos previstos, los posibles sesgos y las medidas de rendimiento. El uso de tarjetas de modelos tiene como objetivo proporcionar información importante a sus usuarios sobre las capacidades y limitaciones de los sistemas de aprendizaje automático y las formas de promover resultados justos e inclusivos con el uso de la tecnología de aprendizaje automático. [23]
El marco del feminismo de datos promueve la reflexión sobre los datos y la ética guiada por ideas del feminismo interseccional. El feminismo de datos pone énfasis en las prácticas en las que la ciencia de datos refuerza las desigualdades de poder en el mundo y en cómo los usuarios pueden utilizar los datos para desafiar el poder existente y comprometerse a crear datos equilibrados. Según D'ignazio y Klein, la interseccionalidad del feminismo de datos reconoce que los datos deben tener en cuenta factores que se entrecruzan, como la identidad, la raza, la clase, etc., para proporcionar una representación completa y precisa de las experiencias de los individuos. Este marco también destaca la importancia de diversas consideraciones éticas al abogar por el consentimiento informado, la privacidad y la responsabilidad que tienen los recopiladores de datos con respecto a los individuos de los que se recopilan los datos. [8]
La dataveillance es el monitoreo de personas en sus datos en línea. A diferencia de la vigilancia, la dataveillance va mucho más allá de simplemente monitorear a personas por razones específicas. La dataveillance se infiltra en las vidas de las personas con un seguimiento constante con fines generales y generales. Según Raley, se ha convertido en la forma preferida de monitorear a las personas a través de diversas presencias en línea. Este marco se centra en las formas de abordar y comprender cómo se recopilan, procesan y utilizan los datos, enfatizando las perspectivas éticas y protegiendo la información de las personas. [24] La dataficación se centra en comprender el proceso asociado con el surgimiento y el uso de big data. Según Jose y Dijck, destaca la transformación de acciones sociales en datos digitales que permiten el seguimiento en tiempo real y el análisis predictivo. La dataficación enfatiza el proceso impulsado por los intereses de la recopilación de datos, ya que las actividades sociales cambian mientras que la transformación en datos no lo hace. También examina cómo los cambios sociales surten efecto a medida que los datos digitales se vuelven más frecuentes en nuestra vida cotidiana. La dataficación enfatiza la complicada relación entre los datos y la sociedad y va de la mano con la dataveillance. [25]
El marco de sesgos algorítmicos se refiere a los sesgos sistemáticos e injustos contra ciertos grupos o resultados en el proceso de toma de decisiones algorítmicas. Häußler dice que los usuarios se centran en cómo los algoritmos pueden producir resultados discriminatorios específicamente cuando se trata de raza, género, edad y otras características, y pueden reforzar ideas de desigualdades sociales y prácticas injustas. En general, hay componentes clave dentro del marco: identificación de sesgos, calidad de los datos, evaluación de impacto, justicia y equidad, transparencia, remediación e implicaciones. [26]
{{cite journal}}
: CS1 maint: DOI inactivo a partir de septiembre de 2024 ( enlace )