La recopilación de datos o la recolección de datos es el proceso de reunir y medir información sobre variables específicas en un sistema establecido, lo que luego permite responder preguntas relevantes y evaluar resultados. La recopilación de datos es un componente de investigación en todos los campos de estudio, incluidas las ciencias físicas y sociales , las humanidades [2] y los negocios . Si bien los métodos varían según la disciplina , el énfasis en garantizar una recopilación precisa y honesta sigue siendo el mismo. El objetivo de toda recopilación de datos es capturar evidencia que permita que el análisis de datos conduzca a la formulación de respuestas creíbles a las preguntas que se han planteado.
Independientemente del campo de aplicación o de la preferencia para definir los datos ( cuantitativos o cualitativos ), la recopilación precisa de datos es esencial para mantener la integridad de la investigación. La selección de instrumentos de recopilación de datos adecuados (existentes, modificados o desarrollados recientemente) y las instrucciones delineadas para su uso correcto reducen la probabilidad de errores .
La recopilación y validación de datos constan de cuatro pasos cuando se trata de realizar un censo y de siete pasos cuando se trata de un muestreo . [3]
Es necesario un proceso formal de recopilación de datos, ya que garantiza que los datos recopilados sean precisos y definidos. De esta manera, las decisiones posteriores basadas en los argumentos incorporados a los hallazgos se toman utilizando datos válidos. [4] El proceso proporciona una línea de base a partir de la cual medir y, en ciertos casos, una indicación de qué mejorar.
Las plataformas de gestión de datos (DMP) son sistemas centralizados de almacenamiento y análisis de datos, que se utilizan principalmente en marketing . Las DMP existen para recopilar y transformar grandes cantidades de datos de demanda y oferta en información discernible. Los especialistas en marketing pueden querer recibir y utilizar datos de primera, segunda y tercera parte. Las DMP lo permiten, porque son el sistema agregado de DSP (plataforma del lado de la demanda) y SSP (plataforma del lado de la oferta). Las DMP son fundamentales para optimizar las campañas publicitarias futuras.
La razón principal para mantener la integridad de los datos es apoyar la observación de errores en el proceso de recopilación de datos. Esos errores pueden ser intencionales ( falsificación deliberada ) o no intencionales ( errores aleatorios o sistemáticos ). [5]
Hay dos enfoques que pueden proteger la integridad de los datos y asegurar la validez científica de los resultados del estudio: [6]
El control de calidad se centra en la prevención, que es principalmente una actividad rentable para proteger la integridad de la recopilación de datos. La estandarización del protocolo, con descripciones detalladas y completas de los procedimientos para la recopilación de datos, es fundamental para la prevención. El riesgo de no identificar problemas y errores en el proceso de investigación suele deberse a directrices mal redactadas. A continuación se enumeran varios ejemplos de tales fallos:
Existen serias preocupaciones sobre la integridad de los datos de usuarios individuales recopilados por la computación en la nube , porque estos datos se transfieren entre países que tienen diferentes estándares de protección de datos de usuarios individuales. [7] El procesamiento de la información ha avanzado hasta el nivel en que los datos de los usuarios ahora se pueden usar para predecir lo que dice una persona incluso antes de que hable. [8]
Dado que las acciones de control de calidad se llevan a cabo durante o después de la recopilación de datos, todos los detalles se pueden documentar cuidadosamente. Es necesario contar con una estructura de comunicación claramente definida como condición previa para establecer sistemas de monitoreo. No se recomienda la incertidumbre sobre el flujo de información, ya que una estructura de comunicación mal organizada conduce a un monitoreo laxo y también puede limitar las oportunidades de detectar errores. El control de calidad también es responsable de la identificación de las acciones necesarias para corregir prácticas de recopilación de datos defectuosas y también de minimizar tales incidencias futuras. Es más probable que un equipo no se dé cuenta de la necesidad de realizar estas acciones si sus procedimientos están escritos de manera vaga y no se basan en retroalimentación o educación.
Problemas de recopilación de datos que requieren una acción rápida: