Los datos agregados son datos de alto nivel que se obtienen combinando datos de nivel individual. Por ejemplo, el resultado de una industria es un agregado de los resultados individuales de las empresas dentro de esa industria. [1] Los datos agregados se aplican en estadística, almacenes de datos y economía.
Existe una distinción entre datos agregados y datos individuales. Los datos agregados se refieren a datos individuales promediados por área geográfica, por año, por agencia de servicios o por otros medios. [2] Los datos individuales son resultados individuales desagregados y se utilizan para realizar análisis para estimar las diferencias entre subgrupos. [2]
Los datos agregados son utilizados principalmente por investigadores y analistas, responsables de políticas, bancos y administradores por múltiples razones. Se utilizan para evaluar políticas, reconocer tendencias y patrones de procesos, obtener información relevante y evaluar medidas actuales para la planificación estratégica. Los datos agregados recopilados de varias fuentes se utilizan en diferentes áreas de estudio, como el análisis político comparativo y el análisis científico de APD para análisis posteriores. Los datos agregados también se utilizan con fines médicos y educativos. Los datos agregados se utilizan ampliamente, pero también tienen algunas limitaciones, incluida la extracción de inferencias inexactas y conclusiones falsas, lo que también se denomina " falacia ecológica ". [3] "Falacia ecológica" significa que no es válido que los usuarios extraigan conclusiones sobre las relaciones ecológicas entre dos variables cuantitativas a nivel individual. [3]
En estadística , los datos agregados son datos combinados de varias mediciones. Cuando se agregan los datos, los grupos de observaciones se reemplazan con estadísticas resumidas basadas en esas observaciones. [4]
En un almacén de datos , el uso de datos agregados reduce drásticamente el tiempo necesario para consultar grandes conjuntos de datos. Los desarrolladores resumen previamente las consultas que se utilizan con regularidad, como las ventas semanales, en varias dimensiones, por ejemplo, por jerarquía de artículos o jerarquía geográfica.
En economía , los datos agregados o agregados de datos son datos de alto nivel que se componen de una multitud o combinación de otros datos más individuales, como:
Los investigadores utilizan datos agregados para comprender el ethos prevaleciente , evaluar la esencia de las realidades sociales y una organización social, estipular cuestiones primarias de preocupación en la investigación y proporcionar proyecciones en relación con la naturaleza de las cuestiones sociales. [5] Los datos agregados son útiles para los investigadores cuando están interesados en investigar las relaciones entre dos variables distintas a nivel agregado y las conexiones entre una variable agregada y una característica a nivel individual. [2] Los investigadores también han hecho un esfuerzo por evaluar políticas, prácticas y preceptos de sistemas de manera crítica con la ayuda de datos agregados, para investigar la relevancia y eficacia correspondientes . [5]
Los gobiernos utilizan datos agregados para desarrollar políticas más eficaces, ya que sirven como medida de la capacidad de un gobierno para conocer las demandas y necesidades de sus ciudadanos y como medida de la forma en que un gobierno mantiene el orden social de manera eficaz. [5] Por ejemplo, los gobiernos de todo el mundo utilizan datos agregados de ubicación móvil para el análisis en respuesta a la COVID-19. Los datos agregados de ubicación móvil podrían proporcionar información sobre la eficacia de las medidas de distanciamiento social lanzadas por los gobiernos. Los gobiernos también utilizan datos agregados para identificar posibles “puntos críticos” y el potencial de transmisión. [6]
Además de proyectar la efectividad de las políticas gubernamentales, los análisis de datos agregados también se utilizan para evaluar la naturaleza, evaluar el alcance, reconocer la tendencia y estudiar el patrón de un fenómeno o proceso específico con el objetivo de diseñar estrategias, preparar políticas a corto o largo plazo y adoptar procedimientos eficaces y pertinentes para el control o la prevención. [5] Los responsables de las políticas también utilizan datos agregados financieros para evaluar las actividades económicas y financieras de las empresas y los hogares porque estos datos ayudan a identificar los riesgos asociados con la estabilidad financiera . Los responsables de las políticas pueden emplear datos agregados para comprender mejor la evolución de las condiciones económicas y financieras de un país. [7]
Los bancos recopilan datos agregados de un número significativo de clientes y luego los anonimizan eliminando la información personal. La principal razón por la que los bancos utilizan datos agregados es para estimar las tendencias económicas y obtener información sobre los grupos de clientes. Los bancos no tienen permitido compartir los datos personales de los clientes , pero los datos agregados pueden compartirse con los clientes comerciales de los bancos y otros socios que también utilicen la misma plataforma para obtener información sobre los datos agregados pueden acceder a ellos. [8]
En Australia, el Commonwealth Bank proporciona a sus clientes comerciales datos anónimos relacionados con sus clientes que se derivan de transacciones con tarjetas. El ANZ también proporciona a sus clientes comerciales datos anónimos que se obtienen de millones de transacciones en terminales comerciales y transacciones con tarjetas del ANZ. [8]
En el Reino Unido, la recopilación de datos agregados de atención de urgencia integrada (IUC ADC) proporciona información completa sobre la actividad de la IUC, su desempeño y la demanda de servicios. Sus datos proceden de los principales proveedores de datos responsables de ofrecer servicios de atención de urgencia integrados en Inglaterra. [9] El Servicio Nacional de Salud (NHS) dependiente del Departamento de Salud y Asistencia Social (DHSC) de Inglaterra declaró que esta recopilación de datos agregados va a sustituir al conjunto de datos mínimos del NHS 111. También se utilizará como fuente formal de estadísticas de la IUC, así como para supervisar los indicadores clave de rendimiento (KPI) de la IUC ADC. [10]
Los datos empíricos disponibles a nivel nacional o regional son utilizados por los administradores e intelectuales, así como por las personas que se preocupan por el bienestar de una región o de una sociedad , como fuentes de referencia. [5] En particular, los administradores utilizan datos agregados para realizar evaluaciones en el ambiente político, religioso, social o de otro tipo actual de una nación para rastrear las brechas en las respuestas sociales relacionadas con el tiempo y el espacio, y para dictar prioridades para la acción. Estas evaluaciones ayudan a los administradores a evaluar las medidas actuales que son útiles en la planificación estratégica futura y proporcionan indicadores sobre medidas correctivas efectivas. [5]
Los datos agregados pueden ser una composición de varios tipos de escritos y registros, incluyendo biografías , autobiografías , relatos descriptivos y correspondencia. [5] Por ejemplo, un investigador recopila, coteja o compila datos agregados mediante el uso de múltiples mecanismos de investigación social , incluyendo inventarios , entrevistas , un informe de opinión y un cuestionario o cronograma . Las agencias oficiales o no oficiales también recopilan y compilan datos agregados de manera continua mediante el uso de infraestructuras disponibles dentro de un departamento a nivel de campo. [5]
Las fuentes de datos agregados también pueden considerarse herramientas para descubrir datos. En los EE. UU., algunos de los datos estadounidenses se presentan en forma de tablas. Entre los ejemplos de fuentes de estos datos agregados estadounidenses se incluyen la Oficina del Censo de los Estados Unidos , el Resumen estadístico de los Estados Unidos y Social Explorer. Los datos del Fondo Monetario Internacional , el Banco de Datos Mundial y Penn World Table son ejemplos de fuentes de datos agregados transaccionales e internacionales. [11]
Los datos agregados se utilizan en el análisis político comparativo porque los analistas no sólo se centran en el comportamiento de los individuos, sino también en el comportamiento de las unidades territoriales, incluidos los distritos electorales y las naciones. [12] En los análisis de la actividad política, los datos significativos, como los relacionados con la industrialización , la urbanización y las redes de comunicación de masas, no se expresan fácilmente en niveles individuales, sino que se expresan en términos per cápita para controlar las variaciones en el tamaño de la población de las unidades territoriales . [12] Los datos agregados están ampliamente disponibles porque los datos demográficos, socioeconómicos y políticos son recopilados y publicados por las naciones, lo que facilita a los investigadores y analistas la realización de estudios de tendencias más largos y les permite enfocar los cambios y los desarrollos con mayor profundidad. [12]
Factores como la necesidad de tiempo, recursos considerables y una amplia cooperación internacional impidieron el uso de metanálisis de datos de pacientes individuales (IPD) , lo que llevó a que la mayoría de los metanálisis publicados dependieran de datos agregados de pacientes (APD). [13] Para adquirir datos en todos los ensayos sobre todos los pacientes, se recopilan datos agregados de pacientes de estudios completados que se presentan en reuniones profesionales, se publican en la literatura médica o fueron proporcionados directamente por investigadores individuales. Los datos agregados de pacientes son utilizados por usuarios como la Colaboración Cochrane , el Grupo de Trabajo de Servicios Preventivos de los Estados Unidos y múltiples sociedades profesionales para brindar apoyo a las pautas de práctica clínica. Los datos agregados de pacientes también se utilizan en estudios de tiempo hasta el evento de metanálisis ya que los resultados pueden informar a los inversores sobre la conveniencia de proceder a realizar más metanálisis que se basen en datos de pacientes individuales que requieren muchos recursos. [13]
En un sistema de información sanitaria, los datos agregados son la integración de datos relativos a numerosos pacientes. No se puede rastrear a un paciente en particular basándose en datos agregados. Estos datos agregados son solo recuentos, incluyendo tuberculosis , malaria u otras enfermedades. Los centros de salud utilizan este tipo de estadísticas agregadas para generar informes e indicadores, y para llevar a cabo una planificación estratégica en sus sistemas de salud. [14] En comparación con los datos agregados, los datos de los pacientes son datos individuales relacionados con un solo paciente, incluido el nombre, la edad, el diagnóstico y el historial médico. Los datos basados en el paciente se utilizan principalmente para realizar un seguimiento del progreso de un paciente, como por ejemplo cómo responde el paciente a un tratamiento particular, a lo largo del tiempo. [14]
El Archivo de Datos de COVID-19, también llamado COVID-ARC, agrega datos de estudios realizados en todo el mundo . Los investigadores pueden tener acceso a los descubrimientos de colegas internacionales y forjar colaboraciones para facilitar los procesos involucrados en la lucha contra la enfermedad. [15] En concreto, el uso de datos de atención médica agregados permite a los proveedores de atención médica obtener información clínica procesable cuando, por ejemplo, se hacen posibles vistas exhaustivas de datos clínicos o registros continuos de pacientes. [15]
Los datos agregados, como los datos demográficos agregados a nivel escolar y los datos agregados sobre el rendimiento escolar, se utilizan en el análisis experimental para evaluar las relaciones entre el rendimiento de los estudiantes y las intervenciones a nivel escolar. [16] Los datos agregados también se pueden utilizar en análisis no experimentales, como el análisis de regresión discontinua y el análisis de series temporales interrumpidas. Los datos a nivel individual no son necesarios en estos análisis no experimentales. Por ejemplo, el análisis de series temporales interrumpidas estima el impacto generado por un programa a nivel escolar comparando el rendimiento de una escuela antes y después del lanzamiento del programa, donde los datos a nivel individual no son necesarios. [16]
Durante el proceso de promediar unidades dentro de un grupo o de un país, se pierde información, lo que aumenta la probabilidad de extraer inferencias inexactas. [17] La pérdida de información ocurre porque la agregación de datos ignora la variación individual como si fuera solo un tipo de ruido estadístico o error de medición. [18] Las inferencias también varían de una a otra cuando se utilizan datos de empresas individuales o datos agregados para el análisis. Por ejemplo, el cálculo de promedios de países no tiene en cuenta variables específicas de las empresas, como el tamaño de las empresas, su antigüedad o la concentración de la propiedad de las empresas, pero el cálculo de promedios individuales sí lo hace. Existen diferencias entre los resultados generados a partir de datos agregados y los datos individuales. [17]
También existe un problema de "falacia ecológica". El concepto fue introducido por Robinson (1950). El significado del término es que la variabilidad en torno a las medias a nivel individual es significativamente diferente de la variabilidad que abarca las medias agregadas. [18] Con el concepto agregado, se expresan cosas distintas a los equivalentes individuales de los datos agregados, lo que significa que no se pueden extraer conclusiones a nivel individual. [3] Aunque los datos agregados tienen una aplicabilidad más amplia que los datos a nivel individual, es más difícil para los investigadores abordarlos con análisis de resultados de subgrupos cuando se utilizan datos agregados. Finalmente, también puede requerirse información individual. El modelado del crecimiento y el modelado longitudinal basado en datos agregados también son difíciles porque las variables pueden variar con el tiempo. [2]
Los datos agregados financieros son un tipo de datos agregados sobre el crédito y la oferta monetaria en Australia, que los responsables de las políticas utilizan para evaluar las actividades económicas y financieras de los hogares y las empresas. [7]
Los agregados crediticios son mediciones de los préstamos que los hogares y las empresas obtienen de intermediarios financieros. La cantidad de fondos que toman prestados las empresas para fines que incluyen inversiones en proyectos, compras de activos o gestión del flujo de efectivo también se mide utilizando agregados crediticios. [7]
Los agregados monetarios son mediciones del dinero o de instrumentos "similares al dinero" del sistema bancario, que se adeuda a las empresas y a los hogares. Un ejemplo de un instrumento "similar al dinero" son los depósitos en la cuenta bancaria . [7]
En el Reino Unido, los datos agregados del censo son datos generados como resultado de los censos del Reino Unido. Proporcionan información sobre las características socioeconómicas y demográficas de la población del país. Son una compilación de cálculos agregados o resumidos del número de personas, residentes de hogares o familias en áreas geográficas particulares con características específicas o combinaciones de características, tomadas de los temas de personas y lugares, poblaciones, familias, salud, etnia y religión, vivienda y trabajo. [19]
Los datos agregados se utilizan como componentes de los resultados de los censos del Reino Unido. Se obtienen a partir del análisis de la información proporcionada en los resultados del censo. [19] Los datos agregados del censo se utilizan para comparar y describir las características de la población en varias ubicaciones del Reino Unido porque pueden proporcionar información comparable en una variedad de niveles geográficos en todo el país. Los datos agregados del censo también se utilizan en el sector académico para fines de enseñanza e investigación, así como para la ubicación de sitios y el marketing en el sector privado. [19]