stringtranslate.com

Información agregada

Un diagrama que muestra el significado básico de datos agregados, que es una combinación de datos individuales.

Los datos agregados son datos de alto nivel que se adquieren combinando datos de nivel individual. Por ejemplo, la producción de una industria es un agregado de la producción individual de las empresas dentro de esa industria. [1] Los datos agregados se aplican en estadística, almacenes de datos y economía.

Existe una distinción entre datos agregados y datos individuales. Los datos agregados se refieren a datos individuales promediados por área geográfica, por año, por agencia de servicios o por otros medios. [2] Los datos individuales son resultados individuales desagregados y se utilizan para realizar análisis para estimar las diferencias de subgrupos. [2]

Los datos agregados son utilizados principalmente por investigadores y analistas, formuladores de políticas, bancos y administradores por múltiples razones. Se utilizan para evaluar políticas, reconocer tendencias y patrones de procesos, obtener conocimientos relevantes y evaluar medidas actuales para la planificación estratégica. Los datos agregados recopilados de diversas fuentes se utilizan en diferentes áreas de estudio, como el análisis político comparativo y el análisis científico de la APD, para análisis adicionales. Los datos agregados también se utilizan con fines médicos y educativos. Los datos agregados se utilizan ampliamente, pero también tienen algunas limitaciones, incluida la obtención de inferencias inexactas y conclusiones falsas, lo que también se denomina " falacia ecológica ". [3] 'Falacia ecológica' significa que no es válido que los usuarios saquen conclusiones sobre las relaciones ecológicas entre dos variables cuantitativas a nivel individual. [3]

Aplicaciones

En estadística , los datos agregados son datos combinados de varias mediciones. Cuando se agregan datos, los grupos de observaciones se reemplazan con estadísticas resumidas basadas en esas observaciones. [4]

En un almacén de datos , el uso de datos agregados reduce drásticamente el tiempo necesario para consultar grandes conjuntos de datos. Los desarrolladores resumen previamente las consultas que se utilizan habitualmente, como las ventas semanales en varias dimensiones , por ejemplo, por jerarquía de artículos o jerarquía geográfica.

En economía , los datos agregados o agregados de datos son datos de alto nivel que se componen de una multitud o combinación de otros datos más individuales, como por ejemplo:

Usuarios principales

Investigadores y analistas

Los investigadores utilizan datos agregados para comprender el espíritu predominante , evaluar la esencia de las realidades sociales y una organización social, estipular cuestiones primarias de interés en la investigación y proporcionar proyecciones en relación con la naturaleza de las cuestiones sociales. [5] Los datos agregados son útiles para los investigadores cuando están interesados ​​en investigar las relaciones entre dos variables distintas a nivel agregado y las conexiones entre una variable agregada y una característica a nivel individual. [2] Los investigadores también han hecho un esfuerzo por evaluar políticas, prácticas y preceptos de los sistemas de manera crítica con la ayuda de datos agregados, para investigar la relevancia y eficacia correspondientes . [5]

Responsables políticos

Los gobiernos utilizan los datos agregados para desarrollar políticas más efectivas porque sirven como una medida de cuán capaz es un gobierno de ser consciente de las demandas y necesidades de sus ciudadanos y una medida de la forma en que un gobierno mantiene el orden social de manera efectiva. [5] Por ejemplo, los gobiernos de todo el mundo utilizan datos agregados de ubicación móvil para análisis en respuesta a Covid-19. Los datos agregados de ubicación móvil podrían proporcionar información sobre la efectividad de las medidas de distanciamiento social implementadas por los gobiernos. Los gobiernos también utilizan datos agregados para identificar posibles “puntos críticos” y el potencial de transmisión. [6]

Además de proyectar la eficacia de las políticas gubernamentales, también se realizan análisis de datos agregados para evaluar la naturaleza, evaluar el alcance, reconocer la tendencia y estudiar el patrón de un fenómeno o proceso específico con el objetivo de diseñar estrategias, preparar estrategias de corto o largo plazo. políticas a plazo, y adoptar procedimientos eficaces y pertinentes para su control o prevención. [5] Las autoridades también utilizan datos de agregados financieros para evaluar las actividades económicas y financieras de las empresas y los hogares porque estos datos ayudan a identificar los riesgos asociados con la estabilidad financiera . Las autoridades pueden emplear datos agregados para comprender mejor la evolución de las condiciones económicas y financieras de un país. [7]

Bancos

Los bancos recopilan datos agregados de un número significativo de clientes y luego los anonimizan mediante la eliminación de información personal. La razón principal por la que los bancos utilizan datos agregados es estimar las tendencias económicas y obtener información sobre los grupos de clientes. Los bancos no pueden compartir los datos personales de los clientes , pero los datos agregados se pueden compartir con los clientes comerciales de los bancos y otros socios que también usan la misma plataforma pueden acceder a ellos para adquirir información sobre los datos agregados. [8]

En Australia, el Commonwealth Bank proporciona a sus clientes comerciales datos anónimos relacionados con sus clientes que se derivan de transacciones con tarjeta. ANZ también proporciona a sus clientes comerciales datos anónimos recopilados de millones de transacciones de terminales comerciales y transacciones con tarjetas ANZ. [8]

En el Reino Unido, la recopilación de datos agregados de atención de urgencia integrada (IUC ADC) proporciona información completa sobre la actividad de IUC, su desempeño y su demanda de servicios. Sus datos provienen de los principales proveedores de datos responsables de ofrecer servicios integrados de atención de urgencia en Inglaterra. [9] El Servicio Nacional de Salud (NHS) dependiente del Departamento de Salud y Atención Social (DHSC) de Inglaterra declaró que esta recopilación de datos agregados reemplazará el conjunto de datos mínimo del NHS 111. También se utilizará como fuente formal de estadísticas de IUC, así como para supervisar los indicadores clave de rendimiento (KPI) del ADC de IUC. [10]

Administradores

Los administradores e intelectuales, así como las personas preocupadas por el bienestar de una región o de una sociedad , utilizan como fuentes de referencia los datos empíricos disponibles a nivel nacional o regional. [5] En particular, los administradores utilizan datos agregados para evaluaciones de la atmósfera política, religiosa, social o de otro tipo actual de una nación para rastrear las brechas en las respuestas sociales relacionadas con el tiempo y el espacio, y para dictar prioridades de acción. Estas evaluaciones ayudan a los administradores a evaluar las medidas actuales que son útiles en la planificación estratégica futura y proporcionan indicadores sobre medidas correctivas efectivas. [5]

Fuentes y métodos de recopilación.

Los datos agregados pueden ser una composición de varios tipos de escritos y registros, incluidas biografías , autobiografías , relatos descriptivos y correspondencia. [5] Por ejemplo, un investigador recopila, coteja o compila datos agregados mediante la utilización de múltiples mecanismos de investigación social , incluido un inventario , una entrevista , un opinionnaire y un cuestionario o cronograma . Los organismos oficiales o no oficiales también recopilan y compilan datos agregados de forma continua mediante la utilización de infraestructuras disponibles dentro de un departamento a nivel de campo. [5]

Las fuentes de datos agregados también pueden considerarse herramientas para descubrir datos. En Estados Unidos, algunos de sus datos se presentan en forma de tablas. Ejemplos de fuentes para estos datos agregados de EE. UU. incluyen la Oficina del Censo de Estados Unidos , el Resumen Estadístico de Estados Unidos y Social Explorer. Los datos del Fondo Monetario Internacional , World DataBank y Penn World Table son ejemplos de fuentes de datos transaccionales e internacionales agregados. [11]

Uso de datos agregados

Análisis político comparado

Los datos agregados se utilizan en el análisis político comparativo porque los analistas no se centran únicamente en el comportamiento individual. También se centran en el comportamiento de unidades regionales, incluidos distritos electorales y naciones. [12] En los análisis de la actividad política, datos importantes como los relacionados con la industrialización , la urbanización y las redes de comunicación de masas, no se expresan fácilmente en niveles individuales. Se expresan en términos per cápita para controlar las variaciones en el tamaño de la población de las unidades de área . [12] Los datos agregados están ampliamente disponibles porque las naciones recopilan y publican datos demográficos, socioeconómicos y políticos. Esto facilita a los investigadores y analistas la realización de estudios de tendencias más largos y les permite enfocar los cambios y desarrollos en un enfoque más profundo. [12]

Metanálisis científicos de APD

Factores como la necesidad de tiempo, recursos considerables y una amplia cooperación internacional impidieron el uso de metanálisis de datos de pacientes individuales (IPD) , lo que llevó a que la mayoría de los metanálisis publicados se basaran en datos agregados de pacientes (APD). [13] Para adquirir datos en todos los ensayos sobre todos los pacientes, se recopilan datos agregados de los pacientes a partir de estudios completos que se presentan en reuniones profesionales, se publican en la literatura médica o fueron proporcionados directamente por investigadores individuales. Los datos agregados de los pacientes son utilizados por usuarios, incluida la Colaboración Cochrane , el Grupo de Trabajo de Servicios Preventivos de los Estados Unidos y múltiples sociedades profesionales para brindar apoyo a las pautas de práctica clínica. Los datos agregados de pacientes también se utilizan en estudios de metanálisis de tiempo hasta el evento, ya que los resultados pueden informar a los inversores sobre la conveniencia de proceder a realizar más metanálisis que se basen en datos de pacientes individuales que requieren muchos recursos. [13]

Otros usos

Cuidado de la salud

En un sistema de información sanitaria, los datos agregados son la integración de datos relativos a numerosos pacientes. No se puede rastrear a un paciente en particular basándose en datos agregados. Estos datos agregados son sólo recuentos, incluyendo Tuberculosis , Malaria u otras enfermedades. Los establecimientos de salud utilizan este tipo de estadísticas agregadas para generar informes e indicadores y llevar a cabo una planificación estratégica en sus sistemas de salud. [14] En comparación con los datos agregados, los datos de los pacientes son datos individuales relacionados con un solo paciente, incluido el nombre, la edad, el diagnóstico y el historial médico. Los datos basados ​​en pacientes se utilizan principalmente para realizar un seguimiento del progreso de un paciente, como por ejemplo, cómo responde a un tratamiento particular, a lo largo del tiempo. [14]

El Archivo de datos de COVID-19, también llamado COVID-ARC, agrega datos de estudios de todo el mundo . Los investigadores pueden acceder a los descubrimientos de colegas internacionales y forjar colaboraciones para facilitar los procesos implicados en la lucha contra la enfermedad. [15] Específicamente, el uso de datos de atención médica agregados permite a los proveedores de atención médica desbloquear conocimientos clínicos procesables cuando, por ejemplo, es posible obtener vistas exhaustivas de datos clínicos o registros continuos de pacientes. [15]

Educación

Los datos agregados, como los datos demográficos agregados a nivel escolar y los datos agregados de rendimiento a nivel escolar, se utilizan en análisis experimentales para evaluar las relaciones entre el rendimiento estudiantil y las intervenciones a nivel escolar. [16] Los datos agregados también se pueden utilizar en análisis no experimentales, como el análisis de discontinuidad de regresión y el análisis de series de tiempo interrumpidas. No se requieren datos a nivel individual en estos análisis no experimentales. Por ejemplo, el análisis de series de tiempo interrumpidas estima el impacto generado por un programa a nivel escolar comparando los logros de una escuela antes y después de que se lance el programa, cuando los datos a nivel individual no son necesarios. [dieciséis]

Limitaciones

Durante el proceso de promediar unidades dentro de algún grupo o dentro de un país, se pierde información, lo que aumenta la probabilidad de sacar inferencias inexactas. [17] La ​​pérdida de información se produce porque la agregación de datos ignora la variación individual como si fuera sólo un tipo de ruido estadístico o error de medición. [18] La inferencia también varía de uno a otro cuando se utilizan datos de empresas individuales o datos agregados para el análisis. Por ejemplo, el cálculo de los promedios nacionales no tiene en cuenta variables específicas de las empresas, como el tamaño, la antigüedad o la concentración de la propiedad de las empresas, pero sí lo hace el cálculo de los promedios individuales. Existen diferencias entre los resultados generados a partir de datos agregados y datos individuales. [17]

También existe el problema de la "falacia ecológica". El concepto fue propuesto por Robinson (1950). El significado del término es que la variabilidad en torno a las medias a nivel individual es significativamente diferente de la variabilidad que abarca las medias agregadas. [18] Con el concepto agregado se expresan cosas distintas a los equivalentes individuales de los datos agregados, lo que significa que no se pueden sacar conclusiones a nivel individual. [3] Aunque los datos agregados tienen una aplicabilidad más amplia que los datos a nivel individual, es más difícil para los investigadores abordar el análisis de los resultados de los subgrupos cuando se utilizan datos agregados. Con el tiempo, también puede ser necesaria información individual. Los modelos de crecimiento y los modelos longitudinales basados ​​en datos agregados también son difíciles porque las variables pueden variar con el tiempo. [2]

Otros tipos de datos agregados

Datos de agregados financieros

Los datos de agregados financieros son un tipo de datos agregados sobre el crédito y la oferta monetaria en Australia, que utilizan los formuladores de políticas para evaluar las actividades económicas y financieras tanto de los hogares como de las empresas. [7]

Agregados de crédito

Los agregados crediticios son medidas del endeudamiento de hogares y empresas con intermediarios financieros. La cantidad de fondos tomados prestados por las empresas para fines que incluyen inversiones en proyectos, compras de activos o gestión del flujo de efectivo también se miden utilizando agregados crediticios. [7]

Agregados monetarios

Los agregados monetarios son medidas del dinero o instrumentos "similares al dinero" del sistema bancario, que se debe a empresas y hogares. Un ejemplo de instrumento "similar al dinero" son los depósitos en la cuenta bancaria . [7]

Datos agregados del censo

En el Reino Unido, los datos agregados del censo son datos generados como resultados de los censos del Reino Unido. Proporcionan información sobre las características socioeconómicas y demográficas de la población del país. Son una recopilación de cálculos agregados o resumidos del número de individuos, residentes de hogares o familias en áreas geográficas particulares con características específicas, o compuestos de características, tomados de temas de personas y lugares, poblaciones, familias, salud, etnicidad y religión, vivienda y trabajo. [19]

Los datos agregados se utilizan como componentes de los resultados de los censos del Reino Unido. Se obtienen a partir del análisis de la información contenida en las declaraciones censales. [19] Los datos agregados del censo se utilizan para comparar y describir las características de la población en varios lugares del Reino Unido porque pueden proporcionar información comparable en una variedad de niveles geográficos en todo el Reino Unido. Los datos agregados del censo también se utilizan en el sector académico con fines de enseñanza e investigación, así como para ubicación de sitios y marketing en el sector privado. [19]

Referencias

  1. ^ Hashimzade, Nigar; Myles, Gareth; Negro, John (19 de enero de 2017). Un diccionario de economía. Prensa de la Universidad de Oxford. pag. 4. doi :10.1093/acref/9780198759430.001.0001. ISBN 978-0-19-875943-0.
  2. ^ abcd Jacob, Robin (2016). "Uso de datos administrativos agregados en la investigación de políticas sociales". Oficina de Planificación, Investigación y Evaluación | ACF . pag. 1-6 . Consultado el 30 de octubre de 2020 .
  3. ^ abc Starrin, Bengt; Hagquist, Curt; Larsson, Gerry; Svensson, Per-Gunnar (1 de junio de 1993). "Tipos de comunidad, estructura socioeconómica y mortalidad por CI: un análisis contextual basado en datos agregados suecos". Ciencias Sociales y Medicina . 36 (12): 1569-1578. doi :10.1016/0277-9536(93)90345-5. ISSN  0277-9536. PMID  8327920.
  4. ^ Agregación y reestructuración de datos (capítulo 5.6 del libro "R en acción", Publicaciones Manning )
  5. ^ abcdefgh Shukla, KS (1982). "Análisis de datos agregados". Revista del Instituto de Derecho de la India . 24 (4): 756–762. ISSN  0019-5731. JSTOR  43950840.
  6. ^ "Datos de ubicación móvil y Covid-19: preguntas y respuestas". Observador de derechos humanos . 2020-05-13 . Consultado el 30 de octubre de 2020 .
  7. ^ Banco abcd, Joel; Durrani, Kassim; Hatzvi, Eden (21 de marzo de 2019). "Actualizaciones de los agregados financieros de Australia". Banco de la Reserva de Australia .
  8. ^ ab Stewart, Emily (22 de marzo de 2019). "Los bancos tienen mucha información sobre usted y no la guardan toda para sí mismos: ABC Life". ABC Noticias . Consultado el 30 de octubre de 2020 .
  9. ^ "Estadísticas» Estadísticas experimentales de recopilación de datos agregados de atención de urgencia integrada (IUC ADC) 2019-20 ". www.england.nhs.uk . NHS de Inglaterra . Consultado el 30 de octubre de 2020 .
  10. ^ "Recopilación de datos agregados de atención de urgencia integrada (IUC ADC) para marzo de 2020 (experimental)". GOBIERNO DEL REINO UNIDO . Inglaterra, Reino Unido. 14 de mayo de 2020 . Consultado el 30 de octubre de 2020 .
  11. ^ Pencek, Bruce. "Guías de investigación: recursos de datos para las ciencias sociales: datos agregados". guías.lib.vt.edu . Virginia Tech . Consultado el 30 de octubre de 2020 .
  12. ^ abc Retzlaff, Ralph H. (1965). "El uso de datos agregados en el análisis político comparativo". La Revista de Política . 27 (4): 797–817. doi :10.2307/2128120. ISSN  0022-3816. JSTOR  2128120. S2CID  154713056.
  13. ^ ab Lyman, Gary H.; Kuderer, Nicole M. (25 de abril de 2005). "Las fortalezas y limitaciones de los metanálisis basados ​​en datos agregados". Metodología de la investigación médica del BMC . 5 (1): 14. doi : 10.1186/1471-2288-5-14 . ISSN  1471-2288. PMC 1097735 . PMID  15850485. 
  14. ^ ab "3.5 Diferencia entre datos agregados y de pacientes en un HIS". docs.dhis2.org . Consultado el 15 de noviembre de 2020 .
  15. ^ ab Greenbaum, Zara (19 de agosto de 2020). "Los científicos lanzan un archivo de datos para impulsar la investigación sobre COVID-19". Noticias HSC . Consultado el 31 de octubre de 2020 .
  16. ^ ab Jacob, Robin T.; Goddard, Roger D.; Kim, Eun Sook (1 de marzo de 2014). "Evaluación del uso de datos agregados en la evaluación de intervenciones escolares: implicaciones para la investigación de evaluación y la política estatal con respecto a los datos de uso público". Evaluación educativa y análisis de políticas . 36 : 44–66. doi :10.3102/0162373713485814. S2CID  145621485.
  17. ^ ab Holderness, Clifford G. (12 de mayo de 2016). "Problemas al utilizar datos agregados para inferir el comportamiento individual: evidencia de la ley, las finanzas y la concentración de propiedad". Revisión crítica de finanzas . 5 (1): 1–40. doi :10.1561/104.00000028.
  18. ^ ab Pollet, Thomas V.; Stulp, Gert; Henzi, San Pedro; Barrett, Luisa (2015). "Eliminar el agravamiento de la agregación de datos: una guía conceptual para abordar cuestiones estadísticas relacionadas con la combinación de datos de observación a nivel individual". Revista americana de primatología . 77 (7): 727–740. doi :10.1002/ajp.22405. ISSN  1098-2345. PMID  25810242. S2CID  1705139.
  19. ^ abc "Guía de datos agregados del censo". census.ukdataservice.ac.uk . Consultado el 31 de octubre de 2020 .