stringtranslate.com

Espacio de datos

Participantes en un espacio de datos

Un espacio de datos es una abstracción en la gestión de datos que tiene como objetivo superar algunos de los problemas encontrados en un sistema de integración de datos . Un espacio de datos se define como un conjunto de "participantes", o fuentes de datos, y las relaciones entre ellos: por ejemplo, que el conjunto de datos A es un duplicado del conjunto de datos B. [1] Puede contener todas las fuentes de datos de una organización independientemente de su formato, ubicación física o modelo de datos . [1] El espacio de datos proporciona una interfaz unificada para consultar datos independientemente del formato, a veces de manera "de máximo esfuerzo", y formas de integrar aún más los datos cuando sea necesario. [1] Es muy diferente de una base de datos relacional tradicional , que requiere que todos los datos estén en el mismo formato. [1] El objetivo del concepto es reducir el esfuerzo necesario para configurar un sistema de integración de datos al confiar en las técnicas existentes de generación de correspondencias y mapeos, [ aclaración necesaria ] y mejorar el sistema en la modalidad de "pago por uso" a medida que se utiliza. [2] [3] Los aspectos de la integración de datos que requieren mucha mano de obra se posponen hasta que sean absolutamente necesarios. [4]

Tradicionalmente, los sistemas de integración e intercambio de datos han tenido como objetivo ofrecer muchos de los supuestos servicios de los sistemas de espacio de datos. Los espacios de datos pueden considerarse un paso siguiente en la evolución de las arquitecturas de integración de datos, pero se diferencian de los sistemas de integración de datos actuales porque requieren una integración semántica antes de poder proporcionar cualquier servicio. Por lo tanto, aunque no existe un único esquema al que se ajusten todos los datos y estos residen en una multitud de sistemas host, el sistema de integración de datos conoce las relaciones precisas entre los términos utilizados en cada esquema. Como resultado, se requiere un importante esfuerzo inicial para configurar un sistema de integración de datos. [5]

Los espacios de datos cambian el énfasis hacia un enfoque de coexistencia de datos que proporciona una funcionalidad básica sobre todas las fuentes de datos, independientemente de lo integradas que estén. Por ejemplo, una plataforma de soporte de espacios de datos (DSSP) puede proporcionar una búsqueda de palabras clave sobre todas sus fuentes de datos, similar a la que proporcionan los sistemas de búsqueda de escritorio existentes. Cuando se requieren operaciones más sofisticadas, como consultas de estilo relacional, minería de datos o monitoreo sobre ciertas fuentes, entonces se puede aplicar un esfuerzo adicional para integrar más estrechamente esas fuentes de manera incremental. De manera similar, en términos de garantías de bases de datos tradicionales, inicialmente un sistema de espacios de datos solo puede proporcionar garantías más débiles de consistencia y durabilidad. A medida que se desean garantías más sólidas, se puede poner más esfuerzo en hacer acuerdos entre los diversos propietarios de fuentes de datos y abrir ciertas interfaces (por ejemplo, para protocolos de confirmación). [6] [7]

Historia

Según un modelo cíclico de desarrollo tecnológico, las nuevas tecnologías progresan pasando primero por una fase de competencia de diseño, donde se explora la tecnología y se realizan experimentos, hasta que la industria se establece en un diseño dominante y deja de iterar tanto. [1] A partir de 2019 , Edward describe que los espacios de datos ya han experimentado una "primera ola" de adopción, compuesta por proyectos exploratorios y de prueba de concepto, y han comenzado una "segunda ola" en la que se están adaptando para casos de uso más generales y menos agradables. [1]

La Comisión Europea ha estado trabajando en el desarrollo de espacios de datos compartidos para varias industrias llamadas "Espacios de Datos Europeos Comunes" desde febrero de 2020. [8] Se planean espacios de datos para las industrias de agricultura, energía, finanzas, salud, medios de comunicación, manufactura, movilidad y turismo, así como para el Pacto Verde Europeo , idiomas, administración pública, investigación e innovación y habilidades. [8] [9] [ aclaración necesaria ] Los primeros pasos concretos que se dieron fueron una serie de iniciativas de investigación e innovación financiadas como parte de la Asociación Público-Privada Europea sobre el Valor de los Big Data (Big Data Value PPP). [10]

Véase también

Referencias

  1. ^ abcdef Curry, Edward (2020), Curry, Edward (ed.), "Espacios de datos: fundamentos, principios y técnicas", Espacios de datos vinculados en tiempo real: habilitación de ecosistemas de datos para sistemas inteligentes , Cham: Springer International Publishing, págs. 45–62, doi : 10.1007/978-3-030-29665-0_3 , ISBN 978-3-030-29665-0
  2. ^ Belhajjame, K.; Paton, NW ; Embury, SM; Fernandes, AAA; Hedeler, C. (2013). "Mejora incremental de los espacios de datos en función de la retroalimentación de los usuarios". Sistemas de información . 38 (5): 656. CiteSeerX 10.1.1.303.1957 . doi :10.1016/j.is.2013.01.006. 
  3. ^ Belhajjame, K.; Paton, NW ; Embury, SM; Fernandes, AAA; Hedeler, C. (2010). "Anotación, selección y refinamiento basados ​​en retroalimentación de asignaciones de esquemas para espacios de datos". Actas de la 13.ª Conferencia internacional sobre la extensión de la tecnología de bases de datos - EDBT '10 . pág. 573. CiteSeerX 10.1.1.298.3519 . doi :10.1145/1739041.1739110. ISBN  9781605589459.
  4. ^ Dong, X.; Halevy, A. (2007). "Indexación de espacios de datos". Actas de la conferencia internacional ACM SIGMOD 2007 sobre gestión de datos - SIGMOD '07 . p. 43. doi :10.1145/1247480.1247487. ISBN 9781595936868.S2CID1184444  .​
  5. ^ Howe, B.; Maier, D.; Rayner, N.; Rucker, J. (2008). "Explotación de espacios de datos: creación de perfiles sin esquema de fuentes de información desconocidas". Taller de la 24.ª Conferencia Internacional sobre Ingeniería de Datos del IEEE de 2008. pág. 270. doi :10.1109/ICDEW.2008.4498331. ISBN 978-1-4244-2161-9.S2CID 14039616  .
  6. ^ Sarma, AD; Dong, X. (L.; Halevy, AY (2009). "Modelado de datos en plataformas de soporte de espacio de datos". Modelado conceptual: fundamentos y aplicaciones . Apuntes de clase en informática. Vol. 5600. págs. 122–138. doi :10.1007/978-3-642-02463-4_8. ISBN 978-3-642-02462-7.
  7. ^ Franklin, M.; Halevy, A.; Maier, D. (2005). "De bases de datos a espacios de datos". ACM SIGMOD Record . 34 (4): 27. doi :10.1145/1107499.1107502. S2CID  14092111.
  8. ^ ab «Dar forma al futuro digital de Europa: espacios comunes europeos de datos». Comisión Europea . Consultado el 24 de agosto de 2024 .
  9. ^ "Una visión desde Bruselas: la estrategia europea para los datos toma forma". Asociación Internacional de Profesionales de la Privacidad . 11 de enero de 2024. Consultado el 24 de agosto de 2024 .
  10. ^ Scerri, Simon; Tuikka, Tuomo; de Vallejo, Irene Lopez; Curry, Edward (2022), Curry, Edward; Scerri, Simon; Tuikka, Tuomo (eds.), "Espacios de datos europeos comunes: desafíos y oportunidades", Data Spaces : Design, Deployment and Future Directions , Cham: Springer International Publishing, págs. 337–357, doi : 10.1007/978-3-030-98636-0_16 , ISBN 978-3-030-98636-0

Lectura adicional