Un espacio de datos es una abstracción en la gestión de datos que tiene como objetivo superar algunos de los problemas encontrados en un sistema de integración de datos . Un espacio de datos se define como un conjunto de "participantes", o fuentes de datos, y las relaciones entre ellos: por ejemplo, que el conjunto de datos A es un duplicado del conjunto de datos B. [1] Puede contener todas las fuentes de datos de una organización independientemente de su formato, ubicación física o modelo de datos . [1] El espacio de datos proporciona una interfaz unificada para consultar datos independientemente del formato, a veces de manera "de máximo esfuerzo", y formas de integrar aún más los datos cuando sea necesario. [1] Es muy diferente de una base de datos relacional tradicional , que requiere que todos los datos estén en el mismo formato. [1] El objetivo del concepto es reducir el esfuerzo necesario para configurar un sistema de integración de datos al confiar en las técnicas existentes de generación de correspondencias y mapeos, [ aclaración necesaria ] y mejorar el sistema en la modalidad de "pago por uso" a medida que se utiliza. [2] [3] Los aspectos de la integración de datos que requieren mucha mano de obra se posponen hasta que sean absolutamente necesarios. [4]
Tradicionalmente, los sistemas de integración e intercambio de datos han tenido como objetivo ofrecer muchos de los supuestos servicios de los sistemas de espacio de datos. Los espacios de datos pueden considerarse un paso siguiente en la evolución de las arquitecturas de integración de datos, pero se diferencian de los sistemas de integración de datos actuales porque requieren una integración semántica antes de poder proporcionar cualquier servicio. Por lo tanto, aunque no existe un único esquema al que se ajusten todos los datos y estos residen en una multitud de sistemas host, el sistema de integración de datos conoce las relaciones precisas entre los términos utilizados en cada esquema. Como resultado, se requiere un importante esfuerzo inicial para configurar un sistema de integración de datos. [5]
Los espacios de datos cambian el énfasis hacia un enfoque de coexistencia de datos que proporciona una funcionalidad básica sobre todas las fuentes de datos, independientemente de lo integradas que estén. Por ejemplo, una plataforma de soporte de espacios de datos (DSSP) puede proporcionar una búsqueda de palabras clave sobre todas sus fuentes de datos, similar a la que proporcionan los sistemas de búsqueda de escritorio existentes. Cuando se requieren operaciones más sofisticadas, como consultas de estilo relacional, minería de datos o monitoreo sobre ciertas fuentes, entonces se puede aplicar un esfuerzo adicional para integrar más estrechamente esas fuentes de manera incremental. De manera similar, en términos de garantías de bases de datos tradicionales, inicialmente un sistema de espacios de datos solo puede proporcionar garantías más débiles de consistencia y durabilidad. A medida que se desean garantías más sólidas, se puede poner más esfuerzo en hacer acuerdos entre los diversos propietarios de fuentes de datos y abrir ciertas interfaces (por ejemplo, para protocolos de confirmación). [6] [7]
Según un modelo cíclico de desarrollo tecnológico, las nuevas tecnologías progresan pasando primero por una fase de competencia de diseño, donde se explora la tecnología y se realizan experimentos, hasta que la industria se establece en un diseño dominante y deja de iterar tanto. [1] A partir de 2019 [actualizar], Edward describe que los espacios de datos ya han experimentado una "primera ola" de adopción, compuesta por proyectos exploratorios y de prueba de concepto, y han comenzado una "segunda ola" en la que se están adaptando para casos de uso más generales y menos agradables. [1]
La Comisión Europea ha estado trabajando en el desarrollo de espacios de datos compartidos para varias industrias llamadas "Espacios de Datos Europeos Comunes" desde febrero de 2020. [8] Se planean espacios de datos para las industrias de agricultura, energía, finanzas, salud, medios de comunicación, manufactura, movilidad y turismo, así como para el Pacto Verde Europeo , idiomas, administración pública, investigación e innovación y habilidades. [8] [9] [ aclaración necesaria ] Los primeros pasos concretos que se dieron fueron una serie de iniciativas de investigación e innovación financiadas como parte de la Asociación Público-Privada Europea sobre el Valor de los Big Data (Big Data Value PPP). [10]