Un sistema de base de datos heterogéneo es un sistema automatizado (o semiautomatizado) para la integración de sistemas de gestión de bases de datos heterogéneos y dispares para presentar al usuario una interfaz de consulta única y unificada.
Los sistemas de bases de datos heterogéneas (HDB) son modelos computacionales e implementaciones de software que proporcionan integración de bases de datos heterogéneas. [1] [2]
Este artículo no contiene detalles de los sistemas de gestión de bases de datos distribuidas (a veces conocidos como sistemas de bases de datos federadas ).
Diferentes formatos de archivos , protocolos de acceso , lenguajes de consulta, etc. A menudo se denomina heterogeneidad sintáctica desde el punto de vista de los datos.
Diferentes formas de representar y almacenar los mismos datos. Las descomposiciones de tablas pueden variar, los nombres de columnas (etiquetas de datos) pueden ser diferentes (pero tienen la misma semántica), los esquemas de codificación de datos pueden variar (es decir, si una escala de medición debe incluirse explícitamente en un campo o debe estar implícita en otro lugar). También se denomina heterogeneidad esquemática.
Los datos de las distintas bases de datos pueden estar relacionados, pero ser diferentes. Tal vez un sistema de bases de datos deba ser capaz de integrar datos genómicos y proteómicos. Están relacionados (un gen puede tener varios productos proteínicos), pero los datos son diferentes ( secuencias de nucleótidos y secuencias de aminoácidos , o secuencias de aminoácidos hidrófilas o β y aminoácidos con carga positiva o negativa). Puede haber muchas formas de analizar conjuntos de datos semánticamente similares, pero distintos.
También puede ser necesario que el sistema presente conocimientos "nuevos" al usuario. Se pueden inferir relaciones entre datos según reglas especificadas en ontologías de dominio .