Una base de datos distribuida es una base de datos en la que los datos se almacenan en diferentes ubicaciones físicas. [1] Puede almacenarse en varias computadoras ubicadas en la misma ubicación física (por ejemplo, un centro de datos); o tal vez dispersos en una red de computadoras interconectadas. A diferencia de los sistemas paralelos , en los que los procesadores están estrechamente acoplados y constituyen un único sistema de base de datos, un sistema de base de datos distribuido consta de sitios débilmente acoplados que no comparten componentes físicos.
Los administradores del sistema pueden distribuir colecciones de datos (por ejemplo, en una base de datos) en múltiples ubicaciones físicas. Una base de datos distribuida puede residir en servidores de red organizados o en computadoras independientes descentralizadas en Internet , en intranets o extranets corporativas , o en otras redes de organizaciones . Debido a que las bases de datos distribuidas almacenan datos en varias computadoras, las bases de datos distribuidas pueden mejorar el rendimiento en los lugares de trabajo de los usuarios finales al permitir que las transacciones se procesen en muchas máquinas, en lugar de limitarse a una. [2]
Dos procesos garantizan que las bases de datos distribuidas se mantengan actualizadas y actualizadas: replicación [3] y duplicación .
Tanto la replicación como la duplicación pueden mantener los datos actualizados en todas las ubicaciones de distribución. [2]
Además de la replicación y fragmentación de bases de datos distribuidas, existen muchas otras tecnologías de diseño de bases de datos distribuidas. Por ejemplo, autonomía local, tecnologías de bases de datos distribuidas síncronas y asíncronas. La implementación de estas tecnologías puede depender, y depende, de las necesidades de la empresa y de la sensibilidad/ confidencialidad de los datos almacenados en la base de datos y del precio que la empresa esté dispuesta a gastar para garantizar la seguridad , coherencia e integridad de los datos .
Cuando se analiza el acceso a bases de datos distribuidas, Microsoft favorece el término consulta distribuida , que define de manera específica del protocolo como "[cualquier] instrucción SELECT, INSERT, UPDATE o DELETE que haga referencia a tablas y conjuntos de filas de uno o más datos OLE DB externos. fuentes". [4] Oracle proporciona una visión más centrada en el lenguaje en la que las consultas distribuidas y las transacciones distribuidas forman parte del SQL distribuido . [5]
Hay 3 tipos principales de arquitectura para bases de datos distribuidas:
En las arquitecturas de memoria compartida y de disco compartido, los datos no están particionados , pero tienen que estar en una arquitectura sin compartir.
La arquitectura de disco compartido es más común para las bases de datos en la nube que para las locales [6] .
Históricamente, nada compartido fue la primera arquitectura que se implementó en la nube, antes de que la llegada del almacenamiento compartido en la nube hiciera posible el disco compartido.
En la práctica, diferentes capas de la base de datos pueden tener arquitecturas diferentes. Ahora es común tener una capa de computación con una arquitectura de nada compartido y una capa de almacenamiento con una arquitectura de disco compartido. Este es, por ejemplo, el caso de Snowflake [7] y AWS Aurora [8] .
consulta distribuida[:] Cualquier instrucción SELECT, INSERT, UPDATE o DELETE que haga referencia a tablas y conjuntos de filas de uno o más orígenes de datos OLE DB externos.
SQL distribuido accede y actualiza sincrónicamente los datos distribuidos entre múltiples bases de datos.
[...] SQL distribuido incluye consultas distribuidas y transacciones distribuidas.
{{cite web}}
: CS1 maint: url-status (link){{cite web}}
: CS1 maint: url-status (link)