Base de datos distribuida

Una base de datos distribuida es una base de datos en la que los datos se almacenan en diferentes ubicaciones físicas. ^[1] Puede almacenarse en varias computadoras ubicadas en la misma ubicación física (por ejemplo, un centro de datos); o tal vez dispersarse en una red de computadoras interconectadas. A diferencia de los sistemas paralelos , en los que los procesadores están estrechamente acoplados y constituyen un único sistema de base de datos, un sistema de base de datos distribuido consta de sitios acoplados de forma flexible que no comparten componentes físicos.

Los administradores de sistemas pueden distribuir conjuntos de datos (por ejemplo, en una base de datos) en múltiples ubicaciones físicas. Una base de datos distribuida puede residir en servidores de red organizados o en computadoras independientes descentralizadas en Internet , en intranets o extranets corporativas o en otras redes de organizaciones . Debido a que las bases de datos distribuidas almacenan datos en múltiples computadoras, las bases de datos distribuidas pueden mejorar el rendimiento en los lugares de trabajo de los usuarios finales al permitir que las transacciones se procesen en muchas máquinas, en lugar de estar limitadas a una. ^[2]

Dos procesos garantizan que las bases de datos distribuidas permanezcan actualizadas y vigentes: la replicación ^[3] y la duplicación .

La replicación implica el uso de software especializado que busca cambios en la base de datos distribuida. Una vez identificados los cambios, el proceso de replicación hace que todas las bases de datos parezcan iguales. El proceso de replicación puede ser complejo y requerir mucho tiempo, según el tamaño y la cantidad de bases de datos distribuidas. Este proceso también puede requerir mucho tiempo y recursos informáticos.
Por otro lado, la duplicación tiene menos complejidad. Identifica una base de datos como maestra y luego duplica esa base de datos. El proceso de duplicación normalmente se realiza a una hora determinada fuera del horario laboral. Esto es para garantizar que cada ubicación distribuida tenga los mismos datos. En el proceso de duplicación, los usuarios pueden cambiar solo la base de datos maestra. Esto garantiza que los datos locales no se sobrescriban.

Tanto la replicación como la duplicación pueden mantener los datos actualizados en todas las ubicaciones distributivas. ^[2]

Además de la replicación y fragmentación de bases de datos distribuidas, existen muchas otras tecnologías de diseño de bases de datos distribuidas. Por ejemplo, tecnologías de bases de datos distribuidas con autonomía local, sincrónicas y asincrónicas. La implementación de estas tecnologías puede depender (y depende) de las necesidades de la empresa y de la sensibilidad/ confidencialidad de los datos almacenados en la base de datos, así como del precio que la empresa esté dispuesta a pagar para garantizar la seguridad , la coherencia y la integridad de los datos .

Al hablar de acceso a bases de datos distribuidas, Microsoft prefiere el término consulta distribuida , que define de manera específica del protocolo como "cualquier instrucción SELECT, INSERT, UPDATE o DELETE que haga referencia a tablas y conjuntos de filas de una o más fuentes de datos OLE DB externas". ^[4]Oracle proporciona una visión más centrada en el lenguaje en la que las consultas distribuidas y las transacciones distribuidas forman parte del SQL distribuido . ^[5]

Arquitectura

Hay tres tipos principales de arquitectura para bases de datos distribuidas:

Memoria compartida : muy poco utilizada ^[6]
Disco compartido
Nada compartido

En las arquitecturas de memoria compartida y disco compartido, los datos no se particionan , pero deben estar en una arquitectura donde no se comparte nada.

La arquitectura de disco compartido es más común para las bases de datos en la nube que para las locales. ^[6]

Históricamente, la arquitectura de nada compartido fue la primera que se implementó en la nube, antes de que la llegada del almacenamiento en la nube compartido hiciera posible el disco compartido.

En la práctica, las distintas capas de la base de datos pueden tener arquitecturas diferentes. Hoy en día es habitual tener una capa de cómputo con una arquitectura de no uso compartido y una capa de almacenamiento con una arquitectura de disco compartido. Este es, por ejemplo, el caso de Snowflake ^[7] y AWS Aurora ^[8] .

Lista de bases de datos que no comparten nada

Lista de bases de datos de discos compartidos

Véase también

Referencias

^ "Definición: base de datos distribuida". www.its.bldrdoc.gov .
^ ab O'Brien, J. & Marakas, GM (2008) Sistemas de información de gestión (págs. 185-189). Nueva York, Nueva York: McGraw-Hill Irwin
^ Ozsu, MT; Valduriez, P. (1991). "Sistemas de bases de datos distribuidas: ¿dónde estamos ahora?". Computer . 24 (8): 68–78. doi :10.1109/2.84879. ISSN 1558-0814. S2CID 5898169.
^ "Glosario de TechNet". Microsoft. 28 de enero de 2010. Consultado el 16 de julio de 2013. consulta distribuida[:] Cualquier instrucción SELECT, INSERT, UPDATE o DELETE que haga referencia a tablas y conjuntos de filas de una o más fuentes de datos OLE DB externas.
^ Ashdown, Lance; Kyte, Tom (septiembre de 2011). "Oracle Database Concepts, 11g Release 2 (11.2)". Oracle Corporation. Archivado desde el original el 15 de julio de 2013. Consultado el 17 de julio de 2013. El SQL distribuido accede y actualiza de forma sincrónica los datos distribuidos entre varias bases de datos . [...] El SQL distribuido incluye consultas distribuidas y transacciones distribuidas.
^ ab Garrod, Charlie (2023). "Conferencia n.° 21: Introducción a las bases de datos distribuidas" (PDF) . Universidad Carnegie Mellon - Facultad de Ciencias de la Computación . Consultado el 12 de marzo de 2023 .
^ Kaushik, Arun (14 de febrero de 2020). "Lo que hace que Snowflake sea tan potente: es el híbrido entre la arquitectura de disco compartido y la arquitectura de nada compartido". Medium . Consultado el 12 de marzo de 2024 .
^ Brahmadesam, Murali; Ternstrom, Tobias (2019). "El almacenamiento de Amazon Aurora desmitificado: cómo funciona todo" (PDF) . Consultado el 12 de marzo de 2024 .

MT Özsu y P. Valduriez, Principios de bases de datos distribuidas (3.ª edición) (2011), Springer, ISBN 978-1-4419-8833-1
Elmasri y Navathe, Fundamentos de los sistemas de bases de datos (3.ª edición), Addison-Wesley Longman, ISBN 0-201-54263-3
Guía del administrador de bases de datos Oracle 10g (versión 1), http://docs.oracle.com/cd/B14117_01/server.101/b10739/ds_concepts.htm