Base de datos distribuida

Una base de datos distribuida es una base de datos en la que los datos se almacenan en diferentes ubicaciones físicas. ^[1] Puede almacenarse en varias computadoras ubicadas en la misma ubicación física (por ejemplo, un centro de datos); o tal vez dispersos en una red de computadoras interconectadas. A diferencia de los sistemas paralelos , en los que los procesadores están estrechamente acoplados y constituyen un único sistema de base de datos, un sistema de base de datos distribuido consta de sitios débilmente acoplados que no comparten componentes físicos.

Los administradores del sistema pueden distribuir colecciones de datos (por ejemplo, en una base de datos) en múltiples ubicaciones físicas. Una base de datos distribuida puede residir en servidores de red organizados o en computadoras independientes descentralizadas en Internet , en intranets o extranets corporativas , o en otras redes de organizaciones . Debido a que las bases de datos distribuidas almacenan datos en varias computadoras, las bases de datos distribuidas pueden mejorar el rendimiento en los lugares de trabajo de los usuarios finales al permitir que las transacciones se procesen en muchas máquinas, en lugar de limitarse a una. ^[2]

Dos procesos garantizan que las bases de datos distribuidas se mantengan actualizadas y actualizadas: replicación ^[3] y duplicación .

La replicación implica el uso de software especializado que busca cambios en la base de datos distributiva. Una vez identificados los cambios, el proceso de replicación hace que todas las bases de datos tengan el mismo aspecto. El proceso de replicación puede ser complejo y llevar mucho tiempo, según el tamaño y la cantidad de bases de datos distribuidas. Este proceso también puede requerir mucho tiempo y recursos informáticos.
La duplicación, por otra parte, tiene menos complejidad. Identifica una base de datos como maestra y luego duplica esa base de datos. El proceso de duplicación normalmente se realiza a una hora determinada fuera de horario. Esto es para garantizar que cada ubicación distribuida tenga los mismos datos. En el proceso de duplicación, los usuarios sólo pueden cambiar la base de datos maestra. Esto garantiza que los datos locales no se sobrescribirán.

Tanto la replicación como la duplicación pueden mantener los datos actualizados en todas las ubicaciones de distribución. ^[2]

Además de la replicación y fragmentación de bases de datos distribuidas, existen muchas otras tecnologías de diseño de bases de datos distribuidas. Por ejemplo, autonomía local, tecnologías de bases de datos distribuidas síncronas y asíncronas. La implementación de estas tecnologías puede depender, y depende, de las necesidades de la empresa y de la sensibilidad/ confidencialidad de los datos almacenados en la base de datos y del precio que la empresa esté dispuesta a gastar para garantizar la seguridad , coherencia e integridad de los datos .

Cuando se analiza el acceso a bases de datos distribuidas, Microsoft favorece el término consulta distribuida , que define de manera específica del protocolo como "[cualquier] instrucción SELECT, INSERT, UPDATE o DELETE que haga referencia a tablas y conjuntos de filas de uno o más datos OLE DB externos. fuentes". ^[4]Oracle proporciona una visión más centrada en el lenguaje en la que las consultas distribuidas y las transacciones distribuidas forman parte del SQL distribuido . ^[5]

Arquitectura

Hay 3 tipos principales de arquitectura para bases de datos distribuidas:

Memoria compartida : muy raramente utilizada ^[6]
disco compartido
nada compartido

En las arquitecturas de memoria compartida y de disco compartido, los datos no están particionados , pero tienen que estar en una arquitectura sin compartir.

La arquitectura de disco compartido es más común para las bases de datos en la nube que para las locales ^[6] .

Históricamente, nada compartido fue la primera arquitectura que se implementó en la nube, antes de que la llegada del almacenamiento compartido en la nube hiciera posible el disco compartido.

En la práctica, diferentes capas de la base de datos pueden tener arquitecturas diferentes. Ahora es común tener una capa de computación con una arquitectura de nada compartido y una capa de almacenamiento con una arquitectura de disco compartido. Este es, por ejemplo, el caso de Snowflake ^[7] y AWS Aurora ^[8] .

Lista de bases de datos que no comparten nada

Lista de bases de datos de disco compartido

Ver también

Referencias

^ "Definición: base de datos distribuida". www.its.bldrdoc.gov .
^ ab O'Brien, J. & Marakas, GM (2008) Sistemas de información de gestión (págs. 185-189). Nueva York, Nueva York: McGraw-Hill Irwin
^ Ozsu, MT; Valduriez, P. (1991). "Sistemas de bases de datos distribuidas: ¿dónde estamos ahora?". Computadora . 24 (8): 68–78. doi :10.1109/2.84879. ISSN 1558-0814. S2CID 5898169.
^ "Glosario de TechNet". Microsoft. 28 de enero de 2010 . Consultado el 16 de julio de 2013 . consulta distribuida[:] Cualquier instrucción SELECT, INSERT, UPDATE o DELETE que haga referencia a tablas y conjuntos de filas de uno o más orígenes de datos OLE DB externos.
^ Ashdown, lanza; Kyte, Tom (septiembre de 2011). "Conceptos de bases de datos Oracle, 11g versión 2 (11.2)". Corporación Oráculo. Archivado desde el original el 15 de julio de 2013 . Consultado el 17 de julio de 2013 . SQL distribuido accede y actualiza sincrónicamente los datos distribuidos entre múltiples bases de datos. [...] SQL distribuido incluye consultas distribuidas y transacciones distribuidas.
^ ab Garrod, Charlie (2023). "Conferencia n.º 21: Introducción a las bases de datos distribuidas" (PDF) . Universidad Carnegie Mellon - Facultad de Ciencias de la Computación . Consultado el 12 de marzo de 2023 .{{cite web}}: CS1 maint: url-status (link)
^ Kaushik, Arun (14 de febrero de 2020). "Lo que hace que Snowflake sea tan poderoso: es el híbrido de arquitectura de disco compartido y nada compartido". Medio . Consultado el 12 de marzo de 2024 .
^ Brahmadesam, Murali; Ternstrom, Tobías (2019). "El almacenamiento de Amazon Aurora desmitificado: cómo funciona todo" (PDF) . Consultado el 12 de marzo de 2024 .{{cite web}}: CS1 maint: url-status (link)

MT Özsu y P. Valduriez, Principios de bases de datos distribuidas (3.ª edición) (2011), Springer, ISBN 978-1-4419-8833-1
Elmasri y Navathe, Fundamentos de los sistemas de bases de datos (tercera edición), Addison-Wesley Longman, ISBN 0-201-54263-3
Guía del administrador de bases de datos Oracle 10g (versión 1), http://docs.oracle.com/cd/B14117_01/server.101/b10739/ds_concepts.htm