stringtranslate.com

Base de datos

Una declaración de selección SQL y su resultado

En informática , una base de datos es una colección organizada de datos o un tipo de almacén de datos basado en el uso de un sistema de gestión de bases de datos ( DBMS ), el software que interactúa con los usuarios finales , las aplicaciones y la propia base de datos para capturar y analizar los datos. . El DBMS abarca además las funciones básicas proporcionadas para administrar la base de datos. La suma total de la base de datos, el DBMS y las aplicaciones asociadas puede denominarse sistema de base de datos . A menudo, el término "base de datos" también se utiliza de manera vaga para referirse a cualquiera de los DBMS, el sistema de base de datos o una aplicación asociada con la base de datos.

Las bases de datos pequeñas se pueden almacenar en un sistema de archivos , mientras que las bases de datos grandes se alojan en grupos de computadoras o almacenamiento en la nube . El diseño de bases de datos abarca técnicas formales y consideraciones prácticas, incluido el modelado de datos , la representación y el almacenamiento eficiente de datos, los lenguajes de consulta , la seguridad y privacidad de datos confidenciales y cuestiones informáticas distribuidas , incluido el soporte de acceso concurrente y la tolerancia a fallas .

Los informáticos pueden clasificar los sistemas de gestión de bases de datos según los modelos de bases de datos que admiten. Las bases de datos relacionales se volvieron dominantes en la década de 1980. Estos modelan datos como filas y columnas en una serie de tablas , y la gran mayoría usa SQL para escribir y consultar datos. En la década de 2000, las bases de datos no relacionales se hicieron populares, denominadas colectivamente NoSQL , porque utilizan diferentes lenguajes de consulta .

Terminología y descripción general

Formalmente, una "base de datos" se refiere a un conjunto de datos relacionados a los que se accede mediante el uso de un "sistema de gestión de bases de datos" (DBMS), que es un conjunto integrado de software informático que permite a los usuarios interactuar con una o más bases de datos y proporciona acceso a todos los datos contenidos en la base de datos (aunque pueden existir restricciones que limiten el acceso a datos particulares). El DBMS proporciona varias funciones que permiten la entrada, el almacenamiento y la recuperación de grandes cantidades de información y proporciona formas de gestionar cómo se organiza esa información.

Debido a la estrecha relación entre ellos, el término "base de datos" se utiliza a menudo de manera informal para referirse tanto a una base de datos como al DBMS utilizado para manipularla.

Fuera del mundo de la tecnología de la información profesional , el término base de datos se utiliza a menudo para referirse a cualquier colección de datos relacionados (como una hoja de cálculo o un índice de tarjetas), ya que los requisitos de tamaño y uso generalmente requieren el uso de un sistema de gestión de bases de datos. [1]

Los DBMS existentes proporcionan diversas funciones que permiten la gestión de una base de datos y sus datos, que se pueden clasificar en cuatro grupos funcionales principales:

Tanto una base de datos como su DBMS se ajustan a los principios de un modelo de base de datos particular . [5] "Sistema de base de datos" se refiere colectivamente al modelo de base de datos, al sistema de gestión de bases de datos y a la base de datos. [6]

Físicamente, los servidores de bases de datos son computadoras dedicadas que contienen las bases de datos reales y ejecutan solo el DBMS y el software relacionado. Los servidores de bases de datos suelen ser computadoras multiprocesador , con memoria generosa y matrices de discos RAID que se utilizan para un almacenamiento estable. Los aceleradores de bases de datos de hardware, conectados a uno o más servidores a través de un canal de alta velocidad, también se utilizan en entornos de procesamiento de transacciones de gran volumen . Los DBMS se encuentran en el corazón de la mayoría de las aplicaciones de bases de datos . Los DBMS pueden construirse alrededor de un núcleo multitarea personalizado con soporte de red incorporado , pero los DBMS modernos generalmente dependen de un sistema operativo estándar para proporcionar estas funciones. [ cita necesaria ]

Dado que los DBMS constituyen un mercado importante , los proveedores de computadoras y almacenamiento a menudo tienen en cuenta los requisitos de DBMS en sus propios planes de desarrollo. [7]

Las bases de datos y los DBMS se pueden clasificar según los modelos de bases de datos que admiten (como relacionales o XML ), los tipos de computadora en los que se ejecutan (desde un grupo de servidores hasta un teléfono móvil ), el lenguaje de consulta ( s) utilizados para acceder a la base de datos (como SQL o XQuery ) y su ingeniería interna, que afecta el rendimiento, la escalabilidad , la resiliencia y la seguridad.

Historia

Los tamaños, capacidades y rendimiento de las bases de datos y sus respectivos DBMS han crecido en órdenes de magnitud. Estos aumentos de rendimiento fueron posibles gracias al progreso tecnológico en las áreas de procesadores , memoria de computadora , almacenamiento de computadora y redes de computadora . El concepto de base de datos fue posible gracias a la aparición de medios de almacenamiento de acceso directo, como los discos magnéticos, que estuvieron ampliamente disponibles a mediados de los años sesenta; Los sistemas anteriores dependían del almacenamiento secuencial de datos en cinta magnética. El desarrollo posterior de la tecnología de bases de datos se puede dividir en tres eras según el modelo o estructura de datos: de navegación , [8] SQL/ relacional y post-relacional.

Los dos primeros modelos principales de datos de navegación fueron el modelo jerárquico y el modelo CODASYL ( modelo de red ). Estos se caracterizaban por el uso de punteros (a menudo direcciones de disco físico) para seguir las relaciones de un registro a otro.

El modelo relacional , propuesto por primera vez en 1970 por Edgar F. Codd , se apartó de esta tradición al insistir en que las aplicaciones deberían buscar datos por contenido, en lugar de seguir enlaces. El modelo relacional emplea conjuntos de tablas estilo libro mayor, cada una utilizada para un tipo diferente de entidad. Sólo a mediados de la década de 1980 el hardware informático se volvió lo suficientemente potente como para permitir el amplio despliegue de sistemas relacionales (DBMS más aplicaciones). Sin embargo, a principios de la década de 1990, los sistemas relacionales dominaban en todas las aplicaciones de procesamiento de datos a gran escala y, a partir de 2018, siguen siendo dominantes: IBM Db2 , Oracle , MySQL y Microsoft SQL Server son los DBMS más buscados . [9] El lenguaje de base de datos dominante, SQL estandarizado para el modelo relacional, ha influido en los lenguajes de base de datos para otros modelos de datos. [ cita necesaria ]

Las bases de datos de objetos se desarrollaron en la década de 1980 para superar el inconveniente de la falta de coincidencia de impedancia relacional entre objetos , lo que llevó a acuñar el término "post-relacional" y también al desarrollo de bases de datos híbridas entre objetos y relacionales .

La próxima generación de bases de datos post-relacionales a finales de la década de 2000 se conoció como bases de datos NoSQL , introduciendo almacenes rápidos de clave-valor y bases de datos orientadas a documentos . Una "próxima generación" competidora conocida como bases de datos NewSQL intentó nuevas implementaciones que conservaban el modelo relacional/SQL mientras buscaban igualar el alto rendimiento de NoSQL en comparación con los DBMS relacionales disponibles comercialmente.

Década de 1960, DBMS de navegación

Estructura básica del modelo de base de datos CODASYL de navegación.

La introducción del término base de datos coincidió con la disponibilidad del almacenamiento de acceso directo (discos y tambores) desde mediados de la década de 1960 en adelante. El término representaba un contraste con los sistemas basados ​​en cintas del pasado, que permitían un uso interactivo compartido en lugar del procesamiento por lotes diario . El Oxford English Dictionary cita un informe de 1962 de System Development Corporation de California como el primero en utilizar el término "base de datos" en un sentido técnico específico. [10]

A medida que las computadoras crecieron en velocidad y capacidad, surgieron varios sistemas de bases de datos de propósito general; a mediados de la década de 1960, varios de estos sistemas habían comenzado a utilizarse comercialmente. El interés en un estándar comenzó a crecer y Charles Bachman , autor de uno de esos productos, el Integrated Data Store (IDS), fundó el Database Task Group dentro de CODASYL , el grupo responsable de la creación y estandarización de COBOL . En 1971, el Database Task Group presentó su estándar, que generalmente se conoció como el enfoque CODASYL , y pronto ingresaron al mercado varios productos comerciales basados ​​en este enfoque.

El enfoque CODASYL ofreció a las aplicaciones la capacidad de navegar por un conjunto de datos vinculados que se formó en una gran red. Las aplicaciones pueden encontrar registros mediante uno de tres métodos:

  1. Uso de una clave principal (conocida como clave CALC, generalmente implementada mediante hash )
  2. Navegar por relaciones (llamadas conjuntos ) de un registro a otro
  3. Escaneando todos los registros en orden secuencial

Los sistemas posteriores agregaron árboles B para proporcionar rutas de acceso alternativas. Muchas bases de datos CODASYL también agregaron un lenguaje de consulta declarativo para los usuarios finales (a diferencia de la API de navegación). Sin embargo, las bases de datos CODASYL eran complejas y requerían una importante capacitación y esfuerzo para producir aplicaciones útiles.

IBM también tuvo su propio DBMS en 1966, conocido como Sistema de Gestión de Información (IMS). IMS fue un desarrollo de software escrito para el programa Apollo en System/360 . IMS era generalmente similar en concepto a CODASYL, pero utilizaba una jerarquía estricta para su modelo de navegación de datos en lugar del modelo de red de CODASYL. Ambos conceptos se conocieron más tarde como bases de datos de navegación debido a la forma en que se accedía a los datos: el término se popularizó con la presentación del Premio Turing de 1973 de Bachman , The Programmer as Navigator . IBM clasifica IMS como una base de datos jerárquica . Las bases de datos TOTAL de IDMS y Cincom Systems se clasifican como bases de datos de red. IMS sigue en uso a partir de 2014 . [11]

Década de 1970, DBMS relacional

Edgar F. Codd trabajó en IBM en San José, California , en una de sus oficinas filiales que se dedicaban principalmente al desarrollo de sistemas de disco duro . No estaba satisfecho con el modelo de navegación del enfoque CODASYL, en particular la falta de un servicio de "búsqueda". En 1970, escribió varios artículos que describían un nuevo enfoque para la construcción de bases de datos que finalmente culminó en el innovador Un modelo relacional de datos para grandes bancos de datos compartidos . [12]

En este artículo, describió un nuevo sistema para almacenar y trabajar con grandes bases de datos. En lugar de almacenar los registros en una especie de lista enlazada de registros de formato libre como en CODASYL, la idea de Codd era organizar los datos como una serie de " tablas ", usándose cada tabla para un tipo diferente de entidad. Cada tabla contendría un número fijo de columnas que contienen los atributos de la entidad. Se designaron una o más columnas de cada tabla como clave principal mediante la cual se podían identificar de forma única las filas de la tabla; las referencias cruzadas entre tablas siempre usaban estas claves primarias, en lugar de direcciones de disco, y las consultas unían tablas basadas en estas relaciones clave, usando un conjunto de operaciones basadas en el sistema matemático de cálculo relacional (del cual el modelo toma su nombre). Dividir los datos en un conjunto de tablas (o relaciones ) normalizadas tenía como objetivo garantizar que cada "hecho" solo se almacenara una vez, simplificando así las operaciones de actualización. Las tablas virtuales llamadas vistas podrían presentar los datos de diferentes maneras para diferentes usuarios, pero las vistas no podrían actualizarse directamente.

Codd utilizó términos matemáticos para definir el modelo: relaciones, tuplas y dominios en lugar de tablas, filas y columnas. La terminología que ahora nos resulta familiar provino de implementaciones tempranas. Codd criticaría más tarde la tendencia de las implementaciones prácticas a apartarse de los fundamentos matemáticos en los que se basaba el modelo.

En el modelo relacional , los registros están "vinculados" mediante claves virtuales que no se almacenan en la base de datos pero que se definen según sea necesario entre los datos contenidos en los registros.

El uso de claves primarias (identificadores orientados al usuario) para representar relaciones entre tablas, en lugar de direcciones de disco, tenía dos motivaciones principales. Desde una perspectiva de ingeniería, permitió reubicar y cambiar el tamaño de las tablas sin una costosa reorganización de la base de datos. Pero Codd estaba más interesado en la diferencia en la semántica: el uso de identificadores explícitos hizo que fuera más fácil definir operaciones de actualización con definiciones matemáticas limpias, y también permitió que las operaciones de consulta se definieran en términos de la disciplina establecida del cálculo de predicados de primer orden ; Debido a que estas operaciones tienen propiedades matemáticas limpias, es posible reescribir consultas de maneras demostrablemente correctas, que es la base de la optimización de consultas. No hay pérdida de expresividad en comparación con los modelos jerárquico o de red, aunque las conexiones entre tablas ya no son tan explícitas.

En los modelos jerárquico y de red, se permitió que los registros tuvieran una estructura interna compleja. Por ejemplo, el historial salarial de un empleado podría representarse como un "grupo repetido" dentro del registro del empleado. En el modelo relacional, el proceso de normalización llevó a que dichas estructuras internas fueran reemplazadas por datos contenidos en múltiples tablas, conectadas únicamente por claves lógicas.

Por ejemplo, un uso común de un sistema de base de datos es rastrear información sobre los usuarios, su nombre, información de inicio de sesión, varias direcciones y números de teléfono. En el enfoque de navegación, todos estos datos se colocarían en un único registro de longitud variable. En el enfoque relacional, los datos se normalizarían en una tabla de usuarios, una tabla de direcciones y una tabla de números de teléfono (por ejemplo). Los registros se crearían en estas tablas opcionales sólo si realmente se proporcionaran la dirección o los números de teléfono.

Además de identificar filas/registros utilizando identificadores lógicos en lugar de direcciones de disco, Codd cambió la forma en que las aplicaciones ensamblaban datos de múltiples registros. En lugar de requerir que las aplicaciones recopilen datos un registro a la vez navegando por los enlaces, usarían un lenguaje de consulta declarativo que expresara qué datos se requerían, en lugar de la ruta de acceso por la cual se debían encontrar. Encontrar una ruta de acceso eficiente a los datos pasó a ser responsabilidad del sistema de gestión de la base de datos, en lugar del programador de la aplicación. Este proceso, llamado optimización de consultas, dependía del hecho de que las consultas se expresaran en términos de lógica matemática.

El artículo de Codd fue recogido por dos personas de Berkeley, Eugene Wong y Michael Stonebraker . Comenzaron un proyecto conocido como INGRES utilizando fondos que ya habían sido asignados para un proyecto de base de datos geográfica y estudiantes programadores para producir código. A partir de 1973, INGRES entregó sus primeros productos de prueba que generalmente estuvieron listos para su uso generalizado en 1979. INGRES era similar al System R en varios aspectos, incluido el uso de un "lenguaje" para el acceso a datos , conocido como QUEL . Con el tiempo, INGRES pasó al estándar SQL emergente.

La propia IBM realizó una implementación de prueba del modelo relacional, PRTV , y una de producción, Business System 12 , ambas ahora descontinuadas. Honeywell escribió MRDS para Multics y ahora hay dos nuevas implementaciones: Alphora Dataphor y Rel. La mayoría de las otras implementaciones de DBMS generalmente llamadas relacionales son en realidad DBMS SQL.

En 1970, la Universidad de Michigan comenzó a desarrollar el sistema de gestión de información MICRO [13] basado en el modelo de datos teóricos de conjuntos de DL Childs . [14] [15] [16] MICRO fue utilizado para gestionar conjuntos de datos muy grandes por el Departamento de Trabajo de EE. UU. , la Agencia de Protección Ambiental de EE. UU . e investigadores de la Universidad de Alberta , la Universidad de Michigan y la Universidad Estatal de Wayne . Se ejecutaba en computadoras centrales IBM utilizando el Michigan Terminal System . [17] El sistema permaneció en producción hasta 1998.

Enfoque integrado

En las décadas de 1970 y 1980, se intentó construir sistemas de bases de datos con hardware y software integrados. La filosofía subyacente era que dicha integración proporcionaría un mayor rendimiento a un costo menor. Algunos ejemplos fueron IBM System/38 , la primera oferta de Teradata y la máquina de base de datos de Britton Lee, Inc.

Otro enfoque de soporte de hardware para la gestión de bases de datos fue el acelerador CAFS de ICL , un controlador de disco de hardware con capacidades de búsqueda programables. A largo plazo, estos esfuerzos generalmente no tuvieron éxito porque las máquinas de bases de datos especializadas no podían seguir el ritmo del rápido desarrollo y progreso de las computadoras de propósito general. Por lo tanto, la mayoría de los sistemas de bases de datos hoy en día son sistemas de software que se ejecutan en hardware de propósito general y utilizan almacenamiento de datos informáticos de propósito general. Sin embargo, algunas empresas como Netezza y Oracle ( Exadata ) siguen aplicando esta idea en determinadas aplicaciones .

Finales de la década de 1970, SGBD SQL

IBM comenzó a trabajar en un sistema prototipo basado libremente en los conceptos de Codd como System R a principios de la década de 1970. La primera versión estuvo lista en 1974/5, y entonces se empezó a trabajar en sistemas de tablas múltiples en los que los datos podían dividirse de modo que todos los datos de un registro (algunos de los cuales son opcionales) no tuvieran que almacenarse en un un solo "trozo" grande. Los clientes probaron versiones multiusuario posteriores en 1978 y 1979, momento en el que se había agregado un lenguaje de consulta estandarizado , SQL [ cita requerida ] . Las ideas de Codd se estaban estableciendo como viables y superiores a CODASYL, empujando a IBM a desarrollar una verdadera versión de producción de System R, conocida como SQL/DS y, más tarde, Base de datos 2 ( IBM Db2 ).

La base de datos Oracle de Larry Ellison (o más simplemente, Oracle ) comenzó a partir de una cadena diferente, basada en los artículos de IBM sobre System R. Aunque las implementaciones de Oracle V1 se completaron en 1978, no fue hasta la versión 2 de Oracle cuando Ellison venció a IBM en el mercado. 1979. [18]

Stonebraker aplicó las lecciones de INGRES para desarrollar una nueva base de datos, Postgres, que ahora se conoce como PostgreSQL . PostgreSQL se utiliza a menudo para aplicaciones globales de misión crítica (los registros de nombres de dominio .org y .info lo utilizan como su almacén de datos principal , al igual que muchas grandes empresas e instituciones financieras).

En Suecia, también se leyó el artículo de Codd y se desarrolló Mimer SQL a mediados de la década de 1970 en la Universidad de Uppsala . En 1984, este proyecto se consolidó como una empresa independiente.

Otro modelo de datos, el modelo entidad-relación , surgió en 1976 y ganó popularidad para el diseño de bases de datos porque enfatizaba una descripción más familiar que el modelo relacional anterior. Posteriormente, los constructos entidad-relación se adaptaron como constructos de modelado de datos para el modelo relacional, y la diferencia entre los dos se volvió irrelevante. [ cita necesaria ]

Década de 1980, en el escritorio

La década de 1980 marcó el comienzo de la era de la informática de escritorio . Las nuevas computadoras dotaron a sus usuarios de hojas de cálculo como Lotus 1-2-3 y software de bases de datos como dBASE . El producto dBASE era liviano y fácil de entender para cualquier usuario de computadora desde el primer momento. C. Wayne Ratliff , el creador de dBASE, afirmó: "dBASE se diferenciaba de programas como BASIC, C, FORTRAN y COBOL en que gran parte del trabajo sucio ya se había hecho. La manipulación de datos la realiza dBASE en lugar de "El usuario, para que pueda concentrarse en lo que está haciendo, en lugar de tener que meterse con los detalles sucios de abrir, leer y cerrar archivos y administrar la asignación de espacio". [19] dBASE fue uno de los títulos de software más vendidos en los años 1980 y principios de los 1990.

Década de 1990, orientado a objetos.

La década de 1990, junto con un aumento de la programación orientada a objetos , vio un crecimiento en la forma en que se manejaban los datos en varias bases de datos. Los programadores y diseñadores comenzaron a tratar los datos de sus bases de datos como objetos . Es decir, si los datos de una persona estaban en una base de datos, ahora se consideraba que sus atributos, como su dirección, número de teléfono y edad, pertenecían a esa persona en lugar de ser datos extraños. Esto permite que las relaciones entre datos estén relacionadas con objetos y sus atributos y no con campos individuales. [20] El término " desajuste de impedancia relacional entre objetos " describía el inconveniente de traducir entre objetos programados y tablas de bases de datos. Las bases de datos de objetos y las bases de datos relacionales de objetos intentan resolver este problema proporcionando un lenguaje orientado a objetos (a veces como extensiones de SQL) que los programadores pueden utilizar como alternativa al SQL puramente relacional. En el lado de la programación, las bibliotecas conocidas como asignaciones relacionales de objetos (ORM) intentan resolver el mismo problema.

Década de 2000, NoSQL y NewSQL

Las bases de datos XML son un tipo de base de datos estructurada orientada a documentos que permite realizar consultas basadas en atributos de documentos XML . Las bases de datos XML se utilizan principalmente en aplicaciones donde los datos se ven convenientemente como una colección de documentos, con una estructura que puede variar desde muy flexible hasta muy rígida: los ejemplos incluyen artículos científicos, patentes, declaraciones de impuestos y registros de personal.

Las bases de datos NoSQL suelen ser muy rápidas, no requieren esquemas de tablas fijas, evitan operaciones de unión almacenando datos desnormalizados y están diseñadas para escalar horizontalmente .

En los últimos años, ha habido una fuerte demanda de bases de datos distribuidas masivamente con alta tolerancia a la partición, pero según el teorema CAP , es imposible que un sistema distribuido proporcione simultáneamente garantías de coherencia , disponibilidad y tolerancia a la partición. Un sistema distribuido puede satisfacer dos de estas garantías al mismo tiempo, pero no las tres. Por esa razón, muchas bases de datos NoSQL utilizan lo que se llama coherencia eventual para proporcionar garantías de disponibilidad y tolerancia de partición con un nivel reducido de coherencia de los datos.

NewSQL es una clase de bases de datos relacionales modernas que tiene como objetivo proporcionar el mismo rendimiento escalable de los sistemas NoSQL para cargas de trabajo de procesamiento de transacciones en línea (lectura-escritura) sin dejar de utilizar SQL y mantener las garantías ACID de un sistema de base de datos tradicional.

Casos de uso

Las bases de datos se utilizan para respaldar las operaciones internas de las organizaciones y para respaldar las interacciones en línea con clientes y proveedores (consulte Software empresarial ).

Las bases de datos se utilizan para almacenar información administrativa y datos más especializados, como datos de ingeniería o modelos económicos. Los ejemplos incluyen sistemas de biblioteca computarizados , sistemas de reserva de vuelos , sistemas de inventario de piezas computarizados y muchos sistemas de gestión de contenido que almacenan sitios web como colecciones de páginas web en una base de datos.

Clasificación

Una forma de clasificar las bases de datos implica el tipo de contenido, por ejemplo: objetos bibliográficos , documento-texto, estadísticos u multimedia. Otra forma es por su área de aplicación, por ejemplo: contabilidad, composiciones musicales, películas, banca, manufactura o seguros. Una tercera forma es por algún aspecto técnico, como la estructura de la base de datos o el tipo de interfaz. Esta sección enumera algunos de los adjetivos utilizados para caracterizar diferentes tipos de bases de datos.

Las principales arquitecturas DBMS paralelas inducidas por la arquitectura de hardware subyacente son:
  • Arquitectura de memoria compartida , donde varios procesadores comparten el espacio de la memoria principal, así como otros almacenamientos de datos.
  • Arquitectura de disco compartido , donde cada unidad de procesamiento (que normalmente consta de varios procesadores) tiene su propia memoria principal, pero todas las unidades comparten el resto de almacenamiento.
  • Arquitectura sin compartir , donde cada unidad de procesamiento tiene su propia memoria principal y otros tipos de almacenamiento.

Sistema de administración de base de datos

Connolly y Begg definen el sistema de gestión de bases de datos (DBMS) como un "sistema de software que permite a los usuarios definir, crear, mantener y controlar el acceso a la base de datos". [24] Ejemplos de DBMS incluyen MySQL , MariaDB , PostgreSQL , Microsoft SQL Server , Oracle Database y Microsoft Access .

El acrónimo DBMS a veces se extiende para indicar el modelo de base de datos subyacente , con RDBMS para el modelo relacional , OODBMS para el objeto (orientado) y ORDBMS para el modelo objeto-relacional . Otras extensiones pueden indicar algunas otras características, como DDBMS para sistemas de gestión de bases de datos distribuidas.

La funcionalidad proporcionada por un DBMS puede variar enormemente. La funcionalidad principal es el almacenamiento, recuperación y actualización de datos. Codd propuso las siguientes funciones y servicios que debería proporcionar un DBMS de propósito general completo: [25]

En general, también es de esperar que el DBMS proporcione un conjunto de utilidades para los fines que puedan ser necesarios para administrar la base de datos de manera efectiva, incluidas utilidades de importación, exportación, monitoreo, desfragmentación y análisis. [26] La parte central del DBMS que interactúa entre la base de datos y la interfaz de la aplicación, a veces denominada motor de base de datos .

A menudo, los DBMS tendrán parámetros de configuración que pueden ajustarse estática y dinámicamente, por ejemplo, la cantidad máxima de memoria principal en un servidor que la base de datos puede usar. La tendencia es minimizar la cantidad de configuración manual y, para casos como las bases de datos integradas, la necesidad de apuntar a la administración cero es primordial.

Los DBMS de las grandes empresas han tendido a aumentar en tamaño y funcionalidad y han implicado hasta miles de años humanos de esfuerzo de desarrollo a lo largo de su vida. [a]

Los primeros DBMS multiusuario generalmente solo permitían que la aplicación residiera en la misma computadora con acceso a través de terminales o software de emulación de terminal. La arquitectura cliente-servidor fue un desarrollo en el que la aplicación residía en el escritorio del cliente y la base de datos en un servidor, lo que permitía distribuir el procesamiento. Esto evolucionó hacia una arquitectura de múltiples niveles que incorpora servidores de aplicaciones y servidores web con la interfaz de usuario final a través de un navegador web con la base de datos conectada solo directamente al nivel adyacente. [28]

Un DBMS de propósito general proporcionará interfaces de programación de aplicaciones (API) públicas y, opcionalmente, un procesador para lenguajes de bases de datos como SQL para permitir que las aplicaciones se escriban para interactuar y manipular la base de datos. Un DBMS de propósito especial puede utilizar una API privada y estar específicamente personalizado y vinculado a una única aplicación. Por ejemplo, un sistema de correo electrónico realiza muchas de las funciones de un DBMS de propósito general, como inserción de mensajes, eliminación de mensajes, manejo de archivos adjuntos, búsqueda de listas de bloqueo, asociación de mensajes a una dirección de correo electrónico, etc.; sin embargo, estas funciones se limitan a lo que se requiere para manejar. correo electrónico.

Solicitud

La interacción externa con la base de datos se realizará a través de un programa de aplicación que interactúa con el DBMS. [29] Esto puede variar desde una herramienta de base de datos que permite a los usuarios ejecutar consultas SQL de forma textual o gráfica, hasta un sitio web que utiliza una base de datos para almacenar y buscar información.

Interfaz del programa de aplicación

Un programador codificará las interacciones con la base de datos (a veces denominada fuente de datos ) a través de una interfaz de programa de aplicación (API) o mediante un lenguaje de base de datos. La API o el lenguaje concreto elegido deberá ser compatible con DBMS, posiblemente indirectamente a través de un preprocesador o una API puente. Algunas API pretenden ser independientes de la base de datos, siendo ODBC un ejemplo comúnmente conocido. Otras API comunes incluyen JDBC y ADO.NET .

Idiomas de bases de datos

Los lenguajes de bases de datos son lenguajes de propósito especial, que permiten una o más de las siguientes tareas, a veces distinguidas como sublenguajes :

Los lenguajes de bases de datos son específicos de un modelo de datos particular. Ejemplos notables incluyen:

Un lenguaje de base de datos también puede incorporar características como:

Almacenamiento

El almacenamiento de una base de datos es el contenedor de la materialización física de una base de datos. Comprende el nivel interno (físico) de la arquitectura de la base de datos. También contiene toda la información necesaria (por ejemplo, metadatos , "datos sobre los datos" y estructuras de datos internas ) para reconstruir el nivel conceptual y el nivel externo a partir del nivel interno cuando sea necesario. Las bases de datos como objetos digitales contienen tres capas de información que deben almacenarse: los datos, la estructura y la semántica. Es necesario un almacenamiento adecuado de las tres capas para la preservación futura y la longevidad de la base de datos. [33] Colocar datos en un almacenamiento permanente es generalmente responsabilidad del motor de la base de datos , también conocido como "motor de almacenamiento". Aunque normalmente un DBMS accede a él a través del sistema operativo subyacente (y a menudo utiliza los sistemas de archivos de los sistemas operativos como intermediarios para el diseño del almacenamiento), las propiedades de almacenamiento y los ajustes de configuración son extremadamente importantes para el funcionamiento eficiente del DBMS y, por lo tanto, son mantenidos de cerca por administradores de bases de datos. Un DBMS, mientras está en funcionamiento, siempre tiene su base de datos residiendo en varios tipos de almacenamiento (por ejemplo, memoria y almacenamiento externo). Los datos de la base de datos y la información adicional necesaria, posiblemente en cantidades muy grandes, se codifican en bits. Los datos generalmente residen en el almacenamiento en estructuras que se ven completamente diferentes de la forma en que se ven los datos en los niveles conceptual y externo, pero de maneras que intentan optimizar (lo mejor posible) la reconstrucción de estos niveles cuando los usuarios y los programas los necesitan. en cuanto a calcular tipos adicionales de información necesaria a partir de los datos (por ejemplo, al consultar la base de datos).

Algunos DBMS admiten especificar qué codificación de caracteres se utilizó para almacenar datos, por lo que se pueden utilizar varias codificaciones en la misma base de datos.

El motor de almacenamiento utiliza varias estructuras de almacenamiento de bases de datos de bajo nivel para serializar el modelo de datos y poder escribirlo en el medio elegido. Se pueden utilizar técnicas como la indexación para mejorar el rendimiento. El almacenamiento convencional está orientado a filas, pero también existen bases de datos de correlación y orientadas a columnas .

Vistas materializadas

A menudo se emplea la redundancia de almacenamiento para aumentar el rendimiento. Un ejemplo común es el almacenamiento de vistas materializadas , que consisten en vistas externas o resultados de consultas que se necesitan con frecuencia. Almacenar dichas vistas ahorra el costoso proceso de calcularlas cada vez que se necesitan. Las desventajas de las vistas materializadas son los gastos generales que se generan al actualizarlas para mantenerlas sincronizadas con los datos de la base de datos actualizada original y el costo de la redundancia del almacenamiento.

Replicación

Ocasionalmente, una base de datos emplea redundancia de almacenamiento mediante la replicación de objetos de la base de datos (con una o más copias) para aumentar la disponibilidad de los datos (tanto para mejorar el rendimiento de los accesos simultáneos de múltiples usuarios finales al mismo objeto de la base de datos como para proporcionar resiliencia en caso de falla parcial de la base de datos). una base de datos distribuida). Las actualizaciones de un objeto replicado deben sincronizarse entre las copias del objeto. En muchos casos, se replica toda la base de datos.

Virtualización

Con la virtualización de datos , los datos utilizados permanecen en sus ubicaciones originales y se establece acceso en tiempo real para permitir análisis en múltiples fuentes. Esto puede ayudar a resolver algunas dificultades técnicas, como problemas de compatibilidad al combinar datos de varias plataformas, reducir el riesgo de error causado por datos defectuosos y garantizar que se utilicen los datos más recientes. Además, evitar la creación de una nueva base de datos que contenga información personal puede facilitar el cumplimiento de las normas de privacidad. Sin embargo, con la virtualización de datos, la conexión a todas las fuentes de datos necesarias debe estar operativa, ya que no existe una copia local de los datos, lo cual es uno de los principales inconvenientes de este enfoque. [34]

Seguridad

La seguridad de la base de datos se ocupa de todos los aspectos de la protección del contenido de la base de datos, sus propietarios y sus usuarios. Abarca desde la protección contra usos intencionales no autorizados de bases de datos hasta accesos no intencionales a bases de datos por parte de entidades no autorizadas (por ejemplo, una persona o un programa informático).

El control de acceso a la base de datos se ocupa de controlar quién (una persona o un determinado programa informático) puede acceder a qué información de la base de datos. La información puede comprender objetos de bases de datos específicos (por ejemplo, tipos de registros, registros específicos, estructuras de datos), ciertos cálculos sobre ciertos objetos (por ejemplo, tipos de consultas o consultas específicas) o el uso de rutas de acceso específicas a los primeros (por ejemplo, el uso de índices específicos). u otras estructuras de datos para acceder a la información). Los controles de acceso a la base de datos los establece personal especial autorizado (por el propietario de la base de datos) que utiliza interfaces DBMS de seguridad protegidas dedicadas.

Esto puede gestionarse directamente de forma individual, o mediante la asignación de individuos y privilegios a grupos, o (en los modelos más elaborados) mediante la asignación de individuos y grupos a roles a los que luego se les conceden derechos. La seguridad de los datos evita que usuarios no autorizados vean o actualicen la base de datos. Mediante contraseñas, los usuarios pueden acceder a toda la base de datos o a subconjuntos de ella llamados "subesquemas". Por ejemplo, una base de datos de empleados puede contener todos los datos sobre un empleado individual, pero un grupo de usuarios puede estar autorizado a ver solo los datos de nómina, mientras que a otros se les permite acceder solo al historial laboral y a los datos médicos. Si el DBMS proporciona una forma de ingresar y actualizar interactivamente la base de datos, así como también interrogarla, esta capacidad permite administrar bases de datos personales.

La seguridad de los datos en general se ocupa de proteger fragmentos específicos de datos, tanto físicamente (es decir, contra la corrupción, la destrucción o la eliminación; por ejemplo, ver seguridad física ), o la interpretación de ellos, o partes de ellos, en información significativa (por ejemplo, mediante observando las cadenas de bits que las componen, concluyendo números de tarjetas de crédito válidos específicos; por ejemplo, ver cifrado de datos ).

Cambie y acceda a los registros de registro, quién accedió a qué atributos, qué se cambió y cuándo se cambió. Los servicios de registro permiten realizar una auditoría forense de la base de datos más adelante manteniendo un registro de los accesos y cambios. A veces, se utiliza código a nivel de aplicación para registrar cambios en lugar de dejarlos en la base de datos. Se puede configurar la supervisión para intentar detectar violaciones de seguridad. Por lo tanto, las organizaciones deben tomarse en serio la seguridad de las bases de datos debido a los numerosos beneficios que ofrece. Las organizaciones estarán protegidas de violaciones de seguridad y actividades de piratería como intrusión en el firewall, propagación de virus y programas de rescate. Esto ayuda a proteger la información esencial de la empresa, que no puede compartirse con personas externas bajo ningún concepto. [35]

Transacciones y concurrencia

Las transacciones de bases de datos se pueden utilizar para introducir cierto nivel de tolerancia a fallos e integridad de los datos después de la recuperación de un fallo . Una transacción de base de datos es una unidad de trabajo, que normalmente encapsula una serie de operaciones sobre una base de datos (por ejemplo, leer un objeto de base de datos, escribir, adquirir o liberar un bloqueo , etc.), una abstracción admitida en la base de datos y también en otros sistemas. Cada transacción tiene límites bien definidos en términos de qué ejecuciones de programa/código se incluyen en esa transacción (determinados por el programador de la transacción mediante comandos de transacción especiales).

El acrónimo ACID describe algunas propiedades ideales de una transacción de base de datos: atomicidad , consistencia , aislamiento y durabilidad .

Migración

Una base de datos creada con un DBMS no es portátil a otro DBMS (es decir, el otro DBMS no puede ejecutarla). Sin embargo, en algunas situaciones, es deseable migrar una base de datos de un DBMS a otro. Las razones son principalmente económicas (diferentes DBMS pueden tener diferentes costos totales de propiedad o TCO), funcionales y operativas (diferentes DBMS pueden tener diferentes capacidades). La migración implica la transformación de la base de datos de un tipo de DBMS a otro. La transformación debe mantener (si es posible) intacta la aplicación relacionada con la base de datos (es decir, todos los programas de aplicación relacionados). Por lo tanto, los niveles arquitectónicos conceptuales y externos de la base de datos deben mantenerse en la transformación. Puede ser deseable que también se mantengan algunos aspectos del nivel interno de la arquitectura. Una migración de base de datos compleja o de gran tamaño puede ser un proyecto complicado y costoso (único) en sí mismo, lo que debe tenerse en cuenta en la decisión de migrar. Esto a pesar del hecho de que pueden existir herramientas para ayudar a la migración entre DBMS específicos. Normalmente, un proveedor de DBMS proporciona herramientas para ayudar a importar bases de datos de otros DBMS populares.

Construcción, mantenimiento y ajuste

Después de diseñar una base de datos para una aplicación, la siguiente etapa es construir la base de datos. Normalmente, se puede seleccionar un DBMS de propósito general apropiado para este propósito. Un DBMS proporciona las interfaces de usuario necesarias para que las utilicen los administradores de bases de datos para definir las estructuras de datos de la aplicación necesarias dentro del modelo de datos respectivo del DBMS. Se utilizan otras interfaces de usuario para seleccionar los parámetros DBMS necesarios (como parámetros relacionados con la seguridad, asignación de almacenamiento, etc.).

Cuando la base de datos está lista (todas sus estructuras de datos y otros componentes necesarios están definidos), generalmente se completa con los datos de la aplicación inicial (inicialización de la base de datos, que generalmente es un proyecto distinto; en muchos casos se utilizan interfaces DBMS especializadas que admiten la inserción masiva) antes haciéndolo operativo. En algunos casos, la base de datos entra en funcionamiento cuando no hay datos de la aplicación y los datos se acumulan durante su funcionamiento.

Una vez creada, inicializada y completada la base de datos, es necesario mantenerla. Es posible que sea necesario cambiar varios parámetros de la base de datos y que sea necesario ajustar la base de datos ( tuning ) para obtener un mejor rendimiento; Las estructuras de datos de la aplicación se pueden cambiar o agregar, se pueden escribir nuevos programas de aplicación relacionados para aumentar la funcionalidad de la aplicación, etc.

Copia de seguridad y restaurar

A veces se desea devolver una base de datos a un estado anterior (por muchas razones, por ejemplo, casos en los que la base de datos se encuentra dañada debido a un error de software o si se ha actualizado con datos erróneos). Para lograr esto, se realiza una operación de respaldo ocasional o continuamente, donde cada estado deseado de la base de datos (es decir, los valores de sus datos y su incorporación en las estructuras de datos de la base de datos) se mantiene dentro de archivos de respaldo dedicados (existen muchas técnicas para hacer esto de manera efectiva). Cuando un administrador de base de datos decide devolver la base de datos a este estado (por ejemplo, especificando este estado en un momento deseado en el que la base de datos estaba en este estado), estos archivos se utilizan para restaurar ese estado.

Análisis estático

Las técnicas de análisis estático para la verificación de software también se pueden aplicar en el escenario de lenguajes de consulta. En particular, el marco de interpretación * Abstract se ha extendido al campo de los lenguajes de consulta para bases de datos relacionales como una forma de soportar técnicas de aproximación sólidas. [36] La semántica de los lenguajes de consulta se puede ajustar de acuerdo con abstracciones adecuadas del dominio concreto de los datos. La abstracción de los sistemas de bases de datos relacionales tiene muchas aplicaciones interesantes, en particular, con fines de seguridad, como control de acceso detallado, marcas de agua, etc.

Funciones varias

Otras características de DBMS pueden incluir:

Cada vez más, se exige un sistema único que incorpore todas estas funcionalidades principales en el mismo marco de construcción, prueba e implementación para la gestión de bases de datos y el control de fuentes. Tomando prestado de otros desarrollos en la industria del software, algunos comercializan ofertas como " DevOps para bases de datos". [37]

Diseño y modelado

La primera tarea de un diseñador de bases de datos es producir un modelo de datos conceptual que refleje la estructura de la información que se mantendrá en la base de datos. Un enfoque común para esto es desarrollar un modelo entidad-relación , a menudo con la ayuda de herramientas de dibujo. Otro enfoque popular es el lenguaje de modelado unificado . Un modelo de datos exitoso reflejará con precisión el posible estado del mundo externo que se está modelando: por ejemplo, si las personas pueden tener más de un número de teléfono, permitirá capturar esta información. Diseñar un buen modelo de datos conceptual requiere una buena comprensión del dominio de la aplicación; Por lo general, implica hacer preguntas profundas sobre las cosas de interés para una organización, como "¿puede un cliente también ser un proveedor?", o "si un producto se vende con dos formas diferentes de empaque, ¿son el mismo producto o productos diferentes? ", o "si un avión vuela de Nueva York a Dubai vía Frankfurt, ¿se trata de un vuelo o dos (o tal vez incluso tres)?". Las respuestas a estas preguntas establecen definiciones de la terminología utilizada para las entidades (clientes, productos, vuelos, segmentos de vuelos) y sus relaciones y atributos.

La producción del modelo de datos conceptual a veces implica aportaciones de procesos de negocio o el análisis del flujo de trabajo en la organización. Esto puede ayudar a establecer qué información se necesita en la base de datos y qué se puede omitir. Por ejemplo, puede ayudar a la hora de decidir si la base de datos necesita contener datos históricos además de los datos actuales.

Habiendo producido un modelo de datos conceptual con el que los usuarios estén contentos, la siguiente etapa es traducirlo en un esquema que implemente las estructuras de datos relevantes dentro de la base de datos. Este proceso a menudo se denomina diseño lógico de base de datos y el resultado es un modelo de datos lógico expresado en forma de esquema. Mientras que el modelo de datos conceptual es (al menos en teoría) independiente de la elección de la tecnología de base de datos, el modelo de datos lógico se expresará en términos de un modelo de base de datos particular soportado por el DBMS elegido. (Los términos modelo de datos y modelo de base de datos a menudo se usan indistintamente, pero en este artículo usamos modelo de datos para el diseño de una base de datos específica y modelo de base de datos para la notación de modelado utilizada para expresar ese diseño).

El modelo de base de datos más popular para bases de datos de propósito general es el modelo relacional, o más precisamente, el modelo relacional representado por el lenguaje SQL. El proceso de creación de un diseño de base de datos lógica utilizando este modelo utiliza un enfoque metódico conocido como normalización . El objetivo de la normalización es garantizar que cada "hecho" elemental se registre solo en un lugar, de modo que las inserciones, actualizaciones y eliminaciones mantengan automáticamente la coherencia.

La etapa final del diseño de una base de datos es tomar decisiones que afectan el rendimiento, la escalabilidad, la recuperación, la seguridad y similares, que dependen del DBMS en particular. Esto suele denominarse diseño de base de datos física y el resultado es el modelo de datos físicos . Un objetivo clave durante esta etapa es la independencia de los datos , lo que significa que las decisiones tomadas con fines de optimización del rendimiento deben ser invisibles para los usuarios finales y las aplicaciones. Hay dos tipos de independencia de datos: independencia de datos físicos e independencia de datos lógica. El diseño físico está impulsado principalmente por los requisitos de rendimiento y requiere un buen conocimiento de la carga de trabajo esperada y los patrones de acceso, y una comprensión profunda de las características que ofrece el DBMS elegido.

Otro aspecto del diseño de bases de datos físicas es la seguridad. Implica tanto definir el control de acceso a los objetos de la base de datos como también definir los niveles y métodos de seguridad para los datos en sí.

Modelos

Collage de cinco tipos de modelos de bases de datos.

Un modelo de base de datos es un tipo de modelo de datos que determina la estructura lógica de una base de datos y fundamentalmente determina de qué manera se pueden almacenar, organizar y manipular los datos . El ejemplo más popular de modelo de base de datos es el modelo relacional (o la aproximación SQL de relacional), que utiliza un formato basado en tablas.

Los modelos de datos lógicos comunes para bases de datos incluyen:

Una base de datos relacional de objetos combina las dos estructuras relacionadas.

Los modelos de datos físicos incluyen:

Otros modelos incluyen:

Los modelos especializados están optimizados para tipos particulares de datos:

Vistas externa, conceptual e interna.

Vista tradicional de los datos [38]

Un sistema de gestión de bases de datos proporciona tres vistas de los datos de la base de datos:

Si bien normalmente solo hay una vista conceptual e interna de los datos, puede haber varias vistas externas diferentes. Esto permite a los usuarios ver la información de la base de datos de una manera más relacionada con el negocio que desde un punto de vista técnico y de procesamiento. Por ejemplo, un departamento financiero de una empresa necesita los detalles de pago de todos los empleados como parte de los gastos de la empresa, pero no necesita detalles sobre los empleados que sean de interés para el departamento de recursos humanos . Por tanto, diferentes departamentos necesitan diferentes vistas de la base de datos de la empresa.

La arquitectura de base de datos de tres niveles se relaciona con el concepto de independencia de datos , que fue una de las principales fuerzas impulsoras iniciales del modelo relacional. [39] La idea es que los cambios realizados en un determinado nivel no afecten la vista en un nivel superior. Por ejemplo, los cambios en el nivel interno no afectan los programas de aplicación escritos utilizando interfaces de nivel conceptual, lo que reduce el impacto de realizar cambios físicos para mejorar el rendimiento.

La visión conceptual proporciona un nivel de dirección indirecta entre lo interno y lo externo. Por un lado, proporciona una vista común de la base de datos, independiente de diferentes estructuras de vista externas, y por otro lado abstrae detalles de cómo se almacenan o gestionan los datos (nivel interno). En principio, cada nivel, e incluso cada visión externa, puede representarse mediante un modelo de datos diferente. En la práctica, normalmente un DBMS determinado utiliza el mismo modelo de datos tanto para el nivel externo como para el conceptual (por ejemplo, modelo relacional). El nivel interno, que está oculto dentro del DBMS y depende de su implementación, requiere un nivel diferente de detalle y utiliza sus propios tipos de estructuras de datos.

Investigación

La tecnología de bases de datos ha sido un tema de investigación activo desde la década de 1960, tanto en el mundo académico como en los grupos de investigación y desarrollo de empresas (por ejemplo, IBM Research ). La actividad investigadora incluye teoría y desarrollo de prototipos . Los temas de investigación notables han incluido modelos , el concepto de transacción atómica, técnicas de control de concurrencia relacionadas , lenguajes de consulta y métodos de optimización de consultas , RAID y más.

El área de investigación de bases de datos tiene varias revistas académicas dedicadas (por ejemplo, ACM Transactions on Database Systems -TODS, Data and Knowledge Engineering -DKE) y conferencias anuales (por ejemplo, ACM SIGMOD , ACM PODS , VLDB , IEEE ICDE).

Ver también

Notas

  1. ^ Este artículo cita un tiempo de desarrollo de cinco años que involucró a 750 personas solo para DB2 versión 9. [27]

Referencias

  1. ^ Ullman y Widom 1997, pág. 1.
  2. ^ "Actualización: definición de actualización de Merriam-Webster". merriam-webster.com . 19 de enero de 2024.
  3. ^ "Recuperación: definición de recuperación de Merriam-Webster". merriam-webster.com . 27 de enero de 2024.
  4. ^ "Administración - Definición de administración según Merriam-Webster". merriam-webster.com . 24 de enero de 2024.
  5. ^ Tsitchizris y Lochovsky 1982.
  6. ^ Beynon-Davies 2003.
  7. ^ Nelson y Nelson 2001.
  8. ^ Bachman 1973.
  9. ^ "Índice de base de datos principal de TOPDB". pypl.github.io .
  10. ^ "base de datos, norte". DEO en línea . Prensa de la Universidad de Oxford. Junio ​​del 2013 . Consultado el 12 de julio de 2013 . (Se requiere suscripción).
  11. ^ IBM Corporation (octubre de 2013). "Los servidores de bases de datos y transacciones de IBM Information Management System (IMS) 13 ofrecen un alto rendimiento y un bajo costo total de propiedad" . Consultado el 20 de febrero de 2014 .
  12. ^ Bacalao 1970.
  13. ^ Hershey y Easthope 1972.
  14. ^ Norte 2010.
  15. ^ Niños 1968a.
  16. ^ Niños 1968b.
  17. ^ MA Kahn; DL Rumelhart; BL Bronson (octubre de 1977). Manual de referencia del sistema de gestión de información MICRO (Versión 5.0). Instituto de Relaciones Laborales y Industriales (ILIR), Universidad de Michigan y Universidad Estatal de Wayne.
  18. ^ "Cronología del 30 aniversario de Oracle" (PDF) . Archivado (PDF) desde el original el 20 de marzo de 2011 . Consultado el 23 de agosto de 2017 .
  19. ^ Entrevista con Wayne Ratliff. La historia de FoxPro. Recuperado el 12 de julio de 2013.
  20. ^ Desarrollo de un DBMS orientado a objetos; Portland, Oregón, Estados Unidos; Páginas: 472–482; 1986; ISBN 0-89791-204-7 
  21. ^ Tumbas, Steve. "Bases de datos COTS para sistemas integrados" Archivado el 14 de noviembre de 2007 en Wayback Machine , revista Embedded Computing Design , enero de 2007. Recuperado el 13 de agosto de 2008.
  22. ^ Argumentación en Inteligencia Artificial por Iyad Rahwan, Guillermo R. Simari
  23. ^ "Semántica de OWL DL" . Consultado el 10 de diciembre de 2010 .
  24. ^ Connolly y Begg 2014, pág. 64.
  25. ^ Connolly y Begg 2014, págs. 97-102.
  26. ^ Connolly y Begg 2014, pág. 102.
  27. ^ Chong y col. 2007.
  28. ^ Connolly y Begg 2014, págs. 106-113.
  29. ^ Connolly y Begg 2014, pag. sesenta y cinco.
  30. ^ Capítulo 2005.
  31. ^ "Lenguaje de consulta estructurado (SQL)". Máquinas de negocios internacionales. 27 de octubre de 2006 . Consultado el 10 de junio de 2007 .
  32. ^ Wagner 2010.
  33. ^ Ramalho, JC; Faria, L.; Helder, S.; Coutada, M. (31 de diciembre de 2013). "Kit de herramientas de preservación de bases de datos: una herramienta flexible para normalizar y dar acceso a bases de datos". Biblioteca Nacional de Portugal (BNP) . Universidad de Miño.
  34. ^ Paiho, Satu; Tuominen, Pekka; Rökman, Jyri; Ylikerälä, Markus; Pajula, Juha; Siikavirta, Hanne (2022). "Oportunidades de los datos urbanos recopilados para ciudades inteligentes". Ciudades inteligentes IET . 4 (4): 275–291. doi : 10.1049/smc2.12044 . S2CID  253467923.
  35. ^ David Y. Chan; Victoria Chiú; Miklós A. Vasarhelyi (2018). Auditoría continua: teoría y aplicación (1ª ed.). Bingley, Reino Unido: Emerald Publishing. ISBN 978-1-78743-413-4. OCLC  1029759767.
  36. ^ Halder y Cortesi 2011.
  37. ^ Ben Linders (28 de enero de 2016). "Cómo encaja la administración de bases de datos en DevOps" . Consultado el 15 de abril de 2017 .
  38. ^ itl.nist.gov (1993) Definición de integración para modelado de información (IDEFIX) Archivado el 3 de diciembre de 2013 en Wayback Machine . 21 de diciembre de 1993.
  39. ^ ab Fecha de 2003, págs. 31–32.

Fuentes

Otras lecturas

enlaces externos