Un modelo físico de datos (o diseño de base de datos ) es una representación de un diseño de datos tal como se implementa, o se pretende implementar, en un sistema de gestión de bases de datos . En el ciclo de vida de un proyecto , normalmente se deriva de un modelo lógico de datos , aunque puede ser objeto de ingeniería inversa a partir de una implementación de base de datos determinada . Un modelo físico de datos completo incluirá todos los artefactos de base de datos necesarios para crear relaciones entre tablas o para alcanzar objetivos de rendimiento, como índices , definiciones de restricciones, tablas de enlace , tablas particionadas o clústeres . Los analistas normalmente pueden utilizar un modelo físico de datos para calcular estimaciones de almacenamiento; puede incluir detalles específicos de asignación de almacenamiento para un sistema de base de datos determinado.
A partir de 2012, [actualizar]siete bases de datos principales dominan el mercado comercial: Informix , Oracle , Postgres , SQL Server , Sybase , IBM Db2 y MySQL . Otros sistemas RDBMS tienden a ser bases de datos heredadas o se utilizan en el ámbito académico, como universidades o escuelas superiores. Los modelos de datos físicos para cada implementación diferirían significativamente, sobre todo debido a los requisitos del sistema operativo subyacente que pueden estar debajo de ellos. Por ejemplo: SQL Server solo se ejecuta en sistemas operativos Microsoft Windows (a partir de SQL Server 2017, SQL Server se ejecuta en Linux. Es el mismo motor de base de datos SQL Server, con muchas características y servicios similares independientemente de su sistema operativo [2] ), mientras que Oracle y MySQL pueden ejecutarse en Solaris, Linux y otros sistemas operativos basados en UNIX, así como en Windows. Esto significa que los requisitos de disco, los requisitos de seguridad y muchos otros aspectos de un modelo de datos físicos se verán influenciados por el RDBMS que un administrador de base de datos (o una organización) elija utilizar.
El esquema físico es un término utilizado en la gestión de datos para describir cómo se deben representar y almacenar los datos (archivos, índices, etc. ) en un almacenamiento secundario utilizando un sistema de gestión de bases de datos (DBMS) particular (por ejemplo, Oracle RDBMS , Sybase SQL Server, etc.).
En el enfoque de tres esquemas de la arquitectura ANSI/SPARC , el esquema interno es la vista de los datos que involucra la tecnología de gestión de datos. Esto se opone a un esquema externo que refleja la vista de los datos de un individuo o al esquema conceptual que es la integración de un conjunto de esquemas externos.
Posteriormente [ cita requerida ] se reconoció que el esquema interno tenía dos partes:
El esquema lógico era la forma en que se representaban los datos para cumplir con las limitaciones de un enfoque particular para la gestión de bases de datos. En ese momento, las opciones eran jerárquicas y de red . Sin embargo, la descripción del esquema lógico aún no describía cómo se almacenarían físicamente los datos en las unidades de disco. Ese es el dominio del esquema físico . Ahora, los esquemas lógicos describen los datos en términos de tablas y columnas relacionales, clases orientadas a objetos y etiquetas XML .
Un único conjunto de tablas, por ejemplo, se puede implementar de numerosas maneras, incluyendo incluso una arquitectura en la que las filas de las tablas se mantienen en computadoras en diferentes países.