En la memoria principal , el almacenamiento auxiliar y los buses de la computadora , la redundancia de datos es la existencia de datos adicionales a los datos reales y que permiten la corrección de errores en los datos almacenados o transmitidos. Los datos adicionales pueden ser simplemente una copia completa de los datos reales (un tipo de código de repetición ) o solo fragmentos seleccionados de datos que permiten la detección de errores y la reconstrucción de datos perdidos o dañados hasta un cierto nivel.
Por ejemplo, al incluir bits de verificación calculados, la memoria ECC es capaz de detectar y corregir errores de un solo bit dentro de cada palabra de memoria , mientras que RAID 1 combina dos unidades de disco duro (HDD) en una unidad de almacenamiento lógica que permite que los datos almacenados sobrevivan a una falla completa de una unidad. [1] [2] La redundancia de datos también se puede utilizar como una medida contra la corrupción silenciosa de datos ; por ejemplo, los sistemas de archivos como Btrfs y ZFS utilizan la suma de comprobación de datos y metadatos en combinación con copias de datos almacenados para detectar la corrupción silenciosa de datos y reparar sus efectos. [3]
Aunque de naturaleza diferente, la redundancia de datos también ocurre en sistemas de bases de datos que tienen valores repetidos innecesariamente en uno o más registros o campos , dentro de una tabla , o donde el campo se replica/repite en dos o más tablas. A menudo, esto se encuentra en diseños de bases de datos no normalizadas y da como resultado la complicación de la administración de la base de datos, introduciendo el riesgo de corromper los datos y aumentando la cantidad de almacenamiento requerida . Cuando se realiza a propósito a partir de un esquema de base de datos normalizado previamente, puede considerarse una forma de desnormalización de la base de datos ; se utiliza para mejorar el rendimiento de las consultas de la base de datos (acortar el tiempo de respuesta de la base de datos).
Por ejemplo, cuando los datos de los clientes se duplican y se adjuntan a cada producto comprado, la redundancia de datos es una fuente conocida de inconsistencia , ya que un cliente determinado puede aparecer con valores diferentes para uno o más de sus atributos. [4] La redundancia de datos conduce a anomalías y corrupción de datos y, en general, debe evitarse mediante el diseño; [5] la aplicación de la normalización de bases de datos evita la redundancia y permite el mejor uso posible del almacenamiento. [6]