stringtranslate.com

Integridad de los datos

La integridad de los datos es el mantenimiento y la garantía de la precisión y coherencia de los datos durante todo su ciclo de vida . [1] Es un aspecto crítico para el diseño, implementación y uso de cualquier sistema que almacene, procese o recupere datos. El término tiene un alcance amplio y puede tener significados muy diferentes según el contexto específico, incluso bajo el mismo paraguas general de informática . A veces se utiliza como término sustituto para la calidad de los datos , [2] mientras que la validación de los datos es un requisito previo para la integridad de los datos. [3]

Definición

La integridad de los datos es lo opuesto a la corrupción de datos . [4] La intención general de cualquier técnica de integridad de datos es la misma: garantizar que los datos se registren exactamente como se pretende (como una base de datos que rechaza correctamente posibilidades mutuamente excluyentes). Además, al recuperarlos posteriormente , asegúrese de que los datos sean los mismos que cuando se registraron originalmente. En resumen, la integridad de los datos tiene como objetivo evitar cambios involuntarios en la información. La integridad de los datos no debe confundirse con la seguridad de los datos , la disciplina de proteger los datos de partes no autorizadas.

Cualquier cambio no intencionado en los datos como resultado de una operación de almacenamiento, recuperación o procesamiento, incluidos intentos maliciosos, fallas inesperadas de hardware y errores humanos , constituye una falla en la integridad de los datos. Si los cambios son el resultado de un acceso no autorizado, también puede deberse a una falla en la seguridad de los datos. Dependiendo de los datos involucrados, esto podría manifestarse desde cosas benignas como que un solo píxel en una imagen aparezca con un color diferente al que se registró originalmente, hasta la pérdida de fotografías de vacaciones o de una base de datos crítica para el negocio, e incluso la pérdida catastrófica de vidas humanas en una vida . -sistema crítico .

tipos de integridad

Integridad física

La integridad física aborda los desafíos asociados con el almacenamiento y la recuperación correctos de los datos en sí. Los desafíos a la integridad física pueden incluir fallas electromecánicas , fallas de diseño, fatiga del material , corrosión , cortes de energía , desastres naturales y otros peligros ambientales especiales como radiación ionizante , temperaturas extremas, presiones y fuerzas g . Garantizar la integridad física incluye métodos como hardware redundante , una fuente de alimentación ininterrumpida , ciertos tipos de matrices RAID , chips reforzados contra la radiación , memoria de corrección de errores , uso de un sistema de archivos en clúster , uso de sistemas de archivos que emplean sumas de comprobación a nivel de bloque como ZFS , almacenamiento matrices que calculan cálculos de paridad, como exclusivo o , utilizan una función hash criptográfica e incluso tienen un temporizador de vigilancia en subsistemas críticos.

La integridad física suele hacer un uso extensivo de algoritmos de detección de errores conocidos como códigos de corrección de errores . Los errores de integridad de datos inducidos por humanos a menudo se detectan mediante el uso de comprobaciones y algoritmos más simples, como el algoritmo Damm o el algoritmo Luhn . Se utilizan para mantener la integridad de los datos después de la transcripción manual de un sistema informático a otro por parte de un intermediario humano (por ejemplo, tarjetas de crédito o números de ruta bancaria). Los errores de transcripción inducidos por computadora se pueden detectar mediante funciones hash .

En los sistemas de producción, estas técnicas se utilizan juntas para garantizar diversos grados de integridad de los datos. Por ejemplo, un sistema de archivos de computadora puede configurarse en una matriz RAID tolerante a fallas, pero es posible que no proporcione sumas de verificación a nivel de bloque para detectar y evitar la corrupción silenciosa de datos . Como otro ejemplo, un sistema de administración de bases de datos podría ser compatible con las propiedades ACID , pero el controlador RAID o la caché de escritura interna de la unidad de disco duro podrían no serlo.

Integridad lógica

Este tipo de integridad se ocupa de la exactitud o racionalidad de un dato, dado un contexto particular. Esto incluye temas como la integridad referencial y la integridad de la entidad en una base de datos relacional o ignorar correctamente datos de sensores imposibles en sistemas robóticos. Estas preocupaciones implican garantizar que los datos "tengan sentido" dado su entorno. Los desafíos incluyen errores de software , fallas de diseño y errores humanos. Los métodos comunes para garantizar la integridad lógica incluyen cosas como restricciones de verificación , restricciones de clave externa , aserciones de programas y otras comprobaciones de integridad en tiempo de ejecución.

La integridad física y lógica a menudo comparten muchos desafíos, como errores humanos y fallas de diseño, y ambas deben lidiar adecuadamente con solicitudes simultáneas para registrar y recuperar datos, el último de los cuales es un tema completamente independiente.

Si un sector de datos solo tiene un error lógico, se puede reutilizar sobrescribiéndolo con datos nuevos. En caso de error físico, el sector de datos afectado queda permanentemente inutilizable.

Bases de datos

La integridad de los datos contiene pautas para la retención de datos , especificando o garantizando el período de tiempo que los datos pueden retenerse en una base de datos particular (normalmente una base de datos relacional ). Para lograr la integridad de los datos, estas reglas se aplican de manera consistente y rutinaria a todos los datos que ingresan al sistema, y ​​cualquier relajación de la aplicación podría causar errores en los datos. La implementación de controles de los datos lo más cerca posible de la fuente de entrada (como la entrada de datos humanos) hace que entren menos datos erróneos al sistema. La aplicación estricta de las reglas de integridad de datos da como resultado tasas de error más bajas y un ahorro de tiempo en la resolución de problemas y el seguimiento de datos erróneos y los errores que causan en los algoritmos.

La integridad de los datos también incluye reglas que definen las relaciones que un dato puede tener con otros datos, como por ejemplo que un registro de Cliente pueda vincularse a Productos comprados , pero no a datos no relacionados, como Activos Corporativos . La integridad de los datos a menudo incluye comprobaciones y correcciones de datos no válidos, basándose en un esquema fijo o un conjunto de reglas predefinidas. Un ejemplo son los datos textuales ingresados ​​donde se requiere un valor de fecha y hora. También se aplican reglas para la derivación de datos, que especifican cómo se deriva un valor de datos en función del algoritmo, los contribuyentes y las condiciones. También especifica las condiciones sobre cómo se puede volver a derivar el valor de los datos.

Tipos de restricciones de integridad

La integridad de los datos normalmente se aplica en un sistema de base de datos mediante una serie de restricciones o reglas de integridad. Tres tipos de restricciones de integridad son parte inherente del modelo de datos relacionales : integridad de la entidad, integridad referencial e integridad del dominio.

Si una base de datos admite estas características, es responsabilidad de la base de datos garantizar la integridad de los datos, así como el modelo de coherencia para el almacenamiento y la recuperación de datos. Si una base de datos no admite estas funciones, es responsabilidad de las aplicaciones garantizar la integridad de los datos mientras la base de datos admita el modelo de coherencia para el almacenamiento y la recuperación de datos.

Tener un sistema de integridad de datos único, bien controlado y bien definido aumenta:

Las bases de datos modernas admiten estas características (consulte Comparación de sistemas de gestión de bases de datos relacionales ) y se ha convertido en responsabilidad de facto de la base de datos garantizar la integridad de los datos. Las empresas, y de hecho muchos sistemas de bases de datos, ofrecen productos y servicios para migrar sistemas heredados a bases de datos modernas.

Ejemplos

Un ejemplo de un mecanismo de integridad de datos es la relación padre-hijo de registros relacionados. Si un registro principal posee uno o más registros secundarios relacionados, todos los procesos de integridad referencial son manejados por la propia base de datos, lo que garantiza automáticamente la exactitud e integridad de los datos para que ningún registro secundario pueda existir sin un padre (también llamado huérfano). y que ningún padre pierda los registros de sus hijos. También garantiza que no se pueda eliminar ningún registro principal mientras el registro principal sea propietario de los registros secundarios. Todo esto se maneja a nivel de base de datos y no requiere comprobaciones de integridad de codificación en cada aplicación.

Sistemas de archivos

Diversos resultados de investigaciones muestran que ni los sistemas de archivos más extendidos (incluidos UFS , Ext , XFS , JFS y NTFS ) ni las soluciones RAID de hardware proporcionan suficiente protección contra los problemas de integridad de los datos. [5] [6] [7] [8] [9]

Algunos sistemas de archivos (incluidos Btrfs y ZFS ) proporcionan sumas de verificación internas de datos y metadatos que se utilizan para detectar corrupción silenciosa de datos y mejorar la integridad de los datos. Si se detecta una corrupción de esa manera y también se utilizan los mecanismos RAID internos proporcionados por esos sistemas de archivos, dichos sistemas de archivos pueden reconstruir adicionalmente los datos corruptos de manera transparente. [10] Este enfoque permite una protección mejorada de la integridad de los datos que cubre todas las rutas de datos, lo que generalmente se conoce como protección de datos de un extremo a otro . [11]

Integridad de datos aplicada a diversas industrias

Ver también

Referencias

  1. ^ Boritz, J. "Opiniones de los profesionales de SI sobre conceptos básicos de integridad de la información". Revista Internacional de Sistemas de Información Contable . Elsevier. Archivado desde el original el 5 de octubre de 2011 . Consultado el 12 de agosto de 2011 .
  2. ^ ¿ Qué es la integridad de los datos? Aprenda cómo garantizar la integridad de los datos de la base de datos mediante comprobaciones, pruebas y mejores prácticas
  3. ^ ¿ Qué es la integridad de los datos? Protección de datos 101
  4. ^ Del libro: Uberveillance and the Social Implications of Microchip Implants: Emerging Página 40
  5. ^ Vijayan Prabhakaran (2006). «SISTEMAS DE ARCHIVOS DE HIERRO» (PDF) . Doctor en Filosofía en Ciencias de la Computación . Universidad de Wisconsin-Madison. Archivado (PDF) desde el original el 9 de octubre de 2022 . Consultado el 9 de junio de 2012 .
  6. ^ "Paridad perdida y paridad recuperada".
  7. ^ "Un análisis de la corrupción de datos en la pila de almacenamiento" (PDF) . Archivado (PDF) desde el original el 9 de octubre de 2022.
  8. ^ "Impacto de la corrupción del disco en DBMS de código abierto" (PDF) . Archivado (PDF) desde el original el 9 de octubre de 2022.
  9. ^ "Baarf.com". Baarf.com . Consultado el 4 de noviembre de 2011 .
  10. ^ Bierman, Margarita; Grimmer, Lenz (agosto de 2012). "Cómo uso las capacidades avanzadas de Btrfs" . Consultado el 2 de enero de 2014 .
  11. ^ Yupu Zhang; Abhishek Rajimwale; Andrea Arpaci-Dusseau ; Remzi H. Arpaci-Dusseau (2010). "Integridad de datos de un extremo a otro para sistemas de archivos: un estudio de caso de ZFS" (PDF) . Conferencia USENIX sobre tecnologías de archivos y almacenamiento . CiteSeerX 10.1.1.154.3979 . S2CID  5722163. Wikidata  Q111972797 . Consultado el 2 de enero de 2014 . 
  12. ^ "Integridad de los datos y cumplimiento de CGMP: orientación para la industria" (PDF) . Administración de Alimentos y Medicamentos de EE. UU. Abril de 2016. Archivado (PDF) desde el original el 9 de octubre de 2022 . Consultado el 20 de enero de 2018 .
  13. ^ Davidson, J. (18 de julio de 2017). "Orientación sobre integridad de datos en todo el mundo". Contrato Farmacéutico . Medios Rodman . Consultado el 20 de enero de 2018 .
  14. ^ Scannel, P. (12 de mayo de 2015). "Integridad de los datos: una perspectiva desde el marco regulatorio y de estándares de dispositivos médicos" (PDF) . Seminario de Integridad de Datos . Asociación de Medicamentos Parenterales. págs. 10–57. Archivado desde el original (PDF) el 20 de enero de 2018 . Consultado el 20 de enero de 2018 .
  15. ^ Cook, R. (4 de enero de 2017). "Carta de prioridades regulatorias y de examen de 2017". Autoridad Reguladora de la Industria Financiera . Consultado el 20 de enero de 2018 .
  16. ^ Cook, R. (8 de enero de 2018). "Carta de prioridades regulatorias y de examen de 2018". Autoridad Reguladora de la Industria Financiera . Consultado el 20 de enero de 2018 .
  17. ^ "Integridad de los datos: permitir decisiones efectivas en las operaciones mineras" (PDF) . Accenture. 2016. Archivado (PDF) desde el original el 9 de octubre de 2022 . Consultado el 20 de enero de 2018 .
  18. ^ "La industria 4.0 y los sistemas ciberfísicos aumentan el imperativo de la integridad de los datos". Blog de Nymi . Nymi, Inc. 24 de octubre de 2017 . Consultado el 20 de enero de 2018 .[ enlace muerto permanente ]
  19. ^ Priyadharshini, B.; Parvathi, P. (2012). "Integridad de los datos en el almacenamiento en la nube". Actas de la Conferencia Internacional de 2012 sobre Avances en Ingeniería, Ciencia y Gestión . ISBN 9788190904223.
  20. ^ Zafar, F.; Khan, A.; Malik, Sur; et al. (2017). "Un estudio de los esquemas de integridad de datos de computación en la nube: desafíos de diseño, taxonomía y tendencias futuras". Computadoras y seguridad . 65 (3): 29–49. doi :10.1016/j.cose.2016.10.006.
  21. ^ Imran, M.; Hlavacs, H.; Haq, IIU; et al. (2017). "Verificación y verificación de la integridad de los datos basada en la procedencia en entornos de nube". MÁS UNO . 12 (5): e0177576. Código Bib : 2017PLoSO..1277576I. doi : 10.1371/journal.pone.0177576 . PMC 5435237 . PMID  28545151.