Una marca de agua almacenada en un archivo de datos hace referencia a un método para garantizar la integridad de los datos que combina aspectos de hash de datos y marca de agua digital . Ambos son útiles para la detección de manipulaciones , aunque cada uno tiene sus propias ventajas y desventajas.
Un hash de datos típico procesará un archivo de entrada para producir una cadena alfanumérica exclusiva del archivo de datos. Si se modifica el archivo, por ejemplo, si se producen uno o más cambios de bits dentro de este archivo original, el mismo proceso de hash en el archivo modificado producirá un alfanumérico diferente. A través de este método, una fuente confiable puede calcular el hash de un archivo de datos original y los suscriptores pueden verificar la integridad de los datos. El suscriptor simplemente compara un hash del archivo de datos recibido con el hash conocido de la fuente confiable. Esto puede dar lugar a dos situaciones: que el hash sea el mismo o que el hash sea diferente.
Si los resultados del hash son iguales, los sistemas involucrados pueden tener un grado adecuado de confianza en la integridad de los datos recibidos. Por otro lado, si los resultados del hash son diferentes, pueden concluir que el archivo de datos recibido ha sido alterado.
Este proceso es común en las redes P2P , por ejemplo, el protocolo BitTorrent . Una vez que se descarga una parte del archivo, los datos se verifican con la clave hash (lo que se conoce como verificación hash). En función de este resultado, los datos se conservan o se descartan.
La marca de agua digital es claramente diferente del hash de datos . Es el proceso de alterar el archivo de datos original, lo que permite la recuperación posterior de datos auxiliares incrustados, conocidos como marca de agua .
Un suscriptor, con conocimiento de la marca de agua y de cómo se recupera, puede determinar (hasta cierto punto) si se han producido cambios significativos en el archivo de datos. Según el método específico utilizado, la recuperación de los datos auxiliares integrados puede ser resistente al posprocesamiento (como la compresión con pérdida ).
Si el archivo de datos que se va a recuperar es una imagen , el proveedor puede incorporar una marca de agua con fines de protección. El proceso permite la tolerancia a algunos cambios, manteniendo al mismo tiempo una asociación con el archivo de imagen original. Los investigadores también han desarrollado técnicas que incorporan componentes de la imagen dentro de la imagen. Esto puede ayudar a identificar partes de la imagen que pueden contener cambios no autorizados e incluso ayudar a recuperar parte de los datos perdidos.
Una desventaja de las marcas de agua digitales es que el suscriptor no puede alterar significativamente algunos archivos sin sacrificar la calidad o utilidad de los datos. Esto puede suceder con varios archivos, incluidos datos de imagen , datos de audio y código informático .