árbol de merkle

En criptografía e informática , un árbol hash o árbol Merkle es un árbol en el que cada nodo "hoja" está etiquetado con el hash criptográfico de un bloque de datos, y cada nodo que no es una hoja (llamado rama , nodo interno o inode ) está etiquetado con el hash criptográfico de las etiquetas de sus nodos secundarios. Un árbol hash permite una verificación eficiente y segura del contenido de una gran estructura de datos . Un árbol hash es una generalización de una lista hash y una cadena hash .

Demostrar que un nodo hoja es parte de un árbol hash binario determinado requiere calcular una cantidad de hashes proporcional al logaritmo del número de nodos hoja en el árbol. ^[1] Por el contrario, en una lista hash, el número es proporcional al número de nodos hoja. Por lo tanto, un árbol Merkle es un ejemplo eficiente de un esquema de compromiso criptográfico , en el que la raíz del árbol se considera un compromiso y los nodos hoja pueden revelarse y demostrarse que son parte del compromiso original. ^[2]

El concepto de árbol de hachís lleva el nombre de Ralph Merkle , quien lo patentó en 1979. ^[3]^[4]

Usos

Los árboles hash se pueden utilizar para verificar cualquier tipo de datos almacenados, manejados y transferidos dentro y entre computadoras. Pueden ayudar a garantizar que los bloques de datos recibidos de otros pares en una red peer-to-peer se reciban sin daños ni alteraciones, e incluso para verificar que los otros pares no mientan y envíen bloques falsos.

Los árboles de hachís se utilizan en:

criptografía basada en hash .
Sistema de archivos interplanetario (IPFS),
BitTorrent
Sistemas de archivos Btrfs y ZFS ^[5] (para contrarrestar la degradación de datos ^[6] );
Protocolo de datos ;
protocolo Apache Wave ; ^[7]
Sistemas de control de revisiones distribuidos Git y Mercurial (aunque, estrictamente hablando, utilizan gráficos acíclicos dirigidos , no árboles);
el sistema de respaldo Tahoe-LAFS ;
Zeronet ;
las redes peer-to-peer de Bitcoin y Ethereum ; ^[8]
el marco de Transparencia de Certificados ;
el administrador de paquetes Nix y descendientes como GNU Guix ; ^[9]
varios sistemas NoSQL como Apache Cassandra , Riak y Dynamo . ^[10]

Se han hecho sugerencias para utilizar árboles hash en sistemas informáticos confiables . ^[11]

La implementación inicial de Bitcoin de los árboles Merkle por parte de Satoshi Nakamoto aplica el paso de compresión de la función hash en un grado excesivo, lo que se mitiga mediante el uso de Fast Merkle Trees. ^[12]

Descripción general

Un árbol hash es un árbol de hashes en el que las hojas (es decir, los nodos hoja, a veces también llamados "hojas") son hashes de bloques de datos en, por ejemplo, un archivo o conjunto de archivos. Los nodos más arriba en el árbol son los hashes de sus respectivos hijos. Por ejemplo, en la imagen de arriba, el hash 0 es el resultado del hash de la concatenación de hash 0-0 y hash 0-1 . Es decir, hash 0 = hash ( hash 0-0 + hash 0-1 ) donde "+" denota concatenación.

La mayoría de las implementaciones de árboles hash son binarias (dos nodos secundarios debajo de cada nodo), pero también pueden usar muchos más nodos secundarios debajo de cada nodo.

Por lo general, se utiliza una función hash criptográfica como SHA-2 para el hash. Si el árbol hash sólo necesita protegerse contra daños involuntarios, se pueden utilizar sumas de verificación no seguras , como las CRC .

En la parte superior de un árbol hash hay un hash superior (o hash raíz o hash maestro ). Antes de descargar un archivo en una red P2P , en la mayoría de los casos el hash superior se adquiere de una fuente confiable, por ejemplo, un amigo o un sitio web conocido por tener buenas recomendaciones de archivos para descargar. Cuando el hash superior está disponible, el árbol hash se puede recibir de cualquier fuente que no sea de confianza, como cualquier par en la red P2P. Luego, el árbol hash recibido se compara con el hash superior confiable y, si el árbol hash está dañado o es falso, se probará con otro árbol hash de otra fuente hasta que el programa encuentre uno que coincida con el hash superior. ^[13]

La principal diferencia con una lista hash es que se puede descargar una rama del árbol hash a la vez y la integridad de cada rama se puede verificar inmediatamente, aunque el árbol completo no esté disponible todavía. Por ejemplo, en la imagen, la integridad del bloque de datos L2 se puede verificar inmediatamente si el árbol ya contiene el hash 0-0 y el hash 1 aplicando hash al bloque de datos y combinando iterativamente el resultado con el hash 0-0 y luego el hash 1 y finalmente comparando el resultado con el hash superior . De manera similar, la integridad del bloque de datos L3 se puede verificar si el árbol ya tiene hash 1-1 y hash 0 . Esto puede ser una ventaja, ya que es eficaz dividir los archivos en bloques de datos muy pequeños, de modo que sólo sea necesario volver a descargar bloques pequeños si se dañan. Si el archivo hash es grande, dicha lista hash o cadena hash se vuelve bastante grande. Pero si es un árbol, se puede descargar rápidamente una pequeña rama, se puede verificar la integridad de la rama y luego puede comenzar la descarga de bloques de datos. ^{[ cita necesaria ]}

Segundo ataque de preimagen

La raíz hash de Merkle no indica la profundidad del árbol, lo que permite un ataque de segunda preimagen en el que un atacante crea un documento distinto del original que tiene la misma raíz hash de Merkle. Para el ejemplo anterior, un atacante puede crear un nuevo documento que contenga dos bloques de datos, donde el primero es hash 0-0 + hash 0-1 y el segundo es hash 1-0 + hash 1-1 . ^[14]^[15]

Se define una solución simple en Transparencia de certificados : cuando se calculan hashes de nodos hoja, se antepone un byte 0x00 a los datos hash, mientras que se antepone 0x01 cuando se calculan hashes de nodos internos. ^[13] Limitar el tamaño del árbol hash es un requisito previo para algunas pruebas de seguridad formales y ayuda a hacer algunas pruebas más estrictas. Algunas implementaciones limitan la profundidad del árbol utilizando prefijos de profundidad del árbol hash antes de los hash, por lo que cualquier cadena hash extraída se define como válida solo si el prefijo disminuye en cada paso y sigue siendo positivo cuando se alcanza la hoja.

Hachís de árbol de tigre

El hachís del árbol del tigre es una forma muy utilizada de árbol de hachís. Utiliza un árbol hash binario (dos nodos secundarios debajo de cada nodo), generalmente tiene un tamaño de bloque de datos de 1024 bytes y usa el hash Tiger . ^[dieciséis]

Los hashes de árbol de tigre se utilizan en los protocolos de intercambio de archivos Gnutella , ^[17] Gnutella2 y Direct Connect P2P ^[18] y en aplicaciones para compartir archivos como Phex , ^[19] BearShare , LimeWire , Shareaza , DC++ ^[20] y gtk-gnutella . ^[21]

Ver también

Referencias

^ Becker, Georg (18 de julio de 2008). "Esquemas de firma de Merkle, árboles de Merkle y su criptoanálisis" (PDF) . Universidad del Ruhr de Bochum. pag. 16. Archivado desde el original (PDF) el 22 de diciembre de 2014 . Consultado el 20 de noviembre de 2013 .
^ "Manual de criptografía aplicada". cacr.uwaterloo.ca . Sección 13.4.1 . Consultado el 7 de marzo de 2024 .
^ Merkle, RC (1988). "Una firma digital basada en una función de cifrado convencional". Avances en criptología - CRYPTO '87 . Apuntes de conferencias sobre informática. vol. 293, págs. 369–378. doi :10.1007/3-540-48184-2_32. ISBN 978-3-540-18796-7.
^ Patente estadounidense 4309569, Ralph Merkle, "Método para proporcionar firmas digitales", publicada el 5 de enero de 1982, asignada al Patronato de la Leland Stanford Junior University
^ Bonwick, Jeff (8 de diciembre de 2005). "Integridad de datos de un extremo a otro de ZFS". blogs.oracle.com . Archivado desde el original el 3 de abril de 2012 . Consultado el 19 de septiembre de 2013 .
^ Likai Liu. "Resistencia Bitrot en una sola unidad". likai.org .
^ "Federación General Verificable". Protocolo Google Wave . Archivado desde el original el 8 de abril de 2018 . Consultado el 9 de marzo de 2017 .
^ Koblitz, Neal; Menezes, Alfred J. (enero de 2016). "Criptoefectivo, criptomonedas y criptocontratos". Diseños, Códigos y Criptografía . 78 (1): 87-102. CiteSeerX 10.1.1.701.8721 . doi :10.1007/s10623-015-0148-5. S2CID 16594958.
^ Dolstra, E. El modelo de implementación de software puramente funcional. Tesis doctoral, Facultad de Ciencias, Utrecht, Países Bajos. Enero de 2006. p.21 ISBN 90-393-4130-3 .
^ Adán Marcos. "El ecosistema NoSQL". aosabook.org . Cuando una réplica está inactiva durante un período prolongado de tiempo, o la máquina que almacena las transferencias sugeridas para una réplica no disponible también deja de funcionar, las réplicas deben sincronizarse entre sí. En este caso, Cassandra y Riak implementan un proceso inspirado en Dynamo llamado antientropía. En antientropía, las réplicas intercambian árboles Merkle para identificar partes de sus rangos de claves replicadas que no están sincronizadas. Un árbol Merkle es una verificación de hash jerárquica: si el hash de todo el espacio de claves no es el mismo entre dos réplicas, intercambiarán hashes de porciones cada vez más pequeñas del espacio de claves replicado hasta que se identifiquen las claves no sincronizadas. Este enfoque reduce la transferencia de datos innecesaria entre réplicas que contienen datos en su mayoría similares.
^ Kilian, J. (1995). "Argumentos eficientes mejorados (versión preliminar)" (PDF) . CRIPTO . doi : 10.1007/3-540-44750-4_25 .
^ Mark Friedenbach: Árboles rápidos de Merkle
^ ab Laurie, B.; Langley, A.; Kasper, E. (junio de 2013). "Certificado de Transparencia". IETF : RFC6962. doi :10.17487/rfc6962.
^ Elena Andreeva; Carlos Bouillaguet; Orr Dunkelman; John Kelsey (enero de 2009). "Ataques de pastoreo, segunda preimagen y mensajes troyanos más allá de Merkle-Damgård". Áreas seleccionadas en criptografía . Apuntes de conferencias sobre informática. vol. 5867. SAC. págs. 393–414. doi :10.1007/978-3-642-05445-7_25. ISBN 978-3-642-05443-3.
^ Elena Andreeva; Carlos Bouillaguet; Pierre-Alain Fouque; Jonathan J. Hoch; John Kelsey; Adi Shamir; Sébastien Zimmer (2008). "Segundos ataques de preimagen a funciones hash difuminadas". En Smart, Nigel (ed.). Avances en Criptología – EUROCRYPT 2008 . Apuntes de conferencias sobre informática. vol. 4965. Estambul, Turquía. págs. 270–288. doi :10.1007/978-3-540-78967-3_16. ISBN 978-3-540-78966-6. S2CID 12844017.{{cite book}}: CS1 maint: location missing publisher (link)
^ Chapweske, J.; Mohr, G. (4 de marzo de 2003). "Formato Tree Hash EXchange (THEX)". Archivado desde el original el 3 de agosto de 2009.
^ "Referencia del archivo Tigertree.c". Gtk-Gnutella . Consultado el 23 de septiembre de 2018 .
^ "Auditoría: aplicación P2P DirectConnect". Symantec . Archivado desde el original el 29 de enero de 2015 . Consultado el 23 de septiembre de 2018 .
^ Arne Babenhauserheide (7 de enero de 2007). "Phex 3.0.0 lanzado". Phex . Consultado el 23 de septiembre de 2018 .
^ "Lista de funciones de DC ++". dcplusplus.sourceforge.net .
^ "Desarrollo". GTK-Gnutella . Consultado el 23 de septiembre de 2018 .

Otras lecturas

Patente de árbol Merkle 4.309.569 : explica tanto la estructura del árbol hash como su uso para manejar muchas firmas únicas.
Formato Tree Hash EXchange (THEX): una descripción detallada de los árboles Tiger

enlaces externos

Escuche este artículo ( 5 minutos )

Este archivo de audio se creó a partir de una revisión de este artículo con fecha del 17 de septiembre de 2013 y no refleja ediciones posteriores.

Implementación AC de un árbol hash binario SHA-256 dinámicamente redimensionable (árbol Merkle)
Implementación del árbol Merkle en Java
Código fuente de Tiger Tree Hash (TTH) en C#, por Gil Schmidt
Implementaciones de Tiger Tree Hash (TTH) en C y Java
RHash, una herramienta de línea de comandos de código abierto, que puede calcular TTH y enlaces magnéticos con TTH