Ataque de colisión

En criptografía , un ataque de colisión sobre un hash criptográfico intenta encontrar dos entradas que produzcan el mismo valor hash, es decir, una colisión hash . Esto contrasta con un ataque de preimagen en el que se especifica un valor hash objetivo específico.

Existen aproximadamente dos tipos de ataques de colisión:

Ataque de colisión clásico: Encuentre dos mensajes diferentes m ₁ y m ₂ tales que hash ( m ₁ ) = hash ( m ₂ ).

Más generalmente:

Ataque de colisión de prefijo elegido: Dados dos prefijos diferentes p ₁ y p ₂ , encuentre dos sufijos s ₁ y s ₂ tales que hash ( p ₁ ∥ s ₁ ) = hash ( p ₂ ∥ s ₂ ), donde ∥ denota la operación de concatenación .

Ataque de colisión clásico

Al igual que los cifrados de clave simétrica son vulnerables a ataques de fuerza bruta , cada función hash criptográfica es inherentemente vulnerable a colisiones mediante un ataque de cumpleaños . Debido al problema del cumpleaños , estos ataques son mucho más rápidos de lo que sería una fuerza bruta. Un hash de n bits se puede romper en 2 ^{n /2} pasos de tiempo (evaluaciones de la función hash).

Dicho matemáticamente, un ataque de colisión encuentra dos mensajes diferentes m1 y m2 , tales que hash(m1) = hash(m2) . En un ataque de colisión clásico, el atacante no tiene control sobre el contenido de ninguno de los mensajes, pero el algoritmo los elige arbitrariamente.

Es posible realizar ataques más eficientes empleando criptoanálisis de funciones hash específicas. Cuando se descubre un ataque de colisión y se descubre que es más rápido que un ataque de cumpleaños, una función hash a menudo se denuncia como "rota". La competencia de funciones hash del NIST fue inducida en gran medida por ataques de colisión publicados contra dos funciones hash muy utilizadas, MD5 ^[1] y SHA-1 . Los ataques de colisión contra MD5 han mejorado tanto que, a partir de 2007, tardan sólo unos segundos en un ordenador normal. ^[2] Las colisiones hash creadas de esta manera suelen tener una longitud constante y en gran medida no están estructuradas, por lo que no se pueden aplicar directamente para atacar protocolos o formatos de documentos generalizados.

Sin embargo, es posible encontrar soluciones abusando de las construcciones dinámicas presentes en muchos formatos. De esta forma se crearían dos documentos lo más similares posible para tener el mismo valor hash. Un documento se mostraría a una autoridad para que lo firmara y luego la firma se podría copiar al otro archivo. Un documento malicioso de este tipo contendría dos mensajes diferentes en el mismo documento, pero mostraría condicionalmente uno u otro mediante cambios sutiles en el archivo:

Algunos formatos de documentos como PostScript o macros en Microsoft Word tienen construcciones condicionales. ^[3]^[4] (if-then-else) que permiten probar si una ubicación del archivo tiene un valor u otro para poder controlar lo que se muestra.
Los archivos TIFF pueden contener imágenes recortadas y se muestra una parte diferente de una imagen sin afectar el valor hash. ^[4]
Los archivos PDF son vulnerables a ataques de colisión mediante el uso de valores de color (de modo que el texto de un mensaje se muestra con un color blanco que se mezcla con el fondo y el texto del otro mensaje se muestra con un color oscuro) que luego se puede modificar para cambiar. el contenido del documento firmado. ^[4]

Ataque de colisión de prefijo elegido

Una extensión del ataque de colisión es el ataque de colisión de prefijo elegido, que es específico de las funciones hash Merkle-Damgård . En este caso, el atacante puede elegir dos documentos arbitrariamente diferentes y luego agregar diferentes valores calculados que den como resultado que todos los documentos tengan el mismo valor hash. Este ataque normalmente es más difícil, un hash de n bits se puede romper en 2 ^(n/2)+1 pasos de tiempo, pero es mucho más poderoso que un ataque de colisión clásico.

Matemáticamente expresado, dados dos prefijos diferentes p ₁ , p ₂ , el ataque encuentra dos sufijos s ₁ y s ₂ tales que hash ( p ₁ ∥ s ₁ ) = hash ( p ₂ ∥ s ₂ ) (donde ∥ es la operación de concatenación ) .

También son posibles ataques más eficientes empleando criptoanálisis de funciones hash específicas. En 2007, se descubrió un ataque de colisión de prefijo elegido contra MD5, que requirió aproximadamente 250 ^evaluaciones de la función MD5. El documento también muestra dos certificados X.509 para diferentes nombres de dominio, con valores hash en colisión. Esto significa que se podría pedir a una autoridad certificadora que firme un certificado para un dominio y luego ese certificado (especialmente su firma) podría usarse para crear un nuevo certificado falso para hacerse pasar por otro dominio. ^[5]

En diciembre de 2008 se publicó un ataque de colisión del mundo real cuando un grupo de investigadores de seguridad publicó un certificado de firma X.509 falsificado que podría usarse para hacerse pasar por una autoridad certificadora , aprovechando un ataque de colisión de prefijo contra la función hash MD5. Esto significaba que un atacante podría hacerse pasar por cualquier sitio web protegido por SSL como un intermediario , subvirtiendo así la validación de certificados integrada en cada navegador web para proteger el comercio electrónico . Es posible que las autoridades reales no puedan revocar el certificado falso y también podría tener un tiempo de vencimiento falsificado arbitrariamente. Aunque se sabía que MD5 era muy débil en 2004, ^[1] las autoridades certificadoras todavía estaban dispuestas a firmar certificados verificados por MD5 en diciembre de 2008, ^[6] y al menos un certificado de firma de código de Microsoft todavía usaba MD5 en mayo de 2012.

El malware Flame utilizó con éxito una nueva variación de un ataque de colisión de prefijo elegido para falsificar la firma del código de sus componentes mediante un certificado raíz de Microsoft que todavía usaba el algoritmo MD5 comprometido. ^[7]^[8]

En 2019, los investigadores encontraron un ataque de colisión de prefijo elegido contra SHA-1 con una complejidad informática de entre 266,9 ^y 269,4 ^y un costo de menos de 100.000 dólares estadounidenses. ^[9]^[10] En 2020, los investigadores redujeron la complejidad de un ataque de colisión de prefijo elegido contra SHA-1 a 2 ^63,4 . ^[11]

Escenarios de ataque

Muchas aplicaciones de funciones hash criptográficas no dependen de la resistencia a las colisiones , por lo que los ataques de colisión no afectan su seguridad. Por ejemplo, los HMAC no son vulnerables. ^[12] Para que el ataque sea útil, el atacante debe tener el control de la entrada a la función hash.

Firmas digitales

Debido a que los algoritmos de firma digital no pueden firmar una gran cantidad de datos de manera eficiente, la mayoría de las implementaciones utilizan una función hash para reducir ("comprimir") la cantidad de datos que deben firmarse a un tamaño constante. Los esquemas de firma digital a menudo se vuelven vulnerables a colisiones de hash tan pronto como la función hash subyacente prácticamente se rompe; Técnicas como el hash aleatorio (salado) ganarán tiempo extra al requerir un ataque previo a la imagen más duro . ^[13]

El escenario de ataque habitual es el siguiente:

Mallory crea dos documentos diferentes, A y B, que tienen un valor hash idéntico, es decir, una colisión. Mallory busca engañar a Bob para que acepte el documento B, aparentemente de Alice.
Mallory envía el documento A a Alice , quien acepta lo que dice el documento, firma su hash y envía la firma a Mallory.
Mallory adjunta la firma del documento A al documento B.
Luego, Mallory envía la firma y el documento B a Bob , afirmando que Alice firmó B. Debido a que la firma digital coincide con el hash del documento B, el software de Bob no puede detectar la sustitución. ^{[ cita necesaria ]}

En 2008, los investigadores utilizaron un ataque de colisión de prefijo elegido contra MD5 utilizando este escenario para producir un certificado de autoridad de certificación fraudulento . Crearon dos versiones de un certificado de clave pública TLS , una de las cuales parecía legítima y fue enviada para su firma por la autoridad certificadora RapidSSL. La segunda versión, que tenía el mismo hash MD5, contenía indicadores que indicaban a los navegadores web que lo aceptaran como una autoridad legítima para emitir otros certificados arbitrarios. ^[14]

Inundación de hash

La inundación de hash (también conocida como HashDoS ^[15] ) es un ataque de denegación de servicio que utiliza colisiones de hash para explotar el tiempo de ejecución del peor de los casos (sonda lineal) de las búsquedas de tablas hash . ^[16] Se describió originalmente en 2003. Para ejecutar un ataque de este tipo, el atacante envía al servidor múltiples datos que codifican el mismo valor y luego intenta que el servidor realice búsquedas lentas. Como el enfoque principal de las funciones hash utilizadas en las tablas hash era la velocidad en lugar de la seguridad, la mayoría de los principales lenguajes de programación se vieron afectados, ^[17] y aún aparecen nuevas vulnerabilidades de esta clase una década después de la presentación original. ^[dieciséis]

Para evitar la inundación de hash sin hacer que la función hash sea demasiado compleja, se introducen funciones hash con clave más nuevas , con el objetivo de seguridad de que las colisiones sean difíciles de encontrar mientras se desconozca la clave. Pueden ser más lentos que los hashes anteriores, pero siguen siendo mucho más fáciles de calcular que los hashes criptográficos. A partir de 2021, SipHash (2012) de Jean-Philippe Aumasson y Daniel J. Bernstein es la función hash más utilizada en esta clase. ^[18] (Los hashes "simples" sin clave siguen siendo seguros de usar siempre que la tabla hash de la aplicación no sea controlable desde el exterior).

Es posible realizar un ataque análogo para llenar los filtros Bloom utilizando un ataque de preimagen (parcial). ^[19]

Ver también

Compatibilidad con los rompecabezas

Referencias

^ ab Xiaoyun Wang, Dengguo Feng, Xuejia Lai, Hongbo Yu: Colisiones para funciones hash MD4, MD5, HAVAL-128 y RIPEMD, Cryptology ePrint Archive Report 2004/199, 16 de agosto de 2004, revisado el 17 de agosto de 2004. Consultado el 27 de julio de 2008. .
^ MMJ Stevens (junio de 2007). "Sobre las colisiones de MD5" (PDF) . [...] podemos encontrar colisiones para MD5 en aproximadamente 2 ^24,1 compresiones para los IHV recomendados, lo que tarda aprox. 6 segundos en un Pentium 4 de 2,6 GHz. {{cite journal}}: Citar diario requiere |journal=( ayuda )
^ Magnus Daum; Stefan suerte . "Hash Collisions (el ataque de mensajes envenenados)". Sesión final de Eurocrypt 2005 . Archivado desde el original el 27 de marzo de 2010.
^ a b C Max Gebhardt; Georg Illies; Werner Schindler (4 de enero de 2017). "Una nota sobre el valor práctico de las colisiones de hash únicos para formatos de archivos especiales" (PDF) . {{cite journal}}: Citar diario requiere |journal=( ayuda )
^ Marc Stevens; Arjen Lenstra; Benne de Weger (30 de noviembre de 2007). "Colisiones de prefijo elegido para MD5 y certificados X.509 en colisión para diferentes identidades". Avances en Criptología - EUROCRYPT 2007 . Apuntes de conferencias sobre informática. vol. 4515. pág. 1. Código Bib : 2007LNCS.4515....1S. doi : 10.1007/978-3-540-72540-4_1 . ISBN 978-3-540-72539-8.
^ Alejandro Sotirov; et al. (30 de diciembre de 2008). "Creación de un certificado de CA fraudulento". Archivado desde el original el 18 de abril de 2012 . Consultado el 7 de octubre de 2009 .
^ "Microsoft publica el aviso de seguridad 2718704". Microsoft . 3 de junio de 2012. Archivado desde el original el 7 de junio de 2012 . Consultado el 4 de junio de 2012 .
^ Marc Stevens (7 de junio de 2012). "El criptoanalista del CWI descubre una nueva variante de ataque criptográfico en el malware Flame Spy". Centrum Wiskunde & Informatica . Consultado el 9 de junio de 2012 .
^ Catalin Cimpanu (13 de mayo de 2019). "Los ataques de colisión SHA-1 ahora son realmente prácticos y un peligro inminente". ZDNet .
^ Gaëtan Leurent; Thomas Peyrin (6 de mayo de 2019). "De colisiones a aplicaciones de colisiones de prefijo elegido a SHA-1 completo" (PDF) .
^ Gaëtan Leurent; Thomas Peyrin (5 de enero de 2020). "SHA-1 es un desastre: primera colisión de prefijo elegido en SHA-1 y aplicación a PGP Web of Trust" (PDF) .
^ "Preguntas y respuestas sobre colisión de hash". Investigación de criptografía Inc. 2005-02-15. Archivado desde el original el 17 de julio de 2008. Debido a la forma en que se utilizan las funciones hash en la construcción HMAC, las técnicas utilizadas en estos ataques recientes no se aplican.
^ Shai Halevi y Hugo Krawczyk, Hashing aleatorio y firmas digitales Archivado el 20 de junio de 2009 en Wayback Machine.
^ Alejandro Sotirov; Marc Stevens; Jacob Appelbaum; Arjen Lenstra; David Molnar; Dag Arne Osvik; Benne de Weger (30 de diciembre de 2008). MD5 se considera dañino hoy en día. Congreso Comunicación del Caos 2008.
^ Falkenberg, Andrés; Mainka, cristiano; Somorovsky, Juraj; Schwenk, Jörg (2013). "Un nuevo enfoque hacia las pruebas de penetración de DoS en servicios web". 2013 IEEE 20ª Conferencia Internacional sobre Servicios Web . págs. 491–498. doi :10.1109/ICWS.2013.72. ISBN 978-0-7695-5025-1. S2CID 17805370.
^ ab "Acerca de esa vulnerabilidad de inundación de hash en Node.js... · V8". v8.dev .
^ Scott A. Crosby y Dan S. Wallach. 2003. Denegación de servicio mediante ataques de complejidad algorítmica. En Actas de la 12ª conferencia sobre el Simposio de seguridad USENIX - Volumen 12 (SSYM'03), vol. 12. Asociación USENIX, Berkeley, CA, EE. UU., 3-3.
^ Jean-Philippe Aumasson y Daniel J. Bernstein (18 de septiembre de 2012). "SipHash: un PRF rápido de entrada corta" (PDF) .
^ Gerbet, Thomas; Kumar, Amrit; Lauradoux, Cédric (12 de noviembre de 2014). El poder de las malas decisiones en los filtros Bloom (informe). INRIA Grenoble.

enlaces externos

"Colisiones significativas", escenarios de ataque para explotar colisiones de hash criptográfico
Generadores de colisiones rápidos MD5 y MD4: Bishop Fox (anteriormente Stach & Liu). Cree colisiones hash MD4 y MD5 utilizando un código nuevo e innovador que mejora las técnicas desarrolladas originalmente por Xiaoyun Wang. Utilizando un Pentium 4 de 1,6 GHz, las colisiones MD5 se pueden generar en un promedio de 45 minutos y las colisiones MD4 se pueden generar en un promedio de 5 segundos. Publicado originalmente el 22 de junio de 2006.