Collection #1 es el nombre de un conjunto de direcciones de correo electrónico y contraseñas que aparecieron en la dark web alrededor de enero de 2019. La base de datos contiene más de 773 millones de direcciones de correo electrónico únicas y 21 millones de contraseñas únicas, lo que da como resultado más de 2.700 millones de pares de correo electrónico/contraseña. La lista, revisada por expertos en seguridad informática, contiene direcciones y contraseñas expuestas de más de 2000 violaciones de datos anteriores, así como aproximadamente 140 millones de nuevas direcciones de correo electrónico y 10 millones de nuevas contraseñas de fuentes previamente desconocidas, y en conjunto la convierte en la mayor violación de datos en Internet. [1] [2]
La Colección #1 fue descubierta por el investigador de seguridad Troy Hunt , fundador de " Have I Been Pwned? ", un sitio web que permite a los usuarios buscar sus direcciones de correo electrónico y contraseñas para saber si alguna de ellas ha aparecido en una filtración de datos conocida. [3] La base de datos se había publicado brevemente en Mega en enero de 2019, y los enlaces a la base de datos se publicaron en un popular foro de hackers. Hunt descubrió que la oferta contenía 87 gigabytes de datos en 12.000 archivos. Este descubrimiento no solo fue preocupante para Hunt, sino que además descubrió que las contraseñas estaban disponibles en formato de texto sin formato en lugar de en su versión hash . Esto implicaba que los creadores de esta base de datos habían podido descifrar con éxito los hashes de estas contraseñas a partir de una implementación débil de algoritmos hash. [2] Los investigadores de seguridad notaron que, a diferencia de otras listas de nombres de usuario/contraseñas que generalmente se venden en la web oscura, la Colección #1 estaba disponible temporalmente sin costo y potencialmente podría ser utilizada por una mayor cantidad de agentes maliciosos, principalmente para el relleno de credenciales . [2]
Para el 30 de enero de 2019, los investigadores de seguridad observaron que conjuntos de datos similares, denominados Colecciones n.° 2 a n.° 5, se habían visto a la venta en la red oscura. Las Colecciones n.° 2 a 5 incluían más de 845 gigabytes de datos, con un total de 25 mil millones de registros de correo electrónico y contraseña. Los investigadores de seguridad del Instituto Hasso Plattner estimaron que las Colecciones n.° 2 a 5, después de eliminar los duplicados, tienen aproximadamente tres veces más datos que la Colección n.° 1. [4] Se descubrió que muchos de los pares de correo electrónico y contraseña de la colección provenían de infracciones anteriores, incluidas las infracciones de datos de Yahoo! y las infracciones de LinkedIn y Dropbox . [4]
Según la firma de inteligencia de amenazas IntSights, las colecciones n.° 1 a n.° 5 habían sido compiladas por un pirata informático conocido como Sanix; sin embargo, los datos fueron filtrados en línea por un corredor de datos rival conocido como Azatej. [5] Ambos piratas informáticos fueron arrestados en mayo de 2020. Azatej fue arrestado en Polonia [6] y Sanix en Ucrania. [7]