数据分析人员的盛宴 “HIBP”14亿条记录网上公布
作者: 日期:2016年12月07日 阅:3,656

“Have I Been Pwned”网站成立三周年了,安全研究人员 Troy Hunt 想为全世界的安全人员带来点福利,于是决定把网站的绝大部分数据共享出来。

311568d2d9c3a8b35e956d7239fc0dd4

Hunt表示,分享这些数据是为了研究人员做分析,不想给任何人带来风险。由于担心有人受到伤害,Hunt去掉了数据集中的三项敏感信息:

1. 所有的个人身份信息;
2. 所有账户的域名;
3. 所有敏感的数据泄露信息

所有的账户信息本来是以下面的形式存储在 Azure Table Storage 中:

{“Partition”:”hotmail.com”,”Key”:”troyhunt”,”Websites”:”000webhost;Adobe;Dropbox;GeekedIn;LinkedIn;Patreon;Plex;Tumblr”,”Timestamp”:”2016-11-16T08:36:51.1806398Z”}

删掉敏感信息后就成了下面这个样子:

000webhost;Adobe;Dropbox;GeekedIn;LinkedIn;Patreon;Plex;Tumblr

上面的数据共有1,431,112,732行(有冗余),文件约15.3G大小。

一些数字:

1,989,141,353 –
“HIBP”当前的账户数量,包括用户名。如Snapchat的460万条记录,但没有邮件地址。

1,574,694,164 –
电子邮件地址数量,但不包括用户名。

1,431,112,732 –
包括更多账户的电子邮件地址,但去除了敏感信息。

2,399,307 –
网站账户组合数量。

分析人员可以把数据整合成下面的标准形式:

bfb0d537d224f6431aac80447986d42f

 

torrent下载链接:

https://haveibeenpwned.com/HIBP%20Consolidated%20and%20Anonymised%20Data.torrent

磁力链:

magnet:?xt=urn:btih:97C585A73AE62A81E5A562237A1B33301F70C51D&dn=HIBP%20Consolidated%20and%20Anonymised%20Data.zip&tr=udp%3a%2f%2fexodus.desync.com%3a6969%2fannounce&tr=udp%3a%2f%2f9.rarbg.to%3a2780%2fannounce&tr=udp%3a%2f%2ftracker.openbittorrent.com%3a80&tr=udp%3a%2f%2fcoppersurfer.tk%3a6969%2fannounce&tr=udp%3a%2f%2fopen.demonii.com%3a1337%2fannounce&tr=udp%3a%2f%2f9.rarbg.com%3a2770%2fannounce&tr=udp%3a%2f%2f9.rarbg.me%3a2790%2fannounce&tr=udp%3a%2f%2fglotorrents.pw%3a6969%2fannounce

申明:本文系厂商投稿收录,所涉观点不代表安全牛立场!


相关文章