机器学习有用但也没那么神奇 AWS两大基于机器学习的安全服务上线

作者：nana 日期：2017年12月26日阅：5,391

AWS新服务GuardDuty和Macie，释放了机器学习在保护数据安全上的巨大能量。但您的企业适合采用这两种服务吗？

启用基于机器学习的云安全工具，比如AWS新服务GuardDuty和Macie，是AWS客户无需花费脑筋的自然选择。开启这些功能将会提升攻击难度，拦下一大部分攻击者，但无法抵御高端对手。

AWS Macie 于今年8月发布，在用户的亚马逊S3存储桶内容上训练，重点检测PCI、HIPAA、GDPR合规问题，发现可疑活动时向客户发出警报。AWS GuardDuty 是11月底发布的一项补充服务，采用机器学习分析 AWS CloudTrail、VPC Flow Logs 及 AWS DNS 日志。与Macie类似，GuardDuty也专注于异常检测，向用户报告可疑活动。

从技术角度来说，这简直令人惊艳。横向平台提供这样的服务，是其他人无法比肩的。

——《机器学习与安全》作者克拉伦斯·池奥

机器学习模型由算法和训练数据构成，其有效性取决于训练数据的优劣。这也是为什么基于机器学习的云安全更为卓越的原因所在。像亚马逊这样的云提供商，拥有对其整个网络的可见性，在训练机器学习模型分辨正常事务与恶意活动上更为便捷。算法从来不会保密太久或是什么长期专利，但数据源却是任何此类产品最宝贵的资产。

虽然企业间威胁情报共享变得越来越普遍，但单个企业可获得的数据的质量，远远及不上亚马逊之类的云提供商。这种有用威胁情报的集中，可能加速企业从数据中心迁移到云端的步伐。

不过，优势明显的同时，陷阱也是存在的。

机器学习提升了攻击难度

机器学习模型的优劣取决于其训练数据，但这也意味着对从未见过的东西——所谓“黑天鹅事件”，该模型不太有效。实事上，媒体对机器学习的描述有很多谬误。如果拨开所有炒作迷雾，机器学习给你的是自动化——你给它数据，它告诉你该找什么，而不是交给人类员工去仔细审查所有数据。

AWS首席信息安全官史蒂芬·施密特表示：“通过采用机器学习理解每家企业的内容和用户行为，亚马逊Macie可以洞穿海量数据，提供更好的可见性和更准确的警报，让客户得以专心保护敏感信息，而无需浪费时间去查找。”

Macie和GuardDuty这样的服务，能很好地捕获S3存储桶配置不当之类的低级错误，有效消除企业云数据面临的威胁。2017年发生的很多数据泄露事件，比如美国陆军/NSA情报与安全司令部(INSCOM)机密文件、美国选民数百万数据分析记录的曝光，以及威瑞森数据泄露事件，都可以由亚马逊基于机器学习的新云安全服务加以有效预防。

但同时，专家警告，机器学习对自适应敌手的分类，仍是未解决的问题；基于机器学习的云安全措施，对高端对手不太有效。

比如说，机器学习概率性分类恶意软件的能力，比之要么匹配要么不匹配的传统杀软恶意软件签名，是个巨大的进步。但基于机器学习的恶意软件检测，只能在一定程度上对不确定性进行分类。例如，“该可执行文件有80%的可能性是恶意的”。然后将该文件转给人类分析师做进一步检查。

专家警告，机器学习用于检测恶意活动仍处在起步阶段，尽管基于机器学习的云安全提升了攻击难度，该方法对攻击手段灵活多变的高端对手依然无效。异常检测说起来容易做起来难，总要在真正警报和误报率上做出平衡取舍。发现“异常”很容易，问题是几乎所有事情在某种意义上都是异常的。从异常中梳理出恶意事件，才是真正的挑战。

自适应对手什么样？

12月初发表的尖端研究中，麻省理工学院的研究人员展现了骗过谷歌InceptionV3机器学习图像分类器的能力。研究人员3D打印了一只海龟，从任何可能角度骗过了该机器学习模型，让其将之分类为一把来复枪。

如果在学校的研究人员都能骗过谷歌的尖端机器学习模型，基本可以想见，民族国家情报机构可能早已掌握该能力，并以之愚弄用于检测恶意网络活动的机器学习模型了。

或许你的威胁模型中没包括民族国家黑客，或者说你觉得自己不需要担心这个。但正如安全专家布鲁斯·施奈尔常说的，今天的学院派攻击，就是昨天的民族国家攻击，也是明天的犯罪攻击。攻击只会随时间进程越来越容易，从不会变得更难以执行。因此，我们可以预测，中期而言，普通罪犯都将能够骗你过基于机器学习的安全工具。

这并不意味着亚马逊的Macie和GuardDuty就没有价值，正好相反，防御性安全就是要提升攻击成本和难度，而这些基于机器学习的安全工具恰恰提供这一点。

拒绝炒作

机器学习与安全的交汇涌起了太多泡沫，我们需要理性视之。不要成为不加批判的狂热者(“AI是我们的救世主！”)，也不要成为虚无主义的悲观者(“机器学习就是垃圾！”)。良莠不分全盘否定不是明智的做法，应教育用户提出问题，教育营销人员回答这些问题。

攻击速度只会越来越快，威胁情报总量只会越来越大。实时威胁评估及响应需要自动化。无论喜不喜欢，机器学习都将存在。

相关阅读

机器学习的能与不能

引入机器学习前需要先弄明白这三件事

机器学习作用于信息安全的五大顶级案例

关键词:

申明：本文系厂商投稿收录，所涉观点不代表安全牛立场！

2017年网络安全大事记

华盛顿视频监控网络被罗马尼亚黑客大范围控制

申明：本文系厂商投稿收录，所涉观点不代表安全牛立场！

nana

相关文章

OPSWAT 加入AWS独立软件供应商加速计划

用AI攻击AI？对抗性机器学习的威胁与防御

机器学习在数据安全感知系统的应用

申明：本文系厂商投稿收录，所涉观点不代表安全牛立场！

相关文章

登录

注册账号