“傍上”机器学习 看亚信安全运用第三代技术破解安全难题
本篇文章2425字,读完约6分钟
现在说人们担心人工智能的到来会对人类构成威胁还为时过早。事实上,利用人工智能和机器学习来解决网络和信息安全问题已经成为现实。自去年以来,机器学习的概念已经逐渐被网络安全行业所接受。越来越多的安全供应商推出了基于人工智能的安全解决方案,甚至许多初创的安全公司也将机器学习和人工智能视为杀手。在中国,亚洲信息安全是人工智能和机器学习在安全方案研究中最活跃的一个,这可以从最近的c3安全峰会的主题中看出。
事实上,人工智能在网络安全中的应用一直存在争议。悲观主义者认为,因为机器学习是在寻找相似性,没有足够的恶意访问和攻击样本,所以没有办法训练,而且安全防护经常被分成行业场景,所以机器学习很难区分和处理。激进分子认为,是时候利用人工智能和机器学习来摆脱上世纪90年代基于签名和哈希算法的旧方法了。
作为国内重量级安全制造商,亚信安全对人工智能的态度较为温和。亚信安全综合安全产品中心总经理、亚信网络安全产业技术研究院副院长童宁表示,人工智能和机器学习无疑正在推动网络安全的发展。但是,亚信安全不会放弃基于签名比较的第一代技术和基于行为分析的第二代技术,它们的结合在应对安全风险方面更有效。
使用机器学习正确的姿势来解决安全问题
事实上,谈到机器学习,我们首先接触到它的两种主流学习方法:监督学习和非监督学习。
监督学习通过现有的训练样本(即已知数据及其相应的输出)进行训练,从而获得最优模型。然后,利用该模型将所有新的数据样本映射到相应的输出结果,并对输出结果进行简单判断,达到分类的目的。无监督学习从无标记的训练数据中推断出结论。最典型的无监督学习是聚类分析,它可以在探索性数据分析阶段发现隐藏模式或分组数据。无监督学习可以监控一些异常行为,也可以用于关联分析领域。
机器学习技术在安全领域成功的关键是什么?童宁的结论是,第一,连续的高质量安全数据,因为网络环境是不断变化的,所以机器应该和人一样老,并且学会保证它的学习能力。第二,必须有网络安全领域的专家。完全由网络安全专家来判断机器应该提取哪些特征用于学习。第三,机器学习中必须有数据专家,包括模型和算法的建立。
机器学习的安全应用
你可能对机器学习的安全应用有疑问。首先,从监督学习的角度来看,有必要回顾一下我们过去是如何识别威胁的。过去,基于特征的威胁识别技术的发展经历了三个阶段:
道路一维特征,黑白列表(文件、ip、域名等)(
道路二维特征、字符串匹配或应用于匹配的其他正则表达式(ips、dlp)
道路多维特征,结合包括行为特征在内的多种特征来确定可疑对象(apt沙箱分析、网络行为监控)
当然,用于识别威胁的多维特征越多,其含义就越准确,但这是一件非常耗费资源的事情,开销太大且效率低下。
亚信安全综合安全产品中心总经理、亚信网络安全产业技术研究院副院长童宁
在监督学习的应用中,它是一种高效的多维特征发现。童宁介绍了监督学习的应用过程:第一,数据准备;二是特征提取,安全专家找出与威胁最相关的特征,数据专家通过数学方法学习反映家族性的特征组合,不同的特征对家族性的权重不同;三是算法的选择,安全领域主要采用分类算法;第四,制造商网络研究;第五,通过连续学习优化算法生成N维特征组合模型;最后,将其应用于客户的实际防御系统。
监督学习带来了多维识别能力,其速度和效率都有了很大提高。然而,它也面临着挑战:第一,模型的新鲜感,由于威胁演变非常迅速,因此有必要保证训练数据的更新能力。二是分类识别的准确率和误判率管理,主要包括准确率和召回率两个指标。
准确率和召回率是许多所谓的人工智能安全厂商不敢直接谈论的话题。准确率指的是正确的程度,召回率指的是遗漏的程度。用童宁的话说,假设总共有100个文件,包括10个恶意文件。如果人工智能发现其中的5个并且它们都是正确的,那么准确率是100%,召回率是50%。如果人工智能发现其中的20个,包括10个恶意文件,准确率为50%,召回率为100%。也许有些制造商说我的人工智能安全准确率是100%,这没有错,但这是片面的。
童宁承认,在实践监督学习时,亚信安全一直在平衡正确率和召回率。总有一定的出错率。前后不可能达到100%。我们现在正在做的是如何把它控制在可控范围内。
纵观无监督学习的应用,过去基于特征的威胁管理已经不能满足安全需求,传统的异常检测技术通过建立行为基线给出了过多的误报,客户发现未知威胁的需求大大增加。无监督学习主要来源于客户环境中的数据,特征提取主要针对客户环境中的网络流量、业务流量和审计流量。聚类算法和关联分析算法基本上用于客户网络的学习,模型通常被设计成一个集中的简单模型,以避免过度的误判。最后,通过连续学习优化算法生成各种基线聚类,从而定义正常行为并发现异常行为。
无监督学习通常用于反欺诈、异常检测、攻击检测、行为分析(uba)等。但它也面临挑战,比如如何保持建模学习所用的数据不受干扰,避免中毒攻击;客户环境下的建模学习通常需要几周甚至几个月的时间,制造商的投入成本相对较高;客户无法持续运行和维护,型号更新缓慢。
因此,用户对机器学习安全技术有不同的反应,有人拒绝,有人相信,有人谨慎。
亚洲信息安全在机器学习中的实践
据报道,亚信安全基于人工智能的安全引擎在数据、特征识别、算法、模型等方面都有很深的积累。亚信安全防毒墙网络版12采用了跨代集成技术,实现了人工智能机器学习技术和其他保护技术的集成和创新。
童宁指出,在监督学习方面,亚信安全利用它来防止和控制恶意程序和软件,以及防止和控制垃圾邮件。在无监督学习方面,亚信安全公司已经将机器学习应用于uba、情境感知和反欺诈产品。
当然,作为一家在安全领域积累了多年技术的安全厂商,亚信安全将不再依赖人工智能和机器学习,而是向他人学习,整合和创新基于特征码比较的第一代技术、基于行为分析的第二代技术和基于机器学习的第三代技术,确保为用户提供高效的安全服务。
标题:“傍上”机器学习 看亚信安全运用第三代技术破解安全难题
地址:http://www.f3wl.com/fsxw/14022.html
免责声明:佛山日报致力于打造最全面最及时的佛山新闻网,部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,佛山日报的作者将予以删除。