据介绍,提高这个新的邮件垃圾邮件过滤器是基于 Google Colab 上的新型开源多语言文本矢量化器 RETVec (弹性高效文本矢量器)。它可以将单词映射成矢量或者数字,识别从而被用来提升垃圾邮件和钓鱼邮件的谷歌识别率,同时降低误报率。部署
由于网络犯罪分子仍然持续创建绕过防御系统的新矢内容,导致当前文本分类模型在识别诈骗和网络钓鱼攻击方面仍存在困难。量算垃圾率谷歌方面声称,大幅钓鱼RETVec 在经过训练之后,提高能够检测并理解“字符级”的邮件操作,包括插入、删除、拼写错误、同音字,同时还能降低计算成本。
根据谷歌自己的统计,将 RETVec 应用到 Gmail 后,垃圾邮件检测率相比以往的过滤器提高 38%、误报率降低 19.4%、张量处理单元 (TPU) 使用率降低了 83.13%。
谷歌方面声称,使用 RETVec 训练的模型表现出更快的推理速度,较小的模型可以降低计算成本并减少延迟,这对于大规模系统和设备上的模型至关重要。
注:该项目现已在 GitHub 上开源,点此跳转
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。
(责任编辑:焦点)