您现在的位置:首页 >> 新•资讯 >> 正文
网络骗子哪里跑?AI把你揪出来
发表时间:2017年9月12日 20:16 来源:DataVisor 责任编辑:编 辑:麒麟

“黑色产业”这个词,听着离我们很遥远,实际上就潜伏在我们身边:钻网购赔付规则 洞、团购套现、僵尸号灌水或反复抽奖、网上社交平台账号被黑后待价而沽等等,不一而足。

拿刷单举例:卖家用储蓄卡垫给刷单者支付用,刷单者下单后留好评,之后退款。根据刷单者账号的质量,每单能挣 6-10 元。网上有些搜索率高的产品,例如茶叶、减肥、卫浴等,排名靠前的大多数都有刷单的成分。

就连最近很火爆的以太坊也难逃魔爪:据彭博报道,在加密货币电子犯罪领域,与以太坊相关的电子诈骗就达到了 2.2 亿美元,参加交易的每十个人就有一位网络诈骗的受害者。

然而,这些都只是窝藏在网络之下庞大黑产的冰山一角:据估计,每年全球网络黑产规模达到了 500 亿美元!换句话说,黑色产业 25 天的规模就抵得上美国总统特朗普攒了一辈子的全部身家了!

规模这么大,难怪网络诈骗者变着花样也要骗!今天小探就带你看看这些网络诈骗者究竟都动了哪些歪脑筋?

骗子不是神对手

位于硅谷山景城的 DataVisor 是打击网络欺诈领域的领头公司。它最大的特点就是运用无监督的机器学习,在欺诈发生最初期、甚至欺诈发生之前就把欺诈者揪出来。听上去是不是有点像《少数派报告》里的情节?不过,他们的无监督学习算法的“误杀率”可是比电影里的还要低。

到底什么是无监督学习?别急,小探先来带你了解一下无监督学习的前辈,“有监督学习”。

DataVisor 创始人之一、CEO Yinglian Xie 博士介绍说,有监督的机器学习是现有系统里两大类的一种(另一种是规则系统)。简单来说,有监督的机器学习就是系统收集些有标签的数据,判断出好人长什么样,坏人长什么样,再根据这个调试。其挑战在于要做特例工程(feature engineering), 要把判断标准调得很贴切。

对于有监督的机器学习来说,另一个挑战是系统收集的训练数据集要好。但是,诈骗无时不刻在发生,标签得到的数据都是过去的数据,疲于应战、只能防守,不仅被诈骗者牵着鼻子走,而且往往模型离线时调得很好,一上线就不行了。Yinglian Xie 说,用有监督学习,由于依赖已有标签,从根本上就存在这个缺陷。

那什么又是规则系统呢?以前有什么样的攻击,系统就制定一些规则:这么做就是好人,那么做就是坏人,用规则调开。然而,这种方式的缺点是手动成本比较高,而且比较被动,总是在亡羊补牢。

DataVisor 创始人兼 CTO Fang Yu(左)和 DataVisor 创始人兼CEO Yinglian Xie(右)

无监督算法则弥补了这两个缺点,对于新型的、未知的、不断变换的攻击,它需要自动适应、自动调整的过程,而且要抓得早,要在刚刚开始之前、还没有被打上标签之前提前就抓住。这种算法是规则系统与有监督机器学习的完美互补;与此同时,它也给有监督的机器学习很快的反馈,帮助有监督的机器学习模型调得更快更好。此外,DataVisor 在无监督的机器学习上还有些自动的规则系统,这也大大降低了人工调试规则的手动成本。

正是“无监督的机器学习”和“在欺诈发生之前就能检测出来”这两大杀手锏的结合,使得 DataVisor 在成立短短几年内就得到了很多大客户的信任:在美国,它的客户包括在线商户点评网站 Yelp 和内容分享网站 Pinterest; 在国内,尽管进入中国市场才刚刚一年时间,DataVisor 也已迅速取得了阿里巴巴集团和社交应用陌陌等大公司的信任。

[1]  [2]  [3]  
相关文章
关于我们 | 联系我们 | 友情链接 | 版权声明
新科技网络【京ICP备15027068号】
Copyright © 2015 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。