您现在的位置:首页 >> IT >> 正文
百度设“年关”:人工日审两千万,违规信息难过筛
发表时间:2016年2月1日 13:34 来源:新科技 责任编辑:编 辑:麒麟

今天是小年,不少人都提前开始了休假,踏上了回家的路途。然而,在这个城市里,还有很多人尽职尽责的坚守在工作岗位上,比如维护治安的公安干警、清洁城市的环保工人……不过很多人不知道的是,还有一个特殊的群体,尽管年关将至仍在日以继夜的工作,他们就是百度的审核人员。日前,记者走访了百度总部,为大家揭开这个特殊群体的神秘面纱。

年关将至不放松 每天人工审核量两千万

虽然已快要立春,但北京的夜晚还是寒气逼人,温度在零度以下,随处可见结凝的路面。位于北五环的西二旗,是全球最大中文搜索引擎百度的公司总部,在晚间依然灯火通明,而在楼下则是成排的出租车,他们告诉记者都在等待下班的百度员工,其中不少是“审核的”。百度审核人员有这么忙?他们都要审核哪些内容?审核过程中有哪些困难?带着这些问题,记者采访了相关人员。

据百度工作人员介绍,针对推广信息的审核首先量极其大,平均每天送审的文字推广信息就有4.7亿条,相当于每秒钟5000条,其中机器自动审核率为95%,其余都需要人工过审;而图片推广信息也达到每天30万条,因为图片的特殊性50%需要人工过审。记者也简单计算了一下,人工过审的文字推广信息有2350万,图片15万,确实是 “Mission Impossible(不可能的任务)”。“我们现在还新增了60人的审查团队,在机器和人工审核的基础上又增加了一道程序,实现‘三道保险’,目的就是严密杜绝虚假信息对大家的危害。”百度工作人员说到。

和虚假信息斗智斗勇 至今屏蔽有害信息38亿

这么高强度的人工审核有必要吗?“有必要的,因为现在很多客户都很‘聪明’,会利用物料技术漏洞试图作弊,在审查的时候是正常的,但在展示的时候却不正常。举个例子说,一个白天看起来合规的钢材推广信息,到了晚上它就变成了低俗信息。”百度审核一位负责人对记者解释道,那么百度有什么举措呢?“相应的,我们的技术人员也升级了Flash物料代码解析模块,主动发现‘不应出现’的外链或php脚本,而且对于Binary深度加密物料都一概拒绝。对于机器不好判断的,我们就人工审核,保证推广信息都合规合法、无不良内容。”

百度审核人员的努力也没有白费,数据显示,截至目前百度共封禁Flash账户超1.5万个,涉及Flash物料数超570万条,大大维护了网络搜索的健康环境。在审核人员的工作中,也遇到了不少“奇葩”难题,比如通过变体字形仿冒正牌产品。“因为涉及欺诈,我们对‘微信’、‘转账’之类的风险词进行了控制,但不少不良客户利用字符变形的形式如‘微|信’、‘微1信’等继续欺诈行为,故而我们也会对变体形式进行系统防控,避免广大网友掉入此类陷阱。”经过百度人员的介绍后,记者也现场尝试了一下,进行一些知名产品搜索果然没有发现“山寨货”。

在采访完成后,记者也不由得感慨,百度审核真是一个辛苦的工作,但它却又极其重要,正是这些审核人员日以继夜的辛勤工作,让大量的虚假推广信息得到杜绝。数据显示,百度至今屏蔽的有害链接超过38亿条,站点级别超过1亿个,光2014至2015年间,百度主动拒绝的广告量就有5亿条。在未来,我们也希望百度在打击有害信息的道路上坚持下去,和相关执法部门、广大网友一起共建绿色健康的网络环境。

相关文章
关于我们 | 联系我们 | 友情链接 | 版权声明
新科技网络【京ICP备15027068号】
Copyright © 2015 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。