5月16日,今日头条通过官方微头条宣布,“灵犬反低俗助手”日前已经完成服务升级,新增反色情短文本模型和反谩骂模型,将准确率从73%提升至82%,提高了9个百分点。截至目前,已经有超过60万人次使用“灵犬”小程序,参与打击低俗,净化网络环境。
这是“灵犬”上线以来,第一次大规模更新。“灵犬”于2018年4月8日正式上线,是国内首款人工智能反低俗小程序。“灵犬”只需要一段文字或文章链接,就能检测内容健康指数,并返回鉴定结果,包括:是否可以获得算法推荐,是否需要引入人工判断等。对于用户输入的内容,“灵犬”会先进行提取、分词和语义识别,然后根据算法规则,输出对应的分数、评级和结论。这一切,都在短短几秒内完成。
移动互联网时代,海量内容创作的快速增长,给内容识别带来很大挑战。“开放灵犬,是为了汇聚全民力量打击低俗。我们希望升级服务,更好地帮助用户检测低俗信息,共同营造清朗的网络空间。”今日头条总编辑张辅评称。
对于人工智能,目前开展反低俗工作至少有三个难点:一是识别“内涵色情”,这类场景需要联想能力,对机器学习要求很高;二是短文本识别,一般来说,机器接收的上下文、语境越充分,判断准确度才会越高;三是对书面语和口头语的分辨,相比规范的书面语,口头语很随意,变化程度大,较难识别。
据张辅评介绍,为了解决以上难点,“灵犬”制定了专门的低俗分类标准,并新建反色情短文本模型,学习了近万个标准案例,重点加强对短文本、色情、内涵色情的识别,同时注意口语语言和标题语言两个维度的覆盖。“灵犬”还新建反谩骂模型,加强对谩骂内容的识别。
基于人工智能模型的训练路径:“收集数据-标注样本-训练模型”,在反复训练中,灵犬会变得越来越聪明。“灵犬”还设有专门的“反馈有奖”入口,鼓励网民积极反馈,提供“灵犬”识别不准确的案例或任何改善意见建议,并给予实物奖励。
今日头条方面表示,目前在内容审核方面,除了配备“灵犬”等,包括色情、低俗、标题党、虚假信息、低质模型在内的180多个人工智能模型,今日头条还投入了6000多人的专业审核团队,结合人工、技术手段,致力于提升内容审核的效率和准确度。