上个月,全国“扫黄打非”办公室作出了新的部署,从3月起开始大力组织开展“净网2019”、“护苗2019”、“秋风2019”等专项行动,持续净化社会文化环境。
据悉,“净网2019”专项行动,将聚焦整治网络色情和低俗问题,通过强化司法打击、行政管理、行业规范、道德约束等多种手段综合施策,综合治理。“护苗2019”专项行动,着重强化网上网下两项整治,坚决查办涉未成年的“黄”“非”案件。其中,将强化对未成年人接触较多的互联网应用的整治,特别对网络短视频、游戏、漫画、学习类APP等领域加强清理,坚决遏制色情、低俗、暴力、恐怖、残酷等有害信息传播。
专项行动的部署,也让一批内容平台进一步承担主体责任,打造或使用第三方内容安全服务,进行自我净化、把识别潜在风险前置。
落实到具体动作时,一些内容平台则有了困惑——图片鉴黄服务,到底哪家实力相对强一点?
下面我们来测评下。
在测评之前想说下,如今内容安全厂商做到拦截特征明显的色情图片只能算是及格,因为当下,不良内容越来越朝着精细化方向发展。只有识别精细化的内容才能真正体现内容安全平台水平,因为这种内容特征提取比较困难。
鉴于此,本次小测评选择了三个类型的内容:隐晦色情、掩盖色情和卡通类不良内容。
那什么是隐晦色情、掩盖色情和卡通类不良内容?隐晦色情,一般是指图片信息具有色情挑逗、暗示意味实足的图片;掩盖色情类,是指图片关键信息被刻意涂改,导致失去特征,一般内容安全平台识别成功率较低;而卡通类,是指由于图像信息量极少,这类图像在内容平台上非常常见,但对内容安全平台挑战特别大,一般无法识别。
测试的平台,笔者选择了四家主流的内容安全平台——百度的图像审核、阿里绿网、腾讯优图和网易易盾。
测试方法,是拿一批不良内容的图片分别过上述四家内容安全平台,平台会返回结果,根据拦截效果来定义哪家平台好。需要指出的是,由于各家返回结果的用词不一致,对于结果在这里统一为三个:“正常”、“嫌疑”、“命中”。
对应的意思是:
l 正常:图片正常,没有不良内容;
l 嫌疑:图片可能存在不良内容;
l 命中:内容安全平台认为该图片存在不良内容
由于笔者找的这批图片均为不良内容的图片,理论上输出的结果应该都是“命中”,最次的结果是“嫌疑”。如果输出结果为“正常”,那就说明该内容安全平台识别不了这种类型图片,识别能力要打问号的。
说了,这么多,我们来看看测试结果吧。
下面先来看下隐晦色情类图片: