本文,笔者对中科院生物识别与安全技术研究中心主任李子青的演讲进行了要点整理,以最精华的观点,供行业人士参考。
中科院李子青:AI+安防的技术和应用痛点
3月31日,「2018中国人工智能安防峰会」在深圳科兴科学园国际会议中心正式开幕。期间众多AI+安防界重量嘉宾登台发表演讲,让人受益匪浅。本文,笔者对中科院生物识别与安全技术研究中心主任李子青的演讲进行了要点整理,以最精华的观点,供行业人士参考。
李子青,人脸识别和智能视频监控专家,主持了多个国家科学研究项目和重大应用工程项目,在相关领域获准和申请专利10余项。2004年,李子青作为“百人计划”入选者来到中科院自动化所,十一年后,创办AI公司中科奥森,亲自主持了多个重大项目的落地。
动态人脸监控存在的问题
过去虽然安防行业更聚焦在智能视频分析的应用上,但是AI跟安防的结合是持续不断的,早在十多年以前就已经引入了AI,视频结构化、人脸结构化、车辆结构化等,都是安防行业在视频大数据领域最关注的问题。但现在与过去不同的是,深度学习带来的AI第三次浪潮将AI的概念进一步强化,更深刻地影响着安防行业。在智能安防产品中,随着静态人脸识别已经到了尾声阶段,动态人脸监控当前正如火如荼地进行中,但在实际应用中却遇到一些问题:
(1)误报率太高。以业务规模来解释,在某个辖区中有1000路视频抓拍人像,并且只有一个黑名单库,假设每个摄像头每10秒或者5秒抓拍一张人脸,该辖区每秒钟抓拍100张左右的图象,该辖区每天要产生864万张抓拍人脸,跟20万人的在图库比对次数是1.728万亿次。
对动态人脸识别的性能要求,用户希望通过率比较高,例如90%的通过率,在动态人脸监控上面算是较高的水平,意味着它每天的误报个数要少于200个。现在的问题是误报率太高,如果每次都是“狼来了”,那么就算公安用户对新技术的有强烈的需求,也会选择禁用甚至放弃。
(2)没有足够的标注数据去解决问题。去年12月份李开复谈AI和大数据,他的观点是:具有一定规模和质量的数据集成为人工智能行业发展的一大制约。搜狗的CTO杨洪涛说,还没有足够的数据去解决问题。后者的总结是不太准确的,应该是没有足够的标注数据去解决问题,因为当前生产环节的数据是海量的,就像刚才描述的公安生产环节的数据并不少。
李开复说,人工标注这些东西是不解决问题的,必须在真实运用场景里得到闭环回馈的标注,才能真正地解决AI与大数据的问题。现在行业做深度引擎开发的都遇到了这样的问题。
这就引出了当前技术和应用的痛点所在,深度学习是需要大数据训练的,但是人工标注费时费力,在这方面标注的资源非常有限。行业里听说,商汤每个月都要花费几百万来做标注,因此深度学习还有一定的发展空间,但是不管是提升算法、改进网络架构,还是通过增大数据标注的方式,提升的空间都不会太大,因为它已经接近天花板。所以行业必须在这方面突破——必须像李开复说的那样,要形成应用场景的数据闭环,能够利用生产环节的大数据进行自主标注、自主学习。
未来AI+安防的趋势
从应用来讲,动态识别的误报率太高,大数据的资源应用没有充分的利用起来,研发单位不管是公司还是其他,只能选择在公安现场去训练,或者通过一些手段把数据拷下来,自己标注、加工,来提升核心引擎。
从数据源头来讲,在传感器方面,仍然是受到了暗光、强光和逆光的影响,虽然行业现在有宽动态、星光型的摄像机,但是这仍然是一个问题。未来的发展趋势就是3D传感器,从Kinect到iphoneX到Lidar,这是另外一个趋势,对二维的识别进行补充。 最后李子青结合中科奥森的新技术,谈了AI+安防未来的技术趋势: