据眼控科技人工智能研究院消息,全国首个道路交通车辆检测、追踪及跨镜识别EM-VEHICLE基准数据集于近期正式发布,填补了国内多目标多相机道路交通车辆追踪任务数据集的空白。
近年来,以深度学习为代表的人工智能技术,在道路交通领域得到了广泛的应用,而这些新技术的研究无不依赖于大量的交通数据。截止到2020年,全球约有10亿部视频监控设备(摄像头)应用于道路交通领域。这些设备每天都会获取大量的视频数据,然而这些数据普遍存在缺少标签、缺乏关联性、分辨率低等问题,难以直接应用于深度学习模型的训练。
基于公司业务需求,并为了解决上述问题,眼控科技人工智能研究院道路交通事业部创建了一个高质量的车辆数据集——EM-VEHICLE基准数据集。该基准数据集包含多个子数据集,能够用于训练模型完成道路交通监管领域车辆检测、车辆分类、多目标单相机(MTSC)追踪、多目标多相机(MTMC)追踪、视频车辆跨镜识别(Video-based Vehicles ReID)等多项任务。
(a)多目标单相机(MTSC)车辆追踪
(b)多目标多相机(MTMC)车辆追踪及车辆跨镜识别
图1 数据集实例
在上述的识别任务当中,EM-VEHICLE数据集主打的是多目标多相机(MTMC)检测追踪任务及视频车辆跨镜识别(ReID)任务。其中,针对多目标多相机(MTMC)检测追踪任务,眼控科技EM-VEHICLE提供的数据与当前已公开的质量最高的数据集CityFlow对标,且相较于CityFlow, EM-VEHICLE的优势在于具有更为复杂和多样的道路场景。例如,在场景多样性方面,CityFlow的数据仅限于白天且光照条件较好的场景,而EM-VEHICLE则涵盖了白天、夜晚、晴天、雨天、多云等多种不同场景;在场景复杂性方面,CityFlow以美国道路作为场景,以机动车目标为主,而EM-VEHICLE则是以中国道路为实际场景,路况更为复杂,除了机动车,还有大量行人与非机动车的干扰,识别任务具有更高的挑战性。
EM-VEHICLE数据集囊括了从全国多个省、市(河南、山东、辽宁、上海等)采集到的道路监控视频数据,第一个版本(EM-VEHICLE V1)中的数据集包含了42个视频序列,近50,000帧视频图像和近400,000个检测框。除了对车辆及车牌位置进行了标注之外,还标注了多种车辆属性,包括车辆类型、车辆颜色、车辆品牌、遮挡率、截断率、光照强度等,可以满足不同场景、类型的道路交通车辆识别模型训练的需求。
图2 数据集车辆属性统计
目前,眼控科技人工智能研究院正在对EM-VEHICLE基准数据集进行模型自动评估和原始数据的进一步校正。下一步将基于EM-VEHICLE数据集,在计算机视觉领域的顶级会议中开展专题研讨会(workshop)和发表论文,并联合高校举办各类道路交通相关的识别任务竞赛。眼控科技人工智能研究院表示,希望EM-VEHICLE数据集能够推动人工智能技术在道路交通领域的发展,并为眼控科技深耕智慧交通领域的发展战略提供助力。