鐠猴拷閻炴稏鍎插﹢涓�2闁汇劌瀚幁顐f媴閹剧粯瀵㈤柍銉︽煛閳ь剚姊归崼锟犳嚊閿濆應鍋撳鍛樊闂佽姤顭終闁挎稑鑻妶浠嬪触閸涘﹥鏆柟闈涚С缁ㄣ劑宕℃繝鍌氼潬闁稿⿵鎷�鐠猴拷闁哄棙鍨垫禍锝夋嚃閻樺搫鍓柡鍕尭閸ゎ參姊婚鈧。浠嬫晬鐎圭挶fespace闁烩晛锕﹂弫鎾绘嚕鐏炶棄绨诲ù锝囧У婢э箓鏌呴悩韫樊閹兼潙鍢查妶浠嬪灳濠婂棗浜栭柍銉︾箖閳ь剨鎷�鐠猴拷濡絾鐗曢崹閬嶅箑瑜忛~鏍儘閺冣偓閸ㄦ岸寮稿⿰鎰獥闁告牗銇為崥顐も偓瑙勭箖閻忔岸鎮介悢鍝勨挅缂佷胶鍋熺划锟犳煀閸涘﹥鏆柛鐘插殫IE婵炲矁宕甸弸鐔煎极閸喓浜�鐠猴拷缂佸鍨甸鐔煎箮閵堝牆鈧粙寮ㄩ懡銈嗘闁挎稒宀稿▔锟�4闂佹彃绉垫慨銏ゆ嚃濠靛浂妲荤紒顕€鈧稓鑹惧☉鎾亾闂婎剦鍋嗗▓鎴﹀磻閵夈儳鏆旈梺顐㈠€风粭澶屸偓鐟扮秺閺佸﹥娼婚敓锟�鐠猴拷閻熸瑱缍侀弨锝夌叕椤愶絾缍忕紒鐙呯磿閹﹪寮弶鍟冾參宕濋崠锛勭獥lifespace閻忓繐绻楅幗鎴︽嚈閹殿喗鎶勯柣銏㈠枙瀵宕濋埡鈧紞妯尖偓鍦仧楠炲洨绮旈幋婵愬妳闂婎剦鍋呭ḿ妤冪不閿涘嫭鍊�鐠猴拷濠碘€冲€风紞宥囩矓閹存繍鍔呴梻鍕Х椤㈠懘鎳橀崒锔惧惞濞戞挾绮晶锔藉緞閳哄啫濮ч柟瀛樺姇閸ㄥ酣鎯冮崟顔肩亰闁谎勫劤閻g偟鐥€圭姷婀哥紒淇卞灪濞叉悂鎳楃捄鐑樻妱濞存粌妫滆濞戞搫鎷�鐠猴拷闁哄嫬妫滈崥妯荤▔椤撶偞绂囬悹褍鍚€缁楁繂鈽夊☉宕囩獥缁惧彞绀侀悽顐﹀及椤栨艾鏋庨柡浣哄瀹撲線鎯冮崟顒佷粯濞达絽鍟块悺銊╁磼閵娿倗鐭欓悹鎰舵嫹鐠猴拷濠碘€冲€风紞宥嗘櫠閻愭彃绻侀柛蹇撶Ф閺屽懘宕濆☉宕囧惞婵箍鍊涢崵鏇㈠磹瀹ュ懍娣柧鏂款儑濞呇呭垝婢跺ǹ鍋ㄩ柦鈧妷銉ユ倠闁哄鍎埀顒佺矊婵亪寮ㄩ悜鈹惧亾閿燂拷鐠猴拷Canalys閻犲鍟伴悥娲晬濮橆偉鍘柛銉﹀灊缁辨帗绋夊顒夊殸濞存粌绨肩粭鍌涚閹寸姵鐣遍梻鍥e亾婵懓鍊风划娑㈡倿閺堢數绉甸弶鈺嬫嫹鐠猴拷濠⒀呭仜缁犳瑧鎼鹃敓锟�30% 闁告绨肩拹鐔哥▔婵犲懐娈�2023闁归潧顑嗗┃鈧柛鎴︾細閹伙綁鏌岃箛姘4000濞戞挸娲崕锟�
您现在的位置:首页 >> 新•资讯 >> 正文
京东探索稀疏三维空间点云Global Context论文入选NeurIPS202
发表时间:2020年12月4日 17:24 来源:新科技 责任编 辑:麒麟

近日,第34届神经信息处理系统大会(Conference on Neural Information Processing Systems,简称NeurIPS,NIPS)在线上召开。作为全球顶级的机器学习和计算神经科学会议,今年的NIPS依然受到了学者们的高度关注,甚至由于其线上开放的特性缓解了往年抢票难的问题,而将获得更多的“听众”。

据悉,今年NeurIPS稿件录取率为20.09%,创下历史新低。在如此严苛的录取标准之下,京东AI深度学习与语音语义实验室提交的探索稀疏3D点云Global Context的论文《Group Contextual Encoding for 3D Point Clouds》成功入选。今年以来,京东AI深度学习与语音语义实验室的研究成果频获国际认可,此前还有多篇论文入选国际语音和语言处理顶会比如ACL 2020、AAAI 2020、INTERSPEECH 2020等。

Global Context对视觉感知至关重要,可以根据语义信息提高物体识别的准确率,但目前针对3D点云的Global Context的研究还不够充分,特别是在三维空间的情况下,数据呈现高维、稀疏的特点,对传统深度学习算法提出了挑战。因此,京东AI研究院基于其研究实习生计划与东京大学合作了《Group Contextual Encoding for 3D Point Clouds》,针对这一研究领域提出了Group Contextual Encoding的Global Context学习方法。

从目前已有3D点云Global Context的研究成果来看,比如LG-PointNet++ 【1】,其复杂度为,N是输入点的个数。当场景复杂时,输入点数较多会导致耗费相当大的算力。Contextual Encoding Layer【2】的复杂度是,是一种有效率的方法,K是该方法里code word数目。但是点云数据稀疏导致的过拟合现象(overfitting),会影响性能的提升,导致在ScanNet,SUN-RGBD数据集上3D检测性能随着Code word数目K的增长,性能却很快就饱和不再增长。虽然目前有一些深度补全的算法可以解决数据稀疏这个问题,但是这些算法都存在结构复杂、耗费计算资源的问题,因此,京东AI研究院决定探索简单有效的方法。

首先要解决数据的稀疏问题。通过把特征通道分组,从而获得更多的等效数据,如图1所示,如果把通道分成G组特征子向量,数据就相对应增广了G倍。再将分组后的特征子向量通过Encoding layer得到Global context,从而有利于在分组后的特征子空间学习全局上下文, 然后通过channel attention的形式作用于分组后的特征。最后通过Concat操作恢复为原特征的尺寸。如此操作既解决了数据的稀疏问题,又解决算法结构复杂、算力耗费巨大的问题。

图1:Group Contextual Encoding方法图。

随后,京东AI研究院又将这种方法在多个3D数集上进行验证,不仅证实这种方法简单有效,还刷新了SOTA方法的性能。将这种方法应用在PointNet++ Backbone上,并部署到VoteNet模型。如表1所示,在ScanNet数据集以mAP@0.25指标测评时,该方法领先VoteNet 【3】 2.2mAP,增幅已然明显,但更令人惊喜的是,在更加严格的mAP@0.5 的指标下,如表2所示,该方法领先Waymo、Facebook AI Research以及Stanford大学提出的 VoteNet高达6.57 mAP,可视化结果如图2所示。

表1:ScanNet数据集mAP@0.25评测指标的结果。

表2:ScanNet数据集mAP@0.5评测指标的结果。

图2:ScanNet数据集的结果可视图。在SUN-RGBD数据集,我们的方法也领先VoteNet 3mAP,具体定量以及定性结果如表3和图3所示。

表3:SUN-RGBD数据集mAP@0.25评测指标的结果.

图3:SUN-RGBD数据集的结果可视图。

京东自2017年开始全面向技术转型,用技术重塑了京东的生态系统,逐渐突破零售边界,拓展至数字科技、物流、健康等众多领域。一直以来,消费者们更多的在购物、物流等环节体验到京东技术的进步,如今,京东在人工智能领域的长足进展不仅获得学术界的认可,也逐渐被更多的用户所知悉,京东的智能语音技术也已经在智能外呼机器人、客服语音机器人等电话交互场景中实现成熟应用,此次提出的Group Contextual Encoding方法也可以应用在下游的AR(增强现实)、MR(混合现实)以及机器人,自动驾驶等领域,推动这些领域的发展。京东技术将不仅赋能金融、医疗、教育、健康等行业,还将在更多领域为用户提供便利。

参考文献

【1】Wang, Xu, Jingming He, and Lin Ma. "Exploiting Local and Global Structure for Point Cloud Semantic Segmentation with Contextual Point Representations." Advances in Neural Information Processing Systems. 2019.

【2】Zhang, Hang, et al. "Context encoding for semantic segmentation." Proceedings of the IEEE conference on Computer Vision and Pattern Recognition. 2018.

【3】Qi, Charles R., et al. "Deep hough voting for 3d object detection in point clouds." Proceedings of the IEEE International Conference on Computer Vision. 2019

高层访谈
雷军:推进“5G+AIoT”超级互联网
小米提出“手机+AIoT”的双引擎战略,目前已证明成效显著。截至到今年6月30日,小米依然是全球..
杨元庆:联想已成立疫情防控小组 并且做好了打大仗的准备
宏观上说,我们是为国家和全人类而战。过去三四十年来,中国已经成长为世界的工厂,为全球各地..
观点态度
5G毫米波网速优势显现,少了高速路的5G不完整
随着5G网络目前在全球各地的开通,5G毫米波在峰值速率上已经展现出了巨大优势。同时,工信部在..
手机厂商这半年:互怼变日常,多品牌成突围关键
2019年的手机行业,可以说是非常热闹的,仅仅上半年,“华米OV”的隔空互怼便开始频繁上演。
移动互联
手机
智能设备
汽车科技
通信
IT
家电
办公打印
企业
滚动
相关新闻
关于我们 | 联系我们 | 友情链接 | 版权声明
新科技网络【京ICP备18031908号-1
Copyright © 2020 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。