·补有K2的液体钙——汤臣倍健钙DK,好吸收才事半功倍·暑假肠胃易出问题,lifespace益生菌帮你打造健康好“肠”态·首创性科研成果:北京宝枫生物神经酸改善HIE治疗效果·科学护肝攻略:集4重护肝植粹于一身的健安适不容错过·解锁身材管理新姿势:lifespace小蓝腰益生菌助你实现科学身材管理·如何科学降血脂?主打天然成分的舒百宁纳豆红曲胶囊了解下·昆腾中国赵丙涛:磁带是冷数据的最佳存储介质·如何增强免疫力?汤臣倍健蛋白粉好营养来“助攻”·Canalys调研:中国企业对于上云的需求仍然低迷·增幅超30% 华为上调2023手机出货量至4000万部·突破多项重点技术 浪潮发布全新算力网络操作系统·自我看衰?苹果大幅削减MR头显销售目标至15万台·华为云正式发布新一代自研分布式数据库GaussDB·全球第一家!三星QD-OLED获Pantone双色彩权威认证·测尿酸试纸怎么用·3999元起!折叠屏手机moto razr 40系列正式发布·贵!索尼推出TOUGH三防CFexpress Type A存储卡·华为正式发布智简全光联接战略及6款重磅新品·联发科董事长蔡明介:预计手机业务未来两年会增长·测尿酸试纸怎么用·腾讯云EdgeOne入选Gartner DDoS缓解方案市场指南·华为OceanStor Pacific分布式存储获IO500榜第一·小米发布2023年一季度财报:扭亏为盈,利润上涨·联想上一财年营收利润双双下滑 非PC收入占比近40%·佳能首款RF“饼干”镜头RF28mm F2.8 STM正式发布·索尼发布轻巧型全景声回音壁HT-S2000 售价2990元·用友董事长兼CEO王文京:全面数智商业创新时代到来·中兴TECS云平台连续三年获GlobalData Leader评级·内核数量为业界最高!Ampere发布192核ARM处理器·Gartner:腾讯云获CPaaS、CRM多个赛道国内第一
您现在的位置:首页 >> IT >> 正文
百度松果计划促深度语音技术合作 加快实现人类级交互能力
发表时间:2015年4月3日 11:17 来源:新科技 责任编辑:编 辑:王鹏

从上世纪60年代哆啦A梦诞生,到 21世纪《钢铁侠》中随时接受托尼召唤的钢铁战衣,这些风靡世界的经典作品中都有一个共同元素,就是那些能跟人类自由交互的超级机器人。今天,百度“松果计划”的深度语音合作项目的步伐已经迈向了这个领域,在语音人机交互方向上开展了与高校的合作研究。

1% 的提升意味着技术的巨大的进步

和机器聊天这个梦人类做了近百年,梦想成真大概就在眼前。据百度2015年发布的移动趋势报告,现在“00”后们提供了34%的语音图片搜索请求,用户使用的大势已经露出端倪。技术是否能满足大势发展呢?百度语音技术部负责人贾磊说:“百度的语音识别的技术近期获得了大幅度提升,百度在国内最先上线了语音识别界领先的基于长短时记忆模型(LSTM)的深度学习技术,使得安静环境下普通话识别的错误率降低了15%,目前的识别率已经从95%提升到96%,用户可以通过语音输入法产品体验到我们最新的语音技术,并且很快就会辐射到语音搜索。”

机器对语音识别的准确率无疑是其能否大规模应用的关键,在逼近100%的过程中,小数点后的每一次数字的变化都是巨大的进步。贾磊表示:“如果我们能够做到95%的话, 你说话要非常清楚,要离话筒非常近,必须这样才能识别出来。如果我们将来能做到99%的准确率的话,这和95%简直是天壤之别,这会彻底改变我们的玩法。我们甚至可以把所有手机的接口做重新的设计和修改。”

从科研阶段到生活应用的神速到位

百度语音技术团队成立至今还不到5年,汇聚了中国语音技术领域的最优秀人才,不但让中国的语音识别技术走在世界前列,自我研发的技术积累也让百度的语音技术在可持续发展中不断突破。同时在“松果计划“的协助下,他们获得了更多与高校合作的机会,在深度语音合作方面取得了很多见就成果。例如大家都熟悉的百度语音搜索产品,它的灵魂是一项名为DNN(深度语音学习)的技术。

百度语音技术团队在研发中,有意识地充分利用高校的研发力量,例如这个DNN技术,它的前期投入和调研就是语音技术团队通过百度校园开放研究项目搭桥,与西北工业大学合作一起完成的。今年,百度 “松果计划”再为二者牵线,提供平台,协助双方联手共同对语音识别的准确率进行创新性研究。“松果计划”对科研能力还是研发经验都有很高要求的百度语音识别团队的协助,让其打开了高校优秀人才引入的渠道。

交互技术在未来将成为核心发展方向

对于语音交互技术,不少用户认为它目前并不是主流的交互方法,实际上这不是语音交互应用的价值不够,而是技术还没实现核心突破。贾磊说:“现在的语音技术更多像是一个听写机,它把你说话得声音翻译成文字,对文字的理解以及文字理解之后下一步的应答和处理。百度今年已经将交互技术定为发展方向,交互技术本身,除了语音技术识别之外,还包括语意理解,智能问答等多方面技术。我们将和兄弟团队,比如NLP团队、大搜索团队合作,最终希望能做成这种完全自然的,逼近人类的语音交互。”

语音应用的大规模应用已经箭在弦上,预计5年内语音识别可以逼近人类交互的水平,贾磊表示。那么,怎样判断语音识别的某项技术已经成熟,被市场接受了呢?他举例说:“如果有50%的人愿意使用语音来做搜索的话,那么就可以定义为语音搜索技术成熟了,这个仅仅指的是语音识别技术。真正完善的语意理解和智能问答要比语音识别技术更复杂,所以这个过程可能是相对比较长。”但他同时也指出:“在语音成熟的过程中,会有很多新的应用、功能伴随语音技术的成熟逐渐的发展起来。从普通大众的角度看,在技术临界点到来前,还是有非常多的可能性值得期待。”

在开篇我们提到了著名的哆啦A梦,但不知道有多少人记得,它是来自22世纪的机器人,如果以科幻变为现实通常都会超人们预期来到的规律看,在21世纪的今天,让机器人能听懂人类的语言,自由沟通,也不算异想天开了吧。

相关文章
关于我们 | 联系我们 | 友情链接 | 版权声明
新科技网络【京ICP备15007775号-1】
Copyright © 2015 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。