您现在的位置:首页 >> 滚动 >> 正文
“你好,巴别鱼”让机器读懂你的声音
发表时间:2014年4月2日 11:23 来源:上海证券报 责任编辑:编 辑:麒麟

“你不必在意乔姆斯基教授语言和意思的结构性,你可以用数学的方法来实现它。”罗杰·凯说。

语音识别是第一步,之后,分析则是一项难度更大的工程。

尽管基于人工智能和语音识别的语音个人助手并不鲜见,安卓平台便同样有类似的程序如Voice Actions,但Siri的风靡证明只是语音识别技术是不够的,它还是一种人工智能形式,如今的系统还需要更强大的自学能力。

去年末,投资银行Piper Jaffray的分析师设计了800道语音问答题,考察苹果Siri和谷歌Google Now的水平,结果后者获得了进步最快奖。

不过,Siri也取得了一定的进步。就在一年前,Siri还有27%的答案来自谷歌搜索,如今这个数字已经大幅下降到4%。

英国媒体近日发表文章指出,语音翻译将成为科技业下一件大事。《圣经》有一个着名的故事:人类想上天堂,造巴别塔。上帝为阻止人类登天,所以迫使人类说不同的语言。由于沟通不畅,巴别塔最终半途而废。但英国作家道格拉斯·亚当斯曾在其小说《银河系漫游指南》中提及一种能够听懂外星人语言的小鱼“巴别鱼”(Babelfish)。

如今,这种“小鱼”科技的出现似乎变得有可能。人工智能专家、南安普顿大学教授奈杰尔·沙德博尔特称,由于大量可供实时语音翻译信息资源的存在,“巴别鱼”系统正在走进现实,未来市场出现类似蓝牙耳机的实时翻译工具是非常自然的事情。

在四、五年前,谷歌便开始研发语音翻译软件,时任机器翻译总裁的弗朗兹·欧克认为,实现语音翻译是有可能的。他们在向着让这种服务运行流畅的方向努力,并且还需要结合高精度的机器翻译和高精度的语音识别。

Google Now就是语音识别加人工智能技术最好的例证——它帮助用户通过语音识别技术进行网络搜索。

谷歌搜索工程部副总裁斯科特·霍夫曼说,搜索领域目前正努力实现的是,根据用户的声音准确理解“用户想要什么”,并给出符合需求的答案。

据海外媒体报道,谷歌已经构筑了与人、地区、事件相关的数据库“知识图谱”等,因此语音搜索方式的实现指日可待。

而依靠一种名为语音输入应用程序接口工具,谷歌旗下的浏览器Chrome 11 Beta版已经可以理解用户所说的话。

下一步:抢夺更多入口

语音识别技术市场正在走向竞争激烈的十字路口。

海外媒体预计,随着语音识别将取代输入、键盘、写字和触摸,成为人机互动最主要的界面,语音技术将遍布世界各个角落。

研究机构BCC曾发布报告预测,全球语音识别市场的规模到2017年会达到1130亿美元,五年复合年增长率高达16.2%。

该机构认为,语音识别市场将分化为三大终端市场:企业、消费者以及健康保健。

在这其中,企业终端的市场规模将在2017年达到422亿美元,复合年增长率为15.9%;消费者终端则将以17.2%的五年复合年增长率,在2017年达到651亿美元的规模;健康保健终端在2017年的规模则将达到59亿美元,复合年增长率为9.4%。

语音识别系统Nuance公司是语音识别软件Dragon的开发者,这款软件在医疗保健行业的应用已经长达十年之久。

[1]  [2]  [3]  [4]  
关于我们 | 联系我们 | 友情链接
新科技网络【京ICP备14006744号】
Copyright © 2014 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。