不过,Siri也取得了一定的进步。就在一年前,Siri还有27%的答案来自谷歌搜索,如今这个数字已经大幅下降到4%。
英国媒体近日发表文章指出,语音翻译将成为科技业下一件大事。《圣经》有一个著名的故事:人类想上天堂,造巴别塔。上帝为阻止人类登天,所以迫使人类说不同的语言。由于沟通不畅,巴别塔最终半途而废。但英国作家道格拉斯 亚当斯曾在其小说《银河系漫游指南》中提及一种能够听懂外星人语言的小鱼“巴别鱼”(Babelfish)。
如今,这种“小鱼”科技的出现似乎变得有可能。人工智能专家、南安普顿大学教授奈杰尔 沙德博尔特称,由于大量可供实时语音翻译信息资源的存在,“巴别鱼”系统正在走进现实,未来市场出现类似蓝牙耳机的实时翻译工具是非常自然的事情。
在四、五年前,谷歌便开始研发语音翻译软件,时任机器翻译总裁的弗朗兹 欧克认为,实现语音翻译是有可能的。他们在向着让这种服务运行流畅的方向努力,并且还需要结合高精度的机器翻译和高精度的语音识别。
Google Now就是语音识别加人工智能技术最好的例证——它帮助用户通过语音识别技术进行网络搜索。
谷歌搜索工程部副总裁斯科特 霍夫曼说,搜索领域目前正努力实现的是,根据用户的声音准确理解“用户想要什么”,并给出符合需求的答案。
据海外媒体报道,谷歌已经构筑了与人、地区、事件相关的数据库“知识图谱”等,因此语音搜索方式的实现指日可待。
而依靠一种名为语音输入应用程序接口工具,谷歌旗下的浏览器Chrome 11 Beta版已经可以理解用户所说的话。
下一步:抢夺更多入口
语音识别技术市场正在走向竞争激烈的十字路口。
海外媒体预计,随着语音识别将取代输入、键盘、写字和触摸,成为人机互动最主要的界面,语音技术将遍布世界各个角落。
研究机构BCC曾发布报告预测,全球语音识别市场的规模到2017年会达到1130亿美元,五年复合年增长率高达16.2%。
该机构认为,语音识别市场将分化为三大终端市场:企业、消费者以及健康保健。
在这其中,企业终端的市场规模将在2017年达到422亿美元,复合年增长率为15.9%;消费者终端则将以17.2%的五年复合年增长率,在2017年达到651亿美元的规模;健康保健终端在2017年的规模则将达到59亿美元,复合年增长率为9.4%。
语音识别系统Nuance公司是语音识别软件Dragon的开发者,这款软件在医疗保健行业的应用已经长达十年之久。
当病人前去看病时,内科医生的桌面上运行Nuance的软件,它便可以利用一个夹式微型话筒来录音。随着问诊的推进,这款软件会及时更新病人的电子健康记录。
未来的语音识别功能也可以帮音乐爱好者大忙:用户可以通过口述歌曲或歌手的名字进行点播,并且它会记住用户的喜好。
脸谱网曾收购一家语音识别和语言翻译应用程序制造商Mobile科技公司。该公司旗下拥有知名移动应用程序Jibbigo Translator,这款应用可以自动翻译超过20种语言。
有分析称,MT的技术确实能够帮助脸谱网做许多事情,包括在未来实现跨语言聊天、旅行者语音翻译和信息流即时翻译等。此外,还有可能帮助脸谱网实现语音图谱搜索。
汽车领域同样是语音识别技术的重要阵地。
宝马[微博]汽车已经开始提供语音识别服务,通过数据中心进行实时处理,转换为文本并通过邮件发送,司机不需要动手便可以完成这一系列动作。