“你不必在意乔姆斯基教授语言和意思的结构性,你可以用数学的方法来实现它。”罗杰·凯说。
语音识别是第一步,之后,分析则是一项难度更大的工程。
尽管基于人工智能和语音识别的语音个人助手并不鲜见,安卓平台便同样有类似的程序如Voice Actions,但Siri的风靡证明只是语音识别技术是不够的,它还是一种人工智能形式,如今的系统还需要更强大的自学能力。
去年末,投资银行Piper Jaffray的分析师设计了800道语音问答题,考察苹果Siri和谷歌Google Now的水平,结果后者获得了进步最快奖。
不过,Siri也取得了一定的进步。就在一年前,Siri还有27%的答案来自谷歌搜索,如今这个数字已经大幅下降到4%。
英国媒体近日发表文章指出,语音翻译将成为科技业下一件大事。《圣经》有一个着名的故事:人类想上天堂,造巴别塔。上帝为阻止人类登天,所以迫使人类说不同的语言。由于沟通不畅,巴别塔最终半途而废。但英国作家道格拉斯·亚当斯曾在其小说《银河系漫游指南》中提及一种能够听懂外星人语言的小鱼“巴别鱼”(Babelfish)。
如今,这种“小鱼”科技的出现似乎变得有可能。人工智能专家、南安普顿大学教授奈杰尔·沙德博尔特称,由于大量可供实时语音翻译信息资源的存在,“巴别鱼”系统正在走进现实,未来市场出现类似蓝牙耳机的实时翻译工具是非常自然的事情。
在四、五年前,谷歌便开始研发语音翻译软件,时任机器翻译总裁的弗朗兹·欧克认为,实现语音翻译是有可能的。他们在向着让这种服务运行流畅的方向努力,并且还需要结合高精度的机器翻译和高精度的语音识别。
Google Now就是语音识别加人工智能技术最好的例证——它帮助用户通过语音识别技术进行网络搜索。
谷歌搜索工程部副总裁斯科特·霍夫曼说,搜索领域目前正努力实现的是,根据用户的声音准确理解“用户想要什么”,并给出符合需求的答案。
据海外媒体报道,谷歌已经构筑了与人、地区、事件相关的数据库“知识图谱”等,因此语音搜索方式的实现指日可待。
而依靠一种名为语音输入应用程序接口工具,谷歌旗下的浏览器Chrome 11 Beta版已经可以理解用户所说的话。
下一步:抢夺更多入口
语音识别技术市场正在走向竞争激烈的十字路口。
海外媒体预计,随着语音识别将取代输入、键盘、写字和触摸,成为人机互动最主要的界面,语音技术将遍布世界各个角落。
研究机构BCC曾发布报告预测,全球语音识别市场的规模到2017年会达到1130亿美元,五年复合年增长率高达16.2%。
该机构认为,语音识别市场将分化为三大终端市场:企业、消费者以及健康保健。
在这其中,企业终端的市场规模将在2017年达到422亿美元,复合年增长率为15.9%;消费者终端则将以17.2%的五年复合年增长率,在2017年达到651亿美元的规模;健康保健终端在2017年的规模则将达到59亿美元,复合年增长率为9.4%。
语音识别系统Nuance公司是语音识别软件Dragon的开发者,这款软件在医疗保健行业的应用已经长达十年之久。