语音识别或将成为科技企业的下一步发力点。消息称,谷歌计划在不远的将来对Android做出重大调整,尤其准备在其界面重点突出语音指令功能,并用搜索键取代传统的home键。
这一消息来的并不意外,毕竟语音识别在目前来讲已经是科技智能界的高端领域,如果能够完全操控好这个应用范围,无论对企业自身还是行业发展都不得不说是一大领先,就连微软也在最新的Windows Phone 8.1操作系统中内置了其最新开发出的语音助理应用Cortana。
可是,如果语音识别真的能够这么容易操作的话,那么作为把语音识别第一个真正应用到手机上的苹果,其研发多年的Siri为什么还是没有得到普遍应用,反而成为了人们茶余饭后的“调戏对象”?
不得不说,语音识别真的不是想象中那么简单,其全球基础研发的水平决定了推广应用的效果,至少从目前看,语音识别技术在全球还没有革命性的成果出现,如果这一根本问题不得到解决,语音识别在各行业的推广就很难有规模。
Siri的被调戏出名之路
想当初,IPHONE 4s刚发布时,Siri可谓是红遍一时。一方面,那时的普通用户还没有太过接触“人工智能”这一技术,还不能理解为什么不用手操作、直接对话就可以完成指令。另一方面,Siri的傲娇和洋派(人家讲的英语)也给了我们高大上的感觉, 使得我们不得不好奇加仰视,就这样接受了它的空降。
可新鲜期一过,应用弊端逐渐显现。不能识别中文的Siri开始被嫌弃,同时开启了它的被调戏之路。虽然历经8个月后,Siri再次推出了中文版本,可问题依然没有得到改善。偶尔心血来潮使用一下,反复几次仍不识别,倒不如直接用手操作的便捷。对于把用户体验当做一切的苹果来说,显然没有想到,正是用户的习惯和环境把苹果呕心沥血推出的Siri拒在了门外,更限制了Siri开发当初的应用意义。
毕竟,相对于英文来说,中文的复杂程度不可小觑。除了语言的地域差异外,还有各种介词的连接和助词的辅助以及同音多义词等汉语诸多个性特征很难让机器识别,比如同一句话换个声调表达的效果就可以南辕北辙。举个当初用来说明此问题的最简单的例子,中文中‘我’这个意思可以用:我,俺,寡人,小生,本人,老朽,吾,哀家,本宫,朕,卑人,鄙人,在下等等,而英文从古到今只有一个‘I’。这样的一个不公平性的存在,Siri的被调戏似乎也就合情合理了。
语音识别技术整体局限
与其说Siri没办法对中文语义分析得到正确的结论,倒不如说是即使它懂也不可能应用的那么灵活。造成这一现象的原因,就要归根于全球语音识别的技术开发体系。
目前全球的新一代的语音识别仍处于测试初期,也有专家曾经分析过,阻碍语音识别发展的几大问题有:语音识别准确度较低;语义、语气理解技术无法跟进;国家与区域性服务能力有限;受周边噪音环境影响较大;还有一点,语音识别通常要在联网时才能应用,这就不能保证它的随时和即时功能。这些技术弊端如果无法解决,科技企业各自开发的语音应用推进就无法顺利覆盖。就好比一台电脑里的CPU不行,这台电脑又怎能好用是一个道理。
在整体开发环境并不利好的当下,谷歌试图通过针对Android平台重新调理,打造出凸显语音指令功能的应用,这并不能定义是对是错,毕竟这是智能领域的热点,也是未来科技的趋势,不仅手机,可穿戴设备、电视和汽车等都是未来语音识别的潜在客户。只不过,应该如何呈现出最佳最有效的结果来应对用户习惯,避免Siri的遭遇,这才是谷歌需要面对的关键,如果继续效仿的模式,就象许多手机厂家都跟风在自己的手机上加入了语音识别,但在用户层面,却没有几个人在用一样,最终恐怕就只能继续炒一下概念,仅此而已了。