您现在的位置:首页 >> 新•资讯 >> 正文
加杀手锏功能抢夺市场?阿里音箱这步棋怕是走早了
发表时间:2017年7月17日 08:00 来源:新浪网 责任编辑:编 辑:麒麟

不出所料,阿里还是发布了智能音箱。

从亚马逊三年前的无心插柳到今天阿里的入局,智能音箱市场的爆发让人始料未及,但这的确发生了。

Echo已累计销售近2000万台,谷歌、微软、苹果随之跟进,之后的一段时间里,国内的软件厂商、硬件产商、内容厂商争相进入,好不热闹。

而直到本月初,阿里才正式发布智能音箱天猫精灵X1,既出乎意料又在情理之中,使得语音入口的争夺战因为阿里的入局变得更加有趣。

其实,499元的天猫精灵在发布前一天,雷锋网就曾写过一篇题为[为何中国版Echo还未问世,明天阿里的AI新品能带来惊喜吗]的文章。

那么,阿里的智能音箱到底带来了哪些有别于其他同类产品的惊喜?

眼前一亮的“惊喜”

此前有媒体称,为了这款智能音箱,阿里巴巴甚至将马云投入上亿美元的Pepper机器人项目中止,把人员队伍拆分划进人工智能实验室。而花了这么大代价出来的产品好像似乎与Echo等音箱并无本质上的差异,所含功能大致包括播音乐、叫外卖、查天气、设闹钟、智能家电操控等。

根据天猫精灵对外宣传的卖点,其中非常重要一点就是连Echo都不具备的声纹识别功能。

阿里称,通过声纹识别技术,音箱可以分辨家里的每一个人,并且根据每个人的喜好而设定推送不同的内容,目前最多可以识别6个人的身份;另外,用户还可通过自己的声音完成购物支付验证环节。而Echo在分辨人的身份上,还需要通过进一步操作来获取用户的个人信息。

让雷锋网好奇的是,如此酷炫的功能为何亚马逊至今都还没用在Echo上。

据悉,亚马逊很早就想应用这项技术,但据亚马逊员工介绍,从声纹识别领域的硬件和软件公司中得到的反馈看来,让这些语音控制设备去识别不同用户的声音比想象中要艰难很多。

“由于设备需要去除噪音,回声,混响,使得它难以对听到的发声者的身份进行识别。”Conexant语音部门副总裁Vineet Ganju说道。

那么拥有声纹识别的天猫精灵真的能撑起它所重点诉求的这个卖点吗?

我看悬。

声纹识别功能为什么悬?

先从声纹识别算法层面讲,声智科技创始人陈孝良博士此前在接受雷锋网专访时表示,声纹识别还是一个比较窄的学科,应用也相对较少。现在大部分研究都是有关动态实时检测,动态检测的方法自然要利用静态检测的各种原理方法,同时也需要增加其他很多算法, 比如VAD、降噪、去混响等。VAD的目的是检测是不是人的声音,降噪和去混响是排除环境干扰。

VAD常用两个方法,基于能量检测和LTSD(Long-Term Spectral Divergence),当前用的较多是LTSD,另外特征提取方面还需要:动态时间规整(DTW)、矢量量化 (VQ)、支持向量机 (SVM),模型方面则需要隐马尔可夫模型(HMM)和高斯混合模型 (GMM)。

[1]  [2]  [3]  
相关文章
关于我们 | 联系我们 | 友情链接 | 版权声明
新科技网络【京ICP备15027068号】
Copyright © 2015 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。