您现在的位置:首页 >> 滚动 >> 正文
电话响起,安能辨我是AI?智能语音机器人来了
发表时间:2018年6月28日 07:36 来源:飞象网 责任编辑:编 辑:麒麟

云讯云雀主要应用了语音识别、自然语音处理、语音合成、机器学习这四种核心技术,从而构建了一位可以被客户认可、公司放心的“懂业务、全套路、能分析、会学习”的完美员工,实现了电销&客服专家的AI化。

语音识别主要是关注自动且准确地转录人类语音的AI技术,它与图像识别技术、机器学习技术是人工智能领域三大核心技术。基顾的语音识别技术主要处理不同口音、背景噪声、区分同音异形/异义词,同时还需要具有跟上正常语速的工作速度。语音识别就好比“机器的听觉系统”,通过识别和理解,把语音信号转变为相应的文本或命令。这里面最关键的技术是机器的识别准确率,目前的识别率在工程环境下已基本达到90%以上,在生活职场环节下,主流ASR服务商能达到80%左右的识别率。云雀与国内顶尖科研机构及企业,达到深度合作,基于十年通讯语料素材,同共研制打磨云雀语音识别核心引擎。

自然语音处理应用背后有大量的基础任务和机器学习模型。利用NLP,我们可以让机器来执行自动摘要,翻译,关系提取,情感分析,话题分割等任务,像人一样处理复杂的文本。目前云讯云雀针对金融、教育与房产领域,进行了针对性的NLP语音训练优化,以保障在三个电销外呼行业,具有更高的NLP数据处理能力。

语音合成就是将文字信息转化为声音信息,给机器配上“人声”。出色的TTS需要大量的语料库,成熟的、可商用的TTS的合成音,在音色、自然度等方面的表现均可以接近人声。目前,行业内根据人声定制的TTS,需录制原声1000小时,费用达40万元。而且效果还与正常人声在语音语调等音色方面,仍有很大差距。云讯云雀在支持TTS的基础上,着重支持真人录音支持,以及高效的在线录音更新模式,以最大化的提升人机交互时的拟真度。

机器学习指的是计算机系统无须遵照显式的程序指令,而只依靠数据来提升自身性能的能力。其核心在于,机器学习是从数据中自动发现模式,模式一旦被发现便可用于预测。比如,给予机器学习系统一个关于交易时间、商家、地点、价格及交易是否正当等信用卡交易信息的数据库,系统就会学习到可用来预测信用卡欺诈的模式。处理的交易数据越多,预测就会越准确,机器也就会“更聪明”。

[1]  [2]  
相关文章
关于我们 | 联系我们 | 友情链接 | 版权声明
新科技网络【京ICP备15027068号】
Copyright © 2015 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。