近期,捷通华声应用最新算法,推出全新一代灵云语音识别核心引擎,识别率实现跨越式提升。目前,新一代语音识别技术已上线灵云平台(AIcloud.com),供开发者调用,并面向政企客户推出包含8k、16k版本的全新灵云语音识别能力平台。
新一代灵云语音识别演示(建议全屏观看)
此次灵云语音识别技术的升级,是捷通华声在CTC算法的基础上,对建模单元粗粒度、模型训练方法、解码帧率进行创新优化。有效提升了语音识别引擎的执行效率、鲁棒性,增强了口音、语速适配能力,大幅提升了多人对讲、远场讲话等场景中的语音识别率。
调用云端语音识别服务 就上灵云平台
新一代灵云语音识别技术已上线灵云平台,开发者可以去灵云开发者社区(aicloud.com/dev/)申请调用。
开发者将灵云语音识别SDK集成到ISO、JAVA、安卓、Windows等软件应用中后,填写申请到的灵云平台语音识别服务地址、授权信息,便可免费调用灵云平台的语音识别服务。
目前,灵云平台上的语音识别技术已服务包括打车软件、输入法、翻译APP、手机银行客户端等各类数十万应用,覆盖数亿终端用户。
灵云ASR能力平台 为政企单位提供私有、专业的语音识别能力
在提供公有云ASR能力的同时,捷通华声一直在为Callcenter、会议、公安等场景提供私有化的语音识别能力。
其中,在Callcenter 电话信道8K语音识别场景,捷通华声已服务众多大型银行客服中心、客服BPO中心,将海量语音实时转写为文字,为智能质检、智能客服、智能外呼、数据分析等提供私有云的语音识别能力。
在会议、司法、医疗等16k语音识别场景,捷通华声积累了大量声学、语言数据,分别推出了会议、审讯、医疗各科室等行业版的语音识别能力平台,为政企客户提供专业、私有、更安全的语音识别能力。
十多年来,捷通华声始终坚持核心技术自主研发。随着此次灵云语音识别技术的跨越式提升,捷通华声将为公有云开发者、政企客户提供识别率更高、更优质的语音识别能力与服务。