摘要:日前,专注于智能语音服务和AI数据服务的标贝科技正式发布了自主研发的一站式智能语音服务平台——标贝开放平台,为开发者提供智能语音解决方案。这意味着经过了长期积累和酝酿,又一家公司进入智能语音服务平台的竞争(标贝开放平台:https://ai.data-baker.com/#/index)。
2021年4月,标贝科技发布一站式智能语音服务平台——标贝开放平台,面向全行业合作伙伴提供从云到端,一站式语音识别(ASR)与语音合成(TTS)服务,帮助软硬件开发者降低开发门槛,节省开发时间和成本。在此之前,标贝科技已经服务了包括人民日报客户端、新华社在内的百余家企业与机构,服务项目累计超过500项,涵盖汽车、教育、客服、零售、阅读、智能硬件等多个领域,被开发者广泛关注。
两大技术,提升交互体验
据悉,目前标贝开放平台提供的智能语音服务主要包括语音合成(TTS)与语音识别(ASR),开发者可以在平台操作界面创建多个智能语音应用,系统自动分配了语音识别和语音合成的全部服务到该应用。语音识别包括一句话识别、长语音识别、录音文件识别,语音合成可选择在线合成、离线合成、长文本合成三种,并可根据客户自身需求进行用量、音色、并发等接入试用。特别值得一提的是,离线引擎的开放,使标贝对智能电视等嵌入式设备厂商的服务更为全面。
在语音合成方面,标贝采用基于transformer机制的高音质合成,综合利用声学和语言学参数,多音字的合成准确率更高,韵律停顿更加自然,整体的语音听感体验更接近场景化的真人表达。合成的接口全面支持多音字标注,手动校对发音,语速停顿调节等通用功能。语音识别方面,基于先进的端到端的深度学习算法,聚焦中文普通话近场识别,在安静环境下近字准确率超过97%。除了支持16k的设备端交互,还支持8k的客服场景电话语音识别。并支持通过热词更新方式,进行领域内特定词识别效果的快速优化。
全音库开放,支持多应用场景
标贝开放平台发布后将开放近60个音色,涵盖老人、儿童、青年男女音。每一种音色均使用海量音频数据训练而成,声音真实饱满、富有表现力,MOS评分达到业内领先水准。同时,平台支持中文、英文、中英混合、方言和多语种发音,可满足教育、新闻、有声阅读、泛娱乐等领域语音定制需求,并支持多语言、多情感同时使用。
简单兼容, 赋能开发者
与目前主流智能语音开放平台相同,标贝开放平台提供 WEB API 调用,Android、iOS 等平台 SDK 接入方式,平台基于B/S架构的管理平台,使开发者可根据需求同时创建多个应用,支持千万级并发,每个应用有独立的可视化数据统计,帮助开发者实时、精确地监测应用服务调用情况。
与此同时,标贝开放平台设有应用预警功能,通过预警管理,开发者可对调用频次、剩余用量、并发量和有效期限等使用状态进行设置,实现精细化管理。来自标贝科技的数据显示,该平台语音合成和语音识别的速度均达到行业领先水平,服务可靠性高达 99.9%。
除此之外,标贝开放平台非常注重交互感,无论是UI界面还是功能体验,都比较人性化,是目前最简单且最兼容的智能语音交互平台之一,致力于让各位开发者,使用方便、效率翻倍。
对于智能语音服务平台的上线,标贝科技相关负责人表示,凭借在基础业务AI数据服务的长期积累,以及不断创新的技术研发投入,标贝科技智能语音交互技术已达到业内领先水平,希望通过标贝语音服务开放平台赋能各行业,共同开创更多语音交互场景,实现开放共赢。据悉,标贝开放平台新注册的会员,可获得一定量的无限期免费服务及优惠。
关于标贝科技
标贝(北京)科技有限公司成立于2016年2月,是一家专注智能语音交互的人工智能公司,此前,标贝科技已获得累计数千万元融资,投资方包括深创投领投,恒生电子,信雅达科技。
标贝开放平台注册地址:https://ai.data-baker.com/#/index