7月21日,捷通华声灵云声纹识别技术重磅出击,剑指身份认证等安全领域,致力全面推动声纹识别技术产业化进程。
灵云声纹识别(VPR)技术采用国际最先进的第二代i-vector算法,声纹模型大小仅有2K字节,占用存储空间非常小,可实现大规模声纹采集、存储和检索。灵云声纹识别技术准确率高,模型占用资源小,用户仅需要最少的输入音频文件即可生成个人的专有身份标识。
相较于其他生物特征识别技术,声纹识别技术具有获取方便、成本低廉、支持远程身份确认、使用简单等优势。可广泛用于金融、国安、社保、电信等需要语音通信和交互的系统中,满足不同客户对利用简单设备,高可靠、低成本进行身份认证的需求。
声纹识别(VPR) ,也称说话人识别,简单讲就是根据人的声音特征,识别出某段语音是谁说的。声纹是生物特征的一种,同人的指纹、掌纹、虹膜、人脸的特征一样,由于每个人的生理差异,很难找到两个声纹完全一样的人,因而可以利用其唯一性这种特性进行身份认证。
灵云声纹识别支持说话人辨识和说话人确认。所谓说话人辨识,是一对多的分析过程 即判断出某段语音是若干人中哪一个所说 目前主要应用于刑侦破案、罪犯跟踪、国防监听、个性化应用等。而说话人确认是一对一的确定过程 即确认某段语音是否属于指定的某人 主要应用于证券交易、银行交易、个人计算机声控锁、汽车声控锁、身份证、信用卡等领域和应用场景的身份确认。在安全认证方面 声音不涉及隐私问题 相关设备造价低廉 利用声纹进行身份识别是最自然又经济的方法 使用者接受程度相对较高。例如银行、证券系统的密码可用声音来代替 即利用声纹技术 使声音转化为密钥 这样人们不需要记住复杂的密码 也不需随身携带钥匙、智能卡之类的东西。另外特别值得提及的一个应用场景是,在电话勒索一类的案件中 最容易获得的证据就是电话录音 通过声纹识别技术 就能根据电话录音获得线索 可以有效缩小刑侦范围,缩短破案周期。虽然现在大多数国家还没有把声音列入法庭审判的有效证据范围 但是声音样本在刑侦和司法上的应用已经日渐受到重视。当然,灵云声纹识别将重点对日益火爆的互联网金融安全提供最强有力的保护。
灵云声纹识别技术的推出,标志着灵云平台智能语音形成了以语音识别、语音合成、声纹识别、自然语言理解四大核心技术组成的完整的智能语音技术生态闭环,为金融、电信等领域广大企业提供了更加全面的智能语音交互与丰富的身份认证技术服务。
捷通华声:中国智能语音产业领军企业
灵云声纹识别技术的研发成功,是清华灵云人工智能研究中心所取得的最新科研成果,也是对捷通灵云团队夜以继日工作的丰硕回报。
捷通华声成立于2000年,是一家长期专注智能语音、智能图像、语义理解等人工智能技术的研究与开发,全面发展人工智能技术云服务与产业应用的高新技术企业。捷通华声是国内最早从事智能语音技术研究与应用的企业,目前,捷通华声拥有自主知识产权的灵云语音合成(TTS)、灵云语音识别(ASR)技术,电话端和手机端准确率均达到国内领先水平;捷通华声灵云多语种语音合成支持的语言已达19种,覆盖了全球90%以上的国家和地区。此次,推出灵云声纹识别技术,使捷通华声在中国智能语音产业发展的道路上又迈出了坚实的一步。
2015年,捷通华声在灵云语音合成(TTS),语音识别(ASR)等智能语音技术产品的基础上,全面支持国内各主流语音质检系统,并相继推出了灵云电话版智能客服、灵云机器人版智能客服等面向客户服务领域的全智能解决方案。捷通华声凭借在中国智能语音产业多年的深厚研究基础并通过与广大合作伙伴的精诚合作,在国内语音市场占有超过50%的市场份额,在“第六届中国行业信息化奖项评选活动”中一举夺得“中国智能语音产业领军企业”大奖。
未来发展,捷通华声将加快合作共赢步伐,努力不断为广大合作伙伴提供最好的智能语音技术,满足各行业特别是对有效提升系统安全认证级别的迫切需求,助力声纹识别技术在金融、证券、通信、国安、刑侦、社保以及其他民用安全认证系统中的应用达到新的高度,扩大服务对象,更全面提升安全水平,使社会大众都能够享受更好、更便捷的客户服务!