4月23日世界读书日,讯飞输入法与新华书店,在广州四阅书店共同打造了一个“方言保护计划公益联名店”,以粤语读书会的形式,邀请方言研究专家、粤语爱好者、讯飞粤语发音人,共同用声音传递粤语之美。同时,活动中讯飞输入法发布了最新语音技术成果应用,实现方言翻译,解决粤语沟通障碍。
在读书会现场,讯飞粤语发音人用粤语朗诵经典文段,读出山川河流、读出人间烟火、读出星辰大海,让现场观众充分感受粤语的无穷魅力。数据显示,目前全球粤语使用人数超过1亿。在广东,粤语不仅仅是简单的信息传递工具,也是很重要的情感根系,正所谓“冇粤语,唔广东”。
2012年讯飞输入法在行业首家推出“粤语语音输入”,用户表示“咁都识得出真系好劲”。目前,讯飞输入法的粤语识别准确率已经超过95%,粤语跟普通话一样亦能1分钟输入400字。在提高粤语用户输入效率的同时,面对九成以上粤语用户与非粤语用户沟通的强烈需求,讯飞输入法首创“输入法方言翻译”功能,支持粤语语音输入翻译成普通话文字,方便与不懂粤语或不认识粤语正字的人进行沟通。
讯飞输入法业务副总经理程坤解释道,实现方言翻译需要克服特殊词汇多和数据量少两个技术难题。基于此,科大讯飞创造性提出了基于多源知识融合的端到端翻译模型结构,并将迁移学习训练机制成功用于方言翻译任务,从而大大提高了粤语翻译成普通话的性能,进而应用于讯飞输入法产品,满足粤语用户清晰传递信息的需求。
如何体验输入法方言翻译功能呢?具体来说,使用讯飞输入法Android新版在语音识别模式中选择【粤语】,进入粤语语音输入界面,点击左上【粤/普】选择翻译结果。在粤语文字输出模式下,语音输入展示粤语正字;开启粤语识别为普通话模式,语音输入翻译为普通话。可见,在方言翻译的道路上,讯飞输入法迈出了坚实的一大步。
一直以来,讯飞输入法AI方言保护计划,以用AI为世界留下多彩乡音为目标,努力通过技术手段推进“语言复制”。截至目前,讯飞输入法已经支持23种方言语音输入,并加入方言“随心说”功能,即普通话模式下可直接使用东北话/天津话/河南话/河北话/山东话/皖北话/四川话七种方言与普通话的混合语音输入,免切换想说就说。这种人性化的AI输入技术,为方言母语使用者提供了便捷的场景,让沟通更便捷。除了面向普通用户,这项技术也通过讯飞听见,以语音转写功能形式,服务于行业用户,提高效率。
中国语保工程数据显示,中国现存的130多种语言中,48种使用人口在5000人以下, 25种不足千人。“语言复制”的概念是通过人工智能技术对一种语言实现完整记录,语音合成就是其中一个重要的组成模块,让机器可以开口说方言。目前科大讯飞已经实现了包括粤语、四川话、湖南话、等11种方言的语音合成系统,并进行产品化应用,走到了推动方言保护的最前线。
关于方言保护计划的新思路以及语言资源保护的重要性,暨南大学文学院中文系教授、博士生导师、全国汉语方言学会副秘书长、常务理事甘于恩教授提出了“语言资源保护要多模态化”的观点,认为语言资源的保护传承,最重要的指标是语言活力的保持和语言能力的强化。2017年,讯飞输入法联合中国声谷发起的方言保护计划,通过“AI+公益”创新方言保护形式,引起大众对方言保护的关注,用智能语音技术加速推动方言留存。此次深入粤语区,打造方言保护计划公益联名店,寻找粤语发音人,共同用声音传递粤语之美。
方言背后,蕴藏着文化多样性的精髓,是中华文明长盛不衰的内在机制。所以保护方言,是尊重方言母语者的使用习惯,并保护以方言为载体的民间文化。讯飞输入法通过方言保护计划公益行动,呼吁更多的方言母语者参与方言保护,身体力行推动乡音的留存。