近日,在刚刚结束的WMT2019国际机器翻译大赛上,金山软件集团(以下简称“金山”)旗下AI Lab团队打败多个国内外巨头与研究机构,成功在英译中赛道上斩获人工测评冠军。继去年12月夺得“2018 AI Challenger全球AI挑战赛”英中文本机器翻译冠亚军后,金山AI Lab时隔半年再夺殊荣。这份荣誉也代表着金山在AI翻译领域上的全新突破。
金山AI Lab参赛团队成员
除了夺得英译中赛道人工评测的冠军外,金山AI Lab还在此次大赛中夺得其他荣誉:机器自动评测的第二名;中译英赛道人工评测和机器自动评测的第二名。在小语种无监督翻译任务上,金山和东北大学自然语言处理实验室合作,在德语-捷克语互译赛道上,分别获得人工评测和机器自动评测的第二名。
金山AI Lab比赛成绩
WMT的全称 Workshop on Machine Translation,是全球学术界公认的国际顶级机器翻译比赛。自2006年至今,WMT机器翻译比赛已经成功举办14届,每一次比赛都是全球各大高校、科技公司与学术机构展示自身机器翻译实力的较量,更是见证了机器翻译技术的不断进步。
本届WMT 2019大赛,共有来自全球的50多支队伍参加,包括微软、Facebook、百度、字节跳动、平安、日本情报通信研究机构(NICT)、东北大学、约翰霍普金斯大学、剑桥大学、爱丁堡大学、格罗宁根大学、亚琛工业大学、马里兰大学等企业、科研机构和高校。
本次WMT比赛中,金山AI Lab团队主要使用神经机器翻译(NMT)模型,采用目前流行的Transformer结构结合数据增广、分布式大规模训练和多模型系统融合等技术。具有翻译更准确、句子流畅度更高的优点。该模型在文本翻译、图片翻译以及语音翻译等产品中得到广泛的使用。结合WPS在办公场景下的优势,前述技术可以在文档翻译、计算机辅助翻译等场景大显身手。
金山AI Lab模型框架图
本次比赛中设有人工测评和机器自动测评。人工评测,是翻译评判时的主要指标,用0~100的百分制度,来表示翻译结果翻译的好坏程度。通过对翻译结果中每个句子的人工评分进行标准化,得到标准化后的人工评分。最后,以标准化后的人工评分作为最终排名依据。相比于机器自动评测,人工评测结果更能全面反映机器翻译系统的翻译质量。
金山的佳绩并非源自偶然,脚踏实地的金山人也从不相信偶然。
2017年5月,雷总亲自挂帅,金山开始在AI领域全力研发,先后成立了多个AI团队,涵盖图像、语音、语言等多个研究方向,汇集了来自中科院、北京大学、墨尔本大学、哈工大等高校的优秀毕业生。短时间内,团队搭建了训练和调优的基础设施,并且配备了强大的底层计算服务能力。
除机器翻译以外,金山AI Lab还在图像、文本、语音等多个方向展开深入探索。金山邀请中科院李长亮博士加盟,主持AI Lab。目前,金山已为相关算法、技术申请专利,并在国际顶级会议上发表相关论文。与此同时,金山更关注将技术与产品服务深度融合,完成技术落地。
2018年7月,金山WPS CEO葛珂在“未来办公大会”上宣布,“云、多屏、内容、AI”正在成为未来办公的新“四大件”。此后,围绕新四大件的完全落地,金山持续提速。AI作为科技最前沿技术,正在横向赋能在金山WPS旗下的所有产品线上。此次WMT比赛取得的骄人成绩,也代表了金山在AI领域的实力和信心。