閻犵尨鎷�闁荤偞绋忛崕鎻掞耿娑擄拷2闂佹眹鍔岀€氼參骞侀锝嗗闁瑰墽绮€点垽鏌嶉妷锔界厸闁逞屽墯濮婂綊宕奸敓鐘冲殜闁挎繂鎳夐崑鎾愁吋閸涱剚妯婇梻浣藉Г椤祩闂佹寧绋戦懟顖炲Χ娴犲瑙﹂柛娑橈攻閺嗩亪鏌熼棃娑毿$紒銊e姂瀹曗剝绻濋崒姘兼浆闂佺ǹ饪甸幏锟�閻犵尨鎷�闂佸搫妫欓崹鍨閿濆鍤冮柣妯烘惈閸擃參鏌¢崟顒佸碍闁搞値鍙冨濠氼敋閳ь剟銆傛禒瀣櫖閻庡湱鎸秄espace闂佺儵鏅涢敃锕傚极閹剧粯鍤曢悘鐐舵缁ㄨ霉閿濆洤校濠⒀嶇畵閺屽懘鎮╅煫顓熸▕闁瑰吋娼欓崲鏌ュΧ娴犲鐏虫繝濠傛娴滄牠鏌嶉妷锔剧畺闁逞屽墾閹凤拷閻犵尨鎷�婵☆偓绲鹃悧鏇㈠垂闁秴绠戠憸蹇涳綖閺嶎厽鍎橀柡鍐e亾闁搞劍宀稿绋库堪閹邦喚鐛ラ梺鍛婄墬閵囩偤宕ラ銈傚亾鐟欏嫮绠栭柣蹇斿哺閹粙鎮㈤崫鍕ㄦ寘缂備椒鑳堕崑鐔哄垝閿熺姵鐓€闁告稑锕ラ弳顓㈡煕閻樻彃娈獻E濠电偛鐭佸畷鐢稿几閻旂厧鏋侀柛顐ゅ枔娴滐拷閻犵尨鎷�缂備礁顦伴崹鐢割敆閻旂厧绠柕鍫濈墕閳ь兛绮欏銊╂嚒閵堝棙顓洪梺鎸庣⊕瀹€绋库枖閿燂拷4闂備焦褰冪粔鍨叏閵忋倖鍤冩繝闈涙祩濡茶崵绱掗鈧埀顒佺〒閼规儳鈽夐幘顖氫壕闂傚⿴鍓﹂崑鍡椻枔閹达箑纾婚柕澶堝劤閺嗘棃姊洪銏犫偓椋庣箔婢跺备鍋撻悷鎵Ш闁轰礁锕ュḿ濠氭晸閿燂拷閻犵尨鎷�闁荤喐鐟辩紞渚€寮ㄩ敐澶屽彆妞ゆ劧绲剧紞蹇曠磼閻欏懐纾块柟顔硷躬瀵剟寮堕崯鍐惧弮瀹曟繈宕犻敍鍕崶lifespace闁诲繐绻愮换妤呭箺閹达附鍤堥柟娈垮枟閹跺嫰鏌i姀銏犳灆鐎殿喖顭峰畷婵嬪煛閳ь剛绱炲Ο灏栧亾閸︻厼浠ф鐐叉川缁棃骞嬪┑鎰Τ闂傚⿴鍓﹂崑鍛缚濡ゅ啰涓嶉柨娑樺閸婏拷閻犵尨鎷�婵犵鈧啿鈧绱炲鍥╃煋闁瑰瓨绻嶉崝鍛存⒒閸曨偆啸妞ゃ垹鎳橀幊姗€宕掗敂鎯ф優婵炴垶鎸剧划顖涙櫠閿旇棄绶為柍鍝勫暙婵囨煙鐎涙ê濮囬柛銊ラ叄閹啴宕熼鑲╀喊闂佽皫鍕姢闁伙絿鍋熼惀顏嗏偓鍦Х濠€鍝ョ磼娣囧崬鐏繛鍙夋倐閹虫鎹勯悜妯诲Ρ婵炲瓨绮屽Λ婊嗩暰婵炴垶鎼幏锟�閻犵尨鎷�闂佸搫瀚Λ婊堝触濡崵鈻旀い鎾跺仦缁傚洭鎮硅閸氣偓缂佹绻傞埥澶娾槈瀹曞洨鐛ョ紒鎯у綖缁€渚€鎮介锕€鍙婃い鏍ㄨ壘閺嬪酣鏌℃担鍝勵暭鐎规挷绶氶幆鍐礋椤掍椒绮繛杈剧到閸熷潡鎮洪妸鈺佺<闁靛ǹ鍊楅惌娆撴偣閹拌埖瀚�閻犵尨鎷�婵犵鈧啿鈧绱炲鍡樻珷闁绘劖褰冪换渚€鏌涜箛鎾缎ら柡灞芥嚇瀹曟繂鈽夊畷鍥ф優濠殿喖绠嶉崐娑㈠吹閺囥垹纾圭€广儱鎳嶅ǎ顕€鏌ч弬娆惧剳婵炲憞鍛灊濠㈣泛枪閸嬨劑鏌﹂埀顒勫Ψ閵夈儲鍊犻梺鍝勵槶閸庮噣鍩€椤掍胶鐭婂┑顕呬邯瀵劑鎮滈埞鎯т壕闁跨噦鎷�閻犵尨鎷�Canalys闁荤姴顑呴崯浼存偉濞差亝鏅慨姗嗗亯閸橆剟鏌涢妷锕€鐏婄紒杈ㄥ笚缁嬪顫濋澶婃婵炲瓨绮岀花鑲╃箔閸屾稓顩查柟瀵稿У閻i亶姊婚崶锝呬壕濠殿喚鎳撻崐椋庡垝濞戙垺鍊块柡鍫㈡暩缁夌敻寮堕埡瀣閻犵尨鎷�婵犫拃鍛粶缂佺姵鐟ч幖楣冩晸閿燂拷30% 闂佸憡顨呯花鑲╂嫻閻斿摜鈻斿┑鐘叉噽濞堬拷2023闂佸綊娼ч鍡椻攦閳ь剟鏌涢幋锔剧窗闁逛紮缍侀弻宀冪疀濮橆剚顔�4000婵炴垶鎸稿ú顓㈠磿閿燂拷
您现在的位置:首页 >> 新•资讯 >> 正文
火山翻译年度盘点:年底每天“干活”1.38亿次
发表时间:2021年2月13日 21:58 来源:飞象网 责任编 辑:麒麟

Transformer解码示意图

镜像生成式翻译模型MGNMT

镜像翻译生成模型MGNMT(Mirror-Generative Neural Machine Translation)旨在解决机器翻译在双语平行数据缺乏场景中的应用问题,目前已应用到火山翻译多个语向的翻译模型中。通过镜像生成方式,MGNMT利用互为镜像翻译方向的相关性,同时将翻译模型和语言模型结合,让模型间互相促进,从而显著提升翻译质量。

目前机器翻译模型需要在大量的双语平行数据上训练,从而得到不错的性能。然而,在很多低资源的语向或领域场景中,双语平行数据是非常稀缺的。这种情况下,双语平行数据非常珍贵,需要更高效地利用;并且由于双语数据稀缺,充分利用大规模非平行单语数据也十分重要。

为了最大化对双语数据和单语数据的有效利用,MGNMT采用了以下几种关键技术:

1. 通过一个共享的隐变量,将两个翻译方向的翻译模型和两个语言的语言模型结合在同一个概率模型中。

2. 训练时,两个翻译方向相互促进。通过隐变量建模了互为译文的双语数据的语义等价性,让两个翻译方向的模型可以更好地利用双语平行数据;同时,通过隐变量作为中间桥梁,任意一方的单语数据都可以同时帮助到两个翻译方向的模型,从而也更好地利用了单语数据。

3. 解码时,语言模型和翻译模型相互协作。正向翻译模型和目标语言模型首先用beam search进行协同解码,得到多个候选译文;随后反向翻译模型和源语言语言模型对候选译文进行排序,选择出最忠实于原文语义的最佳译文。

在低资源的情况下,MGNMT在多个数据上都得到了最好的翻译结果。相较于传统的Transformer模型,以及Transformer结合回翻译(Back-Translation)进行数据增强以利用单语数据的方式,其结果都显示了比较一致的、显著的提升。

MGNMT模型示意图。MGNMT同时建模了两个翻译方向的翻译模型和两个语言模型。

结语

“我们和你一样,一步一踉跄,却坚定不移。我们和你一样,经历波折,却满怀希望”。在《请翻译2020》年度盘点中,火山翻译团队表示,为了呈现更佳的翻译效果,创造更好的跨语言体验,火山翻译孜孜不倦地为不同的语言提供最优解法,为了“让世界更小,让不同的文化更近”。

[1]  [2]  [3]  [4]  [5]  
高层访谈
雷军:推进“5G+AIoT”超级互联网
小米提出“手机+AIoT”的双引擎战略,目前已证明成效显著。截至到今年6月30日,小米依然是全球..
杨元庆:联想已成立疫情防控小组 并且做好了打大仗的准备
宏观上说,我们是为国家和全人类而战。过去三四十年来,中国已经成长为世界的工厂,为全球各地..
观点态度
5G毫米波网速优势显现,少了高速路的5G不完整
随着5G网络目前在全球各地的开通,5G毫米波在峰值速率上已经展现出了巨大优势。同时,工信部在..
手机厂商这半年:互怼变日常,多品牌成突围关键
2019年的手机行业,可以说是非常热闹的,仅仅上半年,“华米OV”的隔空互怼便开始频繁上演。
移动互联
手机
智能设备
汽车科技
通信
IT
家电
办公打印
企业
滚动
相关新闻
关于我们 | 联系我们 | 友情链接 | 版权声明
新科技网络【京ICP备18031908号-1
Copyright © 2020 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。