閻犵尨鎷�闁荤偞绋忛崕鎻掞耿娑擄拷2闂佹眹鍔岀€氼參骞侀锝嗗闁瑰墽绮€点垽鏌嶉妷锔界厸闁逞屽墯濮婂綊宕奸敓鐘冲殜闁挎繂鎳夐崑鎾愁吋閸涱剚妯婇梻浣藉Г椤祩闂佹寧绋戦懟顖炲Χ娴犲瑙﹂柛娑橈攻閺嗩亪鏌熼棃娑毿$紒銊e姂瀹曗剝绻濋崒姘兼浆闂佺ǹ饪甸幏锟�閻犵尨鎷�闂佸搫妫欓崹鍨閿濆鍤冮柣妯烘惈閸擃參鏌¢崟顒佸碍闁搞値鍙冨濠氼敋閳ь剟銆傛禒瀣櫖閻庡湱鎸秄espace闂佺儵鏅涢敃锕傚极閹剧粯鍤曢悘鐐舵缁ㄨ霉閿濆洤校濠⒀嶇畵閺屽懘鎮╅煫顓熸▕闁瑰吋娼欓崲鏌ュΧ娴犲鐏虫繝濠傛娴滄牠鏌嶉妷锔剧畺闁逞屽墾閹凤拷閻犵尨鎷�婵☆偓绲鹃悧鏇㈠垂闁秴绠戠憸蹇涳綖閺嶎厽鍎橀柡鍐e亾闁搞劍宀稿绋库堪閹邦喚鐛ラ梺鍛婄墬閵囩偤宕ラ銈傚亾鐟欏嫮绠栭柣蹇斿哺閹粙鎮㈤崫鍕ㄦ寘缂備椒鑳堕崑鐔哄垝閿熺姵鐓€闁告稑锕ラ弳顓㈡煕閻樻彃娈獻E濠电偛鐭佸畷鐢稿几閻旂厧鏋侀柛顐ゅ枔娴滐拷閻犵尨鎷�缂備礁顦伴崹鐢割敆閻旂厧绠柕鍫濈墕閳ь兛绮欏銊╂嚒閵堝棙顓洪梺鎸庣⊕瀹€绋库枖閿燂拷4闂備焦褰冪粔鍨叏閵忋倖鍤冩繝闈涙祩濡茶崵绱掗鈧埀顒佺〒閼规儳鈽夐幘顖氫壕闂傚⿴鍓﹂崑鍡椻枔閹达箑纾婚柕澶堝劤閺嗘棃姊洪銏犫偓椋庣箔婢跺备鍋撻悷鎵Ш闁轰礁锕ュḿ濠氭晸閿燂拷閻犵尨鎷�闁荤喐鐟辩紞渚€寮ㄩ敐澶屽彆妞ゆ劧绲剧紞蹇曠磼閻欏懐纾块柟顔硷躬瀵剟寮堕崯鍐惧弮瀹曟繈宕犻敍鍕崶lifespace闁诲繐绻愮换妤呭箺閹达附鍤堥柟娈垮枟閹跺嫰鏌i姀銏犳灆鐎殿喖顭峰畷婵嬪煛閳ь剛绱炲Ο灏栧亾閸︻厼浠ф鐐叉川缁棃骞嬪┑鎰Τ闂傚⿴鍓﹂崑鍛缚濡ゅ啰涓嶉柨娑樺閸婏拷閻犵尨鎷�婵犵鈧啿鈧绱炲鍥╃煋闁瑰瓨绻嶉崝鍛存⒒閸曨偆啸妞ゃ垹鎳橀幊姗€宕掗敂鎯ф優婵炴垶鎸剧划顖涙櫠閿旇棄绶為柍鍝勫暙婵囨煙鐎涙ê濮囬柛銊ラ叄閹啴宕熼鑲╀喊闂佽皫鍕姢闁伙絿鍋熼惀顏嗏偓鍦Х濠€鍝ョ磼娣囧崬鐏繛鍙夋倐閹虫鎹勯悜妯诲Ρ婵炲瓨绮屽Λ婊嗩暰婵炴垶鎼幏锟�閻犵尨鎷�闂佸搫瀚Λ婊堝触濡崵鈻旀い鎾跺仦缁傚洭鎮硅閸氣偓缂佹绻傞埥澶娾槈瀹曞洨鐛ョ紒鎯у綖缁€渚€鎮介锕€鍙婃い鏍ㄨ壘閺嬪酣鏌℃担鍝勵暭鐎规挷绶氶幆鍐礋椤掍椒绮繛杈剧到閸熷潡鎮洪妸鈺佺<闁靛ǹ鍊楅惌娆撴偣閹拌埖瀚�閻犵尨鎷�婵犵鈧啿鈧绱炲鍡樻珷闁绘劖褰冪换渚€鏌涜箛鎾缎ら柡灞芥嚇瀹曟繂鈽夊畷鍥ф優濠殿喖绠嶉崐娑㈠吹閺囥垹纾圭€广儱鎳嶅ǎ顕€鏌ч弬娆惧剳婵炲憞鍛灊濠㈣泛枪閸嬨劑鏌﹂埀顒勫Ψ閵夈儲鍊犻梺鍝勵槶閸庮噣鍩€椤掍胶鐭婂┑顕呬邯瀵劑鎮滈埞鎯т壕闁跨噦鎷�閻犵尨鎷�Canalys闁荤姴顑呴崯浼存偉濞差亝鏅慨姗嗗亯閸橆剟鏌涢妷锕€鐏婄紒杈ㄥ笚缁嬪顫濋澶婃婵炲瓨绮岀花鑲╃箔閸屾稓顩查柟瀵稿У閻i亶姊婚崶锝呬壕濠殿喚鎳撻崐椋庡垝濞戙垺鍊块柡鍫㈡暩缁夌敻寮堕埡瀣閻犵尨鎷�婵犫拃鍛粶缂佺姵鐟ч幖楣冩晸閿燂拷30% 闂佸憡顨呯花鑲╂嫻閻斿摜鈻斿┑鐘叉噽濞堬拷2023闂佸綊娼ч鍡椻攦閳ь剟鏌涢幋锔剧窗闁逛紮缍侀弻宀冪疀濮橆剚顔�4000婵炴垶鎸稿ú顓㈠磿閿燂拷
您现在的位置:首页 >> IT >> 正文
UCloud与IDEA研究院合作推出“姜子牙大模型”镜像,助力大模型业务发展
发表时间:2023年7月13日 13:49 来源:新科技 责任编 辑:麒麟

近年来,大模型发展在人工智能领域引起了广泛的兴趣与关注,庞大的规模和学习能力使其具备了出色的性能和表现。近日,IDEA研究院(粤港澳大湾区数字经济研究院)宣布开源通用大模型系列“姜子牙”,让广大开发者可以共同参与模型的改进、优化和拓展,通过分享经验和创意,推动模型的进步和创新。与IDEA建立合作,UCloud镜像市场也上线了姜子牙大模型镜像,基于UCloud强大的云计算基础设施,客户可以轻松创建预装姜子牙大模型的云主机,并享受高性能的GPU算力资源。

“姜子牙通用大模型v1”是由IDEA开发的一款领先的自然语言处理模型。基于LLaMa的130亿参数的大规模预训练模型,具备翻译、编程、文本分类、信息抽取、摘要、文案生成、常识问答和数学计算等能力。目前姜子牙通用大模型v1已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。

本次UCloud上线的是姜子牙大模型的Ziya-LLaMA-7B-Reward模型镜像。该模型基于Ziya-LLaMA模型,在自标注高质量偏好排序数据、严格过滤的外部开源数据这两个偏好排序数据上进行训练。同时该模型能够模拟中英双语生成的奖励环境,对LLM生成结果提供准确的奖励反馈。

作为最新一代发布的大语言模型,“姜子牙通用大模型v1”具备以下三个方面的优势:

1、全面的数据训练:使用来自多个领域和多种来源的原始数据进行预训练,包括英文和中文数据。通过去重、打分、分桶、规则过滤和数据评估等处理,最终得到125B tokens的有效数据。这种全面的数据训练使得模型具备广泛的语言知识和理解能力。

2、高效的中文编解码:通过扩充词表、优化分词方式,提升了对中文的编解码效率。通过增加常见中文字并复用Transformers中的LlamaTokenizer,实现了高效的中文处理能力。

3、多任务有监督微调和人类反馈训练:在多任务有监督微调阶段采用课程学习和增量训练的策略,通过"Easy To Hard"的方式进行训练。同时,通过人类反馈训练进一步提升模型的综合表现。人类反馈训练采用了以人类反馈强化学习为主的方法,结合多种其他手段联合训练,包括人类反馈微调、后见链微调、AI反馈和基于规则的奖励系统等。这些训练方法使得模型能够更好地理解人类意图、减少错误输出,并提高整体性能。

这些优势使得姜子牙大模型成为一款强大的自然语言处理模型,不仅在语言知识和理解能力方面有出色表现,可以高效处理中文,并且经过多任务有监督微调和人类反馈训练,可进一步提升性能和准确性,尤其在角色扮演的领域,表现效果尤为突出。

图片来源:https://huggingface.co/IDEA-CCNL/Ziya-LLaMA-13B-v1

写在最后

作为开源模型,姜子牙大模型鼓励开发者和研究者之间的合作和共享,这使得更多的人可以通过领域知识微调,共同改进模型并推动新模型的推出与发展,技术的本质在于应用,ChatLaw(法律大模型)应用法律行业,就是大模型落地垂直业务场景的极佳案例。

UCloud将继续与IDEA等优秀合作伙伴密切合作,致力于完善大模型和算力相结合的MaaS(Model as a service)服务生态,积极推进人工智能技术的发展,为客户提供更多高性能、高可靠性的“算力+模型”解决方案,助力企业实现智能化转型和业务创新,一起迎接大模型时代的机遇和挑战!

高层观点
用友董事长兼CEO王文京:全面数智商业创新时代到来
用友网络董事长兼CEO王文京认为,随着AI成为全球IT技术与产业创新的中心,商业创新也进入全面数..
华为汪涛:深耕价值客户、商业和分销三类市场
5月8日,在华为中国合作伙伴大会2023上,华为常务董事、ICT基础设施业务管理委员会主任、企业BG..
企业纪事
12岁即显现商业头脑 IT巨头公司戴尔的发展简史
从1984成立到今天,戴尔已成长为全球知名的电脑、服务器、数据储存设备和网络设备厂商。
5G毫米波网速优势显现,少了高速路的5G不完整
随着5G网络目前在全球各地的开通,5G毫米波在峰值速率上已经展现出了巨大优势。同时,工信部在..
移动互联
手机
智能设备
汽车科技
通信
IT
家电
办公打印
企业
滚动
相关新闻
关于我们 | 联系我们 | 友情链接 | 版权声明
新科技网络【京ICP备18031908号-1
Copyright © 2025 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。