闂佽崵濮风亸銊╁箯閿燂拷闂備浇宕甸崑鐐电矙韫囨稑纾块柟缁樺釜閼板灝鈽夐幙鍕2闂傚倷鐒﹂惇褰掑礉瀹€鈧埀顒佸嚬閸欏啴鐛笟鈧、鏇㈡晲閸℃鈧捇姊洪悷鏉库挃缂侇噮鍨抽埀顒傚仯閸ㄤ粙寮诲澶娢ㄩ柨鏃傛櫕閸樻悂姊洪柅鐐茶嫰婢ь垱鎱ㄦ繝鍌滅Ш鐎规洖銈搁弫鎾绘偐閸愬弶鐤侀梻浣瑰缁诲倿骞婃径鎰;闁圭偓鍓氶崥瀣煕濞戝崬澧俊顖氾躬濮婄粯鎷呴挊澹挻銇勯鐘点偐闂傚倷鐒︾€笛呯矙閹达附鍤愭い鏍仜鍥存繛瀵稿Т椤戝懐鎲撮敃鍌涚厱婵炴垶锕弨濠氭煛閸♀晙閭柡宀€鍠栧Λ鍐ㄢ槈濮e尅绱曠槐鎺楀Ω閿濆懎顫囬悗瑙勬磵閸撴繄鎹㈠┑瀣<婵ê鍚嬪ù鍡涙⒒娴e懙褰掋偑閻㈢ǹ绠柨鐕傛嫹闂佽崵濮风亸銊╁箯閿燂拷闂傚倷绀侀幖顐⑽涘▎鎾冲瀭闁割煈鍋嗛々鏌ユ煥濠靛棭妲归柛銈呭暣閺岋絽螣閻戞ɑ鍎撻梺鍛婃惄閸欏啴寮婚敓鐘茬妞ゆ帊绀佺喊宥夋⒑閹肩偛鈧倝宕i崘顭戞綎濠电姵鍑归弫瀣煃瑜滈崜鐔煎Υ閸屾稓顩烽悗锝庡亝濞呮牠鏌f惔鈩冭础闁瑰摜顫塭space闂傚倷鑳堕崕鐢稿疾濞戙垺鏅濋柨鏇炲€搁弸渚€鏌熼崜褏甯涢柛銈嗘礋閹﹢鎮欓懜娈挎缂備降鍔忛褔婀侀梺鎸庣箓濞层倖鐗庡┑鐘媰瀹ュ洨鏆ら梺鍝勮嫰閹虫﹢骞冮埡鍛彄妞ゆ挾鍠愰埢鏇㈡⒑閻熸澘鎮戞繛鍏肩懇瀹曟煡寮婚妷銉幯兠归悩宸剰闁诲繗娅曠换婵囩節閸屾侗妫炴繛瀛樼矋閻楃娀寮诲澶娢ㄩ柨鏂垮⒔閻f椽姊洪柅鐐茶嫰婢ч箖鏌熼崙銈嗗闂佽崵濮风亸銊╁箯閿燂拷婵犵妲呴崑鎾跺緤妤e啯鍋嬮柡鍥ュ灩閸ㄥ倿姊洪鈧粔瀵哥不閹寸姵鍠愰煫鍥ㄥ喕缂嶆牠鏌″搴″箺闁稿孩锕㈤弻锟犲礃閿濆懍澹曢梻浣规偠閸斿秴鐣濈粙娆惧殨缂佸绨遍崼顏堟煙闁箑鏋ら柣娑栧劦濮婃椽宕ㄦ繝鍕潷闂侀潧娲ㄩ崑銈呯暦閵夆晩鏁冮柕鍫濆€告禍楣冩偡濞嗗繐顏紒鐘崇墵閺岋綀绠涢弬鍨懙闂佽鍠曠划娆撳箖閵忋倕浼犻柛鏇樺妽鐎垫ḿ绱撻崒娆愵樂闁煎啿鐖煎畷鎴︽偄閸濆嫬鐏婇梺璺ㄥ枔婵敻鎮¢埀顒勬⒑閸涘﹦鈽夐柨鏇樺劦瀵娊顢橀姀锛勫幈闂佺粯蓱瑜板啫鈻撻悰绫堝┑鐘垫暩閸嬫盯鎯屾担鍝ユ殾闁汇垻枪閸戠娀鏌i弮鍌氬付闁哄绶氶弻娑㈩敃閵堝懏鐏佹繛瀛樼玻閹凤拷闂佽崵濮风亸銊╁箯閿燂拷缂傚倸鍊风粈渚€藝娴兼潙鍨傞柣銏犲閺佸棝鏌i弮鍌氬付缂佺媭鍣i弻鏇㈠醇濠靛牆顣洪梺閫炲苯鍘哥紒顔界懃椤曪綁濡搁埡鍌氭闂侀潧鐗嗗Λ娆擃敇濞差亝鈷戦柟绋挎捣閳洜鈧厜鍋撶紒瀣氨閺嬫牠鏌ㄩ悤鍌涘4闂傚倸鍊烽悞锕併亹閸愵亞鐭撻柛顭戝亝閸欏繘鏌曡箛瀣偓鏍吹閸愨晝绡€闂傚牊绋掔粊鈺備繆閼艰泛鍚圭紒杈ㄥ浮椤㈡岸鍩€椤掑嫬鐒垫い鎺嶈兌閵嗘帡鏌ょ憴鍕姢闁宠棄顦甸獮姗€顢涘顐㈩棜闂傚倸鍊搁オ鎾礈閿曞倸纾婚柛鈩冦仜閺嬫棃鏌熸潏鍓х暠缁炬儳顭烽弻鏇熷緞閸繂濮㈤梺鍝勬濡啫顫忓ú顏嶆晝闁靛繒濮崑鎾搭槹鎼达絿鐣舵繝銏f硾婢跺洭宕戦幘缁樺仭闁规鍠氭闂備浇妗ㄧ粈渚€鏁冮妷銉$細濠电姵纰嶉弲鎼佹煥閻曞倹瀚�闂佽崵濮风亸銊╁箯閿燂拷闂備浇宕甸崰鎰版偡鏉堚晝绀婂〒姘e亾鐎殿喓鍔戦弫鎰緞鐏炶棄绲炬俊鐐€栭崝褏寰婇崜褏绀婇煫鍥ㄦ礈绾惧ジ鏌e▎蹇斿櫧缁炬儳娼¢弻鐔碱敊绾柉鍚悗娈垮櫘閸撶喎顕i崼鏇炵柈闁告劖鍎冲顔锯偓瑙勬礃缁诲牆鐣烽悩缁樻櫖闁告洦鍘惧畷绉巌fespace闂備浇顕х换鎰崲閹邦喗宕叉俊銈呮噹缁犳椽鏌熸潏楣冩闁搞倕鐗撻弻鐔封枔閸喗鐏嶉梺纭呮硾鐎氫即寮婚敐澶婎潊闁靛繒濮甸悘鍡涙倵濞堝灝鏋涙い顓炲槻閻e嘲鈹戠€n亞鍘搁梺閫炲苯澧扮紒杈╁仜铻i悘蹇旂墪娴滈箖鏌涢敂璇插箹濞寸姍鍕垫闁绘劕寮跺婵堢磼椤旇姤顥堟鐐差儏閳规垿骞囬鈧煢闂傚倸鍊搁オ鎾礈閿曞倸纾婚柛娑卞幏缂傛碍淇婇妶鍛殶濞戞挸绉归弻銊モ槈濡警浠鹃梺绋库康閹凤拷闂佽崵濮风亸銊╁箯閿燂拷婵犵數濮烽。浠嬪焵椤掆偓閸熷潡鍩€椤掑嫷妫戠紒杈╁仜椤撳ジ宕堕埡鍐帬闂備胶鎳撻悺銊ф崲瀹ュ绀夐柛娑樼摠閳锋帡鏌涢弴銊ヤ簽閸熺ǹ顪冮妶鍐ㄧ仼闁硅櫕锕㈤獮濠傤潨閳ь剙鐣烽幒妤佹櫆闁诡垎鍕姃婵犵數鍋為崹鍫曞箰閸撗冨灊妞ゆ牗绋掑▍鐘绘煥閺冨洦顥夌紒鍓佸仱閺屽秹宕崟顐f婵犳鍟崶銊у幍闁诲孩绋掗敋濠殿喖娲弻娑㈠Ω閵夆晛寮伴梺璇″灠閸熸潙鐣烽悢纰辨晩闁兼祴鏅欓崰濠囨⒒娴g晫姣囬柛鏇ㄥ亜婵垽姊烘导娆戞偧闁稿鍠栭幆鈧い蹇撴閸嬫捇宕烽鐐愩儲绻濋埀顒勫传閵壯咃紲婵烇絽娲ゅ畷顒勬倶椤忓懐绠鹃柛娆忣槹閸婃劙鏌熼搹顐畼闁圭懓瀚伴幃婊兾熺拠鍙傗€斥攽閻愯尙鎽犵紒顔艰嫰铻炴繝濠傛-閺嗘澘鈹戦悙鏉戠仸闁圭⒈鍋婇獮蹇涙晸閿燂拷闂佽崵濮风亸銊╁箯閿燂拷闂傚倷绀侀幖顐も偓姘煎墮铻炴繝濠傜墕鐟欙附淇婇婵嗗惞闁崇粯姊归妵鍕箻鐠鸿桨娌紓浣稿€稿ú顓㈠箖绾拋妲婚梺鍛婂焹閸嬫挾绱撴担璇℃畷缂佽鍊块崺銉﹀緞婵炵偓顫嶉悗瑙勬礀濞层劑鎮伴妷褏纾奸柟顖嗗啰绋忕紓浣插亾濞撴埃鍋撻柟顔荤矙椤㈡洟鏁冮埀顒勫矗婵犲啨浜滈柡宥冨姀婢规﹢鏌$€n亪鍙勯柡灞稿墲閹峰懘宕崟鍨瘔闁诲氦顫夐幐椋庢濮樿泛绠氶柛鎰靛枛缁€瀣亜閹哄秵顦风紒顕呭灡缁绘稒娼忛崜褍鍩岄梺鍝ュ枎濞硷繝骞冨ú顏勎╅柍杞拌兌閿涙粓姊洪棃娴ㄥ綊宕愬Δ鍛剹婵炲棙鎸婚崑锝夋煙閹峰苯鐓愰悗姘炬嫹闂佽崵濮风亸銊╁箯閿燂拷婵犵數濮烽。浠嬪焵椤掆偓閸熷潡鍩€椤掑嫷妫戠紒杈╁仜椤撳ジ宕卞Ο鑽ゅ娇闂備胶绮崝鏍亹閸愵亝宕插〒姘e亾闁哄本绋栫粻娑㈠箻缂傚簺鍊濋弻锛勪沪閼恒儱娈楅悗瑙勬礃缁诲倿鍩ユ径濠勬殾闁搞儜鍕姃濠电姵顔栭崰鏍不瀹ュ纾规繛鎴欏灩閸氬綊鏌¢崶銉ョ仼缁炬儳婀遍埀顒€绠嶉崕閬嶅箠瀹ュ惓搴敋閳ь剟寮昏瀵剙鈻庨幆褍澹嬫繝鐢靛仜閹茬偤宕ㄩ鐐典喊濠电姰鍨煎▔娑欑仚闂佺ǹ顑冮崝鎴﹀蓟閿曞倸鐒垫い鎺戝鍞梺闈涱槶閸庢煡宕愰悩缁樷拺闁告繂瀚峰Σ鍫曟煕鎼搭喖娅嶉柛鈹惧亾濡炪倖甯婇懗鍫曟儗婵犲倵鏀芥い鏇炴噸闁垳鈧鍠撻崝鎴﹀箖濠婂牆鐓橀柟顖嗗倸顥氶梻浣芥硶閸o箓骞忛敓锟�闂佽崵濮风亸銊╁箯閿燂拷Canalys闂備浇宕垫慨鎾敄閸涙潙鐤ù鐓庣摠閸嬪绻涘顔荤凹闁哄拋鍓氶幈銊ヮ潨閸℃ぞ鍑介梺鍛婏供閸撶喖寮诲☉銏犖ㄩ柨鏇楀亾闁诲繐锕︾槐鎺撴綇閵娿儳鐟茬紓浣割儏椤︻垶锝炲┑瀣垫晢濠㈣泛锕ラ蹇撯攽閻愯尙鎽犵紒顔肩灱閼洪亶鎳栭埡鍐暥闂佺ǹ鏈粙鎾汇€呴弻銉︾厵閻庣數枪鏍¢梺浼欑秮娴滆泛顫忔繝姘倞闁挎繂鎳嶆竟鏇熺節濞堝灝鏋ら柟铏崌瀹曟劖顦版惔鈥崇亰濠电偞鍨崹娲磹閸ф鐓涢柛顐犲灪閺嗏晝绱掓径灞炬毈鐎殿喖鐖奸崺锛勨偓锝庡亜椤忥拷闂佽崵濮风亸銊╁箯閿燂拷婵犵數濮幏鍐川椤撴繄鎹曠紓鍌欒兌婵敻鎮疯楠炴牗銈i崘鈺傛闂佽法鍣﹂幏锟�30% 闂傚倷绀侀幉锟犮€冮崨顖濆С闁兼祴鏅滅€氬鏌i弬鎸庢喐闁崇粯鏌ㄩ埞鎴︽偐閸欏娅у┑鐐茬墳閹凤拷2023闂傚倷绀佺紞濠傖缚瑜旈、鏍幢濡炵粯鏁犻梺閫炲苯澧撮柡灞剧洴楠炲鏁傞崜褏鐛ラ梻渚€鈧稓涓茬紓宥勭窔瀵鐣濋崘顏嗘澑濠殿喗锕╅崜姘额敊閿燂拷4000婵犵數鍋為崹鍫曞箰缁嬫5娲敇閵忕姷锛熼梺璺ㄥ櫐閹凤拷
您现在的位置:首页 >> IT >> 正文
ChatGPT掀起的AI技术革命
发表时间:2023年2月28日 16:33 来源:新科技 责任编 辑:麒麟

文/萨摩耶云科技集团数据业务部副总经理   易小华

自2022年11月上线后,ChatGPT就一路开挂,不仅  5 天时间便突破百万用户,月活用户突破 1 亿更是仅用时 2 个月,成为史上增速最快的消费级应用,远超Tktok、Facebook、Google等全球应用,可谓来势汹汹。ChatGPT表现出很高的人机交互水平,以及自然语言大模型具备面向通用人工智能的特征,在众多行业领域有着广泛的应用潜力。ChatGPT大热之下,其背后技术的原理是什么?AIGC的兴起给金融、跨境电商等众多行业带来怎样的机遇与挑战?AI又将如何赋能商业决策?

真正人类进行交流

ChatGPT是由OpenAI团队开发和训练的一个人工智能聊天机器人程序,使用了Transformer架构,它拥有语言理解和文本生成能力,尤其是通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,做到与真正人类几乎无异的聊天场景进行交流。

2020年5月的GPT-3,参与数量达到了1750亿,堪称“大力出奇迹”。ChatGPT  作为基于GPT-3.5架构开发的大规模对话AI模型,刚一问世就令全球为之震动,而其很可能是GPT-4  正式推出之前的演练。

不过,在萨摩耶云科技集团云科技研发中心数据业务部副总经理易小华看来,从技术角度来说,ChatGPT本身使用到的技术在过去5年已被业界反复验证,并不存在非常大的突破。有着多年AI研发工作的感叹“OpenAI多年的厚积为现在的薄发打下了基础,它所积累的模型规模已经把竞争对手甩在身后。”

ChatGPT的数据飞轮开始转动

从GPT1.0到GOT3.0,再到目前ChatGPT所使用的GPT3.5  , 在过去5年的时间,OpenAI投入了大量的人力、财力、算力,将其模型规模积累壮大。

2018  年 OpenAI 采用 Transformer Decoder 结构在大规模语料上训练了 GPT1 模型,横扫了各项  NLP 任务,自此迈入大规模预训练时代 NLP 任务标准的预训练+微调范式。2019  年,OpenAI  提出了 GPT2,GPT2 拥有和 GPT1 一样的模型结构,但得益于更高的数据质量和更大的数据规模有着惊人的生成能力。

由于  GPT 采用 Decoder 单向结构天然缺陷是无法感知上下文,Google 很快提出了 Encoder 结构的 Bert  模型可以感知上下文,效果上也明显有提升,同年 Google 采用Encoder-Decoder 结构,提出了 T5 模型。从此大规模预训练语言模型兵分三路。

易小华认为,2020  年 OpenAI 提出 GPT3 将 GPT 模型提升到全新的高度,其训练参数达到了 1750 亿,自此GPT系列模型的数据飞轮便转动起来,超大模型时代开启,走上了 NLP  任务新范式预训练+提示学习技术路线。由于  GPT3 可以产生通顺的句子但是准确性等问题一直存在,出现了InstructGPT、ChatGPT  等后续优化的工作,实现了模型可以理解人类指令的含义,会甄别高水准答案,质疑错误问题和拒绝不适当的请求。

强大的ChatGPT如何训练而成?

图片来自于OpenAI官网

ChatGPT使用了类似InstructGPT  的方法来训练模型,该方法也叫做RHLF(  人工反馈强化学习能力),它分三步来训练:

第一步:训练监督策略模型。为了让GPT  3.5初步具备理解指令的意图,首先会在数据集中随机抽取问题,由人类标注人员,给出高质量答案,然后用这些人工标注好的数据来微调  GPT-3.5模型,经过微调的模型已经具备在对话场景初步理解人类意图的能力。

第二步:训练奖励模型。这个阶段主要是通过人工标注训练数据,来训练回报模型。在数据集中随机抽取问题,使用第一阶段生成的模型,对于每个问题,生成多个不同的回答。人类标注者对这些结果综合考虑给出排名顺序。这一过程类似于教练或老师辅导。

接下来,使用这个排序结果数据来训练奖励模型。对多个排序结果,两两组合,形成多个训练数据对比。RM模型接受一个输入,给出评价回答质量的分数。

第三步:使用PPO强化学习来增强第一步生成的微调模型。首先初始化  PPO 模型,采样一批和前面用户提交 prompt 不同的集合,使用 PPO 模型生成答案。利用第二步回报模型对答案打分,通过产生的策略梯度去更新  PPO 模型。这一步利用强化学习来鼓励 PPO 模型生成更符合奖励模型判别高质量的答案。

通过第二和第三步的迭代训练并相互促进,使得  PPO 模型能力越来越强。

瑕不掩瑜,新技术革命风暴袭来

尽管ChatGPT表现出出色的上下文对话能力甚至编程能力,完成了大众对人机对话机器人从“人工智障”到“有趣”的印象改观。我们也要看到,ChatGPT技术仍然有一些局限性,还在不断地进步。比如,其未经大量语料训练的领域缺乏“人类常识”和引申能力,甚至会一本正经的“胡说八道”;ChatGPT无法处理复杂冗长或者特别专业的语言结构;需要非常大量的算力(芯片)来支持其训练和部署;无论是训练时间或训练成本,都是普通训练者难以接受的;ChatGPT仍然是黑盒模型,目前还未能对内在算法逻辑进行分解。

从辩证的角度来看,ChatGPT虽不完美,但它提升了理解人类思维的准确性,带来了里程碑式的技术革命。它将带动AI杀手级应用出现,代替大量低端人力,将给世界带来新的产业革命;使用大模型(或LLM)可以接近人类的思考能力;科技领先的马太效应会越来越明显。

ChatGPT在全球迅速掀起浪潮,中信证券研究院报告认为,中短期内产业化的方向,主要为文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服四大板块。而业内普遍认为,ChatGPT引领的大模型正在让AI技术从五年前的“能听会看”,走到今天的“能思考、会创作”,未来有望实现“会推理、能决策”的重大进步,其在决策智能领域有着广阔的应用潜力。

萨摩耶云科技集团在决策智能技术攻坚已取得重要原始性突破,在金融和跨境电商物流、电信领域积累了丰富的经验。“我们认为,ChatGPT可在营销客服,风险控制,代码编写、跨境电商内容生成等业务场景中产生颠覆性的价值。”易小华说。

重新赋能金融与跨境电商决策

营销和客服是金融领域不可缺少的两个环节,当前的营销渠道主要有广告投放,短信,外呼,app推送,资源位个性化展示、微信公众号等。“如果结合个性化推荐、实时计算能力以及AutoML等技术,ChatGPT可解决线上线下协同营销过程中的自动化断点问题,实现营销策略自动生成和迭代、自动AB实验、渠道自动分流,达到千人千面的精准营销效果。同时,结合金融机构语料进行适应性训练,会促进营销内容生成和用户转化效率的提升,提升营销和客服效率以及用户体验。”

萨摩耶云科技集团尝试以 ChatGPT作为自动客服系统的核心技术,并利用NLP和对话生成技术,训练类似于ChatGPT的语言模型,再叠加个性化推荐模型,结合业务知识库以及业务流程API,打造营销和客服机器人,旨在帮助金融机构进行营销获客提升客户服务质量。易小华表示,把机器学习、知识图谱、决策引擎人工智能技术和LLM模型技术融合,会进一步优化模型的智能性,改变信贷服务的人机交互体验,使得金融服务更有温度。

“我们试图在营销和客服场景中建立新的人机协作模式。一方面,ChatGPT类机器人在营销上承担人群和标签划分以及个性化推荐工作,在客服上执行问题理解、对话管理、问题推荐、答案生成。另一方面,人工客服则专注于话术推荐和会话摘要生成。”

而在金融风险控制方面,利用知识图谱引擎原有的隐性集团识别、深度链扩散、子图筛选等能力基础上,ChatGPT可扩展出更高维度、更大范围的隐性关系识别。萨摩耶云科技集团给出的方案是,探索接入类ChatGPT能力,通过对用户信用数据、历史借款记录、还款记录等数据分析,评估用户风险等级,实现对关键要素提取、资料自动化审核、风险点提示等风控领域的业务流程自动化水平的提升,向金融机构提供全方位智能风险管理服务,大幅提高风险识别能力。

当前,在跨境电商领域的应用方面,虽然ChatGPT可以直接帮助卖家生成内容,但是效果还是需要进一步改进。OpenAI提供了对GPT模型进行微调然后生成自定义GPT模型的接口能力,萨摩耶云科技集团通过调用接口,实现上传自己的训练语料对GPT模型进行微调,达到定制化模型的效果。未来,其可帮助跨境电商卖家在产品编写/优化listing、提升跨境电商平台店铺和产品排名、输出丰富优质的邮件营销内容、提供即时客户服务改善客户体验、开展智能广告投放提升转化率等层面进行降本增效。


人工智能已在多领域广泛应用,ChatGPT高超的人机交互水平、通用人工智能的特征,让世界为之惊叹。“不断进化的ChatGPT将为识别、生成和决策重新赋能,会对社会经济发展产生渗透性、颠覆性的作用。如何应对人工智能会是件有意思的事情,但AI的未来肯定超酷。”易小华对ChatGPT的应用前景充满期待。


高层观点
奇安信齐向东:5G应用发展面临多重网络安全挑战
5G是非常有魅力的,但是5G也是令人担忧的。
韦乐平:网络深度转型最明确的方向首先就是云化
几十年来,运营商一直依靠一代一代不断更新硬件黑盒设备为中心的发展路径。面对在家办公、网课..
企业纪事
5G毫米波网速优势显现,少了高速路的5G不完整
随着5G网络目前在全球各地的开通,5G毫米波在峰值速率上已经展现出了巨大优势。同时,工信部在..
手机厂商这半年:互怼变日常,多品牌成突围关键
2019年的手机行业,可以说是非常热闹的,仅仅上半年,“华米OV”的隔空互怼便开始频繁上演。
移动互联
手机
智能设备
汽车科技
通信
IT
家电
办公打印
企业
滚动
相关新闻
关于我们 | 联系我们 | 友情链接 | 版权声明
新科技网络【京ICP备18031908号-1
Copyright © 2025 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。