5月20日,由深度学习技术及应用国家工程实验室与百度联合主办的WAVE SUMMIT 2021深度学习开发者峰会在北京召开。飞桨框架进入2.0时代后,带来九大全新发布,包括飞桨核心框架V2.1、大规模图检索引擎、文心ERNIE四大预训练模型、推理部署导航图、硬件生态进展、开放云原生机器学习核心PaddleFlow,以及投入15亿资金、聚焦生态发展的飞桨“大航海”计划全面开启。飞桨持续引领深度学习技术发展和跨界科研突破,同时不断降低技术应用门槛,加速AI大生产,推动产业智能化进程。
飞桨以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台。百度深度学习技术平台部高级总监马艳军现场发布了飞桨开源的最新进展。
图:飞桨重磅发布推理部署导航图,助力开发者打通AI应用的“最后一公里”
今年初,飞桨正式发布了开源框架2.0版本,是飞桨发展历程中的重要里程碑。2.0版本默认的编程范式由静态图升级为动态图,而且实现了动静统一的设计,很好地兼顾了科研和产业的需求。目前,飞桨深度学习开源平台从基础模型库、端到端开发套件到工具组件,都基于框架2.0版本进行了升级,开发体验得到了全面提升。2.0版本的大规模训练能力持续突破,参数服务器技术迭代到第三代,是业内首个通用异构参数服务器架构。最近又发布了4D混合并行技术,支持超大模型训练。
此次峰会上,马艳军全新发布飞桨开源框架V2.1,自动混合精度、动态图、高层API等进行了优化和增强。尤其是自定义算子功能全面升级,降低开发者自定义算子的学习与开发成本,大幅提升开发灵活性。
分布式训练方面,发布大规模图检索引擎,支持万亿边的图存储和检索,大规模图模型训练架构支持网易云音乐等企业大规模应用落地。
模型套件方面,文心ERNIE全新开源发布 4大预训练模型,分别是多粒度语言知识增强模型ERNIE-Gram、超长文本理解模型ERNIE-Doc、融合场景图知识的跨模态理解模型ERNIE-ViL和语言与视觉一体的模型ERNIE-UNIMO。知识与深度学习相结合实现知识增强的语义理解,不仅仅能理解语言,还可以理解图像,实现统一的跨模态语义理解。
部署方面,飞桨提供全面的推理部署工具链,重磅发布推理部署导航图,其中已验证300多条部署通路,助力开发者打通AI应用的“最后一公里”。
硬件生态方面,从去年520峰会发布硬件生态伙伴圈到今天的一年时间里,飞桨已经和包括百度昆仑、英特尔在内的22家国内外硬件厂商开展适配和联合优化,已完成和正在适配的芯片或IP达到了31款。
图:飞桨开放云原生机器学习核心PaddleFlow
百度AI产品研发部总监忻舟带来了飞桨企业版“一核两翼”AI开发双平台的全新升级,并宣布正式开放飞桨企业版的“核”——PaddleFlow,一个专为AI平台开发者打造的易被集成的云原生机器学习核心系统。
PaddleFlow提供了计算和存储资源管理与调度、作业执行与服务部署等AI开发平台核心能力,并提供灵活的用户接入和二次开发支持,具备云原生、性能优异、轻量易用等产业特色,助力AI平台开发者高效构建更多细分场景和深度定制的AI平台。
“两翼”中的EasyDL零门槛AI开发平台面向AI应用开发者,预置17种任务场景,通过端到端全流程的自动化建模与优化机制,极致提升AI应用开发效率,本次EasyDL带来了自动场景适配优化、模型自动化评估与辅助诊断两项新特性,不断提升细分场景的模型效果和模型优化迭代效率。