华为详解昇腾AI芯片:自研达芬奇架构 算力和能效比大幅提升
发表时间:2018年10月15日 12:59 来源:快科技
10月10日,华为在全联接大会2018上,首次宣布了华为的AI战略以及全栈解决方案。 与此同时,华为发布了自研云端AI芯片“昇腾(Ascend )”系列,基于达芬奇架构,首批推出7nm的昇腾910以及12nm的昇腾310。
其中,昇腾910是目前单芯片计算密度最大的芯片,计算力远超谷歌和英伟达。昇腾910半精度(FP16)运算能力为256TFLOPS,比NVIDIA的Tesla V100要高一倍,整数精度(INT8)512TOPS,支持128通道全高清视频解码(H.264/265),最大功耗350W。
昇腾310芯片的最大功耗仅为8W,主打极致高效计算低功耗AI芯片。半精度(FP16)运算能力8TFLOPS,整数精度(INT8)16TOPS,支持16通道全高清视频解码(H.264/265)。这两款AI芯片和大规模分布式训练系统都将在明年第二季度推出。
日前,华为终端手机产品线总裁何刚发布长图,详细介绍了昇腾310的用途以及设计细节。
何刚表示,昇腾310作为华为全栈全场景AI解决方案的关键部分, 是华为全面AI战略的重要支撑。 在设计方面,突破了人工智能芯片设计的功耗、算力等约束,实现了能效比的大幅提升。未来将为平安城市、自动驾驶、云业务和IT智能、智能制造、机器人、便携机、智能手机、智能手表等应用场景提供全新的解决方案。
昇腾310采用华为自研达芬奇架构,使用了华为自研的高效灵活CISC指令集, 每个AI核心可以在1个周期内完成4096次MAC计算,集成了张量、矢量、标量等多种运算单元,支持多种混合精度计算,支持训练及推理两种场景的数据精度运算。
统一架构可以适配多种场景,功耗范围从几十毫瓦到几百瓦,弹性多核堆叠,可在多种场景下提供最优能耗比 。