在封装方面,英特尔也制定了技术路线图。标准封装的接点间隔大约是110微米,然后到嵌入式多芯片互连桥接2D封装(EMIB)技术,它的接点间隔就是前者的一半,这样在二维中就可以得到更大的带宽,功耗也更低,能下降近1/5。
Foveros 3D封装技术,将是下一个技术飞跃。此外,就是为解决晶体管密度问题而开发的工具,从而在一个封装上构建完整的系统,集合不同速度的晶体管和IO芯片、互连等等。
“在制程和封装技术上,有密度的提升,有Foveros技术进步。进而利用先进的封装技术为每个工作负载都提供相应最优的芯片。”Raja讲道。
此外,在接下来的10年中,将会看到比过去50年中多得多的架构提升。
在架构方面,工作负载有多种。比如,看起来像标量计算的计算,像向量计算的计算,像矩阵计算的新型卷积计算,以及FPGA代表的空间架构。不同的工作负载好像是一片土地上的不同地区,中间被深沟隔开。“在接下来5-10年中,最重要的现代工作负载,就是这种标量、矢量、矩阵和空间架构的组合。”Raja强调。
对于每个架构而言,性能和通用性都很重要。CPU是最通用的,虽然可能不是其中性能最好的。GPU在性能模型上有些创新,但不像CPU那么通用,但是GPU对于高强度工作负载的性能更好。FPGA加速器效率要高得多,但并不通用。Raja指出:“真正需要关注的是性能和通用性的不同搭配组合。”
对此,英特尔的愿景和路线图是,提供标量、矢量、矩阵和空间的多种架构组合,部署在CPC、GPU、FPGA和加速器套件之中。
在内存和存储方面,当前需要指数级和先进的内存层级架构,以满足当前的计算需求。当内存容量以指数级速率增加时,内存的带宽却呈次线性增长。内存层级架构上,从高速缓存到硬盘,每个级别都应该是10倍的提升。对此,英特尔也在开发封装内存、持久内存和3D NAND等技术,以实现10倍的提升。现在是否能实现这个目标,取决于设定在硬件和软件边界的哪一边。如果不改变相应的软件架构,这些内存层级架构的10倍提升都无法转化为实际的工作负载提升。
下一个技术支柱是互连,包括片上互连、芯片间互连、系统级互连和数据中心级互连。每个层级的互连都在创新。英特尔从片上、封装内互连、处理器间互连、数据中心互连到无线互连等各方面都有投入。同时,还开放了Compute Express Link(CXL)规范。Raja表示,这是英特尔的一项重大创举。
在安全方面,未来10年内任何成功的新架构都应将安全作为其基础和优先特性。安全的挑战源于外露面的指数级增长。6个内存层级架构,4个互连层级架构和数10亿个设备。在这其中,如果架构的每个部分都有1个指数级的外露面,那么需要保护4*6*4个面,即96的面。在业内,外露面仍然存在问题。每次向CPU添加新指令时,都会增加外露面。因此,对于所有硬件和软件方面来说,安全的挑战和机遇都是并存的。
最后一个支柱是软件。对于全新硬件架构的每一个数量级的性能提升潜力,软件能带来超过两个数量级的性能提升。
Raja指出:“英特尔在软件领域的策略是一个架构,像是CPU的图形架构,围绕架构进行扩展。我们拥有一个1200万活跃开发者的生态系统,横跨PC、网络和数据中心。”
同时,英特尔也设定三个目标。一是简便和可扩展。对于开发者来说,它应该易于使用,而且不仅可以扩展到所有的架构,更可以扩展到所有的操作系统,是从一个节点到生态系统中的数百万台互联设备。二是开放性,即将向所有人开放标准。三是必须提供统一的开发体验。“设定了这三个目标,特别是为了构建即将出现的计算机的异构性。”Raja表示。
为解决这个问题,英特尔投入一年多的时间在做OneAPI项目。One API整合了计算和架构创新,通过高速互连以及新的软件开发模式,为开发者简化API,并从英特尔计算架构释放出更高的性能和效率。Raja在大会现场正式宣布,One API项目将在2019年第四季度之前如期交付给开发者。(校对/范蓉)