飞象网讯(魏德龄/文)在如今高速率与低时延在各种用例中已成为重要前提条件的时代,传统的冯 诺依曼架构由于大大依赖单一的CPU或GPU进行计算,已经无法解决日益严重的网络拥塞的问题。以数据为中心的新架构则解决了这一问题,通过让“数据在哪,计算就在那”,从而大大降低通信延时。英伟达的BlueField-3与DOCA软件开发包所构建出的DPU生态系统正在让更多业务受益于这种新架构,让数据中心成为新的计算单元。
数据中心成为新计算单元
以BlueField为代表的DPU的出现正是为以数据为中心的计算架构而生,它的存在实现了业务和基础设施操作的分离,大幅降低了长尾延时,而长尾延时正是影响业务性能的巨大瓶颈所在。
UCloud技术专家马彦青就对基于InfiniBand网络的DPU与以太网进行了举例对比,他表示:“试想一个研究生或博士在2-3年时间里,如果能用InfiniBand网络把计算量缩短一半或1/3,也就是意味着他们在读研和读博期间会有更多的论文产出量。而在石油勘探领域,如果把这种数据、计算和勘探模型的计算缩减一半以上,那意味着它整个油田的勘探也会缩短时间。”
英伟达在今年的GTC上正式发布了BlueField-3,相比上一代产品,它具有5倍加速计算能力、16个Arm A78 CPU核,和4倍的加解密速度。BlueField-3也是首款支持第五代PCIe总线并提供数据中心时间同步加速的DPU。
值得一提的是,BlueField-3也是业界首款速度达到400Gb/s的DPU,英伟达将会在BlueField-3上推出400Gb/s的Ethernet或InfiniBand接口。客户可以使用BlueField-3来实现400Gb/s的加解密速度(无论是用IPSec还是TLS),而以往使用CPU时,即便使用200G的网络,把CPU资源完全耗光,也只能跑到30-40Gb/s。
释放最大性能
无疑,BlueField-3充分实现了把合适的计算放在合适的地方,进而释放最大的性能。除了上文马彦青举例的在实际用例中可以缩短科研或勘探时间外,在安全、网络、存储、AI与HPC等业务场景上都能实现加速。
在安全业务上,BlueField-3可以实现从IP层,传输层以及到MAC层的400Gb/s全线速在线加解密,当使用RegEx和DPI做深度包检测时,速度可以达到50Gb/s。据NVIDIA网络事业部亚太区市场开发高级总监宋庆春透露,从BlueField-3以后,会对未来加密计算开始做铺垫,到BlueField-4以后可以真正实现加密计算。
在网络业务中,BlueField-3专门对RDMA、Connection Tracking、ASAP2等这些网络通信技术做了进一步加强,特别是对时间精度,可在数据中心和边缘之间做非常及时的时钟同步。
在存储业务中,BlueField-3可以实现以往不可能做到的事情,可以做到Block storage、File storage、object storage或者NVME storage的仿真,还可以对storage在数据落盘时加解密的操作进行硬件卸载,甚至是各种签名操作都可以分流到DPU上。
对于AI与HPC而言,BlueField-3可以执行通信框架,实现无阻塞通信,告别以往通信时不计算,计算时不通信的局限,实现通信与业务的分离,进而可让一些业务的性能提升30%-40%。
DPU生态系统兴起