使用经过训练的机器学习模型进行预测可以驱动应用程序高达90%的计算成本。开发人员可以将GPU支持的推理加速附加到Amazon EC2和Amazon SageMaker实例中,从而将推理成本降低75%。
根据官网介绍,每个Inferentia芯片提供高达几百TOPS的算力,使复杂的模型能够做出快速的预测。多个AWS Inferentia芯片可以一起使用来驱动,形成成千上万的TOPS算力。
这款芯片将于2019年底上市,AWS用户可以通过Amazon SageMaker、Amazon EC2等一起使用 Inferentia的算力。
云计算巨头自己造芯:摆脱束缚、降低成本、打击对手
Graviton的问世显示出亚马逊AWS摆脱英特尔的决心。
目前,英特尔拥有全球数据中心计算几乎全部市场份额,英特尔的服务器芯片价格居高不下,而且有供应短缺的风险。
为了摆脱这种束缚,越来越多互联网巨头们正考虑使用Arm,OpenPower,RISC-V和AMD Epyc产品,定制自己的芯片,全球云计算巨头(包括微软,谷歌,Facebook,亚马逊,百度等) 都在寻找替代芯片供应商。
早在2015年左右,亚马逊与AMD合作开发64位Arm服务器处理器,用于亚马逊的数据中心。AMD还在2016年就推出了与亚马逊合作的Arm芯片,代号“西雅图”的Opteron A1100处理器。
不过,AMD未能达到亚马逊的性能标准,于是亚马逊退出了与AMD的合作,收购了Arm授权许可持有者和片上系统设计企业Annapurna Labs,让收购后的团队开始设计物联网网关及其Nitro芯片组,负责处理托管EC2虚拟机的亚马逊服务器的网络和存储任务。
今天的高端Arm CPU的应用范围,远远超出了智能手机,还能够运行桌面端和轻型服务器上的应用程序。Graviton的问世就是Annapurna Labs的成果。
而AWS Inferentia的问世则是打击对手的思路。
第三季度,亚马逊有一半利润来自AWS云服务,AWS业务在第三季度的营业利润率为31%,这是四年多以来的最高水平。
市场份额也印证了AWS的业绩。根据Synergy Research的数据,亚马逊的AWS控制着34%的云基础设施服务市场。微软以15%的市场份额位居第二,其次是IBM(第三)和谷歌(第四),市场份额均为个位数。
形势一片大好。
但是,AWS的对手也突飞猛进。微软Azure云计算同比增长76%,而Alphabet早在今年2月就宣称,基于2017年的公开数据,谷歌云平台是“全球增长最快的主要公有云提供商”。
谷歌云也在最近迎来大调整:现任CEO将在明年1月离职,接替她的是在甲骨文有20年工作经验的云计算市场老手,紧紧盯住AWS的份额。
Inferentia芯片的推出,就是AWS应对这种局面的杀手级武器,主要能够降低成本。