单节点能跑72个大语言模型,宁畅服务器就是这么强大
发表时间:2023年12月18日 12:13 来源:新科技
12月15日,2023英特尔新品发布会暨AI技术创新派对正式举办,第五代英特尔® 至强® 可扩展处理器首次在中国亮相。宁畅作为英特尔重要的合作伙伴之一受邀参展,重磅发布全新升级的G50系列服务器,并现场展出B5000和R620 G50两款产品,与英特尔携手共同迈向AI无处不在的新时代。
第五代英特尔® 至强® 可扩展处理器为AI加速而生,拥有更可靠的性能和更出色的能效。相较上一代,第五代英特尔® 至强® 可扩展处理器训练性能提升高达29%,推理性能提升高达42%,在相同TDP下平均性能提升高达21%,内存带宽提升高达16%,三级缓存容量提升2.7倍,可显著提高内存带宽约束型和时延敏感型工作负载的性能。
宁畅G50系列服务器涵盖通用机架服务器、人工智能服务器、边缘计算服务器等多种类型。全新的G50系列在内存通道等方面进行重要升级,基于最新的第五代英特尔® 至强® 可扩展处理器能够进一步释放AI潜能,为更多需求场景提供高性价比的强大算力支撑。
以宁畅高密度计算服务器B5000 G5为例,通过搭载第五代英特尔® 至强® 可扩展处理器,可执行多个、多种AI推理任务,实现高模型并发。在大语言模型领域,宁畅B5000 G5 4节点可同时支持28个70B百亿大模型并发,单节点可支持72个7B大语言模型并发,仅0.117秒即可实现以文生文(文章续写与扩写)。在以文生图领域,B5000 G5单节点,不到3秒就可根据任意文本输入生成极具逼真度和细节的高质量图像。在图像识别领域,B5000 G5 单节点 1秒钟可分类5566张图像,对比第四代性能提升近10%。
宁畅将加快创新脚步,与英特尔等合作伙伴携手满足广大用户对更高效算力的需求,开创AI应用的无限可能。