联想单机部署DeepSeek推理性能实现新突破
创始人
2025-03-18 00:03:35

中证报中证网讯(记者 孟培嘉)3月17日,联想宣布旗下首款AMD AI大模型训练服务器联想问天WA7785a G3在单机部署671B(满血版)DeepSeek大模型时,可实现极限吞吐量6708token/s,将单台服务器运行大模型的性能推向新高。

据悉,依托联想万全异构智算平台,联想通过访存优化、显存优化、PCIe 5.0全互联架构创新以及精选SGLang框架中性能最优算子等诸多创新方式,对大模型从预训练、后训练到推理的全流程进行持续优化,在模拟问题对话场景时,最高可支持并发数158,TPOT 93毫秒,TTFT 2.01秒;而在模拟代码生成时,并发数可达140,TPOT 100毫秒,TTFT 5.53秒。

这一成绩意味着,单台联想问天WA7785a G3可以支撑1500人规模企业的正常使用,是继联想问天WA7780 G3服务器单机部署满血版DeepSeek大模型总吞吐量突破2500 token/s后,单机部署该大模型推理性能的又一次突破。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

阿里 AI 应用新进展:悟空开... 5月13日,阿里巴巴集团发布2026财年Q4及全年财报。财报表示,阿里全栈AI技术投入已正式跨越初期...
李彦宏:AI时代度量衡是“DA... 中新网北京新闻5月13日电 (记者 吕少威) Create2026百度AI开发者大会13日在京开幕。...
Cyber天花板被打穿!AIS... 新智元报道 编辑:定慧 大卫 【新智元导读】英国AI安全研究所(AISI)昨天扔下重磅炸弹:Myt...
原创 日... AI的浪潮卷到哪,故事就炸到哪。 王兴疯狂押注AI公司,自研LongCat守底线、投资Kimi抢前沿...
【核心阅读】筑牢底座 加“数”... 近日闭幕的第九届数字中国建设峰会吸引了不少人的目光。今年是“十五五”开局之年,也是数字中国建设第二个...
国际最强!“九章四号”研制成功... 记者13日从中国科学技术大学获悉,该校潘建伟、陆朝阳、张强、刘乃乐等学者联合国内研究单位, 成功研制...
企业AI工作手机推荐|鱼汛AI... 在AI技术重构企业销售逻辑的今天,市面上涌现出大量号称“AI赋能”的销售工具。 面对琳琅满目的选择,...
备战2028款苹果iPhone... IT之家 5 月 14 日消息,韩媒 ETNEWS 昨日(5 月 13 日)发布博文,报道称三星显示...
34所产品助力天舟十号“太空快... 北京时间2026年5月11日8时14分,天舟十号货运飞船搭载长征七号遥十一运载火箭在文昌航天发射场发...
华为余承东:尊界S800截至4... IT之家 5 月 14 日消息,今天下午,华为常务董事、产品投资委员会主任、终端 BG 董事长余承东...