DeepSeek致谢腾讯技术团队,DeepEP开源通信框架性能显著提升
创始人
2025-05-08 00:41:29

腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。

经测试,优化后的通信框架性能在 RoCE网络环境提升100%,IB 网络环境提升 30%,为企业开展AI大模型训练提供更高效的解决方案。

该技术方案获得了DeepSeek公开致谢,称这是一次“huge speedup”代码贡献。

IT之家注:DeepEP是一个为专家混合(MoE)和专家并行(EP)量身定制的通信库。它提供高吞吐量和低延迟的全对全GPU内核,这些内核也被称为MoE派发和组合。该库还支持低精度运算,包括FP8。

据悉,腾讯星脉网络团队在DeepEP开源后便展开技术攻关,发现两大关键瓶颈:一是对于双端口网卡带宽利用率不足,二是CPU控制面交互存在时延。

在腾讯的技术优化下,DeepEP不仅在RoCE 网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原有通信效率再提升30%。

目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构建的环境中,这套方案展现出出色的通用性。

来源:IT之家

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

县区科协丨甘泉县科协开展科普大... 为进一步提升青少年科学素养,激发青少年探索科学的兴趣, 5月13日,甘泉县科协特邀市科技馆科普大篷车...
鸿特精密取得成品运载装置专利,... 国家知识产权局信息显示,广东鸿特精密技术(台山)有限公司取得一项名为“一种成品运载装置”的专利,授权...
德祥地产与启源智算签谅解备忘录... 观点网讯:5月15日,德祥地产集团有限公司发布自愿公告,其全资附属公司ITC Strategic H...
苏州益高取得便于安装的车内监控... 国家知识产权局信息显示,苏州益高电动车辆制造有限公司取得一项名为“一种便于安装的车内监控设备”的专利...
广脉科技:算力集成+运营服务+... 广脉科技(920924)于2026年5月15日(星期五)15:00-17:00在全景网举办2025年...
优质空间+百项场景齐发!“河套... 5月14日至16日,2026全球人工智能终端展(WAIDE)暨第七届深圳国际人工智能展览会(GAIE...
上海划设无人机飞行体验区 已有... 中新网上海5月15日电 (记者 李姝徵)面对低空安全“强治理”的要求,如何平衡无人机“管”与“放”的...
AI时代强网赋能!湖南移动宣布... 5月15日,记者从湖南移动“数智赋新能,移跃新时代”战略级新品发布会上获悉,2026年湖南移动将实现...
靖边:科创赋能低空起 智驾未来... 风起毛乌素,低空逐梦行。坐落于陕西靖边县的保通防务科技有限公司(以下简称“保通防务”),抢抓产业风口...
杭企 | 暖芯迦获3亿元融资,... 近日,杭州暖芯迦电子科技有限公司(以下简称“暖芯迦”)宣布完成3亿元战略融资。据悉,本轮融资所得资金...