DeepSeek 致谢腾讯技术团队,DeepEP 开源通信框架性能显著提升
创始人
2025-05-07 21:41:08

IT之家 5 月 7 日消息,腾讯技术团队针对 DeepSeek 开源的 DeepEP 通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。

经测试,优化后的通信框架性能在 RoCE 网络环境提升 100%,IB 网络环境提升 30%,为企业开展 AI 大模型训练提供更高效的解决方案。

该技术方案获得了 DeepSeek 公开致谢,称这是一次“huge speedup”代码贡献。

IT之家注:DeepEP 是一个为专家混合(MoE)和专家并行(EP)量身定制的通信库。它提供高吞吐量和低延迟的全对全 GPU 内核,这些内核也被称为 MoE 派发和组合。该库还支持低精度运算,包括 FP8。

据悉,腾讯星脉网络团队在 DeepEP 开源后便展开技术攻关,发现两大关键瓶颈:一是对于双端口网卡带宽利用率不足,二是 CPU 控制面交互存在时延

在腾讯的技术优化下,DeepEP 不仅在 RoCE 网络实现性能翻倍,反哺到 IB(InfiniBand)网络时更使原有通信效率再提升 30%。

目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与 H20 服务器构建的环境中,这套方案展现出出色的通用性。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

苏州益高取得便于安装的车内监控... 国家知识产权局信息显示,苏州益高电动车辆制造有限公司取得一项名为“一种便于安装的车内监控设备”的专利...
广脉科技:算力集成+运营服务+... 广脉科技(920924)于2026年5月15日(星期五)15:00-17:00在全景网举办2025年...
优质空间+百项场景齐发!“河套... 5月14日至16日,2026全球人工智能终端展(WAIDE)暨第七届深圳国际人工智能展览会(GAIE...
上海划设无人机飞行体验区 已有... 中新网上海5月15日电 (记者 李姝徵)面对低空安全“强治理”的要求,如何平衡无人机“管”与“放”的...
AI时代强网赋能!湖南移动宣布... 5月15日,记者从湖南移动“数智赋新能,移跃新时代”战略级新品发布会上获悉,2026年湖南移动将实现...
靖边:科创赋能低空起 智驾未来... 风起毛乌素,低空逐梦行。坐落于陕西靖边县的保通防务科技有限公司(以下简称“保通防务”),抢抓产业风口...
杭企 | 暖芯迦获3亿元融资,... 近日,杭州暖芯迦电子科技有限公司(以下简称“暖芯迦”)宣布完成3亿元战略融资。据悉,本轮融资所得资金...
封测界性价比黑马:营收不足15... 来源:市值风云 毛利率稳居40%以上。 作者 | 贝壳XY 编辑 | 小白 过去,当我们谈论半导体...
爱仕达接受QFII调研 机器人... 5月14日,爱仕达披露机构调研纪要,公司近日接受Maybank Investment Bank、Pe...
中铁装备取得竖井掘进机专利,避... 国家知识产权局信息显示,中铁工程装备集团有限公司取得一项名为“竖井掘进机”的专利,授权公告号CN22...