蚂蚁,AI重大突破!
创始人
2025-03-25 01:20:40

【导读】蚂蚁AI重磅突破

中国基金报记者 泰勒

国产AI模型,再次迎来突破。

3月24日,据悉蚂蚁集团使用国产芯片开发了一种训练人工智能模型的技术,可将成本降低20%。

知情人士称,蚂蚁 集团采用了国产芯片,基于所谓的“专家混合”(Mixture of Experts)机器学习方法来训练模型。该公司取得的效果与英伟达H800等芯片的结果相当。

有分析称,这些模型标志着蚂蚁集团加入AI领域的竞赛。自DeepSeek展示出能够以远低于OpenAI和Alphabet旗下谷歌投入的数十亿美元成本训练出强大模型以来,这一竞争加速升级。这也凸显出中国企业正积极尝试以本土替代方案取代最先进的英伟达半导体产品,尽管H800并非英伟达最顶级的芯片。

近期,蚂蚁集团Ling团队发表了最新的技术成果论文《每一个FLOP都至关重要:无需高级GPU即可扩展3000亿参数混合专家LING大模型》。

论文提到,近年来,随着OpenAI、Gemini、Claude、Qwen、DeepSeek-AI等大型语言模型(LLM)的快速发展,学术界和产业界围绕通用人工智能(AGI)展开了广泛讨论。尽管稠密模型取得了显著进展,专家混合(MoE)模型,如DeepSeek系列、Qwen系列和MiniMax-01系列等,在某些特定任务中已展现出优于传统稠密模型的性能。

然而,MoE模型的训练通常依赖于高性能计算资源(例如H100、H800等先进AI加速器),其高昂的成本限制了其在资源受限环境中的广泛应用。因此,该研究旨在提出创新的训练策略,使LLM在资源和预算受限的情况下也能实现高效训练,推动AI技术的普惠发展。

为了给业界提供一种适用于资源受限场景的模型训练新路径,并激发更多创新解决方案的产生,论文介绍了两款开源MoE模型:Ling-Lite(总参数16.8B,激活参数2.75B)与Ling-Plus(总参数290B,激活参数28.8B),重点展示其探索与优化过程。

论文称,基于优化技术,蚂蚁集团开发并开源了Ling系列MoE模型,在资源成本与模型性能之间取得良好平衡。例如Ling-Plus模型在五种不同硬件配置下完成9万亿token的预训练任务。若使用高性能硬件设备训练1万亿token,预计成本为635万元人民币;而使用低规格硬件系统则成本约为508万元,节省近20%。这证明,即使在低性能设备上,也能实现大规模MoE模型的有效训练,提升了基础模型开发在计算资源选择上的灵活性与性价比。

论文显示,实验结果最终表明,一个规模为300B的MoE大语言模型可以在性能较低的设备上有效训练,并在性能上达到与同规模的其他模型(包括稠密模型和MoE模型)相当的水平。与高性能设备相比,在预训练阶段使用低规格硬件系统可显著节约成本,计算开支约降低20%。

当前最先进的MoE模型在训练过程中严重依赖高性能AI加速器(如H100、H800),然而,近年来这类高端硬件持续供不应求。正如DeepSeek开源发布中分析的“昼夜推理负载不均”问题,在推理服务高峰期,高性能资源同样面临短缺。在长期科研实践中,许多机构持续面临高端AI加速卡供应不足的问题。

相比之下,性能较低的加速器更易获得,且单价更低。这种差异凸显出建立一种能够在异构计算单元和分布式集群之间无缝切换的技术体系的必要性,从而优化训练与推理的整体成本。

有分析指出,MoE模型的训练通常依赖于如英伟达所售GPU这类高性能芯片,这使得训练成本对许多中小企业而言过于高昂,限制了更广泛的应用。蚂蚁集团一直在致力于提高大语言模型的训练效率,并突破这一限制。从其论文标题即可看出,该公司将目标定为“在无需高端GPU的情况下扩展模型规模”。

这一方向与英伟达的战略背道而驰。英伟达首席执行官黄仁勋曾表示,即便更高效的模型(如DeepSeek的R1)出现,对计算力的需求仍会持续增长,企业要实现更多营收将依赖更强大的芯片,而非通过更便宜的芯片来削减成本。他坚持打造具备更多处理核心、更高晶体管数量和更大内存容量的大型GPU的战略。

有分析称,蚂蚁集团的研究论文凸显出中国AI领域技术创新和发展速度的加快。如果其研究成果属实,这将表明中国在人工智能领域正逐步走向自主可控,特别是在寻求成本更低、计算效率更高的模型架构来应对英伟达芯片出口限制的背景下。

针对此事, 3月24日蚂蚁集团回应称,蚂蚁针对不同芯片持续调优,以降低AI应用成本,目前取得了一定的进展,也会逐步通过开源分享。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

原创 日... AI的浪潮卷到哪,故事就炸到哪。 王兴疯狂押注AI公司,自研LongCat守底线、投资Kimi抢前沿...
【核心阅读】筑牢底座 加“数”... 近日闭幕的第九届数字中国建设峰会吸引了不少人的目光。今年是“十五五”开局之年,也是数字中国建设第二个...
国际最强!“九章四号”研制成功... 记者13日从中国科学技术大学获悉,该校潘建伟、陆朝阳、张强、刘乃乐等学者联合国内研究单位, 成功研制...
企业AI工作手机推荐|鱼汛AI... 在AI技术重构企业销售逻辑的今天,市面上涌现出大量号称“AI赋能”的销售工具。 面对琳琅满目的选择,...
备战2028款苹果iPhone... IT之家 5 月 14 日消息,韩媒 ETNEWS 昨日(5 月 13 日)发布博文,报道称三星显示...
34所产品助力天舟十号“太空快... 北京时间2026年5月11日8时14分,天舟十号货运飞船搭载长征七号遥十一运载火箭在文昌航天发射场发...
华为余承东:尊界S800截至4... IT之家 5 月 14 日消息,今天下午,华为常务董事、产品投资委员会主任、终端 BG 董事长余承东...
硬核AI+三维CAD!新迪数字... 日前,由东莞市人民政府、数字化工业软件联盟、华为云联合主办的「第五届工业软件创新应用大赛」颁奖典礼,...
网红白冰逃税风波后复更自曝:被... 四月底,知名探店网红白冰偷逃税九百多万引发关注。 时隔半个月,今日,白冰社交媒体复更,并在视频中自...
3700亿,eBay要被卖了? 先聊一段往事。 我上初中那会儿,“上网”还是妥妥的高端娱乐方式,只有一小部分同学有QQ号,大部分同学...