小米首个推理大模型开源 数学与代码测评超越OpenAI
创始人
2025-05-03 15:01:39

4月30日,小米公司于“Xiaomi MiMo”公众号正式宣布开源其首个专注于推理能力的大模型「Xiaomi MiMo」。小米官方表示,该模型以7B(70亿)参数规模,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)等公开测评中表现优异,超越OpenAI的闭源模型o1-mini及阿里Qwen2.5-32B等更大规模的开源模型。

小米技术团队表示,MiMo的核心突破在于预训练与后训练阶段的协同优化。在预训练阶段,模型通过挖掘高质量推理语料并合成约2000亿tokens专项数据,采用三阶段渐进训练策略,累计训练量达25万亿tokens。

后训练阶段则引入创新强化学习技术,包括自研的"Test Difficulty Driven Reward"算法和"Easy Data Re-Sampling"策略,有效提升模型在复杂任务中的稳定性。技术团队还开发了"Seamless Rollout"系统,使训练效率提升2.29倍,验证速度加快1.96倍。

值得注意的是,小米官方表示,MiMo-7B在相同强化学习训练数据下,数学与代码领域的表现显著优于当前业界广泛使用的DeepSeek-R1-Distill-7B和Qwen2.5-32B模型。

目前,小米已在HuggingFace平台开源MiMo-7B全系列4个模型,并发布详细技术报告。

【来源:凤凰网科技】

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

南宁打造辐射东盟的人工智能OP... 【东盟专线】南宁打造辐射东盟的人工智能OPC创业集聚地 中新社南宁5月15日电 (记者 黄艳梅)“我...
李彦宏:我们正迎来一个超级个体... 在5月13日举办的Create2026百度AI开发者大会开幕式上,百度创始人李彦宏表示,在今天的智能...
瀑布边喝咖啡还能学手艺?济南起... 喝咖啡不稀奇,但在瀑布附近边喝边学做咖啡呢?在济南起步区的鹊华中新园,一家叫“一尺之间”的店铺给出了...
一线城市开始张贴合规码!没有人... 网约车焦点讯(文/彭小伟)为了让网约车合规化,上海打出了一系列组合拳,成为第一个张贴合规码的一线城市...
协作机器人龙头启动IPO 深交... 作为“协作机器人第一股”,越疆科技有望成为2025年新政落地后,港股企业回流A股深交所的首个落地标杆...
效率与流量,阿里AI的两张面孔... 傅蔚冈 5月13日,阿里巴巴发布2026财年第四季度财报。最引人注目的数字来自云业务:阿里云外部商...
微信挂号系统技术选型报告:智能... 一、开篇引言 随着“互联网+医疗健康”政策的持续深化,微信生态已成为连接医患的核心入口。根据国家卫健...
金价突发大跌,背后三大致命原因... 2026年5月15日,黄金市场迎来了一场毫无征兆的突发性大跳水,国内外贵金属价格全线崩盘,让很多高位...
对证券期货违法犯罪“零容忍”!... 交汇点讯 江苏作为经济大省,资本市场规模大,主体多,资本市场服务科技创新、先进制造、产业链升级需求迫...