腾讯混元开源首款混合推理MoE模型
创始人
2025-06-27 19:41:03

6月27日,腾讯混元宣布开源首个混合推理MoE模型 Hunyuan-A13B,总参数80B,激活参数仅13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高。这意味着,开发者可以用更低门槛的方式获得更好的模型能力。

即日起,模型已经在 Github 和 Huggingface 等开源社区上线,同时模型API也在腾讯云官网正式上线,支持快速接入部署。

这是业界首个13B级别的MoE开源混合推理模型,基于先进的模型架构,Hunyuan-A13B表现出强大的通用能力,在多个业内权威数据测试集上获得好成绩,并且在Agent工具调用和长文能力上有突出表现。

加粗为最高分,下划线是第二名,数据来源于模型公开的测试数据集得分

对于时下热门的大模型Agent能力,腾讯混元建设了一套多Agent数据合成框架,接入了MCP、沙箱、大语言模型模拟等多样的环境,并且通过强化学习让Agent在多种环境里进行自主探索与学习,进一步提升了Hunyuan-A13B的效果。

在长文方面,Hunyuan-A13B支持256K原生上下文窗口,在多个长文数据集中取得了优异的成绩。

在实际使用场景中,Hunyuan-A13B模型可以根据需要选择思考模式,快思考模式提供简洁、高效的输出,适合追求速度和最小计算开销的简单任务;慢思考涉及更深、更全面的推理步骤,如反思和回溯。这种融合推理模式优化了计算资源分配,使用户能够通过加think/no_think切换思考模式,在效率和特定任务准确性之间取得平衡。

相关资料显示,Hunyuan-A13B模型是腾讯内部应用和调用量最大的大语言模型之一,有超过400+业务用于精调或者直接调用,日均请求超1.3亿。

混元官方界面截图

官方界面中显示,该模型支持快慢思考模式切换,数学、科学、长文理解及Agent能力全面提升。其中,快思考模式适合追求速度和最小计算开销的简单任务,而慢思考模式则涉及更深、更全面的推理步骤,这优化了计算资源分配,兼顾了效率和准确性。

在实测中,观察者网测试了小数比较大小,基本的四则运算等多种基本数学题目,Hunyuan-A13B模型都能迅速响应并给出正确的回答。

测试问题

据悉,混元团队还开源了两个新数据集,以填补行业内相关评估标准的空白。其中,ArtifactsBench主要用于代码评估,构建了一个包含1825个任务的新基准;C3-Bench则针对Agent场景模型评估,设计了1024条测试数据。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

宁波银行业绩说明会,管理层最新... 【导读】宁波银行业绩说明会来了!管理层回应净息差、中收表现及董事会换届等问题 中国基金报记者 马嘉昕...
市工商联赴八一农垦大学开展校企... 为深化校地企合作、促进科技创新与产业创新,赋能现代农业与民营经济发展,5月13日-14日,市委统战部...
「数据看盘」游资、量化抢筹多只... 龙虎榜方面,机器人概念今日逆势走强,其中三丰智能获两家量化资金(开源证券西安太华路、华鑫证券上海陆家...
全线跳水,超15万人爆仓 来源:第一财经 5月16日晚,加密货币市场全线跳水,截至发稿,比特币、以太坊大跌超3%,比特币报78...
金价暴跌 当地时间15日,受美元指数上涨等因素影响,国际金价和白银价格均下跌。截至收盘,纽商所6月交割的黄金期...
原创 帮... 各位朋友,如果最近你觉得地上的生意有点卷,那不妨把目光投向天空——不对,是太空!因为商业航天赛道,正...
千名企业家齐聚深圳,王传福:中... 5月15日,2026仰望商业研究院千人大会在深圳大运中心体育馆成功举行。据了解,此次“千人大会”会聚...
俄外长:俄罗斯认真履行对华能源... 【俄罗斯外交部长谢尔盖·拉夫罗夫表示,俄罗斯正在履行向中国供应能源的所有义务,莫斯科和北京存在广泛的...
陈年、精品、五星等5款茅台酒调... 5月16日凌晨,“i茅台”发布公告,对陈年茅台(15)、精品茅台、1L飞天茅台、茅台酒(丙午马年)珍...
原创 金... 2026年5月15日周五早盘一开,原本横盘震荡的黄金市场瞬间遭遇空头砸盘,整个盘面直线走弱,前期苦苦...