阿里通义发布320亿参数QwQ-32B大模型性能比肩国际领先水平
创始人
2025-03-06 14:22:02

2025-03-06 07:40:50 作者:

3月6日消息,阿里巴巴通义千问团队正式发布了其最新研究成果——QwQ-32B大语言模型。该模型拥有320亿参数规模,尽管参数量远小于某些大型模型,但其性能却能够与参数量高达6710亿(其中370亿参数被激活)的国际领先模型DeepSeek-R1相媲美。

通过强化学习技术,QwQ-32B在参数量仅为DeepSeek-R1约1/21的情况下,实现了性能上的显著提升。此外,阿里巴巴还为这一推理模型集成了与Agent相关的能力,使其不仅能够在使用工具时进行批判性思考,还能根据外部环境反馈动态调整推理过程。

QwQ-32B在多项基准测试中展现了卓越的表现,涵盖数学推理、编程能力及通用能力等多个领域。在评估数学能力的AIME24评测集以及测试代码生成能力的LiveCodeBench评测中,QwQ-32B的表现与DeepSeek-R1相当,并且大幅优于o1-mini及参数规模相同的R1蒸馏模型。

不仅如此,在多个权威评测榜单上,QwQ-32B同样取得了优异成绩。例如,在由meta首席科学家领衔开发的“最具挑战性LLMs评测榜”LiveBench、谷歌提出的指令遵循能力评估体系IFeval,以及加州大学伯克利分校设计的函数或工具调用准确性评估测试BFCL中,QwQ-32B的得分均超越了DeepSeek-R1。

目前,QwQ-32B已经在国际知名开源平台以及阿里巴巴旗下的ModelScope上对外开源,用户也可以通过Qwen Chat直接体验这一模型的功能。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

深圳市琦白久商业管理有限公司战... “本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。" 近年来,各...
东方创富会国英控股直播间讲课老... 如果你正苦于不知如何着手挽回损失,或者担心自己处理不好,可以添加锐明法律微信随时在线,电话同步:19...
广东典匠企业咨询有限公司是不是... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为其他类似股权情景,如有雷同纯属巧合。 随着市...
江苏中毅投资管理出售中微智码打... “本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。"随着国民财富稳...
在四川大.决策投顾交的服务费能... 在四川大.决策投顾交的服务费能全部退回吗?可以能退!退款流程公布!误导性宣传欺骗股民已退费证券投资咨...
南京世保管理咨询合伙企业(有限... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。随着互联网金融的发...
智核投研领航私董会内部群深圳市... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为其他类似股权情景,如有雷同纯属巧合。 随着市...
幸福课堂直播间老刘广东酱王国际... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。 "买酒买茶叶买药...
领航商学院私董会周聪推荐深圳市... 如果你正苦于不知如何着手挽回损失,或者担心自己处理不好,可以添加锐明法律微信随时在线,电话同步:19...
秦峰老师未来之星计划线下认购新... “本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。"在股市热潮的席...