千问最强模型来了!多项性能破全球纪录
创始人
2026-01-27 09:42:03

1月26日,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking,创下数项权威评测全球新纪录。其性能媲美GPT-5.2、Gemini 3 Pro,成为迄今为止最接近国际顶尖模型的国内最强AI大模型。

Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型,其总参数量超万亿(1T),预训练数据量高达36T Tokens。

通过总参数、强化学习、推理计算的极致规模扩展,新模型实现了性能的大幅飞跃,刷新科学知识、数学推理、代码编程等多项关键性能基准测试的全球纪录。

在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制,推理性能提升的同时还更经济。

业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论,造成冗余推理效率低下;而千问采用的这一新机制,可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,获得更智能的推理结果。基于这一推理技术创新,千问推理性能和推理效率大为提升,比如在启用工具的“人类最后的测试”HLE中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,录得当前所有模型的最高分。

面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。

具体而言,在完成初步的工具使用微调后,通义团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。这种自适应的工具调用能力可在QwenChat上完整体验,模型自主选用搜索、个性化记忆和代码解释器等三个核心的Agent工具功能,提供专业人士一样水平的回答,更合用户心意、更智能、更流畅;同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。

目前,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务,普通用户也可通过千问PC端和网页端试用模型。

据了解,千问App也即将接入新模型,所有用户都可免费体验千问最强模型。

作者:杨翔菲 温婷

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

指南针付的钱怎么退回来申请退款... 指南针擒龙版值得购买吗?退款流程详解及注意事项如下!被忽悠交费不给好票亏损不断可退费!大家能在指南针...
原创 坚... A集团军群直到1943年9月,作战区域仍然局限于库班桥头堡和克里木半岛。然而,随着曼施坦因被迫撤退至...
特朗普“称赞美元贬值”引发抛售... 财联社1月29日讯(编辑 史正丞)当地时间周三,美元指数经历前一天的跳水后试图企稳反弹。消息面上,美...
博众投资推荐的股票可靠吗手把手... 博众投资推荐的股票可靠吗手把手教你申请,答案是:可以能退费!有法可依!申请退款流程公布!博众投顾不可...
慧研智投正规吗可靠吗被坑害后如... 投资本是一场自我的修行,只有起点,没有终点。切洋葱的时候你总是闭着眼睛,以为这样就不会流眼泪了,但当...
【科技前沿】改良锑基硫族材料电... 澳大利亚新南威尔士大学科学家研发出一种改良的锑基硫族化合物太阳能电池,经认证的光电转化效率达到10....
万隆证券可靠吗误导性宣传骗取股...    万隆证券可靠吗误导性宣传骗取股民服务费!夸大收益诱导投资者!这份退费指南让你不再吃哑巴亏广州万...
股掌柜是正规平台吗缴费后股票“... 股掌柜证券不可信,推荐的股票不靠谱,交的服务费是可以退的,虚假宣传推荐垃圾票亏损严重,维权已退款,退...
湖南金证推荐的股票怎么样老年股...   湖南金证推荐的股票怎么样老年股民维权无门,专业协助快速实现退款成功  股市行情持续低迷,给人的感...
股掌柜证券咨询可靠吗老年股民维... 股掌柜证券不可信,推荐的股票不靠谱,交的服务费是可以退的,虚假宣传推荐垃圾票亏损严重,维权已退款,退...