阿里Qwen3-Coder编程模型开源,480B参数领跑智能体编程赛道
创始人
2025-07-23 14:00:20

阿里巴巴Qwen团队近日宣布了一项重大进展,他们开源了最新的旗舰编程模型Qwen3-Coder-480B-A35B-Instruct。这一开源举措标志着Qwen团队在智能体编程领域迈出了重要一步,该模型以其强大的功能和广泛的适用性引起了业界的广泛关注。

Qwen3-Coder拥有4800亿个参数,其中350亿个参数处于激活状态。它能够原生支持256K的上下文长度,并可通过技术扩展至100万上下文(输入),最大输出能力达到6.5万个token。这一性能表现在基准测试中得到了验证,Qwen3-Coder在智能体编程、智能体浏览器使用和智能体工具调用等三类任务中均取得了开源领域的最优成绩,甚至超越了Kimi K2、DeepSeek V3等开源模型,以及闭源的GPT-4.1模型,其编程能力与Claude Sonnet 4模型不相上下。

Qwen3-Coder不仅参数规模庞大,而且在实际应用中展现出极高的效率。据阿里巴巴官方介绍,借助这一模型,初级程序员能够在一天内完成资深程序员一周的工作量。例如,生成一个品牌官网的速度最快可达5分钟。这一显著的工作效率提升,无疑将为软件开发行业带来巨大的变革。

除了强大的Qwen3-Coder模型外,Qwen团队还开源了一个智能体编程命令行工具——Qwen Code。这一工具是基于Gemini Code进行分叉和定制开发的,通过适配特定的提示和函数调用协议,能够更充分地发挥Qwen3-Coder在智能体编程任务上的潜力。这一工具的推出,将进一步降低智能体编程的门槛,使得更多的开发者能够轻松上手。

Qwen3-Coder模型已在阿里云旗下的大模型服务平台百炼上线,其API采用阶梯计费方式,根据输入的token量调整价格。在特定的输入范围内,其价格与Claude Sonnet 4模型相比略高,但考虑到其更强大的功能和性能表现,这一价格定位仍然具有相当的竞争力。Qwen3-Coder的480B版本也已在Hugging Face、魔搭等开源社区发布,可供开发者下载和本地部署。

在Qwen3-Coder正式发布前,这一模型已经悄然在Qwen Chat官网上线,并吸引了一批海外网友进行实测。他们通过Qwen3-Coder开发出了各种有趣的应用,如Wordle单词游戏、找不同游戏等。这些案例充分展示了Qwen3-Coder在指令遵循、UI设计、动画等方面的强大能力。同时,国内媒体也尝试让Qwen3-Coder开发了一个中英文术语库,并对其生成结果进行了进一步的修改和优化。

在技术细节方面,Qwen团队在博客文章中分享了Qwen3-Coder的部分训练细节。他们指出,预训练阶段使用了7.5万亿token的数据,其中代码占比高达70%,这使得模型在编程方面表现出色,并保留了通用和数学能力。Qwen3-Coder还通过自动扩展多样化编程任务的测试用例,创建了高质量的训练实例,进一步释放了强化学习的潜力。这一做法不仅提高了代码执行成功率,还为其他任务带来了显著收益。

在后训练阶段,Qwen团队引入了长视距强化学习(智能体强化学习),鼓励模型通过使用工具进行多轮交互来解决现实世界任务。为了应对环境扩展的挑战,他们构建了一个能够并行运行20000个独立环境的可扩展系统。这一基础设施为大规模强化学习提供了必要的反馈和支持,使得Qwen3-Coder在SWE-Bench Verified中实现了开源模型中的最佳性能。

随着Qwen3-Coder的开源和广泛应用,阿里巴巴Qwen团队将继续努力提升Coding Agent的性能,旨在让它承担软件工程中复杂和乏味的任务,从而释放人类的生产力。未来,我们期待看到更多基于Qwen3-Coder的创新应用和开发成果。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

数据洪流何处去?中国青年科学家... 央广网武汉5月17日消息(记者邓子依)一片肉眼几乎看不出任何异样的玻璃圆盘,内部却“暗藏玄机”,经过...
2026中小企业风控工作手机品... 在市场竞争加剧、合规要求提升的2026年,中小企业风控管理聚焦客资保护、行为规范与效率提升,一款专业...
介绍:ICG hydrazid... 一、化学试剂的基本信息 保存条件:避光、-20°C储存,避免反复冻融 英文名称:ICG hydraz...
诺奖得主斯宾塞:中国将成全球最... 5月18日,2026清华五道口全球金融论坛在成都举行。在论坛开幕式高端对话环节,2001年诺贝尔经济...
将三星甩在身后!台积电1nm计... 快科技5月18日消息,按既定路线图,台积电首批2nm芯片组将于今年晚些时候落地。目前,台积电已正式启...
兴南街道科普展馆开馆 打造家门... 南开区兴南街道科普展馆近日正式开馆,这座集科普教育、互动体验、资源共享于一体的综合性基层科普服务阵地...
坚锅淘金app客户一直亏损被骗...   坚锅淘金APP的贵金属现货交易是否靠谱?持续亏损是正常的?在抖音、快手、今日头条等平台,精心设计...
微软认了:Win11终于要听你... IT之家 5 月 17 日消息,据科技媒体 Windows Latest 今天报道,微软表示,个性化...
千帆星座第9批组网卫星成功发射... 快科技5月18日消息,据“恒信卫星”公众号消息,5月17日22时42分,千帆星座第九批组网卫星在海南...
2026搜狐科技年度论坛成功举... 5月17日,2026搜狐科技年度论坛在北京成功举办。孙昌璞、张益唐等近三十位科学界、学术界与产业界的...