来源:第一财经
除夕夜的AI圈再次被阿里点燃。
2月16日,阿里巴巴开源全新一代大模型Qwen3.5-Plus,性能媲美Gemini-3-pro、GPT-5.2等顶级闭源模型,打响了“模型卷王”的新春攻势。
2月17日大年初一凌晨,千问发布的数据显示,春节活动期间,全国超过1.3亿人第一次体验AI购物,说了50亿次“千问帮我”,千问一跃成为国民级AI助手。
与过去一年行业常见的堆参数、卷规模不同,这一次的千问3.5是阿里大模型一场“以小胜大”的突围。记者了解到,千问3.5实现了底层模型架构的全面革新,Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。值得一提的是,Qwen3.5-Plus的API价格每百万Token低至0.8元,仅为Gemini 3 Pro的1/18。
千问3.5技术突破、千问app用户狂飙的背后,阿里在这场关于AI时代基础设施话语权的争夺中再落下关键一子。
千问3.5来了
比起一次简单的模型迭代,选在新春节点发布的Qwen3.5-Plus也是行业在Scaling Law 红利逐渐见顶下,打开的一扇新窗口。
与前几代的千问大语言模型不同,千问3.5实现了从纯文本模型到原生多模态模型的代际跃迁。千问3.5基于视觉和文本混合token上预训练,并大幅新增中英文、多语言、STEM和推理等数据,以不到40%的参数量获得超万亿的Qwen3-Max基座模型的顶尖性能,在推理、编程、Agent智能体等全方位基准评估中均表现优异,在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,千问3.5表现均超越Gemini 3 Pro、GPT-5.2。
原生多模态训练也带来千问3.5的视觉能力飞跃:在多模态推理(MathVison)、通用视觉问答VQA(RealWorldQA)、文本识别和文件理解(CC_OCR)、空间智能(RefCOCO-avg)、视频理解(MLVU)等众多权威评测中,千问3.5均斩获最佳性能。同时,千问3.5的学科解题、空间推理、视频理解能力显著提升,支持最长 2 小时视频输入;并实现视觉与代码原生融合,可将草图直接转为前端代码、截图定位修复 UI 问题,让视觉编程成为生产力工具。
而这背后的关键是,千问3.5性能跃升来自于对Transformer经典架构的重大创新突破。
目前,行业大多现有多模态模型仍在走模态数据叠罗汉、堆参数的方式,文本模型上外挂视觉、再外挂语音,通过参数规模弥补架构缺陷。这种方式带来了许多模型体量膨胀、推理成本居高不下,但智力水平受限、推理效率低下,难以真正落地。
而对于千问3.5,阿里不仅使用了混合MoE架构,还在训练阶段采用全新范式,在预训练阶段就采用统一架构同时处理多种模态数据,总参数397B激活仅17B,是同等性能参数量最小的模型。此外,记者了解到,千问团队自研的门控技术成果,曾斩获全球AI顶会2025 NeurIPS最佳论文,该前沿技术也已融入到千问3.5创新的混合架构中,成为千问3.5打破模型性能天花板的重要一环。同时,通过训练稳定优化以及多token 预测等系列技术,Qwen3.5性能与Qwen3-Max模型持平,并进一步提升了推理效率。
“以小胜大”的背后,作为大模型的厂商,阿里正率先将“性能提升”转化为“可规模复制的工程能力”,提升模型性价比的同时,也在进一步推动它走向真正成为生产力工具。
而从更宏观的产业视角看,千问3.5只是阿里多模态布局的冰山一角,阿里仍在持续探索All in one的全模态,发力AGI。
一周前,千问发布集生图和编辑能力于一身的Qwen-image-2.0,被视作国产Nano Banana Pro,随着如今千问3.5在视觉理解能力上的再度突破,千问又向全模态能力迈进了一大步。两条技术路线的并行推进中,藏着阿里为全模态的探索蓄力的野心,这意味着,阿里要让大模型能从解决单一任务,跨越到具备“看懂图片、理解视频、联动工具执行任务”等综合能力,让AI不仅能看懂、听懂,更能动手操作。
今年1月,千问App发布消费级AI购物Agent,春节期间,千问AI购物Agent6天时间帮用户完成了1.2亿笔订单。目前,千问APP、PC端已第一时间接入Qwen3.5-Plus模型,Agent能力大幅增强的千问3.5,也将进一步打开千问APP在工作和生活中帮人办事的能力。
千问2月17日发布的数据显示:过去两天,用户用AI买门票的订单环比增长22倍,AI订机票等交通票务单量增长超7倍。随着春节档电影上线,用户用AI买电影票的订单环比增长372倍,其中来自三四线城市的AI订单量更是增长782倍。所有AI订单中,近一半订单来自县城。因为一句话点单更便捷,近400万60岁以上用户体验了AI购物。
走在通往AGI的路上,这才是千问3.5在春节档带来的真正想象空间。
powered by阿里云
在这个阿里动作不断的春节背后,如果把千问3.5比作阿里冲向AGI的锋利长矛,那么“powered by 阿里云”则是另一条更隐蔽、更具决定性的战线——AI基础设施的闭环生态。
不断推出SOTA级模型的同时,另一方面,自2023年开源以来,阿里已开源400多个千问模型,覆盖全尺寸、全模态,千问全球下载量突破10亿次,开发者基于千问开发的衍生模型超20万,从李飞飞团队到爱彼迎,全球开发者正在基于千问构建属于自己的AI应用。
面向不同国家的AI开发者和企业的需求,千问大模型还在持续演进:千问3.5扩展支持201种语言,将词表大小从15万扩展到25万,可最高提升小语种60%的编码效率。这种开源生态的繁荣,不仅为千问提供了海量的反馈数据,更在开发者心智中种下了“千问”即“基建”的品牌认知。
与此同时,阿里在基础设施层的长期投入,开始与模型能力形成协同效应。
1月29日,阿里平头哥官网上线自研AI芯片“真武810E”,“真武”PPU采用自研并行计算架构和片间互联技术,配合全栈自研软件栈,实现软硬件全自研。其内存为96G HBM2e,片间互联带宽达到700 GB/s,可应用于AI训练、AI推理和自动驾驶。对比关键参数,“真武”PPU的整体性能超过了英伟达A800和主流国产GPU,与英伟达H20相当。
“真武”PPU已被阿里巴巴大规模用于千问大模型的训练和推理,记者了解到,针对以Qwen3为代表的主流MoE架构模型,真武芯片做了大量优化,可满足千问大模型对大规模计算的需求。
千问3.5价格的进一步探底,也得益于模型、芯片以及云的协同创新,这也意味着,阿里模型、芯片、云平台之间“1+1+1>3”的协同效应已开始落到真实的部署成本与吞吐效率上。这构成了阿里云在AI时代的基础设施护城河。
对阿里云来说,这也意味着更长期稳定的收入结构,“powered by 阿里云”的基础设施体系,也在为阿里构建一条更具长期性的AI产业通道,为商业化的成功铺路。
市场调研机构Omdia 数据显示,2025 年上半年,中国 AI 云整体市场(AI IaaS+PaaS+MaaS)规模达 223 亿元,阿里云占比 35.8 %,超过第二到第四名总和。2025年第三季度,阿里云在中国云市场的份额从上季度的34%提升至36%,领先优势扩大。
Omdia指出,AI日益成为核心云基础设施服务新增需求的主要驱动力,并带动计算、存储及数据库等资源消耗增长。阿里财报显示,阿里云AI相关产品收入已连续九个季度实现三位数同比增长。
2025 年 9 月,国际市场调研机构沙利文发布的报告则显示,在金融、制造、互联网、消费电子、汽车等重点行业的700家企业调研中,阿里千问在中国企业级大模型调用市场中占比 17.7%,位居榜首。
从千问3.5打响新春攻势的技术亮相,到模型、芯片与云基础设施的协同推进,再到千问app从Agent能力的代际跃迁到1.3亿人涌入AI购物的消费盛况,阿里围绕AI时代的长期布局正在徐徐展开。一面是以顶尖模型与底层架构通往AGI的“星辰大海”,不断突破智能的边界,一面是千问App让AI服务落入寻常百姓家的人间烟火,将技术红利真正洒向亿万用户的日常,阿里正用一场春节档的“双线作战”,既撑起最前沿的想象力,也接住最真实的生活气。