最新全球模型榜单：阿里 Qwen2.5-Max超DeepSeek V3_资讯

最新全球模型榜单：阿里 Qwen2.5-Max超DeepSeek V3

创始人

2025-02-05 13:00:38

竞赛升温！最新全球大模型榜单发布，阿里新模型超越DeepSeek V3。

当地时间2月4日，在全球知名的AI模型评测平台Chatbot Arena公布了最新一期的榜单。其中，阿里通义千问团队的最新大语言模型Qwen2.5-Ma取得了优异成绩，在总体排名中跻身第7，领先于DeepSeek V3、O1-Mini和Claude-3.5-Sonnet等顶级专有大语言模型。

分别看打分项，Qwen2.5-Max在技术领域表现尤为出色，在数学和编程方面排名第一，在处理复杂任务的硬提示（hard prompts）方面排名第二。

过去一年，阿里不断扩展Qwen模型家族，推出了涵盖文本、音频和视觉格式的多种规模模型，以满足全球开发者和客户日益增长的AI需求。

1月29日凌晨，阿里通义千问团队悄悄上线Qwen2.5-Max，该模型一经发布便在MMLU-Pro、LiveCodeBench、LiveBench和Arena-Hard等主要基准测试中取得领先成绩，展现出与全球顶级模型比肩的性能。

据介绍，最新的Qwen2.5-Max采用了先进的专家混合（MoE）模型架构，预训练数据量超过20万亿个token，运用监督微调（SFT）和人类反馈强化学习（RLHF）技术进行优化，在知识、编程、通用能力和人类对齐等方面表现优异。

目前，全球开发者和企业可通过阿里云的生成式AI开发平台Model Studio访问Qwen2.5-Max。

，此前过度聚焦DeepSeek，却忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体《信息平权》表示，若阿里Qwen-2.5-max这次的确性能超过V3，可以对其RL推理模型给予更大期待。

Qwen2.5-Max发布后，迅速吸引了海内外用户和开发者的大量关注。

有网友生动地概括，Qwen2.5-Max相当于“中文版的ChatGPT”，但水平要比后者“高得多”。

有用户表示，Qwen2.5-Max“重新定义”了视频生成功能，已经超过OpenAI的Sora。

甚至有用户认为，Qwen2.5-Max已经把ChatGPT、DeepSeek狠狠“拍在了沙滩上”。

还有网友制作梗图，猜测继DeepSeek-R1后，这款来自中国的强大AI模型将进一步加剧OpenAI的担忧。

上一篇：高盛：2026年第二季度，金价将突破3000美元原因是TA

下一篇：山东鲁青线缆取得耐弯折电缆专利，提高抗折弯效果

⚠️

本网站信息内容及素材来源于网络采集或用户发布，如涉及侵权，请及时联系我们，发送链接至2697952338@QQ.COM，我们将第一时间进行核实与删除处理。

最新全球模型榜单：阿里 Qwen2.5-Max超DeepSeek V3

相关内容

热门资讯