最新全球模型榜单:阿里 Qwen2.5-Max超DeepSeek V3
创始人
2025-02-05 13:00:38

竞赛升温!最新全球大模型榜单发布,阿里新模型超越DeepSeek V3。

当地时间2月4日,在全球知名的AI模型评测平台Chatbot Arena公布了最新一期的榜单。其中,阿里通义千问团队的最新大语言模型Qwen2.5-Ma取得了优异成绩,在总体排名中跻身第7,领先于DeepSeek V3、O1-Mini和Claude-3.5-Sonnet等顶级专有大语言模型。

分别看打分项,Qwen2.5-Max在技术领域表现尤为出色,在数学和编程方面排名第一,在处理复杂任务的硬提示(hard prompts)方面排名第二。

过去一年,阿里不断扩展Qwen模型家族,推出了涵盖文本、音频和视觉格式的多种规模模型,以满足全球开发者和客户日益增长的AI需求。

1月29日凌晨,阿里通义千问团队悄悄上线Qwen2.5-Max,该模型一经发布便在MMLU-Pro、LiveCodeBench、LiveBench和Arena-Hard等主要基准测试中取得领先成绩,展现出与全球顶级模型比肩的性能。

据介绍,最新的Qwen2.5-Max采用了先进的专家混合(MoE)模型架构,预训练数据量超过20万亿个token,运用监督微调(SFT)和人类反馈强化学习(RLHF)技术进行优化,在知识、编程、通用能力和人类对齐等方面表现优异。

目前,全球开发者和企业可通过阿里云的生成式AI开发平台Model Studio访问Qwen2.5-Max。

,此前过度聚焦DeepSeek,却忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体《信息平权》表示,若阿里Qwen-2.5-max这次的确性能超过V3,可以对其RL推理模型给予更大期待。

Qwen2.5-Max发布后,迅速吸引了海内外用户和开发者的大量关注。

有网友生动地概括,Qwen2.5-Max相当于“中文版的ChatGPT”,但水平要比后者“高得多”。

有用户表示,Qwen2.5-Max“重新定义”了视频生成功能,已经超过OpenAI的Sora。

甚至有用户认为,Qwen2.5-Max已经把ChatGPT、DeepSeek狠狠“拍在了沙滩上”。

还有网友制作梗图,猜测继DeepSeek-R1后,这款来自中国的强大AI模型将进一步加剧OpenAI的担忧。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

九方智投交29800的服务费值... 九方智投交29800的服务费值得吗?只需一步即可挽回!退费流程分享!投资本是一场自我的修行,只有起点...
郭柏灵院士创新工作站落地成都 ... 日前,一份来自成都市科学技术协会联合市委组织部、市经信局等九部门的通知,为四川数字经济产业发展研究院...
中广云智投是正规平台吗别再白交...   中广云牛股营服务费能退款吗?收服务费荐股虚假宣传坑惨股友!已退费!  上海中广云证券咨询有限公司...
国诚投顾推荐股票是真的吗投顾服... 国诚投顾推荐股票是真的吗投顾服务费被骗五万,拆穿投顾公司套路,及时退费退款!国诚投顾不可信,推荐的股...
杭州顶点财经卖投顾服务送酒,投... 杭州顶点财经卖投顾服务送酒,投顾被亏騙真相揭秘!退款其实很简单杭州顶点财经正规吗?杭州顶点财经靠谱吗...
海能交了29800要求退可以吗... 海能交了29800要求退可以吗您的投顾服务费或可退回!深度揭秘销售陷阱与投诉通道上海海能投顾服务费是...
九方智投是正规平台吗维权必读:... 什么是投顾?为客户提供投资建议比如:买卖时机、热点分析、证券选择、风险提示等,禁止代理客户操作。也就...
广州万隆投顾老师荐股导致亏损,... 广州万隆投顾老师荐股导致亏损,超详细退费攻略来袭!已退款!误导性宣传!这些标榜为投资顾问的企业,外表...
爱赢天府荐股可靠吗退费实操指南... 爱赢天府荐股可靠吗退费实操指南:遇到投顾公司承诺不兑现,这样处理有效!爱赢投顾正规吗?爱赢投顾靠谱吗...
广州万隆股票付费推荐可靠吗误导...   万隆证券收费3888元可靠吗?虚假宣传欺诈消费者荐高位股!误导性宣传坑惨股友!专业人士教你一招退...