通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
创始人
2024-06-07 08:01:48

IT之家 6 月 7 日消息,通义千问(Qwen)今天宣布经过数月的努力,Qwen 系列模型从 Qwen1.5 到 Qwen2 的重大升级,并已在 Hugging Face 和 ModelScope 上同步开源。

IT之家附上 Qwen 2.0 主要内容如下:

  • 5 个尺寸的预训练和指令微调模型,包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 以及 Qwen2-72B
  • 在中文英语的基础上,训练数据中增加了 27 种语言相关的高质量数据;
  • 多个评测基准上的领先表现;
  • 代码和数学能力显著提升;
  • 增大了上下文长度支持,最高达到 128K tokens(Qwen2-72B-Instruct)。
模型基础信息

Qwen2 系列包含 5 个尺寸的预训练和指令微调模型,其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。

模型 Qwen2-0.5BQwen2-1.5BQwen2-7BQwen2-57B-A14BQwen2-72B参数量 0.49B1.54B7.07B57.41B72.71B 非 Embedding 参数量 0.35B1.31B5.98B56.32B70.21BGQATrueTrueTrueTrueTrueTieEmbeddingTrueTrueFalseFalseFalse上下文长度 32K32K128K64K128K

在 Qwen1.5 系列中,只有 32B 和 110B 的模型使用了 GQA。这一次,所有尺寸的模型都使用了 GQA,以便让大家体验到 GQA 带来的推理加速和显存占用降低的优势。

模型评测

相比 Qwen1.5,Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。

在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型,如 Llama-3-70B 以及 Qwen1.5 最大的模型 Qwen1.5-110B。

IT之家附上参考地址

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

万隆证券带单靠谱吗?涉嫌虚假宣... 万隆证券带单靠谱吗?涉嫌虚假宣传推荐垃圾股票害人不浅,想要退费的股友请看万隆证券不靠谱,推荐的股票不...
万隆证券带单靠谱吗?办理会员亏... 万隆证券带单靠谱吗?办理会员亏钱黑幕解析!退费看这里!万隆证券不靠谱,推荐的股票不可信,交的服务费是...
万隆证券真的靠谱吗?收费实为陷... 万隆证券真的靠谱吗?收费实为陷阱,服务费追回攻略快留存!万隆证券不靠谱,推荐的股票不可信,交的服务费...
万隆证券带单靠谱吗?编织收费陷... 万隆证券带单靠谱吗?编织收费陷阱,频频亏损是骗局!万隆证券不靠谱,推荐的股票不可信,交的服务费是可以...
万隆退费最简单三个方法?真实经... 万隆退费最简单三个方法?真实经历曝光!已维权退款!万隆证券不靠谱,推荐的股票不可信,交的服务费是可以...
万隆证券投顾马萧的服务值得投资... 万隆证券投顾马萧的服务值得投资吗?“内部消息”都是骗人的!被骗有法可依维权可退!流程公布!万隆证券不...
万隆证券投顾马萧的服务值得投资... 万隆证券投顾马萧的服务值得投资吗?根据相关规定可以退款,小心骗局!已退费!万隆证券不靠谱,推荐的股票...
万隆证券投顾马萧的服务值得投资... 万隆证券投顾马萧的服务值得投资吗?指导股民炒股亏钱,接连亏损不知所措!已退款!万隆证券不靠谱,推荐的...
万隆服务费退费步骤详解?不靠... 万隆服务费退费步骤详解?不靠谱!收费推荐垃圾股被曝光,退款流程公布!万隆证券不靠谱,推荐的股票不可信...
广州万隆服务费能退吗?服务费退... 广州万隆服务费能退吗?服务费退款方法公布,保留好相关记录即可轻松退回!万隆证券不靠谱,推荐的股票不可...