腾讯混元深度思考模型T1正式版来了,吐字快、能秒回,解码速度提升2倍
创始人
2025-03-22 08:01:23

腾讯混元3月21日周五宣布,正式推出自研深度思考模型混元T1正式版,已在腾讯云官网上线,输入价格为每百万token 1元,输出价格为每百万token 4元。

腾讯混元概括,混元T1正式版的特点为“吐字快、能秒回”、“擅长超长文处理”,称它是腾讯自研的强推理模型。

速度方面,混元T1正式版在可比参数量下的解码性能高于行业2倍,首字秒出,吐字速度每秒60至80token,具备优秀的长文处理能力。多项指标达到业界领先推理模型的水平,效果方面,混元T1正式版逻辑强、文风简洁、复杂指令跟随准确,摘要幻觉低。

通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步提升了推理能力。

在体现推理模型基础能力的常见评估指标中,如大语言模型(LLM)评估增强数据集MMLU-PRO中,混元T1取得87.2分,仅次于得分89.3的OpenAI o1,高于得分86.1的OpenAI GPT 4.5和得分84的DeepSeek R1。

在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平,其中,逻辑推理得分93.1,高于前述三个模型o1、GPT 4.5和R1。

混元T1正式版的强大推理能力源于,腾讯沿用混元Turbo S的架构,采用Hybrid-Mamba-Transformer 融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型。

上述架构有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用,从而 显著降低了训练和推理成本

混元T1在超长文本推理领域也展现出独特优势。

基于出色的长文捕捉能力,混元T1能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时,混合Mamba架构针对长序列处理进行了专项优化,通过高效的计算方式,在确保长文本信息捕捉能力的同时大幅降低资源消耗,在相近的激活参数量下,实现了解码速度提升2

在上线全新推理模型之前,本周一,腾讯混元模型首次登上了海外权威大模型竞技场 Chatbot Arena 的榜单,跻身全球 Top 15。一同上榜的还有阿里巴巴本月6日发布的通义千问最新开源模型QwQ-32B。

不同于其他测评,Chatbot Arena 的测评人是C端用户——用户在平台上以匿名方式与多个模型互动,然后投票决定哪个模型更好,从而根据分数生成排行榜。这种测评也被看成是大模型直接PK的竞技场,简单直接。

腾讯混元模型在中文基础能力测试中也表现突出。本周二发布的《中文大模型测评基准SuperCLUE 3月报告》中,腾讯混元位列基础模型国内第二,综合实力稳居国内大模型第一梯队。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

备战2028款苹果iPhone... IT之家 5 月 14 日消息,韩媒 ETNEWS 昨日(5 月 13 日)发布博文,报道称三星显示...
34所产品助力天舟十号“太空快... 北京时间2026年5月11日8时14分,天舟十号货运飞船搭载长征七号遥十一运载火箭在文昌航天发射场发...
华为余承东:尊界S800截至4... IT之家 5 月 14 日消息,今天下午,华为常务董事、产品投资委员会主任、终端 BG 董事长余承东...
硬核AI+三维CAD!新迪数字... 日前,由东莞市人民政府、数字化工业软件联盟、华为云联合主办的「第五届工业软件创新应用大赛」颁奖典礼,...
网红白冰逃税风波后复更自曝:被... 四月底,知名探店网红白冰偷逃税九百多万引发关注。 时隔半个月,今日,白冰社交媒体复更,并在视频中自...
3700亿,eBay要被卖了? 先聊一段往事。 我上初中那会儿,“上网”还是妥妥的高端娱乐方式,只有一小部分同学有QQ号,大部分同学...
DAA是什么?李彦宏说它是AI... 2026年5月13日,Create 2026百度AI开发者大会开幕。百度创始人李彦宏在开幕式上提出了...
2026年网络发稿平台权威测评... 引言:数字化浪潮下,网络发稿生态正在经历深刻变革 在信息爆炸的互联网时代,网络空间已成为企业品牌传播...
2026年手游旗舰手机推荐:O... 对于热爱手游的玩家来说,选择一款合适的旗舰至关重要。这不仅关乎游戏过程中的流畅度与画质体验,也涉及长...
性价比高的电容触摸屏 在工业控制、医疗设备、自助终端等专业领域,电容触摸屏已成为人机交互的核心部件。用户在选择时,往往面临...