DeepSeek-V3.1正式发布,混合推理架构加持,针对下一代国产芯片设计
创始人
2025-08-21 17:44:11

21日,DeepSeek宣布,DeepSeek发布了其最新的大语言模型DeepSeek-V3.1,通过引入混合推理架构和显著增强的智能体(Agent)能力,进一步加剧了全球AI市场的技术竞赛。

V3.1版本的核心亮点是采用了全新的混合推理架构允许模型在一个统一框架内支持“思考”与“非思考”两种模式。根据官方公告,新版本通过训练后优化,在工具使用与编程、搜索等智能体任务上表现获得较大提升。需要注意的是,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。UE8M0 FP8是针对即将发布的下一代国产芯片设计。

据社区测试数据显示,新模型在Aider多语言编程基准测试中得分超越了Anthropic的Claude 4 Opus,同时保持了显著的成本优势。这一性能突破已在开发者社区引发广泛关注,模型在Hugging Face平台的热度迅速攀升。

DeepSeek同步升级了API接口,将上下文窗口扩展至128K,并新增了对Anthropic API格式的支持以简化迁移。更重要的是,公司宣布将于2025年9月6日起执行新的API定价方案并取消夜间优惠,这被视为其在服务能力扩容后,加速商业化进程的关键一步。

混合推理架构,迈向Agent时代

据DeepSeek官网,本次升级包含以下主要变化:

  • 混合推理架构:一个模型同时支持思考模式与非思考模式;
  • 更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;
  • 更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。

在效率方面,新的思考模式(V3.1-Think)经过思维链压缩训练,相比上一代模型(R1-0528),在任务表现基本持平的情况下,token消耗量可减少20%至50%。

新模型着重强化了以编程和搜索为代表的Agent能力。根据DeepSeek公布的数据,V3.1在代码修复(SWE)和命令行终端任务(Terminal-Bench)测试中,性能相较于公司以往模型有明显提高。在搜索任务上,模型在需要多步推理的复杂搜索测试(browsecomp)中也大幅领先。

社区进行的第三方测试进一步证实了其编程能力的跃升。数据显示,在Aider编程基准上,V3.1取得了71.6%的高分,超越了包括Claude 4 Opus在内的多个知名模型。同时,该测试也凸显了其成本效益,完成一次编程任务的成本仅为1.01美元,远低于部分专有闭源模型。这些性能指标的提升,直接增强了DeepSeek在自动化编程和复杂信息处理等商业场景中的吸引力。

开源与API更新同步推进

DeepSeek继续其开源策略,已将V3.1的Base模型和后训练模型在Hugging Face与魔搭社区上发布。据称,此次发布的模型参数量为685B,Base模型在V3基础上额外进行了840B token的训练。公司特别提醒开发者,新模型采用了UE8M0 FP8 Scale的参数精度,且分词器(tokenizer)和聊天模板有较大调整,部署时需参考最新文档。

与此同时,API服务也全面升级。除了将上下文长度扩展至128K外,DeepSeek还为开发者提供了更强大的工具调用功能,例如支持strict模式的Function Calling以确保输出格式的规范性。

此外,为降低生态迁移成本,API增加了对Anthropic API格式的兼容支持,方便使用Claude Code框架的开发者接入DeepSeek模型。

商业化提速:API价格调整在即

在技术与产品更新之外,DeepSeek也迈出了清晰的商业化步伐。公司宣布,将从北京时间2025年9月6日凌晨起,对开放平台的API接口调用价格进行调整,届时将执行新版价格表,并同步取消实行已久的夜间时段优惠。

  • 输入:0.5元/百万tokens(缓存命中);4元/百万tokens(缓存未命中)。
  • 输出:12元/百万 tokens。

在价格调整生效前,所有API服务仍按原价格政策计费。公司表示,此举是为更好地满足用户调用需求,并已对API服务资源进行了扩容。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

亚商智投198元是正规的吗投顾... 亚商智投198元是正规的吗投顾服务费可以退吗?关键步骤与常见情况解析在上海亚.商投资交的高额服务费可...
“大空头”:英伟达掉下神坛只是... 来源:市场资讯 (来源:创业板观察) 知名做空投资人、素有“大空头”之称的迈克尔·伯里(Michae...
国诚投资是正规公司吗?天价服务... 国诚投资是正规公司吗?天价服务费背后有何猫腻?一步教你轻松退费!投资本是一场自我的修行,只有起点,没...
汇正财经投资选股可靠吗三步操作...  汇正财经投资选股可靠吗三步操作:向投资顾问公司成功申请退费的经验分享上海汇正财经顾问有限公司不靠谱...
互联网优质内容创作者汇聚沪上 ... 人民网上海1月19日电 去年7月,《上海市关于支持互联网优质内容创作的若干举措》(以下简称“沪九条”...
1公斤最高299元!水贝市场上... “以前家里堆着的废铜烂铁,现在居然摇身一变成‘硬通货’。”有网友感叹道。 曾经被视为“破铜烂铁”的铜...
山东神光投顾上海分公司诱导股民... 山东神光投顾上海分公司诱导股民购买服务,吹嘘实力骗取会员费,被骗可以追回损失!大家能在山东神光缴费,...
财富在线F5存股收费半年198...   财富在线的钱可以退吗?投顾收费内幕解析!真相震惊已退费  深圳财富在线的高额服务费,能退吗?  ...
上海海能投顾虚假宣传夸大收益,... 上海海能投顾虚假宣传夸大收益,答案是:可以退的!!!大家能在上海海能投顾缴费,相信也都是因为自己认为...
亚商投顾选股魔方app投资反亏... 亚商投顾选股魔方app投资反亏钱,服务费能要回吗?可以!亏损者的退费维权攻略。在上海亚.商投资交的高...