DeepSeek-V3.2-Exp发布,训练推理提效,API成本降50%以上
创始人
2025-09-29 23:12:50

新浪科技讯 9月29日晚间消息,DeepSeek发布DeepSeek-V3.2-Exp模型。据悉,这是一个实验性(Experimental)的版本,作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。DeepSeek-V3.2-Exp 模型现已在 Huggingface 与魔搭开源。

在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。(文猛)

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

B站视频播客单日播放时长突破1... 6月25日,B站发布《哔哩哔哩视频播客创作手册》(1.0版本),首次系统披露平台视频播客生态的增长情...
宇树科技宣布人形机器人R1降价... 【CNMO科技消息】6月24日,CNMO科技注意到,宇树科技官方宣布,调整旗下Unitree R1系...
【县区动态•临洮县】品读陇原院... 为大力弘扬科学家精神,深挖本土科技榜样力量,6月23日,“榜样的力量”科学家故事会——《陇原之光—在...
原创 星... ## 图中展示了艺术家对3IATLAS彗星的印象图,该彗星正从太阳附近经过,太阳照亮了彗星的一侧。在...
又双标?Anthropic指责... IT之家 6 月 25 日消息,据 CNBC 当地时间周三报道,Anthropic 已向美国参议院银...
2026 MWC上海|中信科移... 在全球移动通信技术迈向空天地一体化的关键节点,中国信科集团旗下中信科移动(以下简称中信科移动)携空天...
小米17系列累计销量突破531... 【CNMO科技消息】据第三方市调机构监测数据,小米17系列在国内市场的累计激活销量已突破530万部大...
iQOO 15/15 Ultr... IT之家 6 月 24 日消息,博主 @数码闲聊站 今日发布调价表格,iQOO 15系列手机进行了新...
联合利华(Unilever):... 一、公司概况联合利华(Unilever plc / Unilever N.V.)是全球领先的快速消费...
威瑞森通信公司分析:美国电信巨... 公司概况威瑞森通信公司(Verizon Communications Inc.)是美国最大的无线通信...