DeepSeek更新新模型 可一次性处理超长文本
创始人
2026-02-12 05:21:55

来源:新浪科技

新浪科技讯 2月11日晚间消息,多名用户反馈,DeepSeek在网页端和APP端进行了版本更新,支持最高1M(百万)Token的上下文长度。而去年8月发布的DeepSeekV3.1上下文长度拓展至128K。

实测中发现,DeepSeek在问答中称自身支持上下文1M,可以一次性处理超长文本。提交超过24万个token的《简爱》小说文档,DeepSeek可以支持识别文档内容。

之前曾有知情人士称,DeepSeek 春节更可能推出的是针对V3系列模型的小幅更新。但该人士同时透露,真正的重头戏仍在路上。DeepSeek下一代旗舰模型预计将是一款万亿参数级别的基础模型,正因规模大幅跃升,训练速度明显放缓,导致发布进程有所延后。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

维信诺联合清华北大开发柔性存算... 1月28日,国际顶级期刊《自然》刊发了清华大学、北京大学与维信诺合作开发的全球首款柔性存算一体化芯片...
原创 美... 世界上最早广为人知的原子弹,毫无疑问便是美国在日本投下的那两颗。当时,二战的局势已经趋向明朗,同盟国...
2月11日连板股分析:连板股晋... 转自:财联社 【2月11日连板股分析:连板股晋级率38% 电子布概念股爆发】今日共51股涨停,连板股...
青年思享汇丨人工智能赋能基层团... 青年思享汇 人工智能赋能基层团务 为积极拥抱数智化浪潮,推动基层团务工作提质增效,2月11日,共青团...
尚弘博实业取得手表抛光自动化设... 国家知识产权局信息显示,东莞市尚弘博实业有限公司取得一项名为“一种手表抛光自动化设备”的专利,授权公...
少吃高油高盐食物 健康饮食才能... 0引子:从血管到神经元 探讨饮食与认知功能的关系,通常的路径是直接聚焦于大脑神经元或淀粉样蛋白沉积...
央视财经携手天眼查:用大数据解... 本文来源:时代周报 近日,由中央广播电视总台财经节目中心主办的《中国经济活力数据之夜》隆重举行,天...
如何挑选靠谱的行李寄存平台?2... 为一次高效、无忧的出行选择一款可靠的行李寄存平台,已成为现代旅客规划行程时的关键环节。一个优秀的平台...
DeepSeek更新新模型 可... 来源:新浪科技 新浪科技讯 2月11日晚间消息,多名用户反馈,DeepSeek在网页端和APP端进行...
Anthropic最新2026... 文章转载于新智元 2026年的AI圈,要说谁最风光,Anthropic绝对排第一。 就在刚刚,Ant...