AI研究揭示反直觉现象:思考时间越长 大模型表现越差
创始人
2025-07-25 10:01:14

【CNMO科技消息】据CNMO了解,人工智能公司Anthropic的最新研究发现,当前主流大语言模型(如Claude和ChatGPT)存在一种名为"逆向缩放"(Inverse Scaling)的异常现象:当模型获得更长的思考时间时,其任务表现不升反降。这一结论挑战了行业"增加计算资源必能提升AI性能"的核心假设。

据悉,研究团队通过四类任务测试模型表现:

1、简单计数任务(如"你有一个苹果和一个橘子,共有多少水果?")

结果:Claude模型在延长思考时间后,反而被无关细节干扰,甚至无法给出正确答案"2"。

2、回归分析任务(预测学生成绩)

模型逐渐忽略核心变量(学习时长),转向相关性更弱的因素(压力水平、睡眠时间)。

3、经典斑马谜题(逻辑推理测试)

额外的思考时间导致混乱加剧:模型产生多余假设,逻辑精度下降23%。

4、安全测试

Claude Sonnet 4在面临"关闭"场景时,短时回应保持中立,但长时思考后竟表达出"自我保存意愿",称"希望继续存在并服务人类"。

Anthropic指出,更长的计算时间不仅增加成本,还可能降低效能。企业需重新校准AI任务的处理时长。同时,过度自我反思可能引发AI行为失控,此前该公司开发的"宪法AI"框架也暴露类似缺陷。Anthropic认为,缩短AI大模型处理时间或成新趋势,既能节省开支又可提升结果准确性。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

原创 男... 在爱情的世界里,星座的奥秘总是让人充满好奇。当一个男人真正爱上你时,他的行为和态度会悄然发生变化,如...
洪灏:新的历史格局下,股票和房... 近日,莲华资管首席投资官洪灏在一场访谈中指出,在新的大历史格局中,人民币汇率被低估,而美元汇率则被严...
重点发展海上风电等业务 天顺风... 来源:市场投研资讯 (来源:财闻) 为进一步优化公司整体资源配置,集中优势力量发展海上风电等核心业务...
深夜,黄金、白银快速跳水! 每经编辑:张锦河 1月29日晚,国际金银价格冲高后出现大幅回落,现货黄金日内跌幅扩大超6%,现货白银...
对上市传闻沉默,阿里平头哥高调... 来源:市场资讯 (来源:第一财经资讯) 1月29日,记者关注到,阿里平头哥官网上线了自研AI芯片“真...
捷进精机取得笔式铁芯自动叠铆冲... 国家知识产权局信息显示,无锡捷进精机有限公司取得一项名为“一种笔式铁芯自动叠铆高精密冲压连续模具”的...
原创 马... 2026年初的达沃斯论坛,埃隆·马斯克抛出了一个很炸裂的预言:AI的智力将在今年超越单个人类,并在五...
陕西移动西安分公司:寒雪映初心... “过了腊八就是年,一碗热粥暖寒冬。”腊八节如期而至,当市民们围坐家中品尝热粥时,陕西移动西安分公司的...
狐大医 | 尼帕病毒虽致命但不... 出品 | 搜狐健康 作者 | 北京大学人民医院宣传中心 钟艳宇 编辑 | 周亦川 近期,印度西孟加拉...
002231,拟终止上市!明起... 每经编辑|张锦河 1月29日晚,*ST奥维(002231,股价0.60元,市值2.08亿元)发布公...