苹果说AI无能,大概率支持这结论,但深刻怀疑其动机
创始人
2025-06-10 22:01:17

今日凌晨,苹果全球开发者大会(WWDC25)在硅谷如期开幕。与往年不同的是,这一次苹果没有拿出AI重拳产品,而是默默坐实了“大模型版Siri再次跳票”的消息。

而就在大会前夕,苹果AI研究团队抛出一篇题为《思维的错觉:通过问题复杂性视角理解推理模型的优势与局限性》的论文。

论文剑指DeepSeek-R1、Claude 3.7 Sonnet等当红大模型,称其在复杂任务中会出现“崩溃模式”,甚至断言它们只是“死记硬背的模式机器”,根本不具备真正的推理能力。

苹果的炮火:一次学术包装下的市场反击

苹果这篇论文并非无的放矢。研究团队设计了一套基于“谜题复杂度”的测试框架,对包括DeepSeek-R1、Claude 3.7 Sonnet在内的主流大模型进行了系统分析。

苹果团队宣布,发现了当前AI模型的软肋:

当处理简单问题时,推理模型常会在早期找到正确答案后,仍继续生成错误方案,浪费计算资源。

一旦问题复杂度超过临界点,模型准确率会暴跌至接近零,且伴随“努力程度下降”的反常现象。

即便提供河内塔等问题的标准算法步骤,模型依然无法可靠执行,暴露符号处理能力的根本缺陷。

这些结论迅速在AI圈引发震动。投资公司Bootstrapped创始人Ruben Hassid在社交媒体转发时说:“苹果刚刚证明,这些AI模型实际上根本不具备推理能力,它们只是能很好地记住模式而已。”

但是,质疑的声音同样猛烈。批评者直指实验设计存在“用锤子敲螺丝”的荒谬。该实验通过人为增加谜题步骤制造复杂性,却忽视了大模型在现实任务中的自适应能力。

还有人发现,论文第一作者仅为弗吉尼亚理工大学的在读博士生,暗示其学术严谨性存疑。于是,学术争论早已溢出实验室,成为一场产业舆论混战。

失落的十年:苹果AI战略为何步步踏空?

苹果将炮口对准别人,但是,其自身的AI困局却愈发刺眼,苹果正在失去定义AI时代的机会。

2011年,乔布斯在生命最后阶段全力推动Siri上线,其“对话式助手”的愿景与当今大模型应用场景惊人一致。不过,先驱却成了掉队者,苹果也躲不过这个魔咒。十四年后,Siri仍被困在定闹钟、查天气的机械应答中。

究其根源,苹果在AI战略上可能犯下了三重错误:

高管内耗与技术短视。2018年从谷歌挖来的AI负责人John Giannandrea意图变革,却遭遇软件主管Craig Federighi的抵制,后者长期拒绝为AI投入巨资,认为其“非核心能力”。直到ChatGPT横空出世,管理层才仓促转向。

渐进主义遭遇技术断层。苹果试图用“小步迭代”升级Siri,但将大模型嵌入旧架构引发严重兼容性问题。前员工坦言:“不可能用爬山方式改造Siri”。

隐私枷锁束缚模型进化。苹果坚持用户数据本地化处理,导致其模型规模远小于云端运行的ChatGPT。当竞品借助海量数据狂奔时,苹果的“差分隐私”技术反而成了AI能力的枷锁。

论文背后的动机:吃不到的葡萄是酸的吗?

值此WWDC大会前夕抛出“AI崩溃论”,苹果的时机选择耐人寻味。多重线索指向可能是一场精心设计的认知战役。

首先,可能是转移跳票焦点。当古尔曼等分析师提前预告WWDC的AI更新“少得令人失望”时,论文争议成功将媒体视线转向“大模型是否可靠”的哲学辩论,巧妙淡化了Siri再度跳票的尴尬。

此外,还有可能是打击对手估值。正值OpenAI收购Jony Ive的硬件公司、谷歌与Perplexity联手进军设备端AI之际,苹果的论文为资本市场泼下一盆冷水。若证明当红模型存在根本缺陷,竞品的商业故事将遭重创。

当然,为封闭生态辩护意图也可能存在。当苹果宣布向开发者开放仅30亿参数的“基础模型”时,前述研究恰好为其设备端小模型策略提供理论掩护。既然大模型会崩溃,何必追求参数规模?

业界质疑声也是一针见血。苹果炮轰大模型,本质是对自身错失机遇的心理补偿。“我们只能等着看论文证明人类的推理不仅仅是记忆模式了”,社交媒体的这条高赞评论,道破了苹果立场的反讽性。

能力泡沫与生存危机:苹果的两难困局

平心而论,苹果对AI能力泡沫的警示有其价值。当科技圈将大模型奉为“通用人工智能前奏”时,论文揭示的崩溃现象证实:现有技术仍严重受制于训练数据分布,缺乏人类式的抽象泛化能力。

对苹果来说,真正的危机在于,当三星联手Perplexity、OpenAI结盟Jony Ive打造AI硬件时,苹果的护城河正在被绕过。库克在财报会上承认“需要更多时间”。

诺基亚的幽灵从未如此清晰:功能机之王曾嘲笑初代iPhone“不耐摔”,却在五年内帝国崩塌。今天,苹果质疑大模型“无推理”,颇有历史轮回的寒意。

技术史上,吃不到葡萄说葡萄酸的故事屡见不鲜。IBM曾宣称个人电脑“非企业级”,柯达贬低数码相机“无胶片灵魂”,不过,用话语权弥补创新乏力的尝试,最终都被时代碾碎。

苹果论文揭示的大模型缺陷也许真实存在,但这恰恰是技术演化的常态。蒸汽机初代热效率仅3%,莱特兄弟首飞仅留空12秒,开始的时候,都很稚嫩。

于社会而言,真正的危险不在于技术稚嫩,而在于巨头用“得不到的就毁掉”的竞争策略取代开放创新。

或许,在不久的将来,人们回顾2025年WWDC的最大遗产,不是液态玻璃设计,而是一家科技帝国在范式更迭前夜的认知失调。忙于证明对手的无能,却忘了自己早已在起跑线上沉默良久。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

OpenAI已收购AI声音克隆... 来源:环球市场播报 两年前,OpenAI的技术团队发布博文,详述公司已借助顶尖人工智能技术研发出人...
海光信息:为“能源电力行业第一... 5月15日,由中国电力企业联合会大数据与人工智能分会举办的“能源电力行业第一届人工智能创新研发交流活...
浙江中达精密部件申请自润滑滑动... 国家知识产权局信息显示,浙江中达精密部件股份有限公司申请一项名为“一种自润滑滑动轴承”的专利,公开号...
“AI+”,这样赋能制造全流程 来源:滚动播报 (来源:新华日报) (视觉中国供图) □ 本报记者 付奇 李嘉豪 “‘AI+制造’将...
石化机械获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示石化机械(000852)新获得一项实用新型专利授权,专利名为“...
29个智能气象站启动业务试运行 本报北京5月15日电 (记者李红梅)记者从中国气象局获悉:北京密云等29个智能气象站已于近日启动业务...
违法违规收集使用个人信息!41... 1、未公开个人信息收集使用规则。涉及20款移动应用如下: 《享充充电》(微信小程序)、《小牛充充充电...
微信鸿蒙版App获8.0.17... IT之家 5 月 16 日消息,微信鸿蒙版 App 已在华为应用市场发布 8.0.17.38(839...
2026年国内高端小程序开发公... 2026年,小程序开发已彻底进入两极分化时代。一边是AI工具让“做个能跑的小程序”变得像写文档一样简...
网传“三大运营商即将免月租”,... 据央视新闻,最近,大家在各大社交平台都可能刷到过这样一条消息——三大运营商即将全面推出免月租、按量计...