苹果说AI无能，大概率支持这结论，但深刻怀疑其动机_资讯

创始人

2025-06-10 22:01:17

今日凌晨，苹果全球开发者大会（WWDC25）在硅谷如期开幕。与往年不同的是，这一次苹果没有拿出AI重拳产品，而是默默坐实了“大模型版Siri再次跳票”的消息。

而就在大会前夕，苹果AI研究团队抛出一篇题为《思维的错觉：通过问题复杂性视角理解推理模型的优势与局限性》的论文。

论文剑指DeepSeek-R1、Claude 3.7 Sonnet等当红大模型，称其在复杂任务中会出现“崩溃模式”，甚至断言它们只是“死记硬背的模式机器”，根本不具备真正的推理能力。

苹果的炮火：一次学术包装下的市场反击

苹果这篇论文并非无的放矢。研究团队设计了一套基于“谜题复杂度”的测试框架，对包括DeepSeek-R1、Claude 3.7 Sonnet在内的主流大模型进行了系统分析。

苹果团队宣布，发现了当前AI模型的软肋：

当处理简单问题时，推理模型常会在早期找到正确答案后，仍继续生成错误方案，浪费计算资源。

一旦问题复杂度超过临界点，模型准确率会暴跌至接近零，且伴随“努力程度下降”的反常现象。

即便提供河内塔等问题的标准算法步骤，模型依然无法可靠执行，暴露符号处理能力的根本缺陷。

这些结论迅速在AI圈引发震动。投资公司Bootstrapped创始人Ruben Hassid在社交媒体转发时说：“苹果刚刚证明，这些AI模型实际上根本不具备推理能力，它们只是能很好地记住模式而已。”

但是，质疑的声音同样猛烈。批评者直指实验设计存在“用锤子敲螺丝”的荒谬。该实验通过人为增加谜题步骤制造复杂性，却忽视了大模型在现实任务中的自适应能力。

还有人发现，论文第一作者仅为弗吉尼亚理工大学的在读博士生，暗示其学术严谨性存疑。于是，学术争论早已溢出实验室，成为一场产业舆论混战。

失落的十年：苹果AI战略为何步步踏空？

苹果将炮口对准别人，但是，其自身的AI困局却愈发刺眼，苹果正在失去定义AI时代的机会。

2011年，乔布斯在生命最后阶段全力推动Siri上线，其“对话式助手”的愿景与当今大模型应用场景惊人一致。不过，先驱却成了掉队者，苹果也躲不过这个魔咒。十四年后，Siri仍被困在定闹钟、查天气的机械应答中。

究其根源，苹果在AI战略上可能犯下了三重错误：

高管内耗与技术短视。2018年从谷歌挖来的AI负责人John Giannandrea意图变革，却遭遇软件主管Craig Federighi的抵制，后者长期拒绝为AI投入巨资，认为其“非核心能力”。直到ChatGPT横空出世，管理层才仓促转向。

渐进主义遭遇技术断层。苹果试图用“小步迭代”升级Siri，但将大模型嵌入旧架构引发严重兼容性问题。前员工坦言：“不可能用爬山方式改造Siri”。

隐私枷锁束缚模型进化。苹果坚持用户数据本地化处理，导致其模型规模远小于云端运行的ChatGPT。当竞品借助海量数据狂奔时，苹果的“差分隐私”技术反而成了AI能力的枷锁。

论文背后的动机：吃不到的葡萄是酸的吗？

值此WWDC大会前夕抛出“AI崩溃论”，苹果的时机选择耐人寻味。多重线索指向可能是一场精心设计的认知战役。

首先，可能是转移跳票焦点。当古尔曼等分析师提前预告WWDC的AI更新“少得令人失望”时，论文争议成功将媒体视线转向“大模型是否可靠”的哲学辩论，巧妙淡化了Siri再度跳票的尴尬。

此外，还有可能是打击对手估值。正值OpenAI收购Jony Ive的硬件公司、谷歌与Perplexity联手进军设备端AI之际，苹果的论文为资本市场泼下一盆冷水。若证明当红模型存在根本缺陷，竞品的商业故事将遭重创。

当然，为封闭生态辩护意图也可能存在。当苹果宣布向开发者开放仅30亿参数的“基础模型”时，前述研究恰好为其设备端小模型策略提供理论掩护。既然大模型会崩溃，何必追求参数规模？

业界质疑声也是一针见血。苹果炮轰大模型，本质是对自身错失机遇的心理补偿。“我们只能等着看论文证明人类的推理不仅仅是记忆模式了”，社交媒体的这条高赞评论，道破了苹果立场的反讽性。

能力泡沫与生存危机：苹果的两难困局

平心而论，苹果对AI能力泡沫的警示有其价值。当科技圈将大模型奉为“通用人工智能前奏”时，论文揭示的崩溃现象证实：现有技术仍严重受制于训练数据分布，缺乏人类式的抽象泛化能力。

对苹果来说，真正的危机在于，当三星联手Perplexity、OpenAI结盟Jony Ive打造AI硬件时，苹果的护城河正在被绕过。库克在财报会上承认“需要更多时间”。

诺基亚的幽灵从未如此清晰：功能机之王曾嘲笑初代iPhone“不耐摔”，却在五年内帝国崩塌。今天，苹果质疑大模型“无推理”，颇有历史轮回的寒意。

技术史上，吃不到葡萄说葡萄酸的故事屡见不鲜。IBM曾宣称个人电脑“非企业级”，柯达贬低数码相机“无胶片灵魂”，不过，用话语权弥补创新乏力的尝试，最终都被时代碾碎。

苹果论文揭示的大模型缺陷也许真实存在，但这恰恰是技术演化的常态。蒸汽机初代热效率仅3%，莱特兄弟首飞仅留空12秒，开始的时候，都很稚嫩。

于社会而言，真正的危险不在于技术稚嫩，而在于巨头用“得不到的就毁掉”的竞争策略取代开放创新。

或许，在不久的将来，人们回顾2025年WWDC的最大遗产，不是液态玻璃设计，而是一家科技帝国在范式更迭前夜的认知失调。忙于证明对手的无能，却忘了自己早已在起跑线上沉默良久。

⚠️

本网站信息内容及素材来源于网络采集或用户发布，如涉及侵权，请及时联系我们，发送链接至2697952338@QQ.COM，我们将第一时间进行核实与删除处理。