Claude强到不敢发的Mythos,被质疑用了字节Seed技术
创始人
2026-04-13 16:32:16

梦晨发自 凹非寺

量子位 | 公众号 QbitAI

Claude最强“神话”模型,可能用到来自 字节的技术?

这条猜测直接冲上𝕏热搜榜。

这款“强到不敢公开发布”的Mythos模型,确实刺激了人们对下一代LLM架构的想象。

社区正在热烈讨论它是否采用了 循环语言模型(Looped Language Model)架构。

这个概念来自 字节Seed团队与多个高校合作的一篇论文, Yoshua Bengio也参与其中。

关键线索在于Anthropic公布的一组测试数据。

字节论文指出, 图搜索是循环算法相比标准RLVR具有巨大理论优势的领域之一。

再看Mythos,正是在广度搜索优先的 图搜索测试GraphWalks BFS中,超越对手GPT5.4最多。

80%对21.4%,接近4倍的差距。

在其他类型的任务上,并没有出现如此异常的分差。

说明 这种进步很可能不是来自通用的Scaling Law,而是架构创新

循环语言模型:同一层”多转几圈”,小模型碾压大模型

GraphWalks BFS测试,就是给模型一个复杂的图结构,让它做广度优先搜索,从起点出发,一层一层地访问所有相邻节点。

标准Transformer处理这类问题只能一次前向传播,从头走到尾,输出结果,没有“迭代”这个概念。

Mythos在图遍历上拿到了80%的分数,表明它内部很可能在“”反复计算”,对同一组信息来回处理了好几遍。

那么什么样的架构能实现“反复计算”?

字节Seed团队在论文中提出 LoopLM循环语言模型。

简单总结LoopLM有三个特点。

1、不写长文思考,在模型内部潜空间迭代,不额外输出更多token。

2、简单题少想几步,难题多想几步,自动调节。

3、预训练时就学 “怎么在潜空间思考”,而不是只学 “怎么预测下一个token”。

在实验中,团队训练了Ouro系列循环语言模型,内置了循环思考。

测试结果,1.4B的Ouro模型性能对标约4B的传统模型。2.8B的Ouro模型相当于8B–12B的传统模型。

至于循环模型的能力提升来自何处,论文详细分析了 知识存储vs知识操作的区别。

知识存储(Knowledge Storage)的容量是有限的,大约每个参数2bits,不管用什么架构,这个数字基本不变。

循环也不会让你“记住”更多东西。

但知识操作(Knowledge Manipulation)不一样,把已知事实组合起来做多跳推理、执行程序、搜索图结构,这类能力随循环步数和训练tokens指数级增长。

换句话说,循环模型没有给AI一个更大的知识库,但它让AI在知识库库里的搜索和组合能力提升了一个量级。

那么Mythos究竟是不是循环模型架构,有人总结出除了GraphWalks之外的更多线索。

三条线索指向循环模型架构

第一条线索,也就是广度优先图搜索测试结果。

Mythos除了分数是GPT5.4的4倍,比上一代Opus提升幅度也异常大。

第二条线索,Anthropic报告Mythos 每个任务使用的token数量是Opus4.9的1/5,但速度更慢

(价格也贵5倍!)

这在标准Transformer框架下很难说得通,token少,生成步骤就少,应该更快才对。

但循环模型刚好解释了这个矛盾:推理不发生在token层面,而是发生在潜空间,计算量花在了看不见的地方。

线索三,Mythos在网络安全方面非常突出。

Mythos在CyberGym测试上拿到83.1%,Opus4.6是66.6%,领先近17个百分点。

以及找到上千个零日漏洞,主流操作系统和浏览器全都没逃过。

漏洞发现的本质就是对控制流图做遍历。找到一条从输入到危险函数的路径,也就是图的可达性问题。

又是图遍历。又是循环架构的天生强项。

说了这么多,终归只是大家的猜测,Anthropic没有公开任何关于Mythos架构的信息,很可能以后也不会公开。

但有一句话值得思考:

Scaling Law改善一切,相对均匀,架构创新在匹配其归纳偏置的任务上创造异常尖峰值。

循环Transformer的归纳偏置就是迭代图算法。Mythos的异常尖峰,恰好出现在图遍历任务上。

Anthropic不说,但测试数据已经替它说了。

字节论文:

https://arxiv.org/abs/2510.25741

参考链接:

[2]https://aiia.ro/blog/claude-mythos-looped-language-model-theory

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

字节与荣耀接洽“豆包手机”合作... 快科技4月13日消息,据媒体报道,荣耀正与字节跳动就“豆包手机”相关合作展开接洽。事实上,在与中兴通...
消息称Meta要打造“AI小扎... IT之家 4 月 13 日消息,今天上午,据《金融时报》援引知情人士消息报道,Meta 正在打造一款...
三星2nm 60%良率也没用!... 4月13日消息,据报道,高通正在重新评估下一代骁龙处理器的代工策略,其生产重心全面倒向台积电。 这意...
2026久用不卡手机系统推荐:... 最近不少网友都在咨询相关问题:哪些系统能做到久用不卡?旗舰机选什么流畅的手机系统好?安卓阵营流畅表现...
中国新能源汽车,接住了这泼天富... 根据中国乘用车市场信息联席会(乘联会)上周四(4月9日)发布的最新数据,已经过去的3月,中国汽车海外...
阿波罗11号登月源码公开:AG... 2026-04-12 13:00:14 作者:狼叫兽 阿尔忒弥斯2号任务圆满结束,虽未实现环绕月球...
斗金订购APP5元订购现货交易...   斗金订购APP5元订购现货交易骗局,投资人根本不知道这个平台的合规性就在充值,充值亏钱了就想赚回...
万山磅礴看主峰|支柱产业硬核上... 【编者按】《中华人民共和国国民经济和社会发展第十五个五年规划纲要》发布,擘画了中国未来五年的发展战略...
云启购app商品现货订购金融陷...   现在市场上的贵金属APP缺乏正规交易资质,涉嫌误导消费者购买白银、铂金等商品!当前网络上存在大量...
Claude强到不敢发的Myt... 梦晨发自 凹非寺 量子位 | 公众号 QbitAI Claude最强“神话”模型,可能用到来自 字节...