顶尖大佬坦白局,只会聊天的大模型没戏了?
创始人
2026-01-13 10:20:31

才开年没几天,这帮搞AI的就坐不住了。

上周末,智谱AI联合清华大学基础模型北京市重点实验室,搞了个AGI Next前沿峰会, 传说中的“开源四杰”,一下就来了三家。

清华大学教授、智谱创始人唐杰,月之暗面创始人杨植麟,还有阿里Qwen的技术负责人林俊旸,一个个都是名头响当当的人物。

除此之外,这段时间风头正盛的腾讯CEO办公室首席科学家姚顺雨,回国后也首次公开露脸, 带来了一些让人感到“头大”的操作。

人没到场,只露了脸。。。照片里看起来头最大的那个人就是他。

当然,现场也不乏学术界的代表,像加拿大皇家学院院士、香港科技大学荣休教授杨强,还有清华大学教授、院士张钹。

91岁的张院士虽然自嘲“早已经被替代了” ,但说出来的话相当犀利, 直言现在的大语言模型并不是人类语言的真正模型。

这群大佬凑在一块,没有把时间浪费在商业互吹上,更多的是聊技术路线、新的范式。比如Chat AI基本上到头了,接下来应该往哪走?再比如咱们虽然显卡没美国多,但穷则思变搞不好能憋出大招。。。

这么说吧,他们把之后AI可能会怎么发展,给提前“剧透”了一部分。

隔壁咱们也正好去了现场,今天也一起来看看会上都有哪些干货。

“Chat范式快到头了”,这是智谱创始人唐杰在现场抛出的一个暴论。

在他看来,随着 DeepSeek 的横空出世,大家做得再好,更个性化、更有情感,无非就是在对话上修修补补,玩不出什么新花样。

至于新范式, 说白了就是让AI干活儿。

过去一年,不管是写代码的 Coding,还是能处理复杂任务的 Agentic,其实都是在往这个方向走。

圆桌会议上,主持人就针对Agent抛了一个很高的预期:到了 2026 年,能不能让它跑个几天几夜,把人类一两周的工作量给干了?

不过在Agent这事儿上,大佬们没有盲目画饼,而是抛出了几个冷思考。

世超斗胆总结下,就是别拿大炮轰蚊子。

在Qwen技术负责人林俊旸看来,Agent 真正的机会,不在于那些大家都能想到的头部需求,而是那些翻遍全网都找不到解决方案的长尾问题。

而从性价比的视角来看,如果一个简单的需求,也非要让AI在后台烧钱推理半天,这笔买卖显然也是不划算的。

不过现在更大的问题可能是,AI还没那么聪明,要实现这种能干活的 AI,是继续无脑堆显卡、堆数据吗?

一直以来,大力出奇迹的Scaling,都被业内看作是提高模型智能水平的有效手段。但峰会现场, 唐杰却认为这是“人类偷懒的一种方法”。

因为光靠堆料带来的收益正在变低,如果还只盯着参数量,不去找新的范式,那其实就是一种思维上的懒惰。

在这一点上,杨植麟说得可能更具体。

他们通过Token efficiency(Token效率)和Long Context(长上下文),来实现更好的Agent智能。

具体来说,Token efficiency 就是指在遵循 Scaling Law 的前提下,让模型在有限的训练数据里,把智商上限拉得更高 。为此,Kimi 甚至搞出了新的二阶优化器 MUON 和线性注意力机制,愣是把效率提升了 2 倍。

说人话就是,少吃草,多挤奶。

除了抠效率,这次峰会,“自主学习”也是被反复提及的关键词之一。

啥叫自主学习?简单来说,就是让AI自己悟道。

听起来有点超前,但姚顺雨直接甩出了两个已经实现了的案例:

一个是 ChatGPT,正在利用海量的用户对话数据,不断地进行自我微调和风格适应。另一个更狠,在Claude这个项目里, 有 95% 的代码其实是Claude自己写的。

按照姚顺雨的说法,在硅谷大街小巷的咖啡馆里,自主学习已经成为了一种共识。

而当被问到,谁最可能引领这个新范式时,姚顺雨也给出了一个判断: 虽然 OpenAI 的创新基因可能因为商业化被削弱了,但它仍然是那个最有可能的选手。

聊完技术,咱们还得聊聊大模型在产业端的情况。

现场,姚顺雨就提到了他对于模型分化的两个观察。

一个是C端对模型智能的钝感力,换句话说,大模型的能力具体变强了多少,多数C端用户是感受不到的。

面向C端用户的产品,模型智商提高 10 分还是 20 分,对用户来说区别不大。有时候一个 80 分的模型配合丝滑的交互,体验反而可能会吊打 90 分的模型。

但在ToB领域,就不一样了,强弱分化很明显。

在这里,模型越强,代表着能解决的任务越多,产生的价值就越大。所以,谁家模型能帮程序员把写代码的效率,哪怕只提升10%,企业也愿意掏钱。

另外一个, 则是垂直整合和模型应用分层两条路径的分化。

ToB的垂直整合未必成立,尤其对于生产力场景来说,模型层和应用层需要的能力不太一样。但在ToC应用上,垂直整合还是成立的,无论是ChatGPT还是豆包,模型和产品都在非常强耦合地紧密迭代。

最后,一个敏感但避不开的问题,就是AI的中美竞争,几位嘉宾也没藏着掖着。

唐杰很坦诚,在他看来,虽然国内在开源上有了一些成绩, 但实际上中美差距可能还在拉大。

那咱们缺的是啥?显卡吗?

是,也不是。 比起显卡,咱们更缺的其实是胆子。

姚顺雨直言,国内团队复现技术那叫一个快,只要一个技术被证明是可行的,咱们一拥而上能做得更好。

但如果是个不确定的新范式,大家就不敢碰了。说白了,就是缺了点冒险精神。

不过林俊旸最后,还是给了国内一个 20% 的胜率。

咱们国内团队虽然不像美国巨头那样富得流油,显卡随便烧,但穷也有穷的活法。

正是因为资源有限,逼得大家必须在算法和架构上抠细节,这种被逼出来的创新,搞不好能比那些显卡大户搞出来的东西更扎实。

反正通过这场坦白局,世超对之后AI的发展可以说是非常兴奋了。

新的范式正在破土而出,大模型可能会迎来比想象中更具突破性的进展。大家不再迷信那些静态的排行榜和跑分,而是更关注模型在真实世界里,解决复杂问题的能力。。。

也许在不远的将来,当我们回望今天,就会发现我们正站在人类历史的变革前夜。

撰文:西西

编辑:江江&面线

美编:焕妍

图片、资料来源

峰会现场

部分图源网络

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

金牛订购APP输了很多钱可以追... 金牛订购APP输了很多钱可以追回吗?被骗的钱可退!退费流程公布2016成功维权案例金牛订购贵金属平台...
珍牛订购APP亏损了不少钱怎么...  珍牛订购APP亏损了不少钱怎么退?醒醒吧,退费者道出残酷真相1月份可靠的退费流程珍牛订购亏钱了能追...
台积电:硅基话语权的巅峰 2026年的钟声刚刚敲响,全球科技和金融市场的目光便被一道来自东方的强光所穿透。 这道光,源自台积电...
美国投资移民机构推荐:四家代表... 在美国投资移民(EB-5)领域,选择一个专业、可靠且经验丰富的区域中心是确保移民申请与资金安全的关键...
当AI颠覆了广告收入,该靠什么... 本文来自微信公众号:,作者:刘宇轩,原文标题:《当ChatGPT陷入“数据混乱”:硅谷的焦虑与阿里千...
华与华曾申请品牌营销全能型商标 天眼查工商信息显示,华与华关联公司上海华与华营销咨询有限公司成立于2004年1月,法定代表人为华杉,...
原创 贸... 哈喽,大家好,今天小墨这篇评论,主要来分析2025年中国贸易顺差创历史新高背后,劳动力市场发生了什么...
专家:国内房价调整幅度明显超过... 资料图 本文综合第一财经、北京商报、南方都市报、界面新闻等 自2022年以来,中国房地产已经经历约4...
武田中国持续推进人才发展战略 (来源:经济日报) 转自:经济日报 近日,杰出雇主调研机构(Top Employers Instit...
去年成交近11万套商品住宅,武... 1月15日下午,2026年武汉市返乡置业购房季活动正式启动,吸引110多家房企、数百个楼盘参与。 第...