深圳最新引入的顶尖科学家首次公开发声!“现在人和人的差距非常大”
创始人
2026-01-12 01:01:09

新任腾讯CEO/总裁办公室首席AI科学家姚顺雨1月10日首次公开露面,以嘉宾身份出席清华大学北京重点实验室主办的AGI-Next前沿峰会,姚顺雨此前曾任OpenAI研究员。他表示,在OpenAI之前,他在一个公司实习过,这是一个toB的公司,他觉得在toB公司工作过有很多收获,最大的收获是即使今天的模型不再变好,所有的模型训练全部停止了。但是我们把这些模型部署到世界上各种各样的公司,已经能带来今天10倍或者100倍的收益,能应对GDP产生5%-10%的影响,但是今天它对GDP的影响还不到1%。

另外他觉得教育非常重要,他观察现在人和人的差距非常大,更多时候不是说人类替代了人类工作,而是会使用这些工具的人在替代那些不会使用工具的人,就像当年电脑出来,如果转身学习编程跟你还在持续计算尺、使用算法,差距是巨大的。今天中国能做到的最大的有意义的事情是更好的教育,教育大家怎么更好的使用像Claude或者ChatGPT这样的产品,在国内我们可以用Kimi或者智谱这样的国产模型。

深圳最新引入的天才少年顶尖科学家

姚顺雨入职腾讯后首次公开发声!

1月10日,在由清华大学基础模型北京市重点实验室、智谱AI发起的AGI-Next前沿峰会上,,汇聚了清华大学教授、智谱创始人唐杰,腾讯AI首席科学家姚顺雨,月之暗面创始人杨植麟,阿里巴巴Qwen技术负责人林俊旸等AI领域专家,围绕通用人工智能(AGI)的最新进展、技术范式革新及产业应用展开深入讨论。

峰会聚焦于AGI的关键技术方向与产业趋势。 与会者普遍认为,2025年大模型技术已从早期的参数规模竞赛转向更注重智能效率与实用性提升,例如人类终极测试(HLE)基准显示模型在复杂推理和泛化能力上取得进展,但效率瓶颈日益凸显,未来需通过持续学习、记忆技术和多模态融合等路径突破。 具体技术方向包括:

- 多模态模型:唐杰指出,当前模型在统一感知视觉、声音等多源信息方面仍存在短板,需借鉴人类感觉统合机制实现原生多模态能力。

- 自主学习与Agent技术:姚顺雨认为2025年已出现自主学习信号,但需明确具体任务目标;林俊旸强调强化学习潜力未充分释放,未来AI需提升主动性,但需同步解决安全风险。

- 效率优化:行业面临数据规模膨胀与收益递减问题,需转向“智能效率”导向,通过算法创新降低对算力的过度依赖。

产业层面,AI正从聊天机器人向智能体演进。 在To B市场,顶级模型因错误率低而具备高溢价空间,企业付费意愿集中于头部模型;To C端则更关注对用户实时状态、位置等“上下文”的捕捉能力。垂直整合路线成为主流,厂商通过模型与应用层紧密耦合提升体验,同时学术界与工业界的创新差距缩小,为范式突破提供新动力。

AGI-Next前沿峰会发言要点总结

1月10日,清华大学基础模型北京市重点实验室发起的AGI-Next前沿峰会汇聚了AI圈“大半边天”,智谱唐杰、Kimi杨植麟、阿里林俊旸旸、腾讯姚顺雨等专家就AGI发展路径展开深度讨论。以下是核心发言要点精华总结:

一、主题演讲核心观点唐杰:让机器像人一样思考,从Chat走向做事

  • 核心判断:DeepSeek横空出世后,Chat范式基本结束,下一步重点是让AI完成具体任务(如Coding、Agent)。

  • 发展路径:参考人类认知双系统——系统一(记忆与模式匹配)和系统二(复杂推理),需强化多模态感知、记忆持续学习、反思与自我认知能力。

  • 未来方向:推进三类Scaling(数据规模、推理时长、环境交互),解决超长任务规划,探索新范式(如高效知识压缩)。

  • 开源生态:中国开源模型已形成影响力,但需警惕与美国的差距可能扩大。

杨植麟:Scaling Law是基石,但需优化Token效率与长上下文

  • 第一性原理:Scaling Law是将能源转化为智能的核心,Transformer因Scaling优势成为主流架构。

  • 关键突破:推出Muon优化器(2倍Token效率提升)和kimi Linear架构(线性注意力机制),助力Agent处理超长任务。

  • Agent时代:强化先验知识可降低搜索空间,实现复杂任务自动化(如数百步代码生成)。

  • 价值观导向:做模型是“创造一种世界观”,追求智能的多样性与审美(Taste)。

林俊旸旸:迈向通用Agent,多模态与环境交互是关键
  • 范式转变:模型需从对话转向执行长周期任务的Agent,需具备多模态能力(文本、视觉、语音)。

  • 实战进展:千问模型在代码生成(SWE-bench达70分)、图像编辑、语音交互上迭代,强调实用性与生产力。

  • 开源初心:服务开发者与真实需求,覆盖119种语言及方言,解决长尾问题。

  • 未来重点:全模态模型、强化学习与环境交互、安全可控的自主学习。

姚顺雨:toB与toC分化,Agent价值在生产力革命

  • 市场分化:toC场景对智能需求有限(如增强版搜索),toB场景中智能直接对应生产力提升(强模型溢价显著)。

  • 垂直整合:toC场景模型即产品成立,toB需分层(模型+应用),真实数据捕获是关键。

  • 自主学习:已初现信号(如Cursor实时学习),但需明确场景与奖励函数,突破需想象突破性任务(如赚钱系统)。

  • 教育优先:教会用户使用工具比模型本身更重要,中国需提升工具普及率。

二、圆桌讨论焦点议题

1. 路线分化

  • 姚顺雨:toB愿为最强模型付费,toC需个性化Context;垂直整合在toC成立,toB需模型与应用分层。

  • 林俊旸旸:分化是自然的,AGI应服务真实需求,非盲目追求通用性。

  • 杨强:学术界需跟进理论突破(如记忆与推理的平衡、睡眠式噪音清理)。

  • 唐杰:分化源于价值与成本权衡,需快速迭代应用窗口。

2. 自主学习
  • 姚顺雨:定义模糊,当前多是场景特定(如代码优化),需想象突破性任务(如赚钱系统)。

  • 林俊旸旸:强化学习潜力未完全释放,安全是最大挑战。

  • 唐杰:2026年必有范式革新,因Scaling效率遇瓶颈,需提升“智能效率”。

3. Agent之年
  • 姚顺雨:toB的Agent价值明确,模型越智能收益越高;环境部署与教育是瓶颈。

  • 林俊旸旸:Agent需与环境深度交互(如科学实验),长尾问题体现AGI魅力。

  • 唐杰:Agent成败取决于任务价值、成本与应用速度。

4. 中国能否反超美国?
  • 姚顺雨:概率高,但需突破算力瓶颈、培育冒险文化,避免“刷榜思维”。

  • 林俊旸旸:20%概率已乐观,差距在算力投入与创新环境。

  • 杨强:toC可能复制互联网成功,toB需本土化解决方案(如联邦学习)。

  • 唐杰:需敢冒险的聪明人、更好营商环境、坚持长期主义。

三、张钹院士总结:AI时代的企业家使命
  • 现状反思:大模型基于近似语义模型,存在指称、真知、语用等五大缺失。

  • AGI目标:应定义为可检验的五大能力(时空一致多模态、可控在线学习、可验证推理等)。

  • 企业家责任:需担当治理责任,推动技术造福人类,将AI变为如水电的通用工具。

总结共识:AI正从对话转向做事,Agent与多模态是未来重点;中美差距存在但中国有机会;范式革新需兼顾Scaling效率与理论突破;安全与治理是关键挑战。

姚顺雨:我观察现在人和人的差距非常大

以下是姚顺雨在AGI-Next前沿峰会圆桌讨论中的全部发言内容,按讨论顺序整理:

大家好,我现在是不是一个巨大的脸在会场?不好意思,今天没法亲自来北京,但是很高兴参加这个活动。最近忙着做模型、做产品、做AI,是一个很正常的状态。回国的感觉还是挺好的,吃的好很多。

Q1:路线分化

我觉得有两个大的感受,一个感受是 toC和toB发生了明显的分化,另外一个感受是 垂直整合这条路,以及模型和应用分层 这条路,也开始出现了分化。

我先说第一点,我觉得很明显的是当大家想到AI就是两个,ChatGPT,另外一个Claude code,是做toC和toB的。非常有意思的一点是我们今天用ChatGPT和去年相比的话,感受差别不是太大。但是,Coding夸张一点来讲,已经在重塑整个计算机行业做事的方式,人已经不再写代码,而是用英语和电脑去交流。我觉得很核心的一点,对于toC来说,大部分人大部分时候不需要用到这么强的智能,可能今天用ChatGPT和去年相比,写成交代数和伽罗瓦理论的能力变强的,但是大部分人大部分时候感受不到。大部分人尤其是在中国更多像是搜索引擎的加强版,很多时候也不知道该怎么去用,把它的智能给激发出来。

但对于toB来说,很明显的一点是智能越高,代表生产力越高,值钱的也越来越多,这些东西都是相关的。对于toB来讲,还有一个很明显的点,大部分时候很多人就愿意用最强的模型,一个模型是200美元/月,第二强或者差一些的模型是50美元/月、20美元/月。很多美国的人愿意花溢价用最好的模型,可能他的年薪是20万美元,每天要做10个任务,像一个非常强的模型可能10个任务中,八九个做对了,差的是做对五六个,问题是你不知道这五六个是哪五六个的情况下,需要花额外精力去监控这个事情。我觉得无论是人还是模型,在toB这个市场上发现了一个很有意思的现象,强的模型和稍微差点,或者弱的模型它的分化会越来越明显。

第二点观察,垂直整合这条路和模型应用分层这条路的区别,我觉得一个比较好的例子,比如ChatGPT Agent,相比于用Claude或者Gemini加上Manus这样的应用层产品,过去大家会认为当你有垂直整合能力肯定会做的更好,但起码今天来看并不一定。首先模型层和应用层需要的能力还是挺不一样的,尤其是对于toB或者生产力这样的场景来说,可能更大的预训练还是一个非常关键的事情,这个事情对于产品公司确实很难做,但是想要把这么一个特别好的模型用好,或者这样的模型有它的溢出能力,也需要在应用侧或者环境这一侧做很多相应的事情。我们会发现其实在toC的应用上垂直整合还是成立的,无论是ChatGPT还是豆包,模型和产品是非常强耦合去紧密迭代的,但是对于toB来说这个趋势似乎是相反的,模型在变的越来越强、越来越好,但同样会有很多应用层的东西应用好的模型在不同的生产力环节。

腾讯肯定还是toC基因更强的公司,我觉得我们会思考怎么样能够让今天的大模型或者说AI的发展能够给用户提供更多价值,很核心的思考是我们发现很多时候我们的环境来讲或者更强的模型,或者很强的模型,很多时候是额外的Context。我最近经常举一个例子,比如我想问我今天该去吃什么?其实你今天问ChatGPT和你去年问或者明天问都会差很多。这个事情想要变好,不是说你需要更大的模型、更强的预训练、更强的强化学习、更强的Agent环境或者更强的搜索引擎,这个问题可能需要更多额外的输入,或者我们叫Context。

toB确实是很难的事情,生产力的革命,包括我们今天很多中国的公司做Coding Agent需要打很多海外市场。我们会思考怎么把自己先服务好,像创业公司做Coding这个事情和大公司做Coding这个事情,一个区别是作为大公司本身就已经有各种各样的应用场景、各种各样需要生产力变的更好的地方。如果我们的模型能够在这个地方做的更好,不仅这个模型会有自己独特的优势,不仅我们公司本身能得到很好的发展,很重要的一点是对于真实世界场景的数据捕捉会是一个很有意思的事情。比如说Cloud,这些创业公司,他们想要去做更多的Coding Agent的数据厂商去标注这个数据,他们需要利用各种各样的软件工程师去想我要去标什么样的数据。这个事情是数据公司一共就这么几家,一共有招了这么多人,最终你会受限,但如果你是一个10万人的公司可能会有一些有意思的尝试,怎么把真实世界的数据利用好,而不是仅仅依赖于标注商或者协议。

Q2:自主学习

现在自主学习是一个非常热门的词,在硅谷大街小巷咖啡馆里面,大家都在谈论,形成了一个共识。根据我的观察,每个人对这个东西的定义和看法都不一样,我讲两点:

第一,这个事情不是方法论,而是数据或者任务。当我们在谈论自主学习的时候,它到底在什么样的场景下基于什么样的奖励函数去做。你在聊天的时候变的越来越个性化是一种自主学习,在写代码的时候越来越熟悉每个公司独特的环境或者文档是一种自主学习,你去探索新的科学,在这个过程中像一个博士一样,从原来不了解有机化学是什么,到完成这个领域的专家,这也是一种自主学习。每一种自主学习的挑战或者说方法论都不太一样。

第二,ChatGPT在利用用户的数据不断弥合人聊天的风格是什么,这是不是一种自我学习?今天Claude已经写了Claude这个项目95%的代码,它在帮助它自己变的更好,这是不是一种自我学习?我们当时2022年、2023年的时候,我去硅谷宣传这个工作,我当时写了第一页是说ASI最重要的点是自主学习。今天的AI系统本质上都有两部分,首先它是一个模型,其次它有个代码库,你怎么去用这个模型,是用来做推理,还是做Agent,有相应的代码库,我们今天看Claude这个系统本质上有两部分。一部分是是部署环境的一大堆相应的代码,KeonGPU的环境是怎样的。另一部分是怎么样去使用它,有一大堆相应的代码,无论是GPU的,或者说它的前端还是环境是什么样的。我们做Switch方面大家意识不到,这些自主学习的例子可能还局限在每一个特定的场景下,没有让人感觉到非常大的威力。

这个事情已经在发生了,可能效率或者受限制的限制,有各种各样的问题,可能这个事情我个人的看法它更像是一个渐变。很多人说2026年看到信号,我觉得2025年就看到信号了。Cursor每几个小时都会用最新的用户数据去进行学习,包括新的模型,也在使用这些真实环境下的数据去训练,大家觉得这个东西可能还没有特别石破天惊,是因为受限于他们没有预训练能力,他们模型效果确实还不如Opens,显然这是一个信号。

最大的问题是想象力,我们很容易想象强化学习或者推理这个范式,如果实现大概是什么样,我们可以想象O1,在数学题上本来是10分,现在变成了80分,通过这个强化学习有非常强的思维链做这个事情。如果2026年或者2027年我们有一个范式的发生,我宣布了一个新的模型或者新的系统实现了自我学习,我们应该用什么样的任务,它应该是什么样的效果,你会相信它实现了。它是一个赚钱的交易系统,它可以赚很多钱,它真的解决了人类之前没法解决的科学问题还是别的。我觉得可能需要先想象到它长什么样。

Q3:Agent之年

我觉得还是像刚刚说的toB和toC不太一样,目前看起来,我觉得toB的情况现在已经达到了在不断上升的曲线,目前看起来好像没有变慢的趋势。很有意思的一点是它基本上不做什么创新,就是觉得模型预训练变大了,老老实实的把这些东西做好,只要预训练不断地变大,后训练不断地把这些真实世界的任务给做好,会越来越聪明,它就会带来越来越大的价值。从某种程度来说,做toB,所有的目标这件事更一致,模型的智能越高,解决的任务越多,解决的任务越多,在toB下带来的收益越大。

做toC的问题是说,我们都知道DAU或者说产品的指标和模型的智能,很多时候是不相关的,甚至是相反的关系,我觉得这是能够聚焦的另一个很重要的原因,他只要真的把模型越做越好,他的收益越来越高,所有的事情都是非常好的。目前看起来,toB或者说生产力的Agent刚刚开始,现在除了模型之外,有两个Next,环境问题或者Deployment问题。在OpenAI之前,我在一个公司实习过,这是一个toB的公司,我觉得在toB公司工作过有很多收获,最大的收获是即使今天的模型不再变好,所有的模型训练全部停止了。但是我们把这些模型部署到世界上各种各样的公司,已经能带来今天10倍或者100倍的收益,能应对GDP产生5%-10%的影响,但是今天它对GDP的影响还不到1%。

另外我觉得教育非常重要,我观察现在人和人的差距非常大,更多时候不是说人类替代了人类工作,而是会使用这些工具的人在替代那些不会使用工具的人,就像当年电脑出来,如果转身学习编程跟你还在持续计算尺、使用算法,差距是巨大的。今天中国能做到的最大的有意义的事情是更好的教育,教育大家怎么更好的使用像Claude或者ChatGPT这样的产品,当然Claude可能在中国用不了,但我们可以用Kimi或者智谱这样的国产模型。

Q4:中国能否反超

我觉得概率还挺高的,我还是挺乐观的。目前看起来,任何一个事情一旦被发现,在中国就能够很快的复现,在很多局部做的更好,包括之前制造业、电动车这样的例子已经不断地发生。我觉得可能有几个比较关键的点,一个可能是中国的光刻机到底能不能突破,如果最终算力变成了Bottleneck,我们能不能解决算力问题。目前看起来,我们有很好的电力优势,有很好的基础设施的优势。主要的瓶颈,一个是产能,包括光刻机,以及软件生态。如果这个问题解决,我觉得会是很大的帮助。

另一个问题,除了toC之外,能不能有更成熟或者更好的toB的市场,或者有没有机会在国际的商业环境竞争。今天我们看到很多做生产力或者做toB的模型或者应用,还是会诞生在美国,因为支付意愿更强的,文化更好,今天在国内做这个事情很难,所以大家都会选择出海或者国际化的事情,这两个是比较大的客观上的因素。

更重要的是主观上的概念,最近我在跟很多人聊天,我们的感受是在中国有非常多非常强的人才,任何一个事情只要被证明能做出来,很多人都会非常积极地尝试,并且想做的更好。我觉得中国想要突破新的范式或者做非常冒险事情的人可能还不够多,这里面有经济环境、商业环境包括文化的因素,如果增加一点,主观上有没有更多有创业精神或者冒险精神的人,真的想要去做前沿探索或者新的范式突破的事情。目前来看,一个范式一旦发生,我们可以用很少的卡、很高的效率去局部做的更好,我们到底能不能引领新的范式,这可能是今天中国唯一要解决的问题,因为其他所有做的事情,无论是商业,还是产业设计,还是做工程,我们某种程度上已经比美国做的更好。

每个地方的研究文化都很不一样,美国实验室的区别可能比中美实验室的差别还要大,在中国也一样。在中国大家还是更喜欢做更安全的事情,比如说今天预训练这个事情已经被证明可以做出来了,其实这个事情也非常难做,有很多技术问题要解决,但只要这件事情一旦被证明能做出来,我们都很有信心几个月或者一段时间内就把这个问题搞清楚。但如果今天让一个人说探索一个长期记忆或者持续学习,这个事情大家不知道怎么做、不知道能不能做起来,这个事情还是比较困难的。可能不只是大家更喜欢做确定性的事情、不太愿意做创新性的事情,很重要的一点是文化的积累或者整体的认知,其实是需要时间沉淀的事情。OpenAI在2022年就开始做这个事情了,国内2023年开始做了,对这个东西的理解会有一些差异,或者说中国没有这么大。

我觉得可能很多也就是时间问题,当你积累了文化或者底蕴更深的时候,潜移默化的程度可能会影响人的做事方式,但是它很微妙,很难通过榜单去体现。中国对于刷榜或者数字看的更重一些,包括DeepSeek做的比较好的一点,他们可能没有那么关注榜单的数字,可能会更注重,第一,什么是正确的事情;第二,什么是你自己能体验出好或者不好的。我觉得这还是挺有意思的,因为你看Claude模型可能在编程或者软件工程的榜单上也不是最高的,但大家都知道这个东西是最好用的,我觉得这还是需要大家能够走出这些榜单的束缚,能够坚持自己觉得是不是正确的过程。

(深圳梦整合自AGI-Next前沿峰会)

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

国诚慧选股是真的吗?投顾退费成...   深圳市国诚投资咨询有限公司靠谱吗?深圳市国诚投资咨询有限公司正规合法吗?深圳市国诚投资咨询有限公...
长江创投会直播间上海零以博润通... “本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。"随着资本市场加...
和讯投资可以追回服务费吗?荐股... 和讯投资服务费是可以退的。和讯投资确实是一家正规的投顾公司。但这并不能说明他们公司的宣传就符合实际,...
中赢财经商学院直播间讲股票宣传... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为其他类似股权情景,如有雷同纯属巧合。随着生活...
和讯信息荐股收费是否可靠?希望... 和讯投顾交了29800服务费可以退吗?退款流程公布!误导性宣传欺骗股民和讯信息科技有限公司怎么样?和...
要闻!上海九方云智能交的服务费... 要闻!上海九方云智能交的服务费能退吗?业务员诱导交费荐股深入陷阱!大家不要再被騙了!  《中华人民共...
上海极星耀科技有限公司股权上市... “本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。"随着资本市场加...
中赢学堂老师推荐南京世保管理咨... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为其他类似股权情景,如有雷同纯属巧合。随着资本...
国 融证券退款流程?荐股背后真... 国 融证券交的服务费能退吗?可以退!!有法可依!最详细的退款流程公布!!告诉大家一个好消息,在国 融...
上海极星耀科技有限公司认购股权... “本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。"随着资本市场加...