火爆AI圈的Harness是什么?看国内“大厂”怎么说
创始人
2026-04-03 20:14:31

新京报AI研究院·行业观察

继“龙虾”OpenClaw之后,又一个新词最近在AI行业走红——Harness Engineering(直译为“驾驭工程”)。在硅谷,它迅速席卷AI工程圈;在国内,它出现在林俊旸的长文中,汤道生的演讲里。

什么是Harness Engineering?简单来说,这是一个不强调模型性能,更强调工程环境,通过让“驾驭模型的系统环境”更专业而提升使用效果的范式。

事实上,国内的各大厂商已经将这一理念应用到了自家的产品设计中,近一周以来,新京报AI研究院从腾讯、字节、百度三家大厂相关负责人了解到了他们对Harness Engineering的理解,我们发现,“不只看模型还要看环境”“模型与框架协同升级”正在成为AI行业发展的重要转变之一。

什么是Harness Engineering?

在AI大语言模型破圈初期,被开发者们提及最多的概念是Prompt Engineering(提示词工程),即怎么把话对大模型说清楚,怎么给示例,怎么设计格式。

实际上,提示词工程已经被不少AI应用放到了产品层面,新京报AI研究院就曾在扣子、钉钉等不少应用中发现输入提示词后,旁边有“提示词优化”选项。

2026年初,Harness Engineering取代提示词工程,成为硅谷最流行的AI工程化范式,其核心是为 AI 智能体(Agent)构建一套完整的运行环境、约束规则与反馈闭环,让 AI 可靠、自主地完成复杂工作。

HashiCorp 联合创始人Mitchell Hashimoto(米切尔·桥本)曾给它下过一个朴素但深刻的定义:“每当 AI 犯错,就工程化一个方案,让它永远不再犯同样的错。”

“目前业内有一个共识:没有模型能支持所有Agent场景。通用模型的泛化性在复杂的真实环境中是有限的,而 Harness Engineering正是弥补这一鸿沟的关键路径。”百度云相关业务负责人云周(应采访对象要求化名)对新京报AI研究院表示。

他告诉记者,Harness Engineering的核心价值在于,不只是创造新能力,而且是通过工程手段,激发并稳定大模型在特定场景中的既有能力,“我们可以把大模型想象成一匹拥有惊人体能、在荒野中横冲直撞的野马。它虽然跑得快,但你无法预期它在赛场上的表现。”

在云周看来,Harness Engineering(驾驭工程)就是那套精良的“马具”,对于大模型而言, 缰绳是Prompt Engineering(提示词工程),马鞍是RAG(检索增强生成)插件,而马镫则是闭环的沙盒执行环境。没有这套“马具”,骑手(业务场景)无法指挥野马完成精准的跨栏或长途奔袭;有了 Harness,我们才能将野马转化为能上赛场、稳定输出的赛马。正如人类智能的提升源于工具使用的演进,AI 的进化也是通过 Harness 学会使用现实世界的工具。

那么,普通用户如何理解这一技术范式呢?云周对新京报AI研究院表示,普通用户并不需要理解背后的算法,但 Harness Engineering 的存在决定了你的 AI 体验是否“顺手”和“可靠”:它能有效抑制大模型的“幻觉”现象,确保 AI 给出的建议是基于事实的,而不是一本正经地胡说八道;它让 AI 能够“读懂”你的私人文档、公司流程,提供量身定制的帮助,而不仅仅是泛泛而谈;它像一道防火墙,确保 AI 不会输出有害信息,为 AI 建立了一个“隔离沙箱”,确保所有的操作都在安全范围内运行,不扩散风险,保护用户的数据隐私。

大厂已在实践,AI 落地不只是一道算法题,更是一道工程题”

新京报AI研究院注意到,Harness Engineering的理念实际上已经深入到了国内大厂的产品中。

最先公开提及这一理念的是腾讯集团高级执行副总裁汤道生。他在3月27日腾讯云上海峰会的演讲中表示:“AI 落地不只是一道算法题,更是一道工程题。在同样的模型能力下,不同的Harness设计,都将影响 AI 落地的实际效果。”

汤道生称,腾讯要全面“强化模型的Harness与工具,用精心的工程实现,最大化发挥大模型的能力,让应用更高效落地”。

在4月2日火山引擎武汉峰会会后的采访中,火山引擎总裁谭待也回复了记者关于Harness Engineering的问题。他表示,火山引擎推出的“字节版龙虾”Arkclaw,已经使用了这类架构能力,“核心思路是把最好的框架进行服务化和产品化,而且框架要和模型趋同进化,比如让豆包模型在OpenClaw上跑得更好,这样也能帮助行业更好地发展。”

云周也对新京报AI研究院表示,Harness Engineering 本质上是软件工程与 AI 的深度交汇。百度智能云目前的几款产品,正是这一技术导向的典型实践,如百度最近发布的国产龙虾产品DuMate(搭子)展示出了Harness Engineering 的“约束与执行”能力。它原生内置了安全沙箱,让 AI 在闭环隔离的环境中执行代码和文件,不扩散风险。通过“高危拦截”机制,删除文件等敏感操作必须人工二次确认,给 AI 装上了“刹车” 。它突破了聊天机器人的边界,成为能自主完成跨应用、跨文件任务的“AI 搭子” 。这种从“理解”到“执行”的闭环,正是通过 Harness 工程将大模型能力精准导流到 Word、Excel、PPT 等真实办公场景中实现的。

新京报AI研究院注意到,这一新范式对企业 IT 负责人产生了直接的指导意义:不要再把精力全部花在“选哪个模型”上。当主流模型的推理能力差距逐步缩小时,真正决定落地效果的是围绕模型搭建的工程系统。

3月26日,原通义千问技术负责人林俊旸也在发布的长文中提到了Harness,他表示“在智能体强化学习中,策略被嵌入一个更大的Harness中:工具服务器、浏览器、终端、搜索引擎、模拟器、执行沙箱、API 层、记忆系统和编排框架。同时,这也意味着Harness Engineering的崛起。” 他进一步指出,智能体时代的竞争优势,将来自更好的环境、更紧的训推耦合、更强的Harness工程,以及把模型决策与决策后果串成闭环的能力。

在汤道生看来,随着行业的发展,主流大模型的复杂推理能力都挺强,国内开源模型与海外闭源能力的差距,也在逐步缩小,为市场提供了更具性价比的大模型推理服务。客户按照自己的业务场景,对性能和成本的偏好,其实有很多的选择。因此才更加考验Harness Engineering的设计。

“Agentic模型训练最大的卡点不是模型,而是真实环境的复刻。2026年,我们不需要全能的通用模型,我们需要的是在垂直场景下,通过Harness Engineering 建立起高吞吐、高效率的强化学习系统。谁能把这套‘马具’做得最轻量、最坚固,谁就能率先通往产业级Agent之路。”云周对新京报AI研究院表示。

追踪AI全域前沿,洞察行业实时变局。我们以独立专业视角,观察技术演进、产业实践与生态逻辑,全景记录人工智能行业的每一次关键变化与发展进程,持续记录智能时代的浪潮与演进。

新京报AI研究院 罗亦丹

编辑 杨娟娟

校对 刘军

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

不只拼电池,储能企业开始拼“赚... 价值创造正在成为储能行业的新引擎。 4月1日至3日,贝壳财经记者在第十四届储能国际峰会暨展览会(ES...
iPhone 18 Pro系列... PChome 4月3日消息,据报道,iPhone 18 Pro系列的量产与发布节奏已明确,该机型计划...
租赁市场规模将破百亿 机器人产... 景区里秀才艺,商场中做互动,展会上亮本领……如今,走下春晚舞台的人形机器人正在我们日常生活中大展身手...
“眼镜一哥”毛源昌走不出省也要... 来源:界面新闻 界面新闻记者 | 周芳颖 界面新闻编辑 | 楼婍沁 在中国眼镜零售这个长期分...
不是,为什么你们都想借钱给我? 在数字服务广泛普及的当下,很多人发现,想借给你钱的早已不只是金融App。 从社交、娱乐、出行到生活工...
兰州信息科技学院学子走进兰州新... 为进一步深化校企合作,拓宽学生就业视野,提升专业实践能力。3月27日,在甘肃团 省委的积极链接与协调...
火爆AI圈的Harness是什... 新京报AI研究院·行业观察 继“龙虾”OpenClaw之后,又一个新词最近在AI行业走红——Harn...
飞智预告:FS68磁轴键盘4月... IT之家 4 月 3 日消息,主攻手柄与散热设备的飞智 Flydigi 今日发布正式预告,表示将于 ...
谷歌发布Gemma 4开源AI... 谷歌的Gemini AI模型在过去一年中取得了巨大进步,但用户只能按照谷歌的条款使用Gemini。该...
东莞银行拟跨省收购村镇银行,I... 在完成广东省内旗下村镇银行整合后,东莞银行将改革触角伸向省外。日前,东莞银行发布通知,将于2026年...