智东西
作者 | 陈骏达
编辑 | 漠影
过去一年,AI圈的关注重点已从单纯追逐模型性能,转向了一个更务实的问题:“该如何真正用好模型?”在这种趋势下,Agent开始被越来越多的人提及。它正逐渐成为AI落地的新形态,也越来越被业界视作共识。
火山引擎总裁谭待近日在Force原动力大会的一则观点,也呼应了这个趋势:AI时代的技术主体,其实就是Agent。它不仅能自主感知、规划和执行任务,还能完成复杂操作,软件在历史上第一次,从被动的工具变成了主动的执行者。
当然,Agent被寄予厚望,并不代表开发就容易。实际上,要让Agent真正融入企业的日常工作流,开发者还得面对各种繁琐的工程问题。光有“聪明的AI”还不够,还需要一套从设计、开发,到部署和运行的标准化、体系化支撑。
这,也正是为什么火山引擎以及国内外各大云厂商,都在抢着推出面向Agent的一体化开发平台和底层架构能力。核心逻辑很简单:把复杂的工程和底层技术封装好,让开发者能更快把Agent落地到业务里去。
一、从模型到平台,Agent开发底座正在被重构
如今,模型和Agent的边界越来越模糊。大模型不再只是“会聊天”,它们开始能调用函数、做多轮规划,甚至自主使用工具。从某种意义上讲,模型本身已经可以被看作Agent了。最近火山引擎发布的豆包大模型1.8,其实就是这样一款模型。
不过,对于开发者来说,有一个强大的Agent模型只是第一步,距离真正落地还有一段路要走。现实中的难题,往往出在工程实现和应用细节上。
第一道坎,是快速构建和基础工具调用。要让Agent有“手”和“脚”,就得给它配一系列工具,还要在响应速度和推理成本之间找到平衡。
第二道坎,是企业知识和业务逻辑的整合。通用大模型知识面再广,也不可能完全理解企业内部的复杂业务。想让Agent真正懂业务,就必须让它深度结合企业私有数据,具备上下文理解能力。
企业还希望看到更进阶的能力:如果有上百上千个Agent“数字员工”上线,它们能否在实践中自我学习、进化?
针对第一个问题,OpenAI、微软等海外头部AI玩家已经通过Responses API做出了回应。火山方舟也推出了Responses API,为旗下大模型和AI能力提供统一入口。
这个API能做什么?它允许开发者链式管理多轮对话,整合文本、图像或混合模态的数据,并能与缓存结合,降低使用成本。
更重要的是,它可以自主选择调用工具,一次请求完成多工具、多函数、多模型组合响应,把原本需要手动编排的复杂流程变成了“即插即用”。
针对企业希望用自身数据增强模型的需求,火山方舟升级了VikingDB向量数据库,提供递进式的信息检索,也就是先找“全”相关结果,然后再通过精细化重排机制选“对”正确结果。
与此同时,Viking记忆库也同步升级,支持了图文记忆。记忆能力与知识库能力的叠加,提供了更高质量的上下文输入,让Agent能在企业场景创造更多价值。
最后,如果企业希望用强化学习提升Agent表现,火山方舟提供了veRL平台,并在veRL框架的基础上,提供更低门槛的serverless强化学习体验,是让开发者把精力放在业务逻辑上,无需关注工程细节。
此外,火山方舟全面升级“协作奖励计划”,向认证企业用户提供每日500万免费tokens、个人用户每日200万免费tokens,助力开发者更快、更好构建Agent。
总体来看,从Responses API,到Viking,再到RL平台,火山方舟的思路很明确:通过平台化、组件化降低开发门槛,为Agent的落地做好底层支撑。
二、Agent不止能跑Demo:走向企业级的关键一跃
有了封装好的能力,开发者可以很快做出原型、尝鲜新功能,但企业级场景可没那么简单。真正把Agent投入到日常业务后,更多的挑战涌现。
首先是安全问题。企业的数据往往敏感且复杂,Agent一旦接入,就要保证不会越权访问或泄露信息。简单一句“权限控制”,背后可能涉及多层加密、审计日志和访问策略设计,这些都不能马虎。
再说可观测性。企业希望清楚地知道Agent在干什么、为什么做这个决策。否则,就算模型再强大,也很难获得信任。可观测性不仅是日志记录,更包括Agent行为的监控、评估,以及工具调用的可追溯性等等。
最后,也是现实中最难的一环:许多企业早已有大量内部服务和系统,Agent要真正发挥作用,就必须顺利接入这些存量系统。
企业要把上述技术全部自己开发出来,工程量几乎是天文数字。幸好,并不是每个企业都必须从零开始。火山引擎近日全新升级的AgentKit,正是为企业级Agent落地提供的一整套解决方案。
针对企业最关心的安全问题,AgentKit提供了身份与权限管理(Identity)、全托管运行环境(Runtime)、安全沙箱(Sandbox)、安全围栏(Guardrails)等组件,一方面明确划定Agent权限,另一方面严格控制其行为边界,全链路可追溯,让每次任务执行都“有据可查、有权可依”。
而且,这些安全控制并不会束缚Agent的潜力。比如Identity就支持OAuth 2.0灵活授权,可以根据企业内部办公或外部客户服务等不同场景,匹配最合适的授权方式,在保障安全的前提下不影响它发挥“聪明才智”。
可观测性方面,AgentKit提供了评测(Evaluation)与观测(Observation)工具。
据说,字节直接把内部2000+团队使用的评测平台能力搬到了AgentKit,评测支持了离线和在线两种模式,上线后也能实时监控运行效果。
而AgentKit的观测工具,则能够对会话、工具和模型进行监控,让Agent的全链路都可追溯。这些工具与主流AI应用开发框架是兼容的,接入更为简单,也不需要太多改造。
当前,Agent正在成为连接用户意图与存量系统的新交互层。大会现场,我们了解到,通过AgentKit Gateway,火山引擎原本的会议签到系统就被直接被转成MCP服务,而且几乎不需要改动任何代码。转换后,Agent就能轻松调用相关服务。
火山引擎云基础产品负责人田涛涛还在现场演示了一个案例,借助AgentKit,仅需8分钟,就可以打造一个完整的生图、生视频Agent,并完成部署和观测。
同时,AgentKit Gateway还能通过语义匹配,把用户的指令和MCP工具精准对应,不仅让工具调用更准确,也避免大模型浪费不必要的Token。
三、工具重新定义“会开发”,人人都可以是Agent开发者
有了模型服务与开发平台,Agent开发生态的最后一块拼图,当属配套开发工具。
过去,想做一个Agent可没那么简单:你得会编程、懂算法,还得有足够的算力。这让很多普通开发者和小团队望而却步。
2023年,扣子在诞生时,就试图解决这一问题。它提供了可视化的开发界面、模块化组件和编排平台,让开发者能用拖拽的方式快速搭建和测试Agent。
不过,用过的人都知道,扣子也不是完美的。正如扣子负责人说的:“小白用户学会了拖拽,但想做复杂一点的业务逻辑就卡壳;专业开发者又觉得拖拽不够灵活,最后还是得回到写代码。”
最近最火的“Vibe Coding”,可能就是解决这个问题的新思路。想象一下,如果你只用自然语言描述需求,就能生成Agent,是不是开发门槛一下子就低了很多?
在火山引擎Force原动力大会的开发者论坛上,扣子负责人宣布“扣子开发平台”升级为“扣子编程”。他说,这次,扣子不只是一个AI应用搭建工具,而是要变成真正赋能开发者创造力的平台,聚焦“想要什么”的创意本身。
扣子的这一转变,体现在很多方面。比如,如果现在要在扣子里搭建Agent,你只要说需求,扣子编程的“Vibe Agent”工具就能帮你写提示词、接数据库。效果不达预期时,只要继续描述改动方向即可。同样的开发方式,也适用于工作流与App的开发。
扣子编程还把更复杂的基础设施工作,也给“Vibe”了。以前开发好的Agent,想上线还得处理服务器、部署、域名备案、iOS/安卓发布等一大堆工程活。现在这些都能通过“Vibe Infra”搞定,一键打包上线,连IDE都不用打开。
除了扣子,字节在Agent开发工具层面的另一张牌,是TRAE。
如果说Vibe Coding在解决“不会写代码也能做Agent”的问题,那TRAE更像是在帮已经有工程基础的团队,把Agent和AI真正用进日常开发流程里。
作为一款国产AI IDE,TRAE今年跑得很快。官方数据显示,它的注册开发者已经超过600万,在国内市场占据第一的位置,增速也很猛。
最近,TRAE又把目光放到了企业用户身上,正式推出了TRAE CN企业版。从设计思路来看,TRAE CN企业版主要在回答几个现实问题。
首先是能不能扛住大项目。不少工具进到企业的大型代码库就“掉链子”。TRAE CN企业版主打的正是对超大规模代码库的支持,配合企业级GPU集群,尽量把响应控制在毫秒级,指向的是实际生产环境。
其次是团队能不能用顺手。企业开发场景复杂,IDE、插件、CLI并存,安全和部署要求也各不相同。TRAE CN企业版提供多形态接入和多部署方案,同时支持多模型或企业自有模型,让AI更贴近团队习惯。
最后是用得明不明白、安不安全。TRAE CN企业版将生成效果、使用频率和成本消耗可视化,并强调代码不被存储、不参与训练,试图降低企业对AI工具的顾虑。
这也释放出一个清晰信号:火山引擎Agent开发正在形成完整工具链,既能承载个人灵感的快速试验,也能进入企业级工程体系。
在开发者支持层面,火山引擎同步补齐了学习与社区资源。其开发者社区已升级为Agent开发者社区,配套动手实验室,提供开箱即用的沙箱环境和免费云资源,帮助开发者快速上手实战。
同时,火山引擎还推出Agent核心开发者计划,并在多地成立Agent开发者城市社区,试图通过内容、实践与线下交流,持续扩大Agent开发生态。
结语:Agent开发生态,从概念走向体系
从火山方舟提供的大模型与底层能力,到AgentKit面向企业级落地的工程化平台,再到扣子编程与TRAE CN企业版覆盖不同层级开发者的工具体系,火山引擎正在搭建一个相对完整的Agent开发生态。
这一体系既向下封装复杂的模型与工程能力,也向上降低开发门槛,让Agent不再停留在概念验证或Demo阶段,而是具备进入真实业务场景的可能性。
在Agent加速进入实际业务场景的过程中,Agent能否真正落地,越来越取决于平台、工具和生态的成熟度。从这个角度看,Agent的竞争,已经不只是“模型有多聪明”,而是谁能更系统地把它变成可被开发、可被管理、也能规模化部署的生产力工具。