我对各种AI Coding Agent工具的看法_资讯

我对各种AI Coding Agent工具的看法

创始人

2025-06-10 17:01:48

原文：《我对各种 AI Coding Agent 工具的看法》

https://xxchan.me/ai/2025/06/08/ai-coding.html

作者：xxchan

Agentic coding 或许是当下最火（最卷）的方向，一万家公司在做。并且隔三差五就在社交媒体上看到又有什么新工具、谁家又出什么新功能了（又 blow 谁的 mind 了，又颠覆谁谁了）。这还挺让人困惑的，我发现很多人会问 “这些 AI coding 工具真有那么牛吗？”，或者 “XX 和 YY 到底有啥区别”。不少人自己试用了一下，感觉不过如此，于是迅速下头。同时，我还发现还有不少程序员连 Cursor都没用过。

我平时很喜欢把玩各种 agentic coding tool，因此忍不住想锐评一番。这个领域无疑充满了大量的 hype，但仔细看，还是能分辨出不同产品间的差异，甚至整个行业的发展方向。

Agent 能做什么不能做什么，以及如何用好它，这里面有很多 “手艺”的成分。所以这事儿很难解释清楚，了解它们的最好方式还是得自己上手试。看再多别人的使用感受，都不如自己玩一把来得真切（但我还是忍不住想讲讲我的看法）。这篇文章，就是试图把我关于各种 AI coding 工具那些零散的观察和思考，整理成一篇比较长的文字。

一些背景

总的来说，我很相信 “agent coding 能成” 这个未来。具体点说，我相信未来 AI agent 可以独立在一个大型项目中，端到-端地完成复杂的开发任务（加功能、修 bug、重构）。

首先交代一下，我主要的工作是写开源流数据库 RisingWave[1]，一个超过 60 万行代码的 Rust 项目，还算比较复杂。虽然一些上下文明确的小活儿，我已经习惯了让 AI 来干，但说实话，我暂时还没有大规模、严肃地用 AI coding 去做那些真正困难的开发任务。同时，我也没仔细想过未来模型的能力边界，以及实现 agent 的具体技术难点在哪。所以，这篇文章主要基于我的直觉，是对各个工具的感性分析。另外也不是一篇教你怎么用、怎么选的攻略。

下面开始正题。我们先按工具逐一分析，最后再聊些更宏观的话题。

具体产品分析Cursor：野心勃勃的领跑者

Cursor现在毋庸置疑是 AI Code Editor 这个赛道的老大哥。

0.50/1.0 版本里藏着的线索

说起来，我动笔写这个，很大一个 trigger 是看了 cursor 0.50 的 changelog[2]（然而拖到今天他们 1.0[3]都发了……），里面透露了很多有意思的点，有点暗示未来方向的意味：

Simpler, unified pricingCursor 之前的定价模式有点臭名昭著，它引入了一个定义模糊的“fast request”，不同模型还对应不同的数量。新版统一成了“Requests”（其实也没太大区别）。更重要的是很多人觉得一个月 20 刀很贵，我倒认为这一定价太低了，他们很可能在亏钱。按 request 计费本身就不太合理，尤其在 agent 时代，一个请求可能跑很久、烧很多 token。当然，这也可能是种**“健身房模式”**，让用量少或短对话的用户，来平衡高用量用户的成本。但另一个不合理之处在于，这会驱使它去优化 token 成本（比如压缩上下文），而用户想要的却是最大化的效果。
Max mode按照官方说法，“It's ideal for your hardest problems”。在我看来，这有点吹牛。我的理解是，Max mode 就是不再精细化管理上下文，同时上了 token-based billing。在过去，模型长上下文能力不强时，精细控制或许能省钱且效果好（因为模型会被无效信息误导）。但现在模型能力提升太快，这种控制反而成了负优化。有趣的是，像 Roo Code 这样的开源 BYOK 方案，一直宣传的就是“Include full context for max performance”。所以 Cursor 这波操作，有点像开倒车，或者说是早期的优化成了现在的技术债。他们那句“If you've used any CLI-based coding tool, Max mode will feel like that - but right in Cursor”给人的感觉更微妙了。既然我可以用 CLI-based agent，为什么还要在 Cursor 里用一个要额外收 20% margin 的版本呢？
Fast edits for long files with Agent:这也是个有点像开倒车的改动。它给我的感觉是，开始使用基于文本的方法来直接应用大模型的输出。Cursor 之前一直吹嘘自己的 apply model，这事儿可能做得太早了。以前模型不够准，需要复杂的 apply 逻辑；以后模型越来越强，这种复杂性可能就没那么必要了。
Background Agent & BugBot总的来说 “Agent mode” 顶多算是辅助驾驶，真正的 Agent 是你能以更轻松的方式给他派活。Background Agent 是你派个活就不用管了，BugBot 是自动 code review。后面必定还会出例如在 GitHub 上 assign 个 issue 就开始干活了之类的功能，成为一个全能的合格牛马。这个信号非常明确：Cursor 要和 Devin 硬碰硬了。这是个非常自然的方向，用过 Cursor agent mode 的人，很可能都想过能不能让它同时干两件事。在本地做这个有难度，放到云端就顺理成章了。 Cursor vs Devin，有点像特斯拉 vs Waymo。后者一开始就直接做终极目标自动驾驶，前者则是发展成熟、用户规模大了以后逐渐转向更自动的方向。这条路的好处是用户期待会低一点，坏了能人，可以自己动手改。依赖现有的其他做的好的体验还可以继续保持一定的用户黏性。相比之下，Devin 如果一开始的体验不及预期，用户很可能就流失了。（当然，对 pro user 来说，在本地 checkout 修改不是难事，但 Cursor 有大量相对小白的用户，为他们提供简单的 UIUX 也是一个点。）
还有一些 1.0 的小改进

支持了 memory：我认为同样是所有 ai agent 的必备功能。
Richer Chat responses：支持了 mermaid，以及 markdown table 渲染。说明 chat 体验还是有东西卷的（提升一点用户粘性）
但总的来说 1.0 主要感觉是 marketing 为主的一个版本，并没有什么质变（相比之下 0.50 倒是更震惊我一点）

与 Cursor 的激进大动作相应的则是 Anysphere, which makes Cursor, has reportedly raised 9B valuation[4]。对应 OpenAI 想要收购 windsurf 的新闻，可见 Cursor 急切的想要一统江湖的野心。融了这么多钱，我猜他们下一步很可能就是训练自己的模型。除此以外，它也完全有可能会收购市场上的其他玩家，成为一个整合者的角色。

回过头来说，Cursor 到底好在哪？

上一篇：原创苹果iOS26跳版本正式发布，液态玻璃界面曝光，XR等老机型被淘汰

下一篇：投资79亿！5000P算力！签约40个重点项目~南A中心6月底建成

⚠️

本网站信息内容及素材来源于网络采集或用户发布，如涉及侵权，请及时联系我们，发送链接至2697952338@QQ.COM，我们将第一时间进行核实与删除处理。

我对各种AI Coding Agent工具的看法

相关内容

热门资讯