我对各种AI Coding Agent工具的看法
创始人
2025-06-10 17:01:48

原文:《我对各种 AI Coding Agent 工具的看法》

https://xxchan.me/ai/2025/06/08/ai-coding.html

作者:xxchan

Agentic coding 或许是当下最火(最卷)的方向,一万家公司在做。并且隔三差五就在社交媒体上看到又有什么新工具、谁家又出什么新功能了(又 blow 谁的 mind 了,又颠覆谁谁了)。这还挺让人困惑的,我发现很多人会问 “这些 AI coding 工具真有那么牛吗?”,或者 “XX 和 YY 到底有啥区别”。不少人自己试用了一下,感觉不过如此,于是迅速下头。同时,我还发现还有不少程序员连 Cursor都没用过。

我平时很喜欢把玩各种 agentic coding tool,因此忍不住想锐评一番。这个领域无疑充满了大量的 hype,但仔细看,还是能分辨出不同产品间的差异,甚至整个行业的发展方向。

Agent 能做什么不能做什么,以及如何用好它,这里面有很多 “手艺”的成分。所以这事儿很难解释清楚,了解它们的最好方式还是得自己上手试。看再多别人的使用感受,都不如自己玩一把来得真切(但我还是忍不住想讲讲我的看法)。这篇文章,就是试图把我关于各种 AI coding 工具那些零散的观察和思考,整理成一篇比较长的文字。

一些背景

总的来说,我很相信 “agent coding 能成” 这个未来。具体点说,我相信未来 AI agent 可以独立在一个大型项目中,端到-端地完成复杂的开发任务(加功能、修 bug、重构)。

首先交代一下,我主要的工作是写开源流数据库 RisingWave[1],一个超过 60 万行代码的 Rust 项目,还算比较复杂。虽然一些上下文明确的小活儿,我已经习惯了让 AI 来干,但说实话,我暂时还没有大规模、严肃地用 AI coding 去做那些真正困难的开发任务。同时,我也没仔细想过未来模型的能力边界,以及实现 agent 的具体技术难点在哪。所以,这篇文章主要基于我的直觉,是对各个工具的感性分析。另外也不是一篇教你怎么用、怎么选的攻略。

下面开始正题。我们先按工具逐一分析,最后再聊些更宏观的话题。

具体产品分析Cursor:野心勃勃的领跑者

Cursor现在毋庸置疑是 AI Code Editor 这个赛道的老大哥。

0.50/1.0 版本里藏着的线索

说起来,我动笔写这个,很大一个 trigger 是看了 cursor 0.50 的 changelog[2](然而拖到今天他们 1.0[3]都发了……),里面透露了很多有意思的点,有点暗示未来方向的意味:

  • Simpler, unified pricingCursor 之前的定价模式有点臭名昭著,它引入了一个定义模糊的“fast request”,不同模型还对应不同的数量。新版统一成了“Requests”(其实也没太大区别)。 更重要的是很多人觉得一个月 20 刀很贵,我倒认为这一定价太低了,他们很可能在亏钱。按 request 计费本身就不太合理,尤其在 agent 时代,一个请求可能跑很久、烧很多 token。当然,这也可能是种**“健身房模式”**,让用量少或短对话的用户,来平衡高用量用户的成本。但另一个不合理之处在于,这会驱使它去优化 token 成本(比如压缩上下文),而用户想要的却是最大化的效果。

  • Max mode按照官方说法,“It's ideal for your hardest problems”。在我看来,这有点吹牛。我的理解是,Max mode 就是不再精细化管理上下文,同时上了 token-based billing。在过去,模型长上下文能力不强时,精细控制或许能省钱且效果好(因为模型会被无效信息误导)。但现在模型能力提升太快,这种控制反而成了负优化。有趣的是,像 Roo Code 这样的开源 BYOK 方案,一直宣传的就是“Include full context for max performance”。所以 Cursor 这波操作,有点像开倒车,或者说是早期的优化成了现在的技术债。他们那句“If you've used any CLI-based coding tool, Max mode will feel like that - but right in Cursor”给人的感觉更微妙了。既然我可以用 CLI-based agent,为什么还要在 Cursor 里用一个要额外收 20% margin 的版本呢?

  • Fast edits for long files with Agent:这也是个有点像开倒车的改动。它给我的感觉是,开始使用基于文本的方法来直接应用大模型的输出。Cursor 之前一直吹嘘自己的 apply model,这事儿可能做得太早了。以前模型不够准,需要复杂的 apply 逻辑;以后模型越来越强,这种复杂性可能就没那么必要了。

  • Background Agent & BugBot总的来说 “Agent mode” 顶多算是辅助驾驶,真正的 Agent 是你能以更轻松的方式给他派活。Background Agent 是你派个活就不用管了,BugBot 是自动 code review。后面必定还会出例如在 GitHub 上 assign 个 issue 就开始干活了之类的功能,成为一个全能的合格牛马。 这个信号非常明确:Cursor 要和 Devin 硬碰硬了。这是个非常自然的方向,用过 Cursor agent mode 的人,很可能都想过能不能让它同时干两件事。在本地做这个有难度,放到云端就顺理成章了。 Cursor vs Devin,有点像特斯拉 vs Waymo。后者一开始就直接做终极目标自动驾驶,前者则是发展成熟、用户规模大了以后逐渐转向更自动的方向。这条路的好处是用户期待会低一点,坏了能人,可以自己动手改。依赖现有的其他做的好的体验还可以继续保持一定的用户黏性。相比之下,Devin 如果一开始的体验不及预期,用户很可能就流失了。(当然,对 pro user 来说,在本地 checkout 修改不是难事,但 Cursor 有大量相对小白的用户,为他们提供简单的 UIUX 也是一个点。)

  • 还有一些 1.0 的小改进

    • 支持了 memory:我认为同样是所有 ai agent 的必备功能。

    • Richer Chat responses:支持了 mermaid,以及 markdown table 渲染。说明 chat 体验还是有东西卷的(提升一点用户粘性)

    • 但总的来说 1.0 主要感觉是 marketing 为主的一个版本,并没有什么质变(相比之下 0.50 倒是更震惊我一点)

与 Cursor 的激进大动作相应的则是 Anysphere, which makes Cursor, has reportedly raised 9B valuation[4]。对应 OpenAI 想要收购 windsurf 的新闻,可见 Cursor 急切的想要一统江湖的野心。融了这么多钱,我猜他们下一步很可能就是训练自己的模型。除此以外,它也完全有可能会收购市场上的其他玩家,成为一个整合者的角色。

回过头来说,Cursor 到底好在哪?

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

掌上银牛APP违规开展类期货交... 掌上银牛APP违规开展类期货交易续费高亏损的钱能退吗?不着急亏损的钱能退,成功退款流程!掌上银牛AP...
优品订购APP走势很假重注突然... 优品订购APP走势很假重注突然亏完输的钱怎么退安全吗?可以维权追回输的钱,成功退款方法!拇指订购AP...
腾龙订购APP贵金属投资是坑人... 腾龙订购APP贵金属投资是坑人的高回报诱导致血本无归亏损完了怎么退?可以维权追回输的钱,2025年1...
奇德新材:公司业务正呈现稳健向... 证券日报网讯 12月22日,奇德新材在互动平台回答投资者提问时表示,股价波动受宏观环境及市场情绪等多...
突发!旧金山大规模停电,波及约... 据新华社,太平洋天然气和电力公司介绍,当地时间12月20日,美国旧金山市突发停电,事故影响约13万用...
瑞牛宝购APP涉非法期货交易虚... 瑞牛宝购APP涉非法期货交易虚假宣传亏的钱怎么退回?可以维权追回输的钱,成功退款流程!掌上银牛APP...
刚刚,现货黄金价格创历史新高 22日早间,现货黄金(伦敦金现)强势拉涨,盘中突破10月20日创下的历史纪录(4381.484美元)...
北京跑出“全球大模型第一股”!... 美团、蚂蚁、腾讯、雷军、联想都投了。 全球首个大模型IPO,要在中国诞生了。 12月19日晚间,北...
急需“样板房”,富士康子公司将... (文/观察者网 张家栋 编辑/高莘) 据《日经亚洲》报道,富士康汽车设计部门在近日宣布,将以7.8...
微银订购app客服失联爆仓怪亏... 微银订购app客服失联爆仓怪亏的钱怎么退回?不担心有办法要回亏损,2025年12月退费流程!天鹅订购...