AI 软件开发的第三个时代

Sun Mar 01 · 原文链接

几年前我们开始打造 Cursor 时,大多数代码还是一按一键敲出来的。Tab 自动补全改变了这一点,也开启了 AI 辅助编程的第一个时代。

随后,智能体(agent)到来,开发者开始通过同步的「提示—响应」循环来指挥智能体工作。这是第二个时代。而现在,第三个时代正在到来:智能体可以在更长的时间尺度上、更少的人类指令下,独立完成更大的任务。

因此,Cursor 不再主要是「写代码」的工具;它更像是在帮助开发者建造那座生产软件的“工厂”。这座工厂由一支支智能体编队组成——你把它们当作队友来协作:给出初始方向、为它们配齐能独立工作的工具,并在最后审阅它们的产出。

Cursor 的很多人已经在用这种方式工作了。我们合并的 PR 中,超过三分之一已经由智能体在云端的自有电脑上自行完成并创建。一年之后,我们认为绝大多数开发工作都会由这类智能体来完成。

从 Tab 到智能体

Tab 特别擅长识别那些低熵、重复性的工作并将其自动化。在将近两年的时间里,它带来了显著的杠杆效应。

之后模型变强了。智能体能够容纳更多上下文、使用更多工具,并执行更长的行动序列。开发者的习惯开始转变:先是在夏天慢慢变化,而在最近几个月里则迅速加速。

这种转变彻底到今天,很多 Cursor 用户已经完全不再去按 Tab 键。2025 年 3 月,我们的 Tab 用户大约是智能体用户的 2.5 倍;而现在完全翻转了:智能体用户是 Tab 用户的 2 倍,并且 Cursor 中的智能体使用量激增。

但这种变化很快就会让位于更大的浪潮。Tab 时代持续了将近两年;而第二个时代(大多数工作由同步智能体完成)可能连一年都撑不到。

云端智能体与构建产物

相比 Tab,同步智能体工作的层级更“靠上”。它们能处理需要上下文与判断的任务,但仍要求开发者在每一步都在线参与。然而,这种实时交互形式,加上同步智能体会与本机资源竞争,使得你一次只和少数几个智能体协作才现实。

云端智能体移除了这两个限制。每个智能体都运行在自己的虚拟机上,开发者可以把任务交出去,然后去做别的事。智能体会在数小时内推进任务,不断迭代与测试,直到它对结果有把握,然后带着「可以快速审阅」的东西回来:日志、视频录制、可交互的在线预览,而不只是代码 diff。

这让并行运行大量智能体变得可行,因为这些产物与预览提供了足够的上下文,你无需从零重建每次会话就能评估输出。人类的角色也从“指导每一行代码”转向“定义问题与制定审阅标准”。

这种转变已在 Cursor 内部发生

Cursor 内部我们合并的 PR 中,有 35% 已由运行在云端 VM 中、能够自主运转的智能体创建。我们观察到,开发者采用这种新工作方式有三个特征:

  1. 智能体几乎写了 100% 的代码。

  2. 开发者把时间花在拆解问题、审阅产物/代码、以及给出反馈上。

  3. 他们会同时启动多个智能体,而不是手把手带着某一个智能体一路做到完成。

在这种方式成为软件开发的标准流程之前,还有大量工作要做。在工业规模下,一个开发者勉强能绕过的 flaky test 或环境问题,会变成中断每一次智能体运行的系统性失败。更广泛地说,我们仍需要确保智能体能尽可能有效地运行——它们必须完整访问所需的工具与上下文。

我们认为,昨天的发布是朝着这个方向迈出的早期但重要的一步。