(来源:机器之心)
AI 编程工具的进步速度正在迅速加快。
如果各位读者从事涉及代码相关的工作,应该很能察觉到近两年 AI 编程能力的进化幅度,GPT-5 和 Gemini 2.5 等最新前沿大模型已经让开发者在实际任务中一定程度实现了自动化,近期发布的 Sonnet 4.5 又再次推动了这一进展。
再结合现在已经非常成熟 CLI、IDE 工具等的辅助,采用编码智能体进行开发工作已经成为了一种常态,甚至成为了一种新的生活方式。
不仅仅是程序员,产品类、设计类岗位的从业人员都已广泛采用 AI 编码智能体辅助工作,AI 生成的代码比例越来越高。
但是,AI 编码智能体仍然存在一些问题,比如代码质量不高,智能体分析效率低下等等。
那么,与其等待智能体分析生成或是多次「抽卡」的低效,有没有可能同时并行使用多个智能体进行工作呢?
Datasette 的创建者,独立开源开发者 Simon Willison 已经成为了同时使用多个编码智能体的开发者。
为此,他发布了一篇全新博客,分享了自己同时运行多个编码 AI 的经历和宝贵经验,引起了海外开发者们广泛的关注,在 X 上的推文已破 10 万阅读量。
博客标题:Embracing the parallel coding agent lifestyle
博客链接:https://simonwillison.net/2025/Oct/5/parallel-coding-agents/
拥抱并行编码代理生活方式
Simon Willison 起初对此是持怀疑态度的。AI 生成的代码必须经过审查,而审查速度天然是瓶颈。光是跟上单个大模型的产出速度就已经很吃力了,如果同时运行多个代理,只会更加落后,那又有什么好处呢?
尽管一开始有顾虑,但过去几周他发现自己其实已经悄然接受了这种「并行编码代理」的工作方式。
在工作中,他发现可以并行启动越来越多的小任务,而不会给主要工作增加太多认知负担。
以下是 Simon Willison 总结的一些高效使用并行代理的模式:
概念验证研究任务
第一个适合并行代理的任务类别是研究。
研究任务用于回答问题或提供建议,而不会直接修改你计划保留的项目代码。
许多软件项目都始于概念验证阶段。例如:能否用 Yjs 和 Python 后端实现一个简单的协作笔记工具?这些库虽然存在,但它们能否顺利协同工作?
如今的编码代理已经能够用新库快速构建原型,验证这些基础性问题。即便新库不在模型的训练数据中也没关系 —— 直接让代理去克隆这些依赖的仓库、阅读代码、自己摸索使用方法。
系统机制回溯
当你需要回忆系统中某一部分的工作原理时,现代的「推理型」大模型能在一两分钟内给出详细且可操作的答案。
无论代码库多大,代理都可以借助诸如 grep 之类的工具,在数十个文件之间追踪调用路径。
你可以让它:
记录签名 cookies 是在哪里设置和读取的;
分析你的应用如何使用子进程与线程;
或指出 JSON API 哪些部分还未被文档覆盖。
这些由 LLM 生成的解释非常值得保存起来 —— 它们可以作为后续 prompt 的上下文材料,非常有价值。
小型维护任务
接下来是真正打算保留的代码修改,尽管它们风险较低。事实证明,有许多小问题只需一点额外的「脑力负担」,这些完全可以交给代理处理。
例如警告⚠️信息(warnings):如果测试套件抛出某个弃用(deprecated)警告⚠️,把它丢给一个代理,让它运行测试、找到并修复问题。你无需中断正在进行的主要任务来解决这种小烦恼。
发现这种机会是一种能力。最好的练习方式就是多尝试 —— 任何小的维护任务都值得交给代理试一试。无论成功或失败,你都能从中学到东西。
精确指定的实际工作
审查一段「从天而降」的代码改动是很费力的。
首先得推测作者的意图:它要解决什么问题?这个问题是否值得解决?方案是否合理、能否与后续计划兼容?这些都需要思考大量高层问题,才能开始看具体实现。
但如果代码是根据你自己写的详细规格说明生成的,那么审查负担就轻得多。当你已经确定了目标、方法和实现细节,只需要验证代理产出的代码是否符合你的要求即可。
现在的使用方式
目前,Willison 的主力工具是:
Claude Code(Sonnet 4.5)
Codex CLI(GPT-5-Codex)
Codex Cloud(用于异步任务,经常直接从手机触发)
此外,还在尝试:
GitHub Copilot Coding Agent(集成在 GitHub 网站界面的内置代理)
Google Jules(谷歌目前免费的 Codex Cloud 替代方案)
他仍在摸索最适合自己的工作模式,预计还会持续调整。
他经常同时打开多个终端窗口,在不同目录中运行不同的代理实例(通常是 Claude Code 与 Codex CLI 的组合),以 YOLO 模式(无需批准)执行那些安全性可控的任务。
对于风险较高的任务,主要使用异步代理(通常是 Codex Cloud)。这样即便出问题,最糟糕的情况只是源码泄露。
他偶尔也会使用 GitHub Codespaces 来运行 VS Code 的 agent 模式 —— 它出乎意料地高效,且完全在浏览器中运行。这在 workshop 或演示场景中特别好用:只要有 GitHub 账号即可使用,无需额外的 API 密钥。
开发者热议
这篇博客一经发布就受到广泛关注,非常契合现在代码相关开发工作的痛点。越来越多人正在尝试同时使用多个编码智能体进行开发工作。
Google Labs 的产品总监 Kath Korevec 有 80% 左右的编码工作是由 AI 辅助完成的,她同样表达了对并行智能体工作流的热情。
还有一些开发者分享了自己关于并行智能体开发范式的理解:
当然,很多开发者表达了一些担忧的声音,尤其是关于智能体生成代码产生的不可控因素:
更多开发者讨论,可以关注原推文:
https://x.com/simonw/status/1974835974938206222