一个月没打开过,于是干脆就删了。
去年11月,Boris Cherny亲手卸载了自己的IDE。
在那一个月里,他提了259个PR,没一行代码是自己敲的,全是Claude Code写的。
于是,一个亲手造出Claude Code的人,就把自己的驾驶舱拆了。
这还没完。今年6月2日的一场访谈里,Boris又甩出一句刷屏全球开发圈的话:
我不再给Claude写提示词了:是循环在跑,是它们在提示Claude、自己琢磨该干什么。我的工作就是写循环。
几天后,OpenClaw之父,如今在OpenAI的Peter Steinberger,抛出第二颗炸弹。
他在X平台上写道:别再给编程智能体写提示词了,你该去设计那些替你提示智能体的循环。
同时,Google资深工程主管、前Chrome开发者体验负责人Addy Osmani,在一篇博客中,为这个引爆整个AI编程圈的词起了一个名字:循环工程(Loop Engineering),认为它可能成为我们未来与编程智能体协作的方式。
于是,循环(loop),这个旧编程概念一夜翻新,突然成了2026年这一轮AI开发范式迁移的中心。而统治了编程几十年的编辑器时代,正在落幕。
可循环工程,真得要把你苦练两年的提示词工程一夜干掉了吗?
1
从写提示词到写循环
过去两年,人们跟编程智能体打交道的方式是回合制的。
你敲一句提示词,读它的回复,再敲下一句。在这个过程中,人既是调度员,又是质检员。说白了,人就是那个循环本身。
而循环工程要做的,是让你搭一套小系统:它会自己找活、把活派出去、检查做完没有、记下进度、再决定下一步干什么。
然后你再让这套系统去指挥那些智能体干活,而自己则抽身出来。
用Osmani的话来说,循环工程就是「把那个负责提示智能体的人替换掉,你转而去设计那套替你提示的系统」;而这里的循环本身,是一个递归式的目标:你定下目的,让AI一轮轮迭代,直到完成。
他把循环工程放在自己此前提出的脚手架工程(harness engineering)「上面一层」:脚手架管一个智能体跑一个任务,循环决定跑哪些任务、什么时候跑、什么算干完。
The New Stack给了一个更好懂的类比:这就像从「操作机床」,变成「设计机床所在的整条产线」。
提示词没死它钻进了循环里循环工程来了,是不是意味着提示词工程已死?
并没有。
先看看循环到底怎么跑。
Claude Code有/loop和/goal两个命令;Codex也能干同样的事,靠的是/goal加上它的定时任务(Automations)。
/loop让一段提示词按你设的间隔反复跑;/goal则让智能体一直干,直到你写的那个条件为真才停。每跑完一轮,由一个独立的小模型来判断「到底完成没有」,写代码的那个不许给自己打分。
提示词没死,它只是从你手里钻进了/loop和/goal。你不再一句句敲,现在写进循环、反复复用。所以你苦练的提示词非但没作废,反而更值钱了。
你可能早就在用只是没叫它循环别被「工程」两个字吓住。
ChatPRD创始人Claire Vo对它有一个特别接地气的判断:
你要是在Claude Cowork里设过一个定时任务,那么,恭喜,你已经写过一个循环了。
这并非一个刚刚提出的全新概念,Django框架的联合创造者、独立AI研究者Simon Willison,早在2025年9月就写过「设计智能体循环」。
18个月里,开发者一路从提示词工程跳到上下文工程,再到脚手架工程,如今轮到循环工程。
一年前想搭个循环,你得自己手搓一大堆bash脚本,写完还不算完,得永远养着它,三天两头怕它散架。
现在,搭循环要用的那些组件,Codex和Claude Code里直接内置了。
1
复刻Boris的「蜂巢」你现在的Claude Code里就能搭
Boris没公开过自己的配置,X上一位@Av1dlive的开发者,根据Boris的公开访谈,从零重建了一整套名为「蜂巢」(THE HIVE)的系统配置。
而这样一套自运转的系统,普通人也搭得起来。它需要的组件,全在你的Claude Code里。
整套「蜂巢」是三层。
第一层是本地循环,靠/loop。开着会话时它持续干活,最小1分钟跑一次,关掉电脑就停。
第二层是云端例程(Routines),Anthropic今年4月推出,跑在云上、新克隆的仓库里,关了电脑照样跑,最小1小时一次。
第三层是集群,靠/batch和动态工作流(dynamic workflows):一次性把活扇出去,几百上千个worktree子智能体并行,每个待在自己隔离的代码检出里,互不干扰。
@Av1dlive还整理出七个可以直接抄的循环。
七条slash命令,七个并行的循环:盯PR、挖Slack反馈、清僵尸PR、给issue分类、把你反复纠正的规则沉淀进CLAUDE.md……全是会话级的,关掉终端就停。这是「蜂巢」最入门的一层。
真正的魔法在于组合。
第二层的云端例程把发现写进文件,第一层的本地循环读文件接力去干,撞上大活就拉起第三层集群。
结果回流,每周再让一个例程去蒸馏、更新CLAUDE.md。
这套飞轮一转,你的智能体每周都比上周更聪明。
1
Codex与Claude Code撞脸 才是真正的信号
Osmani在博客里列了一张对照表,一个完整的循环,拆开就是这六大组件:
自动化(Automations),定时触发,自己去做发现和分诊,把找到的东西丢进一个收件箱等你查看。
隔离工作区(Worktrees),防打架。两个智能体同时改一个文件,就跟两个工程师不打招呼往同一行代码上提交一样,必定会打架;git worktree给每个智能体一份独立检出,谁也碰不到谁。
技能(Skills),治金鱼记忆。把项目惯例、构建步骤、踩坑经验,一次写进SKILL.md,省得智能体每轮从零猜。
连接器(Connectors),摸清真实世界。它基于MCP,让智能体能读你的issue、查数据库、往Slack里发消息:这是「告诉你该怎么改」和「直接替你开好PR、更新好工单」的区别。
子智能体(Sub-agents),写查分离。写代码的模型给自己批改,总是太手软;另开一个指令不同、最好换个模型的子智能体来挑刺,能抓住第一个智能体自己说服自己放过的毛病。
最后是记忆(Memory),一个markdown文件就行,记下做了什么、过了什么、还剩什么,明天那一轮才能接上今天。
这些组件听起来都不新鲜:
从2022年的ReAct,到2023年的AutoGPT,到2025年7月Geoffrey Huntley那个「一行bash反复喂同一句提示词」的Ralph循环,再到今年春天Codex和Claude Code都上的/goal。
新就新在,两家产品几乎一字不差地把同一套组件都做了出来。
真正的竞争,开始转变为谁能让人更顺手地写循环,这将是Codex与Claude Code新一轮竞争的胜负手。
1
能自己干活的循环 也会自己闯祸
能够让智能体自动干活,这听起来似乎很爽,但仍面临以下几个挑战:
第一个挑战,是成本。
多个智能体叠着子智能体、跑在最前沿的模型上,动态工作流动辄吃掉预期5到10倍的token。
Steinberger敢这么玩,是因为他自嘲是「拥有无限token的人」,那是OpenAI的福利,普通人没有。
第二个挑战,是失控。
Anthropic自己点名过循环最容易栽的三种坑。
偷懒:50项安全问题做了20项就说「搞定」;
自夸:给自己的活打高分;
漂移:跑了很多轮之后,你当初写的「别做X」在第47轮悄悄消失了。
这三种坑,正是「制造者」和「检查者」必须拆开的原因。
第三个挑战,是质疑。
Reddit和开发者圈里不少人觉得,循环工程本质就是ReAct、智能体循环(agent loop)、任务调度这些老东西换个名字、加层产品化包装,新瓶装旧酒。
「我是提示词工程师」→钻进灌木丛→「提示词工程根本不算什么,就是把话说清楚的花哨叫法」→「我现在是上下文工程师」。这张疯转的辛普森梗图,道破了这轮质疑:从提示词到上下文再到循环,头衔换了一茬又一茬,会不会只是同一个人钻进同一片灌木丛,换个名字再钻出来?
这些怀疑,也不全是酸话。
就连Anthropic自己也坦白:所谓人均日合并代码量已是2024年的8倍,这个数「几乎肯定高估了真实生产力」:代码行数衡量的是量,不是价值。
所以话说回来,循环并不等于全自主AI:它照样靠停止条件、靠验证机制、靠人来定目标。
它也并非全新技术,而且强烈依赖场景:编码、测试这类有明确验收标准的活才跑得稳,开放式任务很容易跑飞、白烧算力。
1
会写循环才是你的护城河
虽然,循环工程仍面临以上挑战,但方向并不会变。
Claire Vo在直播中,把这一刻叫「属于管理者的时代」:你其实是在设计一份工作。写循环,就像给一名新员工办入职,你带的是一支随叫随到的数字团队。
模型本身,正越来越像水电煤:谁都能接,谁接的都一样。每个季度,都会有新模型把你上季度的妙手提示词作废:真正能形成复利的,是你那套循环、那些攒下来的技能、那份被每周蒸馏的CLAUDE.md。
这也是Boris卸载IDE的底气:他的产出不依赖于某一次对话,而是依赖系统。
Osmani在博客里提醒:循环越强,有三件事反而越扎手。
第一件事,验证还得你自己过:循环报「完成」,只是它的说法,不是真做对了的证明;
第二件事,理解债(comprehension debt)越欠越多:循环写的代码越堆越高,你真读懂的没跟上,每一个没读就合的PR,都在加宽这道沟。
第三件,也是最险的:同一个循环,用在你懂的活上是杠杆,用来逃避理解,就是在加速自己的下滑。
Boris能把IDE删掉,靠的并非「不写提示词」,而是把提示词从自己手里,移进了循环。
现在,就去写你的循环。
但记得要当那个看得懂它在干什么的工程师,而不是只会按下「运行」的人。
