近期,人工智能领域因一个名为“loop工程”的新概念掀起热议。该术语源于OpenClaw创始人斯坦伯格在社交平台发布的一条动态,他主张“应通过设计循环而非提示词来驱动AI代理工作”。这一观点迅速引发行业关注,但评论区却呈现两极分化:支持者认为其代表AI开发范式革新,反对者则质疑其存在token消耗过高、实用性存疑等问题。截至目前,该推文浏览量已突破800万次。
追溯概念起源,“loop工程”最早由Claude Code创始人鲍里斯提出。他在访谈中透露,团队已放弃手动编写提示词,转而通过预设循环逻辑让AI代理自主决策修改方向。“我的工作仅需设计循环框架,具体执行由系统完成。”这种模式与传统编程形成鲜明对比——传统循环依赖固定指令重复执行,而AI代理的循环通过目标导向实现动态优化。
以代码调试为例,传统编程需预先设计所有可能场景的应对逻辑,而AI代理的循环系统则通过“目标-行动-观察-评估-修正”的闭环持续迭代。开发者仅需设定最终目标(如修复特定漏洞),代理会在循环中自动分析代码状态、选择工具、执行修改并验证结果,直至满足预设标准。这种模式在处理开放性任务时优势显著,例如澳洲开发者杰弗里·亨特利利用类似机制,仅花费297美元便构建出完整编程语言。
随着技术演进,loop工程的应用边界持续扩展。2026年春季,Codex与Claude Code相继推出“/goal”命令,将循环机制产品化。该功能可自动运行任务直至验证通过,但斯坦伯格提出的愿景更为宏大——他设想将循环构建为可协作、可调度的AI工作系统。例如,某循环可长期监控GitHub问题库,自动分配修复任务、运行测试并提交合并请求,而另一组循环则负责监督多个子流程的进度与质量。
这场争论的核心,实则指向提示词工程的存续价值。尽管清晰具体的提示词仍是与AI交互的基础,但其角色正从“最终指令”转变为“初始输入”。在循环系统中,初始提示词无需包含所有细节,代理可通过多轮迭代逐步完善结果。以生成登录页面为例,传统提示词需详细描述布局、验证规则等要求,而循环系统仅需设定基础目标(如“创建符合安全标准的登录界面”),代理会在测试-修改循环中自主完善功能细节。
构建有效的循环系统需聚焦五大核心组件。首先是目标定义,需明确可验证的指标(如“将接口响应时间压缩至300毫秒内”),避免模糊表述导致代理迷失方向。其次是上下文管理,需筛选代码状态、测试报告等关键信息,避免无关数据干扰决策——Ralph系统的创新即在于通过固定锚点文件重置上下文,防止信息过载。
工具选择同样关键。代理需配备与任务匹配的专用工具(如代码调试器、自动化测试框架),但工具数量需严格控制,防止代理因选项过多而偏离目标。评估机制则是循环的“大脑”,需设计自动化标准(如测试通过率)判断任务进度,同时在代码可读性等主观领域保留人工审核节点,形成“人机协作”的评估体系。最后,停止条件需涵盖成功、失败、资源耗尽等多重场景,例如连续20次修改未提升性能时自动终止流程,或在执行数据删除等高风险操作前要求人工确认。
当前,基于Git的状态管理系统开始应用于循环架构,代理可通过历史提交记录理解修改逻辑。这种设计不仅提升了上下文连贯性,也为复杂任务的长期运行提供了技术支撑。随着更多开发者探索循环系统的实践路径,AI代理的工作模式正从“单次执行”向“持续进化”加速转变。

