【AI】Loop Engineering：AI 编程范式的下一次跃迁-平芜编程栈

Loop Engineering：AI 编程范式的下一次跃迁

摘要：2026年6月，一条12个字的推文引爆了整个 AI 编程圈。“你不该再手动给 Agent 写提示词了，你应该设计让 Agent 自己驱动自己的循环系统。” 这就是 Loop Engineering —— 一种从「人驱动 AI」到「系统驱动 AI」的根本性转变。本文将带你彻底搞懂它。

一、从一条推文说起

2026年6月7日凌晨，Peter Steinberger（OpenClaw 创始人、OpenAI 开发者）在 X 上发了两句话：

“Here’s your monthly reminder that you shouldn’t be prompting coding agents anymore. You should be designing loops that prompt your agents.”

帖子在24小时内突破了500万浏览量，整个 AI 开发者社区陷入了激烈讨论。

几天前，Anthropic Claude Code 的创始人兼负责人Boris Cherny在一场邀请制活动上说了几乎相同的话：

“我现在不再自己给 Claude 写提示词了。我有循环在跑，它们负责提示 Claude 并判断下一步怎么做。我的工作，是写循环。”

两段话，数百万浏览，以及随之而来的巨大困惑——因为几乎没有人能说清楚"循环（Loop）"到底是什么。

随后，Google 工程师Addy Osmani发表了一篇博客，将这个概念正式命名为Loop Engineering，并给出了清晰的定义框架。

二、Loop Engineering 到底是什么？

2.1 一句话定义

Loop Engineering：你不再手动一轮一轮地给 AI Agent 写提示词，而是设计一套系统，让这套系统按目标、按计划，自动持续地驱动 Agent 工作，直到完成目标。

用更直白的比喻来说：

旧模式	新模式
你开车，手动转向、踩油门	你造了一辆自动驾驶汽车
你是 AI 的"驾驶员"	你是 AI 系统的"工程师"
每一步都需要你介入	你定义目标，系统自动跑到完成

2.2 核心机制：五步闭环

一个完整的 Loop 工程系统，会自动完成以下五个动作，不断循环：

┌─────────────────────────────────────────────────────┐ │ │ │ 发现工作 → 分配 Agent → 执行任务 │ │ ↑ ↓ │ │ 决定下一步 ← 持久化状态 ← 验证结果 │ │ │ └─────────────────────────────────────────────────────┘

Discover（发现工作）：主动扫描任务队列、PR 列表、Issue 面板等，找到需要处理的工作
Assign（分配 Agent）：将任务分配给合适的子 Agent 或工具
Act（执行）：Agent 实际运行、写代码、调用工具、修复 Bug
Verify（验证结果）：检查输出是否达标，测试是否通过，目标是否满足
Persist（持久化状态）：记录已完成的工作，保存上下文，供下一轮循环使用

如果验证不通过，Loop 会自动重试或调整策略，而不是等你来介入。

三、AI 交互范式的进化史

Loop Engineering 不是凭空出现的，它是 AI 开发方法论自然演进的结果。

第一阶段：Prompt Engineering（~2024）

核心关注点：如何问出一个好问题

你写一条精心设计的提示词
AI 给出一次回答
你根据结果再写下一条提示词
瓶颈：你是整个流程的瓶颈，每一步都需要人工干预

第二阶段：Context Engineering（2025）

核心关注点：设计 AI 看到的整个"信息环境"

不再只关注单条提示词的质量
开始系统性地设计 System Prompt、Memory、Tool 定义、历史记录
Anthropic 将其定义为"Prompt Engineering 的自然进化"
瓶颈：仍然是单次运行，不具备自主持续运行的能力

第三阶段：Harness Engineering（2025~2026初）

核心关注点：为单次 Agent 运行配好所有装备

给 Agent 配置工具集、文件权限、沙箱环境
相当于"准备好工作台"，但 Agent 跑完一次就结束了
瓶颈：Harness 装备的是单次执行，不是持续自主运行

第四阶段：Loop Engineering（2026）

核心关注点：设计替代"你"的自动驱动系统

Agent 不再是你调用一次就结束的工具
而是在一个循环系统中自主发现工作、执行、验证、迭代
你的角色从"操作者"变成"系统设计者"

Prompt Engineering ↓ Context Engineering ↓ Harness Engineering ↓ Loop Engineering ← 我们现在在这里

四、Loop 的类型与结构

4.1 最简单的 Loop 是什么样的？

从技术视角看，一个 Loop 的核心极其简单：

# 伪代码：最简 Loop 结构whilenotgoal_met(state):work=discover_work(state)result=agent.execute(work)verified=verify(result)state=persist(state,verified)ifneeds_human_review(result):notify_human_and_pause()

就是for-loop+LLM call+结果验证。正如一位开发者犀利地评论：

“我今年发布的每个 AI Agent 都是一个 for 循环、一次 LLM 调用，加上 JSON 解析外面套一个 try/catch。唯一算得上’智能’的，是月底的 Anthropic 账单。”

Loop 的神奇之处不在于循环本身，而在于你怎么设计循环体里的决策逻辑，让它不会"跑偏"。

4.2 调度触发方式

触发类型	说明	适用场景
定时触发（Cron）	每隔 N 分钟/小时执行一次	定期巡检、PR 监控
事件触发	收到新 Issue/PR/消息时触发	CI/CD 集成、Webhook
目标驱动	设定完成条件，达成即停	复杂编码任务
递归触发	每次执行结果决定是否继续	探索性任务

4.3 Claude Code 的原生 Loop 支持

/goal命令（Claude Code v2.1.139，2026年5月发布）：

/goal"将所有 API 接口迁移到新版 SDK，确保测试全部通过"

Claude 会自动：

跨多轮持续工作
每轮结束后由独立评估模型检查目标是否达成
追踪已消耗的时间、对话轮数和 Token 数量
达成目标才停止，否则继续迭代

Boris Cherny 分享的入门实战案例：

/loop babysit all my PRs. Auto-fix build issues, and when comments come in, use a worktree agent to fix them.

翻译：让 Claude 持续监控我所有的 PR，自动修复 build 报错，有人评论就开一个独立的 worktree Agent 去处理。

五、一个完整的实战 Loop 示例

场景：自动化代码审查与修复系统

┌──────────────────────────────────────────────────────┐ │ Loop 控制器 │ │ 触发条件：每30分钟 OR 新PR创建事件 │ └────────────────────────┬─────────────────────────────┘ │ ↓ ┌──────────────────────┐ │ 发现工作 │ │ 扫描所有 open PR │ │ 过滤出需要处理的 │ └──────────┬───────────┘ │ ↓ ┌──────────────────────┐ │ 分配子 Agent │ │ 每个PR → 独立 │ │ worktree Agent │ └──────────┬───────────┘ │ ↓ ┌──────────────────────┐ │ 执行 │ │ ① 读取PR变更 │ │ ② 运行测试 │ │ ③ 分析失败原因 │ │ ④ 编写修复代码 │ └──────────┬───────────┘ │ ↓ ┌──────────────────────┐ │ 验证 │ │ 测试全通过？ │ │ 代码风格合规？ │ └──────────┬───────────┘ ✓ │ ✗ ┌──────────┼──────────────┐ ↓ ↓ 提交修复 Commit 重试（最多3次） 更新 PR 描述 OR 标记需人工介入 │ ↓ 持久化状态 记录本次处理结果 等待下一轮触发

六、Loop Engineering 的核心挑战

Loop 很强大，但也带来了新的工程挑战：

6.1 "认知债务"问题

这是目前最被低估的风险。

“Loop 发了修复，但不等于你理解它怎么修的。”
— Addy Osmani

当 Loop 替你写了成百上千行代码，你可能逐渐失去对代码库的理解。Loop 是杠杆，不是替代你判断力的工具。建议：

定期 Review Loop 提交的变更，而不只是看测试是否通过
保留关键模块的 “人工理解” 义务
Loop 可以跑，但工程师需要保持 “我还能接管” 的能力

6.2 Loop 失控与成本爆炸

Uber 在2026年6月的教训：AI 工具的预算在4个月内耗尽了全年额度，随后对每人每工具设置了月度上限。

防护措施：

# 必须设置的安全边界loop_config={"max_turns":20,# 最大轮次"max_tokens":100_000,# Token 上限"timeout_minutes":60,# 超时强制停止"require_human_review":[# 这些操作必须人工确认"delete_files","modify_production_config","send_external_requests"]}

6.3 状态管理复杂度

多个 Loop 并行运行时，状态同步是核心难题。推荐使用：

独立 Git Worktree：每个 Agent 有自己的工作目录，共享 Git 历史
结构化状态存储：用数据库或文件记录每个任务的处理状态，避免重复处理

七、如何开始实践 Loop Engineering？

第一步：识别你的"重复手动循环"

找到你日常工作中，你在做的那些循环动作：

每天早上检查昨晚的 CI 结果？
每次有 PR 就手动跑代码审查？
每小时刷新一次日志看有没有报错？

这些都是 Loop Engineering 的候选场景。

第二步：从最简单的 Loop 开始

# Claude Code 最简入门/goal"运行所有测试，修复所有失败的测试，直到测试全部通过"

不需要复杂的架构，一个目标 + 一个 Agent + 一个验证条件，就是你的第一个 Loop。

第三步：逐步添加复杂度

在简单 Loop 跑通之后，再考虑：

加入定时调度（Cron）
加入事件触发（Webhook）
拆分为多个专注子 Agent
加入状态持久化

第四步：建立监控和干预机制

Loop 需要可观测性：

Trace 日志：记录每次 Loop 的执行路径
人工干预钩子：超过阈值时自动暂停并通知
回滚机制：Loop 出问题时能快速撤销

八、与旧范式的本质区别

维度	Prompt Engineering	Loop Engineering
执行主体	你	系统
执行节奏	你一问它一答	自主持续运行
失败处理	你看结果、重写提示词	自动重试、自动调整
核心技能	如何写出好的提示词	如何设计可靠的自动化系统
工程复杂度	低	高（需要设计状态管理、验证逻辑、安全边界）
潜在收益	提升单次交互质量	真正的自动化、24小时无人值守运行

九、总结

Loop Engineering 代表了 AI 编程范式的一次重要跃迁。它的本质是：

把你从"AI 操作员"升级为"AI 系统设计师"。

你不再需要坐在屏幕前，一轮一轮地喂给 AI 提示词。你设计一套系统，定义好目标和验证条件，然后让系统替你驱动 AI 工作，直到完成。

但这也意味着新的责任：

你需要设计更好的系统，而不只是写更好的提示词
你需要保持对代码的理解，不能让 Loop 造成"认知债务"
你需要建立安全边界，防止 Loop 失控或成本爆炸

Loop 是杠杆，不是替代品。工程师需要保持判断力，Loop 的价值在于解放你的时间，让你专注于更高层次的系统设计。

参考资料

Boris Cherny, Anthropic Claude Code — Acquired Unplugged (WorkOS, June 2, 2026)
Peter Steinberger (@steipete) — X, June 7, 2026
Addy Osmani (Google) — “Loop Engineering” Blog Post, June 8, 2026
MindStudio — “What Is Loop Engineering? The New Meta for AI Coding Agents”
Data Science Dojo — “Agentic Loops: From ReAct to Loop Engineering (2026 Guide)”
Lushbinary — “Loop Engineering: The Guide for AI Agents”