AI Agent Loop 与新术语地图-平芜编程栈

概述

AI 应用开发的关注点正在从单次的 **Prompt Engineering（提示词工程），逐步转向Agent Loop（智能体循环）与 Agentic Workflow（智能体工作流）**。

过去更常见的问题是：如何写一个好提示词，让模型一次性给出更好的答案。现在更重要的问题变成：如何设计一个可以持续观察、思考、调用工具、检查结果并自我修正的 AI 系统。

一句话概括：

Prompt 解决的是“这一轮怎么问”；Loop 解决的是“一个任务如何持续推进到完成”。

从 Prompt 到 Loop 的演进

阶段	核心问题	典型能力	局限
Prompt Engineering	怎么问模型	角色设定、格式约束、Few-shot 示例	一次性交互，缺少持续反馈
RAG	怎么让模型查资料	向量检索、混合检索、重排	多数仍是“检索一次、回答一次”
Tool Use	怎么让模型调用工具	Function Calling、API、数据库、文件系统	工具调用若无闭环，容易失控或半途而废
Agent	怎么让模型自主完成任务	ReAct、计划、工具调用、记忆	需要状态管理、权限控制和评估体系
Agent Loop	怎么让任务持续推进	观察、行动、反馈、评估、迭代	工程复杂度更高，需要可观测性和护栏

这条演进线说明：AI 应用的核心不再只是“模型回答得好不好”，而是“系统能不能可靠地完成一个复杂任务”。

Agent Loop 是什么

Agent Loop 是智能体围绕目标不断迭代的执行闭环。典型结构如下：

目标 Goal ↓ 观察 Observe：读取上下文、文件、工具返回、外部状态 ↓ 思考 Plan/Reason：判断下一步行动 ↓ 行动 Act：调用工具、写代码、检索、执行命令、请求 API ↓ 反馈 Feedback：读取结果、错误、测试输出、用户反馈 ↓ 评估 Eval：判断是否达成目标 ↓ 继续循环或结束

早期的 ReAct 模式可以看作 Agent Loop 的基础形式：模型在“思考—行动—观察”之间反复切换。今天的 Agent Loop 则进一步加入了状态管理、长期记忆、权限控制、可观测性和评估体系。

Workflow、Agent 与 Loop 的区别

Workflow：流程固定

Workflow 是预先设计好的流程，AI 通常只是其中一个节点。

例如：

用户输入 → 检索知识库 → 调用 LLM 总结 → 格式化 Markdown → 保存结果

特点：

稳定、可控、容易测试
适合企业系统、审批流、固定业务链路
灵活性较弱，遇到异常情况需要人工设计分支

Agent：目标驱动

Agent 是围绕目标自主选择下一步行动的系统。

例如：

用户：帮我排查这个 bug Agent：读报错 → 搜函数 → 看测试 → 改代码 → 跑测试 → 根据失败结果继续修改

特点：

适合开放任务和复杂问题
能动态决定下一步
对上下文、工具、权限、评估要求更高

Loop：执行闭环

Loop 是 Agent 能持续推进任务的机制。

没有 Loop 的 Agent 更像“会调用工具的聊天机器人”；有 Loop 的 Agent 才能在任务失败、信息不足或结果不理想时继续迭代。

实际工程中，最常见的形态不是纯 Workflow，也不是完全自主 Agent，而是：

外层用 Workflow 控制边界，内层用 Agent Loop 处理复杂步骤。

新术语分层地图

1. 模型层

术语	含义	关注点
LLM	大语言模型	文本理解、生成、推理
Long Context	长上下文	一次处理更多资料，但不等于替代 RAG
Reasoning Model	推理模型	更擅长多步推理、代码、数学、复杂规划
Thinking Tokens	推理 token	模型内部推理消耗，影响成本、延迟和质量
Multimodal	多模态	统一处理文本、图片、音频、视频、PDF 等

模型层解决的是“底层能力有多强”。但仅有强模型不等于有可靠应用，仍需要上下文、工具、流程和评估。

2. 上下文层

术语	含义	关注点
Context Engineering	上下文工程	设计模型应该看到什么，而不只是写提示词
Context Window	上下文窗口	一次请求能放入多少信息
Memory	记忆机制	保存用户偏好、项目背景、任务状态和长期知识
State	状态	Agent 当前执行到哪里、已有结果是什么
Context Compression	上下文压缩	长任务中保留关键信息、丢弃噪声

Prompt Engineering 是写好一段话；Context Engineering 是搭好一个工作台。对于 Agent Loop 来说，上下文质量直接决定循环是否稳定。

3. 检索层

术语	含义	关注点
RAG	检索增强生成	先查资料，再生成答案
Hybrid Search	混合检索	关键词检索 + 向量检索
Reranker	重排模型	对初步检索结果重新排序
Query Rewriting	查询改写	把用户问题扩展成更适合检索的多个 query
GraphRAG	图谱增强 RAG	利用实体关系图增强复杂知识检索
Agentic RAG	Agent 化 RAG	由 Agent 动态决定检索策略、轮次和验证方式

普通 RAG 更像“查一次资料后回答”；Agentic RAG 则会根据问题难度进行多轮检索、交叉验证和答案自检。

4. Agent 层

术语	含义	关注点
Agent	智能体	围绕目标自主选择行动
Agent Loop	智能体循环	观察、思考、行动、反馈、评估的闭环
Tool Use	工具使用	调用搜索、文件、数据库、API、浏览器等外部能力
Function Calling	函数调用	模型以结构化方式请求系统执行函数
MCP	Model Context Protocol	为模型连接外部工具和数据源的协议
Multi-Agent	多智能体	多个 Agent 按角色协作
Handoff	交接	一个 Agent 将任务转交给另一个 Agent 或人类
Human-in-the-loop	人在环路中	人类审批关键步骤，控制风险

Agent 层的核心是把模型从“回答者”变成“执行者”。但执行能力越强，越需要权限边界和过程审计。

5. 评估与控制层

术语	含义	关注点
Evals	评测	用测试集持续评估模型和 Agent 表现
Guardrails	护栏	限制越权、违规、危险或格式错误行为
Tracing	链路追踪	记录每一步模型调用、工具调用和中间结果
Observability	可观测性	监控成功率、延迟、成本、错误率、用户反馈
Policy	策略	定义哪些事情可以自动做，哪些必须人工确认

评估与控制层决定 Agent 能不能从 Demo 走向生产。如果没有 Evals 和 Tracing，Agent 失败时很难知道是哪一步出了问题。

6. 应用架构层

术语	含义	关注点
Copilot	副驾驶	AI 辅助人类，人做最终决策
Autonomous Agent	自主 Agent	AI 长时间独立推进任务
AI-Native Application	AI 原生应用	核心流程围绕 AI 能力重新设计
Durable Execution	持久化执行	长任务可暂停、恢复、重试
State Machine / Graph	状态机 / 图	用节点、边和状态管理 Agent 流程
Agentic System	Agent 化系统	多个模型、工具、状态、评估组成的完整系统