概述
AI 应用开发的关注点正在从单次的 **Prompt Engineering(提示词工程),逐步转向Agent Loop(智能体循环)与 Agentic Workflow(智能体工作流)**。
过去更常见的问题是:如何写一个好提示词,让模型一次性给出更好的答案。现在更重要的问题变成:如何设计一个可以持续观察、思考、调用工具、检查结果并自我修正的 AI 系统。
一句话概括:
Prompt 解决的是“这一轮怎么问”;Loop 解决的是“一个任务如何持续推进到完成”。
从 Prompt 到 Loop 的演进
| 阶段 | 核心问题 | 典型能力 | 局限 |
|---|---|---|---|
| Prompt Engineering | 怎么问模型 | 角色设定、格式约束、Few-shot 示例 | 一次性交互,缺少持续反馈 |
| RAG | 怎么让模型查资料 | 向量检索、混合检索、重排 | 多数仍是“检索一次、回答一次” |
| Tool Use | 怎么让模型调用工具 | Function Calling、API、数据库、文件系统 | 工具调用若无闭环,容易失控或半途而废 |
| Agent | 怎么让模型自主完成任务 | ReAct、计划、工具调用、记忆 | 需要状态管理、权限控制和评估体系 |
| Agent Loop | 怎么让任务持续推进 | 观察、行动、反馈、评估、迭代 | 工程复杂度更高,需要可观测性和护栏 |
这条演进线说明:AI 应用的核心不再只是“模型回答得好不好”,而是“系统能不能可靠地完成一个复杂任务”。
Agent Loop 是什么
Agent Loop 是智能体围绕目标不断迭代的执行闭环。典型结构如下:
目标 Goal ↓ 观察 Observe:读取上下文、文件、工具返回、外部状态 ↓ 思考 Plan/Reason:判断下一步行动 ↓ 行动 Act:调用工具、写代码、检索、执行命令、请求 API ↓ 反馈 Feedback:读取结果、错误、测试输出、用户反馈 ↓ 评估 Eval:判断是否达成目标 ↓ 继续循环或结束早期的 ReAct 模式可以看作 Agent Loop 的基础形式:模型在“思考—行动—观察”之间反复切换。今天的 Agent Loop 则进一步加入了状态管理、长期记忆、权限控制、可观测性和评估体系。
Workflow、Agent 与 Loop 的区别
Workflow:流程固定
Workflow 是预先设计好的流程,AI 通常只是其中一个节点。
例如:
用户输入 → 检索知识库 → 调用 LLM 总结 → 格式化 Markdown → 保存结果特点:
- 稳定、可控、容易测试
- 适合企业系统、审批流、固定业务链路
- 灵活性较弱,遇到异常情况需要人工设计分支
Agent:目标驱动
Agent 是围绕目标自主选择下一步行动的系统。
例如:
用户:帮我排查这个 bug Agent:读报错 → 搜函数 → 看测试 → 改代码 → 跑测试 → 根据失败结果继续修改特点:
- 适合开放任务和复杂问题
- 能动态决定下一步
- 对上下文、工具、权限、评估要求更高
Loop:执行闭环
Loop 是 Agent 能持续推进任务的机制。
没有 Loop 的 Agent 更像“会调用工具的聊天机器人”;有 Loop 的 Agent 才能在任务失败、信息不足或结果不理想时继续迭代。
实际工程中,最常见的形态不是纯 Workflow,也不是完全自主 Agent,而是:
外层用 Workflow 控制边界,内层用 Agent Loop 处理复杂步骤。
新术语分层地图
1. 模型层
| 术语 | 含义 | 关注点 |
|---|---|---|
| LLM | 大语言模型 | 文本理解、生成、推理 |
| Long Context | 长上下文 | 一次处理更多资料,但不等于替代 RAG |
| Reasoning Model | 推理模型 | 更擅长多步推理、代码、数学、复杂规划 |
| Thinking Tokens | 推理 token | 模型内部推理消耗,影响成本、延迟和质量 |
| Multimodal | 多模态 | 统一处理文本、图片、音频、视频、PDF 等 |
模型层解决的是“底层能力有多强”。但仅有强模型不等于有可靠应用,仍需要上下文、工具、流程和评估。
2. 上下文层
| 术语 | 含义 | 关注点 |
|---|---|---|
| Context Engineering | 上下文工程 | 设计模型应该看到什么,而不只是写提示词 |
| Context Window | 上下文窗口 | 一次请求能放入多少信息 |
| Memory | 记忆机制 | 保存用户偏好、项目背景、任务状态和长期知识 |
| State | 状态 | Agent 当前执行到哪里、已有结果是什么 |
| Context Compression | 上下文压缩 | 长任务中保留关键信息、丢弃噪声 |
Prompt Engineering 是写好一段话;Context Engineering 是搭好一个工作台。对于 Agent Loop 来说,上下文质量直接决定循环是否稳定。
3. 检索层
| 术语 | 含义 | 关注点 |
|---|---|---|
| RAG | 检索增强生成 | 先查资料,再生成答案 |
| Hybrid Search | 混合检索 | 关键词检索 + 向量检索 |
| Reranker | 重排模型 | 对初步检索结果重新排序 |
| Query Rewriting | 查询改写 | 把用户问题扩展成更适合检索的多个 query |
| GraphRAG | 图谱增强 RAG | 利用实体关系图增强复杂知识检索 |
| Agentic RAG | Agent 化 RAG | 由 Agent 动态决定检索策略、轮次和验证方式 |
普通 RAG 更像“查一次资料后回答”;Agentic RAG 则会根据问题难度进行多轮检索、交叉验证和答案自检。
4. Agent 层
| 术语 | 含义 | 关注点 |
|---|---|---|
| Agent | 智能体 | 围绕目标自主选择行动 |
| Agent Loop | 智能体循环 | 观察、思考、行动、反馈、评估的闭环 |
| Tool Use | 工具使用 | 调用搜索、文件、数据库、API、浏览器等外部能力 |
| Function Calling | 函数调用 | 模型以结构化方式请求系统执行函数 |
| MCP | Model Context Protocol | 为模型连接外部工具和数据源的协议 |
| Multi-Agent | 多智能体 | 多个 Agent 按角色协作 |
| Handoff | 交接 | 一个 Agent 将任务转交给另一个 Agent 或人类 |
| Human-in-the-loop | 人在环路中 | 人类审批关键步骤,控制风险 |
Agent 层的核心是把模型从“回答者”变成“执行者”。但执行能力越强,越需要权限边界和过程审计。
5. 评估与控制层
| 术语 | 含义 | 关注点 |
|---|---|---|
| Evals | 评测 | 用测试集持续评估模型和 Agent 表现 |
| Guardrails | 护栏 | 限制越权、违规、危险或格式错误行为 |
| Tracing | 链路追踪 | 记录每一步模型调用、工具调用和中间结果 |
| Observability | 可观测性 | 监控成功率、延迟、成本、错误率、用户反馈 |
| Policy | 策略 | 定义哪些事情可以自动做,哪些必须人工确认 |
评估与控制层决定 Agent 能不能从 Demo 走向生产。如果没有 Evals 和 Tracing,Agent 失败时很难知道是哪一步出了问题。
6. 应用架构层
| 术语 | 含义 | 关注点 |
|---|---|---|
| Copilot | 副驾驶 | AI 辅助人类,人做最终决策 |
| Autonomous Agent | 自主 Agent | AI 长时间独立推进任务 |
| AI-Native Application | AI 原生应用 | 核心流程围绕 AI 能力重新设计 |
| Durable Execution | 持久化执行 | 长任务可暂停、恢复、重试 |
| State Machine / Graph | 状态机 / 图 | 用节点、边和状态管理 Agent 流程 |
| Agentic System | Agent 化系统 | 多个模型、工具、状态、评估组成的完整系统 |
AI 应用架构的重点,是把不稳定的模型能力封装进可控、可观测、可恢复的软件系统中。
对 Java / 企业应用开发的意义
对于 Java 后端和企业系统开发者来说,Agent Loop 不是一个脱离工程的概念,而是一次新的系统集成机会。
传统企业系统关注:
- 业务流程
- 权限控制
- 数据一致性
- 日志审计
- 异常补偿
- 调度任务
- 接口集成
Agentic 系统同样需要这些能力,只是中间多了一个 LLM 决策层。
因此,Java 开发者可以从以下方向切入:
- 企业知识库问答:RAG + 权限过滤 + 引用溯源 + 反馈评估
- 智能工单助手:读取工单 → 检索知识 → 给出处理建议 → 人工确认
- 运维排障 Agent:读取日志 → 分析异常 → 查询监控 → 生成排查步骤
- 代码辅助 Agent:定位问题 → 修改代码 → 跑测试 → 生成总结
- 低代码平台智能助手:理解表单、流程、脚本和接口,辅助配置业务功能
Java 开发者的优势不是训练模型,而是把 AI 接入真实业务系统,并处理权限、状态、事务、审计、可观测性这些生产级问题。