AI工程化设计（五）多智能体设计-平芜编程栈

一、多 Agent 协作机制

1. 什么是 Multi-Agent System？

多 Agent 系统（MAS）本质是：

由多个具备自主性、感知能力、决策能力和通信能力的智能体组成的分布式系统。

相比单一 LLM：

不再是“一个大脑解决所有问题”
而是“多个角色协作完成复杂任务”

2. 技术优势

多 Agent 的价值，核心在于结构化复杂性：

✅ 并行与分布式能力

多个 Agent 可以同时处理不同子任务，大幅提升效率

✅ 高鲁棒性

单个 Agent 失败不会拖垮整个系统

✅ 协作与博弈能力

通过：

协商（Negotiation）
竞争（Debate）
协作（Collaboration）

实现更优决策

✅ 模块化架构

天然支持：

扩展
替换
维护

3. 典型应用场景

智能客服系统（分角色处理）
数据分析助手（规划 / 执行 / 汇总）
自动化研发（代码生成 + review）
企业 AI 助手（跨系统协作）

二、Agent 角色设计

一个好的 Agent 系统，首先不是写代码，而是：

👉设计角色

1. 基础角色

UserProxyAgent（用户代理）

接收用户输入
负责与用户交互

AssistantAgent（执行者）

负责具体任务执行

2. 常见扩展角色

在真实系统中，通常会拆成更细：

Planner Agent：任务拆解
Executor Agent：执行任务
Tool Agent：调用工具
Critic Agent：评估与反馈
Summary Agent：结果汇总

3. 一个典型流程

User → Planner → 多个子Agent → Summary → Output

例如：

用户提问
Planner 拆解任务
不同 Agent 分别处理
Summary 汇总结果输出

三、Agent 核心机制

1. 协作模式

Group Chat（群聊模式）

多个 Agent 轮流发言，逐步达成共识

👉 适合：复杂推理、头脑风暴

Debate（辩论机制）

Agent 之间互相“反驳”

👉 提升决策质量（类似 self-consistency）

2. 通信机制

Message Passing

基于：

send()
receive()

实现异步通信

Tool 调用传递

Agent A → 调用 → Agent B（或工具）→ 返回结果

Feedback Loop（反馈闭环）

引入 Critic Agent：

评估输出
提出改进建议
触发重新执行

3. 人在回路（Human-in-the-loop）

关键场景必须引入人工：

高风险决策
财务/法律
重要审批

四、Agent × RAG × 微调：如何组合？

这是很多人最困惑的部分：

👉到底该用 RAG 还是微调？还是 Agent？

我们直接给工程化答案：

1. 技术选型对比

方案	成本	灵活性	适用阶段
Prompt + RAG	低	高	PoC / MVP
Tool Calling	中	高	功能扩展
微调（Full）	高	低	成熟业务
微调（LoRA）	中	中	规模化

2. 微调的本质

⚠️ 很关键的一点：

微调不是让模型“学知识”，而是改变：

输出风格
决策偏好
表达方式

知识问题 → 用 RAG
行为问题 → 用微调

3. 最佳实践

✅ 初期（0 → 1）

Prompt + RAG

✅ 中期（1 → N）

Agent + Tool Calling

✅ 后期（规模化）

RAG + Agent + LoRA

五、轻量微调三剑客

在工程实践中，更推荐轻量方案：

1. LoRA

特点：

低成本
训练快
效果稳定

👉 适合：

文本生成
对话优化

2. P-Tuning v2

本质：

可学习的 Prompt

👉 适合：

小样本任务
分类 / NER / 意图识别

3. Adapter

特点：

模块化
支持多任务切换

👉 适合：

企业级系统
多场景复用

4. 如何选择？

方法	数据量	模块化	典型任务
LoRA	中-大	中	生成/对话
P-Tuning	小	低	分类/抽取
Adapter	中-大	高	多任务系统

六、适用场景总结

可以直接用这套决策逻辑：

数据很少（<1k）
→ P-Tuning / Prompt
要效果 + 成本平衡
→ LoRA
多任务 + 可插拔
→ Adapter
强知识依赖（法律/医疗）
→ RAG + LoRA
低延迟场景
→ 避免 Adapter

七、系统架构设计：从单点到体系

1. 不要只选一种技术

真实系统一定是：

❌ 单一技术
✅ 组合架构

2. 推荐架构

Modular AI System

RAG（知识）
Agent（决策）
Tool（执行）
Fine-tuning（行为）

3. 检索架构选择

Modular RAG：简单业务
Graph RAG：复杂关系推理

4. Agent 组织方式

参考企业结构：

分层（Manager → Worker）
分角色（Planner / Executor）
分团队（子Agent群）

八、可观测性（Observability）

如果你做过 Agent 系统，很快会遇到：

👉“为什么它这样做？”

所以必须做：

1. 日志与追踪

推荐工具：

LangSmith
OpenInference
Weights & Biases

2. 关键指标

正确性（Accuracy）
一致性（Consistency）
Tool 调用成功率

3. Prompt 管理

版本控制
回滚能力

九、安全与合规

企业落地必须考虑：

✅ PII 检测

敏感信息过滤

✅ Prompt Injection 防御

✅ 权限控制

不同 Agent 不同工具权限

✅ 内容审核

十、性能与部署

1. 推理优化

vLLM
KV Cache

2. 缓存

Redis 相似查询缓存

3. 部署

Kubernetes + FastAPI

4. 成本控制

Token 监控
小模型兜底

5. AI 的 CI/CD

自动化测试
灰度发布

十一、稳定性保障（非常重要）

Agent 最大的问题不是能力，而是：

👉失控

1. 防止死循环

max_turns 限制
重复检测（“对话熵”）

2. Plan-and-Execute

避免反复试错：

先规划
再执行

3. 可视化调试

记录全链路：

sender → receiver → content → tool_call

支持：

回放
Debug

十二、总结：一套工程化思维

最后，用一句话总结这一篇：

Agent 不是“更聪明的模型”，而是“更合理的系统结构”。

最佳实践路线

单模型 → RAG → Agent → 多Agent → 微调 → 工程化体系

核心原则

用RAG 解决知识问题
用Agent 解决复杂流程
用微调优化行为
用工程化保证稳定性

一、多 Agent 协作机制

1. 什么是 Multi-Agent System？

2. 技术优势

✅ 并行与分布式能力

✅ 高鲁棒性

✅ 协作与博弈能力

✅ 模块化架构

3. 典型应用场景

二、Agent 角色设计

1. 基础角色

UserProxyAgent（用户代理）

AssistantAgent（执行者）

2. 常见扩展角色

3. 一个典型流程

三、Agent 核心机制

1. 协作模式

Group Chat（群聊模式）

Debate（辩论机制）

2. 通信机制

Message Passing

Tool 调用传递

Feedback Loop（反馈闭环）

3. 人在回路（Human-in-the-loop）

四、Agent × RAG × 微调：如何组合？

1. 技术选型对比

2. 微调的本质

3. 最佳实践

✅ 初期（0 → 1）

✅ 中期（1 → N）

✅ 后期（规模化）

五、轻量微调三剑客

1. LoRA

2. P-Tuning v2

3. Adapter

4. 如何选择？

六、适用场景总结

七、系统架构设计：从单点到体系

1. 不要只选一种技术

2. 推荐架构

Modular AI System

3. 检索架构选择

4. Agent 组织方式

八、可观测性（Observability）

1. 日志与追踪

2. 关键指标

3. Prompt 管理

九、安全与合规

✅ PII 检测

✅ Prompt Injection 防御

✅ 权限控制

✅ 内容审核

十、性能与部署

1. 推理优化

2. 缓存

3. 部署

4. 成本控制

5. AI 的 CI/CD

十一、稳定性保障（非常重要）

1. 防止死循环

2. Plan-and-Execute

3. 可视化调试

十二、总结：一套工程化思维

最佳实践路线

核心原则

廊坊肛肠医生哪家好

HY-Motion 1.0开源生态：与HunyuanVideo/FLUX/PyTorch3D无缝集成指南

《Windows Internals》10.1.18 Startup and the registry process：为什么现代 Windows 不再把所有 Hive 都简单塞进 paged poo

《Windows Internals》10.1.19 Registry symbolic links：为什么有些注册表键看起来像真的在那儿，其实只是被配置管理器“重定向”到了别处？

《Windows Internals》10.1.22 The registry namespace and operation：为什么应用眼里的 HKLM...，到了内核里会先变成 \Registry

如何通过开源在线演示文稿工具提升创作效率：PPTist的技术民主化实践