AI Agent是一种具有自主性或半自主性的智能实体,能够利用人工智能技术在数字或物理环境中感知、决策、采取行动并实现目标。与Copilot、聊天机器人等相比,AI Agent能够自主规划和行动,实现用户预设的目标。
伴随着人工智能技术的迭代,AI Agent也经历了多个发展阶段。从2024年开始,基于大模型(主要是指“大语言模型LLM”)的AI Agent正在成为企业落地AI应用/解决方案时的必备功能。
构建基于大模型的AI Agent系统需要采用模块化和可组合的软件架构方法,各个能力通常拆解为独立的功能模块(例如记忆、感知、执行、LLM接口等),各模块之间通过标准化接口通信,形成松耦合的分布式系统(类似微服务架构),这种架构的优点是简单、灵活且易于扩展,可以根据具体需求添加或修改模块。
基于大模型的AI Agent代表了未来的AI应用落地趋势,虽然具有巨大潜力,但也给企业开发人员带来了一系列新的挑战。为了帮助企业更好地理解Agent可以支持的能力,并识别交付这些能力的机会和复杂性,沙丘智库发布《AI Agent架构设计模式研究报告》,将当前最常见、最成熟且最重要的基于大模型的AI Agent的架构设计模式分为7大类、具体26种,通过合理使用这些模式,企业可以构建出高效、可靠且安全的AI Agent系统。
· 架构模式:架构模式用于指导基于大模型的AI Agent的整体结构,是构建AI Agent的基础,决定了Agent如何在系统中交互、通信以及履行其指定的角色。在选择架构模式时,企业需要考虑Agent的功能范围、用于开发Agent的框架或平台。所选的架构模式将影响Agent的响应速度、可维护性、适应性以及评估和保证Agent质量的方法。架构模式包括单Agent、Agent角色、多Agent、 Agent交接 。
· 工作流模式:工作流模式用于定义Agent完成任务的工作流,这些工作流可以是线性的、循环的或动态的。采用动态工作流的AI Agent解决方案的自主性更强,但对于明确需求,使用预定义工作流(静态)是更加简单的方法,可以简化设计、评估和安全实施。工作流模式包括预定义计划、多跳问答、动态计划生成、编排Agent、协作Agent、人机协同。
· 大模型交互模式:大模型交互模式是指如何利用大模型的能力完成信息收集、动态规划、状态监控等一系列任务,包括如何构造prompt从大模型获取最佳响应,以及如何调用LLM API来执行特定任务。大模型交互模式包括:ReAct、思维链(CoT)、反思、结构化响应、重试限制。
· 行动模式:行动模式是指Agent根据其对输入的解释、对系统环境的感知,做出决策来采取行动的模式。例如,Agent可能需要调用特定的函数来执行任务,选择使用特定的工具,或者与外部环境(如数据库或API)集成以获取或发送信息。行动模式包括:函数调用(Function Call)、工具使用(tool use)。
· 记忆模式:记忆是指用于获取、检索、保留和后续检索信息的过程,记忆模式是指定义和管理记忆的模式,对Agent性能至关重要,支持短期记忆(任务内)、公共记忆(跨每个用户的任务)和全局记忆(跨所有Agent使用)。与决策、行动和活动相关的记忆可以用来帮助Agent提高学习和适应能力,同时也确保了信息访问的隐私和控制。记忆模式包括:RAG、记忆持久性、记忆共享范围。
· 评估模式:评估模式可用于实施持续的评估、验证和改进,从而提高Agent的性能和可靠性。评估模式包括:用户参与反馈、将大模型作为裁判、确定性评估、交互日志。
· 安全和身份管理模式:安全和身份模式侧重于保护Agent系统的安全性和身份管理,有助于保护Agent系统免受安全威胁,并确保其操作符合安全和合规要求。安全和身份管理模式包括:大模型防护栏、身份传播。
每种模式的介绍、适用场景、优劣势分析等详见完整报告:沙丘智库《AI Agent架构设计模式研究报告》(58页PPT)
* 以上内容节选自沙丘智库《AI Agent架构设计模式研究报告》
报告目录
1.基于大模型的AI Agent定义
2.基于大模型的AI Agent架构设计
3.基于大模型的AI Agent工作流
4.基于大模型的AI Agent典型特征
5.基于大模型的AI Agent实现方式
5.1 架构模式
5.1.1 架构模式:单Agent
5.1.2 架构模式:Agent角色
5.1.3 架构模式:多Agent
5.1.4 架构模式:Agent交接
5.2 工作流模式
5.2.1 工作流模式:预定义计划
5.2.2 工作流模式:多跳问答
5.2.3 工作流模式:动态计划生成
5.2.4 工作流模式:编排Agent
5.2.5 工作流模式:协作Agent
5.2.6 工作流模式:人机协同
5.3 大模型交互模式
5.3.1 大模型交互模式:ReAct
5.3.2 大模型交互模式:思维链(CoT)
5.3.3 大模型交互模式:反思
5.3.4 大模型交互模式:结构化响应
5.3.5 大模型交互模式:重试限制
5.4 行动模式
5.4.1 行动模式:函数调用(Function Call)
5.4.2 行动模式:工具使用(tool use)
5.5 记忆模式
5.5.1 记忆模式:RAG
5.5.2 记忆模式:记忆持久性
5.5.3 记忆模式:记忆共享范围
5.6 评估模式
5.6.1 评估模式:用户参与反馈
5.6.2 评估模式:将大模型作为裁判
5.6.3 评估模式:确定性评估
5.6.4 评估模式:交互日志
5.7 安全和身份管理模式
5.7.1 安全和身份管理模式:大模型防护栏
5.7.2 安全和身份管理模式:身份传播
6.给企业用户的建议
▎****更多研究
2025年中国银行业大模型应用跟踪报告
2025年中国消费品零售业大模型应用跟踪报告
国资央企DeepSeek大模型应用跟踪报告
银行业DeepSeek大模型应用跟踪报告
2025年中国保险业大模型应用跟踪报告
2024年AI Agent最佳实践报告
2024年“大模型+数据分析”最佳实践报告
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。