前两天年底,很多财务共享在做年度总结,感觉一下子提到智能体的概念又多了起来,有共享中心一下发布了20多个智能体。有朋友找我说,这智能体看着怪怪的。
今天用一期说说,来解释一下什么是智能体,以及在财务场景中的举例。
01什么是智能体
1、智能体是具备自主目标导向的完整系统,核心是“感知环境→规划任务→决策行动→执行反馈”的闭环能力,本质是“能主动解决问题的智能体”。
2、核心能力:围绕 “特定目标” 主动行动。例如“帮我订下周去深圳的出差机票+酒店”。
3、本质属性:是“主动闭环的系统”,无需人类每步干预,能自主感知环境信息(如读取邮件、调用天气API)、拆解任务(如把 “订机票” 拆成 “查航班→选座位→填信息→付款”)、执行行动(调用订票 API)、反馈结果(告知用户 “机票已订好,订单号 XXX”)。
(以上三个定义来源于豆包)
4、智能体是一个多模块或者多技术集中的系统,闭环运行步骤如下:
(1)用感知模块(也可以说是各种技术,下同)获取需要的信息,如读取文本、图像或者接口数据;
(2)用大模型对感知到的信息进行理解、分析、规划、做出决策;是智能体的核心,大脑;但大模型只是输出指令或者输出文本,无法进行具体规划的执行和最终决策,还需要胳膊腿;
(3)所以需要工具调用模块来调用各种系统(API接口或者MCP协议的方式)或者电子表格或者邮件或者低代码平台等来执行大模型的规划和决策;类似大模型的胳膊腿;
(4)当然,对于复杂场景,还需要行动规划模块把每一步拆分的更细、更具体、更精准;
(5)记忆模块,记录决策,生成新的信息;
(6)反馈模块,跟踪执行的结果,反馈记录的决策,调整下一次行动,让任务执行的更精准、更有效。
5、这么看,智能体的关键点应该能理解了:主动感知、主动计划、主动执行,人只做确认,不是等着人下指令。类似出差行为,不是人告诉他“我要去深圳出差,帮我定机票吧”,他再帮我生成差旅申请单让我确认、帮我推荐3-5个航班信息帮我选。而是说,通过领导的邮件或者微信对话感知到了我出差,根据我的出差习惯、出差地天气、见客户时间等信息,直接机票和酒店全部定好了,通知我。甚至,他知道我习惯每天晚上6点要喝一杯咖啡,在我航班落地的时候,帮我订好了机场门口的星巴克。
6、智能体与大模型的区别也显而易见:大模型只做信息处理、分析、计划,只是生成另外一个信息,感知、执行、反馈三个行动的环节,需要其他技术或者叫智能体的其他模块完成。
7、我的理解:尤其是没有主动感知、没有主动计划的智能体,不叫智能体。
8、如果是你说用了一个环节也叫智能体,比如决策行动,那我也可以说我们的智能审核也叫智能体,因为是根据审核规则审核通过了单子或者拒了单。
02财务智能体举例
1、前边说的差旅智能体的案例,类似成为个人助理,他在旁边听你开会,听你跟客户或者跟同事或者跟领导的对话,知道你喜欢早航班还是晚航班,了解你喜欢靠窗还是靠走廊的座位,清楚你喜欢咖啡还是茶,知道你偏向粤菜还是牛肉火锅,帮你安排一切。
2、还有一个场景,政策制度解读并调整智能审核的规则。人工模式下,税务条例修改后,人工接到通知或者人通过朋友圈看到这个政策,规则组的同事在会议室开会讨论研究,形成一个结论修改公司A条制度,根据A条制度修改智能审核系统中的B条审核规则。
3、政策制度解读智能体这么干:智能体实时抓取税务局网站上的信息,获取新的条例后自动结合企业特点和内部制度,生成A条制度建议并修改公司的红头文件,自动配置完成智能审核系统的B条规则,发邮件通知规则组同事,说你是否同意发此红头文件,你是否同意智能审核系统的此规则配置。规则组点确认或者说可以,邮件自动发送全员并在OA发布,智能审核系统自动调整规则并通知相关系统管理员。
4、所以,这是真正的智能体干的事:在大模型的理解、分析、建议的基础上,把事情给干了。
5、所以,智能体更多的体现出来替代人的属性,体现出了角色的属性。
6、年底的几个跨年演讲我看了,有两个大咖说,AI不是替代人,是帮人干更多的事。我理解这个观点是缓解焦虑,但,AI就是替代人是毋庸置疑的。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。