上周,我给一家企业实施AI Agent应用时,对方的项目总监悄悄问我:“K总,我听说这个Agent上线后,会裁掉90%的员工,是真的吗?”听到这一类问题,我一点也不惊讶,“AI焦虑”已经成为一种普遍社会现象。但要想全面深入地回答这个问题,就会涉及到Agent的发展阶段、核心组成、类型划分、以及当前面临的种种不足等等,不是一两句话就能说得清,下面通过这篇文章,好好剖析一下这个问题。
01Agent发展的5个阶段
AI Agent不是突然冒出来的成熟产物,而是随着底层大模型推理能力的不断增强,逐步走向完善的。整体上,我们可以将它的发展划分为五个阶段(L1–L5):
L1:简单步骤跟随
在这个初级阶段,Agent的能力仅限于按照用户或开发者预先设定的确切指令,一步步完成任务。比如,你可以让它“打开邮件,阅读第一封未读邮件”,它更像一个智能化的执行器,但缺乏自主判断和更复杂的决策能力。
L2:确定性任务自动化
进阶到L2,Agent能够基于对确定性任务的描述,在预设的动作空间内自动完成一系列步骤。它不再需要每一步都精确指令,而是能在给定规则下完成相对封闭、可预测的流程,比如你可以让它“查询今天上海的天气”。在这一过程中,Agent 会自动调用并整合多个数据源。
L3:战略任务自动化
这是当前许多先进Agent正在努力达到的阶段。在L3,Agent可以根据用户指定的高层次任务目标,自主调用各种资源和工具,规划并执行步骤,并能根据中间反馈,迭代优化计划。
L4:记忆和上下文感知
在这个阶段,Agent将具备更深层次的智能,能够感知用户在长期交互中的上下文,理解用户过去的记忆,并有时主动提供个性化的服务。它能记住你的偏好、习惯,甚至能预测你的需求,比如“告诉扫地机器人今晚打扫房间”,它会根据你的日常习惯,避开你常用的区域,或根据天气状况推荐何时清洗窗户。
L5:数字人格
这是Agent发展的终极目标,智能体将能代表用户完成更复杂的事务,甚至能与他人进行交互,并确保其安全和可靠性。这个时候,它可能不仅仅是你的助理,更是你在数字世界中的一个分身,能够独立思考、决策,并保护你的利益。
目前,随着推理大模型的进一步成熟,以及Manus、百度文心智能体平台、扣子空间、通义千问智能体等通用Agent的出现,企业AI Agent的应用正加速从L2向L3阶段迈进。它们在执行确定性流程和一定程度的自主规划方面,已经表现出色;但在真正拥有长期记忆、上下文理解和主动服务方面,仍有很长的路要走。
02Agent关键组件和架构
一个AI Agent之所以能够“智能”地运作,离不开其背后精密的组件协同和逻辑架构。
1、5个关键组件
就像人类的思考和行动一样,Agent也有一套完整的认知与执行系统:
感知:它是智能体与外部环境交互的基础接口,负责收集和解析环境数据,包括文本、图像和声音等。
规划:作为智能体的决策中心,它负责将复杂的总目标分解成可执行的步骤,并制定实现策略。这里不得不提的是“思维链”,这种提示技术已成为提高大模型在复杂任务表现上的标准方法,它让Agent能像人类一样进行逐步推理。
记忆:存储着历史交互、知识积累和临时任务数据,是Agent实现上下文感知和长期学习的基础。
工具使用:通过调用外部资源,如API、代码库、RPA或应用程序,来扩展自身能力,是Agent在企业环境中实现价值的关键。
行动:是感知、规划、记忆和工具使用的最终成果,也是智能体执行任务和与环境交互的具体表现。
2、架构逻辑图
把这些组件连接起来,Agent 的逻辑架构也就一目了然。整条信息流清晰呈现了其从输入、处理到输出的完整路径:
来源@顿悟山丘智库
用户输入层: Agent的起点,接收用户以图文、语音、视频等多种形式提供的指令或信息。
接入网关层:负责统一接口管理,进行身份认证、协议转换和路由,确保输入信息能够安全、高效地进入Agent的核心处理区。
意图识别层:对输入的原始数据进行预处理、意图分类和实体提取,将非结构化的用户指令转化为Agent能够理解的结构化信息。
推理决策层:这是Agent的核心大脑,负责任务的规划、策略的筛选、大语言模型的推理和最终决策的验证。它决定了Agent下一步“做什么”和“怎么做”。
工具执行层:根据决策层的指令,调用并执行相应的工具,如注册、MCP、API、代码执行等,并处理工具返回的结果。
结果生成层:将工具执行后的结果或推理决策的产出,进行内容组装、格式化,并进行质量优化,使其符合用户阅读和理解的习惯。
用户输出层:将处理完成并格式化的结果呈现给用户。
除此之外,还有三个重要的支撑模块,即管理支持、记忆系统以及知识库,它们共同构建了Agent的基本架构。
03企业级Agent的两种类型
在企业应用层面,Agent可以根据其主要解决的问题和工作方式,大致分为两大类:
1、流程自动化型
这类Agent的核心在于“自动化”,它们依据企业内已经固定的工作流和明确的规则,执行重复性、规范化的任务。这类Agent的优势在于提高效率、降低错误率、节省人力成本。
比如,财务部门的发票报销流程、企业内部的业务审批流、员工的学习考试系统等,都是流程自动化型Agent的典型应用场景。它们能够精准地遵循既定步骤,无需人工干预,极大地提升了日常运营的效率。目前,在金融、保险、制造等传统行业,流程自动化型Agent占据了企业应用的主导地位。
2、超级Agent型
与流程自动化型Agent不同,超级智能体型Agent更侧重于探索和目标达成。它们被赋予一个高层次的目标,然后由智能体自主规划、探索信息、调用工具,并迭代优化路径以实现该目标。这类Agent更强调灵活性和解决复杂、非结构化问题的能力。
常见的应用场景包括生成市场研报、进行复杂的数据分析、甚至辅助软件开发等,都属于超级智能体型Agent的应用范畴。它们需要更强的推理能力、更广阔的知识面以及更灵活的工具调用能力。尽管目前在企业中的应用尚处于辅助地位,但其发展潜力巨大,代表着Agent更高级的智能形态。
04当前Agent的不足
Agent固然强大,但并非万能,当前仍存在一些显著的不足,主要包括以下三个方面:
1、错误复合效应
大模型在执行任务时,准确率永远不可能达到100%。哪怕单次调用的准确率高达95%,(已属相当不错的水平),但当一个复杂任务需要Agent连续调用20次时,最终成功率却会骤降至约36%(0.95的20次方)。这也意味着,在真实而复杂的业务场景中,Agent想要“一步到位”全自动完成任务的概率,要远比想象中低得多。
而真正可行的做法,是放弃对“完美全自动”的幻想,把任务拆解成一系列更小的步骤,逐步执行、逐步验证。这样一来,即便某个环节出错,也能单独回溯或重试,不会牵连整个流程,从而显著提升系统的稳定性和任务的整体成功率。
2、token成本指数级增长
当Agent与用户或系统进行多轮交互时,为了保证上下文连贯,往往需要在每次对话中携带大量历史内容。随着轮次增加,所需的Token数量会急剧上升,API调用成本也随之飙升,最终成为企业部署Agent的一大负担。
更高效的做法,是尽量采用无状态或弱状态的会话设计,减少不必要的上下文传递。在多轮对话中,只保留关键变量或必要信息,并通过记忆系统进行优化,而不是把所有历史记录一股脑塞给大模型。这样不仅能大幅降低Token消耗,也能让系统运行得更轻、更稳。
3、工具生态不足
不少人以为,Agent的核心在于AI本身,但现实中,真正由AI推理完成的部分往往不到30%,其余70%的工作都落在调用、集成和调试浏览器、搜索引擎、编程接口、RPA(机器人流程自动化)等外部工具上。由于当前工具生态还不够成熟,很多时候Agent会陷入反复调试工具的困境,效率低下。
解决这一问题,首先要明确Agent可用的工具范围和使用规范,让它清楚“能用什么、该怎么用”。同时,还要设计完善的兜底机制,一旦工具调用失败或效果不佳,Agent能及时切换到备用方案,避免陷入无休止的重试循环。只有这样,Agent的稳定性和实用性才能真正提升。
05企业Agent应用场景举例:价值重塑, 而非简单替代
Agent到底是否会导致90%的裁员?最终还是要看它在企业中能“做什么”和“替代什么”。下面列举两个真实使用场景,来具体说明这一点。
- 语核科技AI数字员工:从“周”到“小时”的效率杠杆
语核科技是一家专注于企业级AI应用的科技公司,其核心是打造流程自动化型智能体,在业务层面精确瞄准了企业中“非标准化文档解析”和“海量物料匹配”这一业务瓶颈。为它的一个重工客户,成功解决了“非标维修清单和上万个物料SKU匹配”的头疼问题。使得这项工作的时间成本从原来的“一周以上”,大大压缩为“半小时以内”,同时还保持了高达90%以上的端到端准确率。为客户解决了发展中的一个耗时低效的业务阻塞点,释放出了大量的人力、物力和时间投入。
- 递航科技AI招聘官:将HR从“海量简历”中拯救出来
递航科技是一家专注于AI招聘领域的创新企业,致力于用智能Agent重塑传统招聘流程。在传统模式下,HR每天要筛上千份简历、发上百条信息,效率低、体验差。递航科技打造的数字员工团队,由多个具备不同职能的专业Agent协同工作(比如,AI“画像师”能精准构建人才模型,AI“寻访师”在全网高效锁定候选人,AI“沟通师”负责完成初步筛选与意向沟通),实现了招聘前端的自动化与智能化,同时也让招聘过程变得更快、更准,也更轻松。
说到这里,想必大家对“Agent上线是否会引发大规模裁员”这样的话题,已经有了更深的认识和更准确的判断。
AI Agent的核心价值在于自动化重复性任务,从而解放员工,使其能聚焦于更高价值的创新与决策。它带来的是企业岗位结构的优化和人才能力的升级,而非简单粗暴的取代。从某个角度看,Agent并不是职场中的“杀手”,而更像赋能企业与员工共同进化的加速器。战略性地理解并驾驭这项技术,才是我们在智能时代最该做的事,这远比“原地焦虑”有意义得多。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。