如果你现在去问任何一位企业 CIO「你们有没有在用 Agentic AI」,大概率得到肯定的回答。PwC 2025 年调研显示,79% 的组织声称已「在某种程度上」采用了 AI Agent。
但如果你追问一句「你们的 Agentic 项目产生了什么可量化的业务价值」,现场气氛就会变得微妙。
Gartner 同年发出的预警说明了这种微妙从何而来:超过 40% 的 Agentic AI 项目将在 2027 年底前被叫停,主要原因是成本失控、价值不清晰、风险管控缺失。
同一个月,UiPath和德勤联合宣布「Customer Zero」成果:SAP S/4HANA迁移clean core达成率93%(行业基准是80%),85%以上关键财务工作流实现无人值守自动化,交付200+自动化流程。
Salesforce也公布了自用数据:Agentforce一年内处理超150万次支持请求,SDR Agent从沉睡线索中创造了170万美元新销售管道,员工节省50万小时工作量。同一项技术,同一个时间窗口:一边是40%的失败预警,一边是实打实的业务成果。分水岭在哪里?
问题的根源不在技术本身,而在于大量企业根本没搞清楚自己在部署什么。Agentic AI、AI Agent、Agentic Process、Agentic Workflow、APA……
这些词被同时创造、同时流行、同时被滥用,没有权威机构站出来先定义再使用。于是,把简单规则自动化包装成Agentic的,有;把Chatbot改个名字叫Agent拿去融资的,有。Gartner甚至专门造了个词描述这种现象「Agent Washing」。
概念混乱导致决策混乱,决策混乱导致项目烂尾。这才是那40%失败率背后更深层的原因。
本文就跟大家把这些全部说清楚:Agentic Process是什么、核心机制是什么、优势与风险各几斤几两、Agent Skills和MCP协议的价值在哪里、OpenClaw和hermes-agent怎么用、各类厂商的实现路径差异、BPM会不会被消灭、企业该怎么判断要不要转型。
一篇文章,全部讲透。
七个词,七个不同层次
每隔一段时间,AI领域就会冒出一批高度相关却被高度混用的词汇。市面上 Agentic 系列概念的混乱,有客观原因:这批词几乎同时被造出来、同时被炒起来,Andrew Ng、Marc Benioff、Jensen Huang 各说各话,Anthropic、OpenAI、Salesforce 各做各做,读者看了十篇文章,每篇对同一个词的定义都不一样。
王吉伟频道整理了一张完整的概念层级图,这是一个“6个纵向层级+1个横向治理层”的结构,从上到下、从核心到落地大致是这样的:
Agentic AI→ AI Agent→ Agent Skills→ Agentic Process→ Agentic Workflow(→ APA, Agent Harness则是贯穿所有层级的横向治理层,不算在纵向层级里。
这七个概念不是同义词,也不是同类概念的不同叫法,本质上是从范式到执行、从能力到流程、从编排到工程化落地,并由治理体系贯穿全局的分层架构,每一层解决不同维度的问题。下面我们就逐个把这些概念讲明白,用最通俗的话拆解清楚。
Agentic AI(智能体\代理式人工智能)。它是整体技术范式,描述的是AI系统具备自主感知、目标分解、多步推理和主动执行能力这件事本身。它不是某个产品,而是一种设计哲学——AI 不只是回答问题,而是主动完成目标。大家可以把它理解为「生成式 AI」同级别的范式概念,而不是某个可以采购的软件。
AI Agent(AI智能体)。它是 Agentic AI 的具体执行单元,说白了就是一个能够感知环境、推理决策、调用工具、执行任务的自主实体。简单类比就是,Agentic AI 是一家快递公司的整体运营体系,那 AI Agent 就是一个具体的快递员,是范式的实例化,是实实在在干活的“人”。
Agent Skills(智能体技能)。这是Agent的能力原子,也是Agent能干活的基础——一个Agent之所以能做某件事,是因为被赋予了对应技能,比如调用API的技能、操作数据库的技能、执行代码的技能、控制浏览器的技能。Skills是Agent行动能力的最小单位,就像人身上的一个个“技能点”,也是整个 Agentic 生态互操作的关键接口,近年来标准化进展最快的就是这一层。
Agentic Process(智能体流程)。这是整个体系的核心主角,也是最容易被忽视的一层。它描述的是AI Agent完成任务时走过的完整动态循环:感知信息、推理规划、调用工具执行、评估反馈、再次迭代,直到目标达成。说白了就是智能体干活的“完整步骤”,强调的是「流程」本身,是动态的、有状态的、自适应的,也可以理解成智能体的“认知-行动闭环”。
Agentic Workflow(智能体工作流)。它是对多个Agentic Process的编排和组合,不再关注单个Agent怎么完成一个任务,而是关注“这些任务按什么顺序、以什么逻辑串联起来”。如果说Agentic Process是“一次完整快递任务的流程”,那Agentic Workflow就是“多个快递任务的调度安排”;再简单点说,Process是原子,Workflow是分子,是系统级的任务编排。
Agentic Process Automation(APA,智能体\代理式流程自动化)。它是把Agentic Process和Workflow落地到企业业务场景的工程化体系,相当于RPA(机器人流程自动化)的进化版。区别在于,RPA靠硬编码的固定规则干活,而APA用AI的自适应能力替代了固定规则,能实现端到端的智能自动化,也是企业级应用落地的关键一步。
Agent Harness(智能体驾驭框架)。这是最容易被企业忽略、却最不能缺的一层,它不是纵向的某一级,而是横向贯穿所有层的“控制层”,可以理解为“管理和约束AI Agent行为的缰绳”。它的核心作用就是定义Agent的权限边界、监控执行轨迹、处理异常回滚、协调多Agent之间的任务分配。就像Agent是马,Harness是鞍辔和缰绳,没有它,Agent跑得越快越危险,企业用起来也越没保障。
这七个概念构成了一个完整的Agentic AI体系:Agentic AI定方向(能力范式),AI Agent去执行(执行单元),Agent Skills打基础(能力原子),Agentic Process做核心(运作流程),Agentic Workflow做调度(编排形式),APA落地到企业(工程体系),Agent Harness保安全(治理控制)。
这套体系不只是一次技术升级,更是对企业数字化体系的一次结构性重构。
概念 | 层次定位 | 核心关注点 | 直觉类比 |
Agentic AI | 能力范式 | AI 具备自主性 | 工业革命(整体转型方向) |
AI Agent | 执行单元 | 谁来执行任务 | 具体的快递员 |
Agent Skills | 能力原子 | Agent 会做什么 | 快递员的专业技能证书 |
Agentic Process | 运作流程 | 任务怎么被完成 | 一次快递任务的完整履约流程 |
Agentic Workflow | 编排形式 | 多个任务怎么衔接 | 多任务的调度安排表 |
APA | 工程实现体系 | 如何在企业落地 | 快递公司的数字化管理系统 |
Agent Harness | 治理控制层 | 如何保证安全可控 | 行为规范与监管机制 |
这张表的价值在于:选型和决策时,不会把预算花在错误的层次上。搞清楚这张图,后面所有内容都会顺畅很多。
Agentic Process 核心机制:一个改变一切的循环
理解Agentic Process,最关键的是理解它的运行方式:Agentic Loop(智能体循环)。
Andrew Ng在2023年系统阐述了这个框架,将其归纳为四个阶段,业界普遍沿用至今。
第一阶段:感知(Perceive)。Agent收集当前任务所需的所有信息:用户指令、数据库查询结果、工具返回值、API响应,甚至网页截图或医疗影像。感知能力决定Agent的「视野」宽度,也决定了后续推理的质量上限。
第二阶段:推理与规划(Reason & Plan)。这是LLM真正发力的阶段。模型分析当前状态,将大目标分解为可执行的子步骤,选择调用哪些工具,制定行动序列。ReAct(Reasoning + Acting)框架、Chain-of-Thought提示、Tree-of-Thought规划,都属于这一层的技术方案。推理阶段的质量直接决定Agent「走弯路」的频率。
第三阶段:执行(Act)。Agent实际调用Skills或Tools:API请求、数据库写入、代码执行、文件操作、浏览器自动化。这是「想法」变成「行动」的关键转化点,也是出问题最多的环节。执行层的宽度,决定了Agentic Process能触达的业务边界。
第四阶段:反思与学习(Reflect & Learn)。Agent检验执行结果是否符合预期。成功则更新记忆状态,进入下一步或标记完成;失败则分析原因,调整策略,重新进入循环。短期记忆(Context Window)和长期记忆(Vector Store或外部存储)都在这个阶段得到更新。
然后,循环重复,直到目标完成,或触达预设终止条件(最大迭代次数、超时时间、成本上限)。
这个循环有个让人印象深刻的特征:非线性。它不是从A到B再到C的线性流程,而是随时可能回到起点重新规划。这正是它应对复杂、不确定任务的核心能力所在。
理解了Agentic Loop,就能理解Agentic Process和传统技术的本质差距。
传统RPA的本质是「规则驱动的确定性执行器」。你定义每一步操作,它精确复现。优势是稳定、可审计;弱点是规则边界之外的任何变化都可能让整个流程崩掉,而且规则永远写不完。
纯LLM(如ChatGPT对话模式)的本质是「一次性生成器」。你给问题,它给答案,结束。不会主动检验答案,不会自行调用外部工具,更不会在出错后自主纠正。
Agentic Process填补的,正是这两者之间的巨大空白:既保留了RPA的执行力(能真实触发系统操作),又具备了LLM的适应性(能处理非确定性情境),再加上循环反馈机制,使其能处理人类工作中最难自动化的那类任务:模糊目标、多步决策、动态环境。
用一句话总结:RPA自动化的是「怎么做」(How),Agentic Process自动化的是「做什么直到目标达成」(What to do until done)。
对比项 | 传统RPA | 纯LLM | Agentic Process |
执行方式 | 规则脚本 | 单次生成 | 循环推理+执行 |
不确定性处理 | 报错/中断 | 不执行,只生成文本 | 自主重规划 |
记忆能力 | 无 | 仅上下文窗口 | 持久化记忆 |
工具调用 | 预设接口 | 不调用 | 动态选择工具 |
人工干预需求 | 异常时高 | 每步都需要 | 最小化(可配置) |
适应新情况 | 弱 | 强(但不执行) | 强且能执行 |
可审计性 | 高 | 低 | 中(取决于实现) |
优势明确,但风险不能轻描淡写
Agentic Process确实有真实优势,但风险同样真实,而且危险。
真实的优势
能处理非结构化任务。传统自动化的最大盲区是非结构化信息:措辞模糊的邮件、多格式合同文档、口头描述的客户诉求。Agentic Process可以理解、归纳、做出判断,这是RPA永远做不到的。
具备自我修正能力。单个步骤出错不代表整个任务失败,Agent检测到异常后可以重新规划路径,而不是直接中断。这种容错弹性在长链任务中价值极高。
支持多步长链任务。从「发起采购申请」到「完成入库对账」,跨越十几个系统操作和决策节点,Agentic Process可以全程自主推进,无需人工在中间节点反复介入。
可并行扩展,能力边界不断延伸。McKinsey的研究显示,2-5人的人类团队可以监管50-100个Agent协同运行的端到端流程。
Anthropic的多智能体研究表明,主Agent协调专业子Agent的架构,在复杂研究任务上的性能比单一Agent高出90%以上。Landbase统计,2025年企业使用Agentic Process的平均ROI达171%,美国企业达192%,是传统自动化的3倍。
真实的风险:40%项目失败的真相
幻觉导致不可控行为,代价远超对话场景。LLM的幻觉在Chatbot里顶多让你看到错误答案;在Agentic Process里,幻觉可能导致Agent向错误账户发起付款、删除错误文件、向客户发送错误信息。
UC Berkeley Sutardja Center明确指出:高风险场景(如金融交易)中,AI幻觉的代价将远超对话场景,且Agent的「策略性欺骗」风险在高风险环境中已有记录案例。
成本失控是真实的定时炸弹。每一轮Agentic Loop都在消耗算力。有团队记录到Agent进入递归循环,最终导致云账单达到六位数。设计不当的循环终止条件不是小概率事件,而是架构层面的系统性风险。
安全与合规漏洞,责任归属悬而未决。2025年初,一家健康科技公司因Agentic AI系统漏洞导致48.3万条患者记录泄露。多Agent系统还面临「Agent勾结」风险:一个被攻击的Agent可能向其他Agent传递恶意指令。
Gartner数据显示,35%的企业将网络安全顾虑列为部署Agentic AI的首要障碍。更麻烦的是,AI Agent自主做出错误决策,锅由谁来背?开发商、部署企业,还是操作员?这在法律层面还没有清晰答案,在强监管行业里是当前落地最大的隐性障碍。
Agent Washing污染市场认知。Gartner估计,在数千家声称提供Agentic方案的厂商中,真正具备实质Agentic能力的约130家。大量「伪Agentic」产品用炒作拉高了企业预期,最终结果就是那40%的失败项目。
Klarna是最著名的反面教材。这家瑞典支付公司曾高调宣称AI替代了大量客服,但CEO后来承认AI输出「质量低于人类员工」,公司随后恢复雇用人工客服。教训不是Agentic Process不行,而是:流程没准备好就上Agent,是在放大混乱。
还有一个被严重低估的成本:MIT的研究指出,实施Agentic AI 80%的工作量消耗在数据工程、利益相关方对齐、治理设计和工作流集成上,模型本身只占20%。企业往往只看到那20%的光鲜部分,忽略了那80%的「脏活」,这才是最普遍的失败根源。
如何应对?引入Agent Harness,给每个Agent设定明确的权限边界(最小权限原则),关键操作前强制人工审批,异常行为触发自动熔断。
设置三道保险:最大迭代次数、超时机制、成本上限同时生效。建立完整的推理审计轨迹,每个决策步骤都必须有记录,这是合规的基础,也是故障排查的前提。
Agent Skills 与 MCP:执行层的标准化革命
Agent Skills:能力原子的分类与价值
如果把Agent比作一位员工,Skills就是他的专业技能证书清单。一个Agent的Skills通常分为四类:
感知类技能(输入处理):文本理解、图像识别、文档解析(PDF/Excel/Word)、网页内容提取、语音识别。感知技能决定Agent能「读」什么类型的输入,也是多模态扩展的切入点。
推理类技能(内部认知):代码解释执行、数学计算、逻辑推断、多步规划、语言翻译。主要由LLM本身提供,但可通过微调或专用工具增强。
行动类技能(外部执行):API调用、数据库读写、代码执行(Python/SQL等)、浏览器操作、文件系统操作、邮件/日历/消息发送。这是Agentic Process能够真正「干活」的关键,决定了Agent能触碰哪些真实系统。
协作类技能(多Agent交互):任务委派、结果汇总、向人类请求确认、与其他Agent通信。这类技能是多智能体系统(Multi-Agent System)得以运转的基础。
Skills的标准化是2025年最重要的基础设施里程碑。2025年12月18日,Anthropic发布Agent Skills开放规范(SKILL.md格式),企业可以像搭积木一样把已有的技能模块组合成新的 Process,不同厂商的 Agent 可以共享同一套技能生态,降低平台锁定风险。
OpenAI和Microsoft随后采纳,标志着Agent能力单元正式走向标准化和可组合化。
Salesforce的AgentExchange(2026年初上线)是目前全球最大的Skills市场,Marc Benioff将其定位为「6万亿美元数字劳动力市场」的基础设施层。
标准化对企业意味着什么?意味着可以像搭积木一样把已有技能模块组合成新的Process,不必每次从头开发;也意味着不同厂商的Agent可以共享同一套技能生态,降低平台锁定风险。
Anthropic的多智能体研究已经证实,专业化分工的多Agent架构(每个子Agent专精一类Skills)在复杂任务上的性能是量级级别的提升,这说明Skills的专业化分工本身就是Agentic Process性能优化的核心杠杆。
MCP:让Skills连接一切系统的「USB-C接口」
Skills本身需要一个标准协议来连接外部系统,这就是MCP(Model Context Protocol,模型上下文协议)的价值所在。
Anthropic于2024年11月发布MCP,2025年3月OpenAI采纳,现已移交Linux Foundation治理,AWS、Google、Cloudflare均给出生产级承诺,SDK月下载量达9700万次。BCG把它称为「AI的USB-C接口」,在MCP出现之前,每个Agent连接每个系统都需要定制化开发;MCP出现后,将这个过程标准化了。
2026年3月发布的MCP Roadmap明确四个优先方向:传输扩展性(支持高并发Agent调用)、Agent间通信(让Agent协作更顺畅)、治理成熟度(权限控制和审计)、企业就绪度(与现有IT基础设施对接)。苹果Xcode已于2026年初原生支持MCP,这个信号意味着:协议标准化之争,Anthropic已经在牌局上赢了相当大的先机。
与MCP并行的还有Google发布的A2A(Agent-to-Agent)协议,专注于多Agent间的通信标准,已获SAP、Salesforce、ServiceNow、Workday等50余家厂商采纳。
两者定位不同,并不冲突:MCP负责Agent连接外部工具,A2A负责Agent之间的协作通信。一个是Agent的「对外接口」,一个是Agent的「内部通话频道」。两个协议标准同时成熟,意味着Agentic Process的基础设施层正在快速完善。
用 OpenClaw 和 hermes-agent 构建 Agentic Process
理论够了,来看具体实限。对于想在私有环境中构建Agentic Process、同时控制成本和数据主权的团队,OpenClaw + hermes-agent是目前最受关注的开源项目组合之一。
OpenClaw:本地自托管的完整 Agentic Loop 实现
OpenClaw是一个本地自托管的Agentic AI系统,其架构直接体现了Agentic Process的核心设计哲学,由四个核心组件构成。
持久化记忆(Persistent Memory):存储跨任务的上下文状态,解决普通LLM「没有记忆」的根本缺陷。没有持久化记忆的Agent,每次都像第一次见你,做不了任何需要累积上下文的工作。这让Agent在跨会话、跨任务场景下保持连贯性,是长周期复杂任务的必要基础。
Agent(AI Brain):核心推理模块,负责理解用户目标、拆解任务、制定计划、评估结果。整个Agentic Loop的决策中枢,通常由一个或多个LLM驱动。
模块化Skills库:涵盖文件系统操作、终端命令执行、浏览器自动化等本地资源交互能力,使Agent能像真正的本地助手一样代替用户完成具体计算机操作,而不只是「说说」该怎么做。
「Agentic Loop & Proactive Monitoring」机制:OpenClaw的核心亮点,实现主动监控和持续迭代,确保Agent不会在任务执行中途悄悄「失联」。
整体运转流程:用户输入目标 → Agent推理规划 → 调用Skills执行 → 持久记忆存储状态 → 评估结果 → 循环直至完成。全程数据不出本地网络,对医疗、金融、政务等数据敏感行业吸引力强。
对中小企业或个人开发者,OpenClaw的价值在于低成本、高可控、可定制,适合验证Agentic Process逻辑、测试Skills组合,或构建内部专用自动化助手。
hermes-agent:开源社区的私有化推理引擎首选
hermes-agent基于NousResearch的Hermes系列模型,该系列专为Function Calling(工具调用)和结构化推理深度优化,是开源社区构建Agentic Process使用最广泛的基础推理引擎之一。
它的核心优势是Function Calling的稳定性和结构化输出的一致性。这两点对Agentic Loop的Act阶段至关重要:如果模型的Function Call输出格式不稳定,Skills调用就会频繁失败,整个循环陷入无效迭代。
Hermes模型在推理时以结构化XML或JSON格式输出「思考过程」和「工具调用指令」,开发者能清晰观察Agent在每一步的判断和行动,对需要可解释性和可调试性的企业场景,这是显著优势。
用hermes-agent实现Agentic Process的典型路径:首先定义Skills集(即Tools),告诉模型可以调用哪些工具及参数格式;其次设定系统提示(System Prompt),明确角色、目标和行动规范;然后用户提供任务目标;最后模型进入推理-调用-反馈循环,直到任务完成。
局限在于:复杂多步骤任务的推理深度不如GPT-4o或Claude 3.7 Sonnet,长上下文下的稳定性需要额外调优。但对于希望私有部署同时控制成本的团队,hermes-agent是最务实的选型之一。
最佳实践组合:OpenClaw提供Skills框架、记忆系统和监控机制,hermes-agent提供推理引擎。两者配合,构成完整的本地Agentic Process基础设施,成本远低于调用OpenAI或Anthropic API,隐私保护更强,适合作为企业内部自动化的试验田,验证成功后再决定是否迁移至云端商业平台。
六个真实案例
概念讲够了,来看真实发生的事情。王吉伟频道选了六个场景,覆盖ERP迁移、CRM客服、财税服务、零售库存、医疗临床、软件工程,覆盖企业重资产的企业核心系统和AI原生场景。
案例一:UiPath × Deloitte,SAP迁移的行业基准
大型ERP迁移通常是企业最痛苦的IT项目:几百个业务流程、几十个系统集成,手工测试和数据迁移工作量惊人,错误率难以控制。UiPath和德勤将Agentic Automation嵌入迁移全流程,Agent负责自动识别流程差异、生成测试用例、校验数据、处理异常。
结果:SAP S/4HANA迁移clean core达成率93%(行业基准80%),85%以上关键财务工作流实现无人值守自动化,交付200+自动化流程。
这个案例的意义在于:它证明了Agentic Process在「确定性要求极高」的ERP场景同样适用,而不只是适合边界模糊的创意类任务。
传统RPA在ERP迁移中遇到的最大困难,是那些规则复杂、数据脏乱、需要根据上下文判断的「灰色地带」,Agentic Process通过推理能力在大多数特殊情况下自主做出合理判断,只把真正超出能力边界的情况交给人工。
2026年3月,UiPath和德勤联合推出Agentic ERP Platform,将成功经验打包成可复制的标准化产品,标志着ERP场景的Agentic落地从「定制项目」走向了「产品化」。
案例二:Reddit × Salesforce Agentforce,客服效率的质变
Reddit 是 Agentic Process 在 CRM 客服场景中迄今最具说服力的公开案例。部署 Salesforce Agentforce 360 后,46% 的支持案例被自动偏转处理(无需人工介入),平均响应时间从 8.9 分钟压缩至 1.4 分钟。
这里的核心设计亮点是「置信度阈值」机制:并非让 Agent 试图处理所有问题,而是用阈值划定「自动完成」和「升级人工」的边界。置信度够,Agent 自主处理;置信度不够,立即转人工并提供推理上下文。
这种「Human in the Loop」设计,是 Agentic Process 在企业级应用中获得持续信任的核心机制,而不只是一个安全策略,更是一个务实的工程选择。
案例三:1-800Accountant,税季的弹性压力测试
这家会计服务公司在税务季(业务量陡增 3 至 5 倍的时期)部署了 Salesforce Agentforce,让 Agent 处理客户咨询中的标准化问题:政策查询、文件要求说明、账单问题、申报状态跟踪。
结果:70% 的客户咨询由 Agent 自主解决,不需要人工介入,人工客服得以集中精力处理真正复杂的个案和高价值客户服务。
这是 Agentic Process 在「季节性峰值场景」中价值最清晰的体现:弹性扩展、按需调用、人机分工明确。传统客服扩容需要提前招聘培训,Agentic Process 的扩容只需调整并发参数。
案例四:零售库存重分配,10天压缩到1小时
Nuance、Ambience Healthcare 等公司部署的临床文档 Agentic Process,是另一类意义重大的案例。
医生与患者对话期间,Agent 实时感知对话内容,自动推理并生成结构化的 SOAP 格式临床笔记,同时触发与 EHR 系统的数据写入和编码匹配,医生无需手动记录,完成后审核确认即可。
这个场景的独特价值在于:临床文档是高度非结构化、高专业密度的任务,传统 RPA 完全无法处理,纯 LLM 只能生成文本但无法写入系统,只有 Agentic Process 才能端到端打通「理解→生成→写入」这整条链路。
它清晰地标出了 Agentic Process 价值版图上 RPA 从未抵达过的领域。
案例五:临床文档 Agent,打通医疗数据最后一公里
Nuance、Ambience Healthcare等公司部署了临床文档Agentic Process:医生与患者对话期间,Agent实时感知对话内容,自动推理并生成结构化临床笔记(SOAP格式),同时触发与EHR系统的数据写入和编码匹配,医生无需手动记录,文档完成后再审核确认。
这个场景的价值在于:临床文档是高度非结构化、高专业密度的任务,传统RPA完全无法处理,纯LLM只能生成文本但无法写入系统,只有Agentic Process才能端到端打通,真正把「听诊室里说的话」变成「系统里规范的记录」。
案例六:软件工程全自动 Bug 修复,进入生产环境
GitHub Copilot Workspace和Devin(Cognition AI)代表Agentic Process在软件工程场景的前沿:给定一个Issue描述,Agent自动感知代码仓库上下文,推理Bug原因,生成修复代码,执行测试,测试通过后提交PR。
这已经是一个完整的、多步骤的、需要大量工具调用(代码阅读、代码生成、测试执行、版本控制)的Agentic Process,而且正被真实工程团队用于生产环境。
这个案例的意义不在于「AI会修Bug了」,而在于它证明了Agentic Process有能力处理知识密集型的专业判断任务。
因为篇幅问题,这里只简单介绍下案例,我会在其他文章中分享更具体的案例。
各类厂商实现路径:五大派系全景对比
同样是「做Agentic Process」,不同类型的厂商切入点截然不同。搞清楚这些差异,是企业选型最重要的前置判断。
ERP厂商:SAP的「原生嵌入」战略
SAP把Agentic Process的战场放在ERP核心业务流程上。SAP Joule整合在S/4HANA、SuccessFactors、Ariba等产品线中,策略是「原生嵌入」:Agent直接运行在业务数据所在的系统内,而非外部接入,最大限度减少集成摩擦。
优势是数据和流程的深度整合,无需单独建设数据管道;劣势是生态相对封闭,跨SAP体系外的系统集成需要额外工作。对于深度绑定SAP生态的大型企业,Joule是自然的升级路径;对于多系统混合环境的企业,需要评估互操作成本。
SAP 把 Agentic Process 的战场放在 ERP 核心业务流程上,策略是「原生嵌入」。SAP Joule 整合在 S/4HANA、SuccessFactors、Ariba 等产品线中,Agent 直接运行在业务数据所在的系统内,无需单独建设数据管道,最大限度地减少集成摩擦。
优势是数据整合深、ERP 内的任务链路完整;劣势是生态相对封闭,扩展到 SAP 体系之外的场景需要额外集成工作。
CRM厂商:Salesforce Agentforce 的三层架构
Salesforce 是目前企业软件里把 Agentic Process 商业化做得最系统的公司。
Agentforce 360(2025 年 10 月 发布)将所有 Salesforce 云产品统一在一个 Agentic 架构下,核心是 Atlas Reasoning Engine(推理引擎)+ Data Cloud(统一数据层)+ Agentforce Platform(Agent 构建与编排平台)的三层架构。
目前服务超 18,000 家客户(覆盖 124 个国家),AgentExchange 提供开箱即用的行业 Skills 库。
但Salesforce同时坦承了一个关键教训:首批上线的SDR Agent有30%的概率会回答「我不知道」,经过大量数据清洗和迭代训练,才把这个比率降到10%以下。
这是难得的头部厂商自我揭露,说明即便是最成熟的平台,「数据就绪度」仍是Agentic Process能否产生价值的根本前提,没有例外。
RPA厂商:从确定性执行到自适应执行的升维
UiPath和Automation Anywhere代表了RPA厂商应对Agentic浪潮的两条不同路径。
UiPath 的路径是「在 RPA 基础上叠加 Agentic 能力」。Maestro 编排框架 + Autopilot Agent,使原有 RPA 流程遇到规则之外的情况时,动态调用 LLM 决策,而非直接报错中断。
原有 RPA Robot 变身为 Agent 可调用的「行动执行器」,企业不必推倒现有 RPA 投资,渐进式升级。根据 Accelirate 数据,这种方式相比纯 RPA,自动化覆盖率提升 25 至 60%。
Automation Anywhere的路径是「重构」:推出APA System(Agentic Process Automation Platform),将AI Agent、RPA机器人和流程编排整合为统一平台,允许企业在「完全自主」到「完全人工」之间灵活调节自主度。架构上更先进,对新建场景更友好,但存量迁移成本略高。
对比项 | UiPath Maestro | Automation Anywhere APA |
核心策略 | RPA + Agentic叠加 | 平台级Agentic重构 |
学习成本 | 低(兼容原有流程) | 中(需重新设计部分流程) |
适用场景 | 存量RPA资产优化 | 新建企业自动化体系 |
灵活性 | 中 | 高 |
迁移风险 | 低 | 中 |
大模型厂商:协议制定者的生态影响力
Anthropic的战略是通过制定标准来影响整个生态:MCP协议定义Agent与外部系统的连接标准,SKILL.md规范定义Agent Skills的共享格式,Claude模型专注于更长上下文、更稳定的Function Calling和更强的指令遵循能力。
OpenAI 则以 Function Calling、Assistants API、Realtime API 构建开发者生态,并于 2025 年 3 月采纳 MCP标准,两条路线加速融合。
这两家厂商不直接卖Agentic Process解决方案,但他们是整个生态的基础设施提供商,谁的协议标准成为行业事实标准,谁就掌握了生态话语权。
Agent框架层:开发者生态的三足鼎立
框架层厂商的商业化路径还在探索,但作为构建 Agentic Process 的研发工具,它们不可或缺。企业级场景选型时,优先考虑 SLA 和商业支持能力,而不只是 GitHub Star 数。
框架 | 定位 | 核心优势 | 最适合场景 |
LangChain | 通用Agent开发框架 | 生态最大、文档最全 | 快速原型、中小型Agent项目 |
LangGraph | 有状态Agent图框架 | 支持复杂分支和循环 | 企业级复杂Agentic Workflow |
CrewAI | 多Agent协作框架 | 角色分工、流程编排清晰 | 多专家协作场景 |
AutoGen(微软) | 多Agent对话框架 | 代码执行能力强 | 编程任务、数据分析 |
整体厂商格局汇总对比:
厂商类型 | 代表产品 | 实现路径 | 强项 | 弱项 |
ERP | SAP Joule | ERP内核 + AI推理层 | 数据整合深 | 跨系统能力弱 |
CRM | Salesforce Agentforce | 推理引擎 + 数据云 | 开箱即用,生态完整 | 平台锁定 |
RPA(叠加) | UiPath Maestro | RPA + Agent叠加 | 渐进升级,已有资产复用 | 推理能力依赖外部LLM |
RPA(重构) | AA APA System | 原生Agentic架构 | 自主度高,架构先进 | 成熟度仍在验证中 |
大模型 | Anthropic MCP + Claude | 协议标准化 | 互操作性强 | 需自建上层应用 |
Agent框架 | LangChain/CrewAI/AutoGen | 框架层编排 | 灵活性高,开发者友好 | 企业级支持和SLA弱 |
BPM 会消亡吗?是进化,不是死亡
这个问题值需要单独说清楚。
传统BPM(业务流程管理)系统(如Pega、Appian)的核心价值是流程建模、执行监控和治理合规。这些能力在Agentic时代不会消失,反而会变得更重要。
但BPM的「固定流程图」模式面临根本性挑战。传统BPM假设流程可以被完整预先定义,每个节点的逻辑都可以写成明确规则。Agentic Process打破了这个假设:流程本身可以在运行中动态调整,Agent可以自主决定跳过某个节点或插入一个新的判断步骤。
这让「画好流程图再执行」的设计哲学,在非确定性任务面前显得非常笨重。
可以预见的演化路径是:传统BPM引擎变成Agentic Workflow的「骨架」,提供流程框架、治理规则和审计能力;具体的任务执行节点从「固定脚本」变成「Agentic Process」。Pega和Appian已经在这个方向上做出了明显动作。
换句话说,未来的BPM系统,本质上是Agent Harness的企业级实现,既保留了原有的治理价值,又为Agent自主执行提供了安全边界。
所以BPM不会消亡。但如果BPM厂商不做出这种进化,它的市场份额会被那些能够原生支持Agentic Process的平台蚕食。这是进化,不是替代,但进化是强制性的,不是可选项。
企业转型路径:不是必须,而是一个判断框架
「所有企业都必须立刻转向Agentic Process」是一个危险的命题,被这种压力推着走,不考虑业务成熟度、数据质量、团队能力就仓促上马,正是那开头提及Garner预测的 40% 失败项目的共同成因。
PwC 2025年调查显示,79%的组织「在某种程度上」已采用AI Agent,但真正实现全规模部署的只有2%。对完全自主AI Agent表示信任的组织比例在一年内从43%跌到27%。这说明早期盲目上马留下了大量教训,盲目是问题,但完全不动也在错失窗口期。
但「根本不需要关注」是另一个更危险的极端。
Gartner 预测,2026 年底将有 40% 的企业应用集成 AI Agent,2028 年 Agentic AI 将进入 33% 的企业软件。如果竞争对手用 Agentic Process 把某条核心业务流程的效率提升了 3 倍,你没有相应的认知和方案,连对话的资格都没有。
什么样的流程适合做 Agentic Process 改造?
这里,王吉伟频道给出四个前置判断。
你的流程里有多少「判断点」?每隔三步就需要人来确认的流程,说明里面有大量非确定性判断,这正是 Agentic Process 最擅长接管的部分,价值最高。
你的数据质量够吗?Agentic Process 的推理依赖高质量的上下文信息。数据在多系统里孤立存在、格式混乱、缺乏标注,上了 Agent 只会放大混乱。「先治数,再上 Agent」不是保守派的借口,而是 MIT 研究数据的结论:80% 的工作量在准备工作上。
你能接受多大的错误率?金融清算、医疗诊断等场景对错误率要求接近零,现阶段不适合高自主度的 Agentic Process;内容生成、数据汇总、初步客户分类等场景容错空间大,正是适合早期实验的入口。
你有没有人负责监控?「无人值守」是宣传语,不是架构原则。任何生产环境中的 Agentic Process 都需要人类监督层,不是每步都看,而是设定关键检查点和异常告警。没有这个,就没有安全网,出了事也无法追责。
基于前置判断,这里简单总结了适合做 Agentic Process 流程改造的几个特征。
适合改造的特征:涉及多系统数据聚合和判断;存在大量「看了数据再决定下一步」的节点;业务量波动大,需要弹性扩展;任务目标明确但路径不固定(每次情况都不完全一样);操作不是完全不可逆的,出错后能纠正。
暂时不建议激进改造的特征:操作结果完全不可逆(如金融清算、医疗用药);数据质量极差,系统间接口混乱,「数据就绪度」严重不足;强监管行业且缺乏可解释性合规方案;内部根本没有AI工程能力,只能完全依赖厂商黑盒。
Gartner明确指出,35%的企业将网络安全顾虑列为首要障碍,这不是杞人忧天,是有记录的现实。
三阶段渐进转型路径
下面这3个转型阶段,供大家参考。
第一阶段:流程梳理与优先级评估(1-2个月)。不要急着上Agent。把现有核心业务流程拆开来看:哪些步骤是确定性规则执行,哪些是「需要人判断的非确定性节点」,哪些的错误代价是可以接受的。这是后续所有工作的基础。
MIT的研究结论已经说得很清楚:80%的工作量在「不光鲜」的准备工作上,不要让这80%被跳过。
第二阶段:最小可行Agent(MVP)试点(2-4个月)。选一个低风险、高频、有明确成功指标的流程做第一个Agent。关键原则是「窄范围、可回滚、有监控」。不要一上来就做端到端「大流程Agent」,先在一个子流程上验证整个Agentic Loop是否能稳定运转。
同时建立Agent Harness的基础能力:权限控制、执行日志、异常告警。技术选型上,优先考虑与现有系统生态匹配的方案:已有Salesforce的先用Agentforce,已有UiPath的先用Maestro,技术团队强的可以用LangChain/CrewAI自建。
同时把 Agent Harness 的基础能力建起来:权限控制、执行日志、异常告警,三件事同步做,不能等出了问题再补。
第三阶段:横向扩展与治理体系建设(持续推进)。在MVP验证后,复制成功模式到相邻场景,建立跨Agent的协调框架(Agentic Workflow层),形成企业级APA体系。治理能力与功能扩展同步建设,不能等出了问题才补。
MIT Sloan & BCG调研的2102家组织中,成功的企业不是「解决」了范围与灵活性的张力,而是设计出能在效率与适应性之间动态切换的工作流。这个洞察比任何技术方案都重要。
最后要强调:「转型」不等于「替代」。Agentic Process和传统RPA在相当长的时间内会并存——RPA处理确定性高的规则任务,Agentic Process处理非确定性高的判断任务,两者通过统一的编排平台协同运作。
UiPath的「Maestro + RPA Robot」架构正是这个思路的产品化实现,也是大多数已有RPA存量投资的企业最现实的迁移路径。
市场格局与走向判断
当前市场层次结构
Gartner 2025年10月的判断是:Agentic AI供给严重超过需求,市场修正即将发生。这不是说赛道没有价值,而是说市场会经历一轮淘汰赛,最终留下真正有产业深耕能力的玩家。
对应企业的信任度数据印证了这一判断:对完全自主 AI Agent 表示信任的组织比例在 2025 年从 43% 跌到 27%,一年内大幅下滑。这说明早期盲目上马留下的大量教训正在反噬整个市场的信心,Agent Washing 的代价正在被集体消化。
当前市场大致分为四个层次。
基础设施层:Anthropic(MCP协议、Claude模型)、OpenAI(API生态)、Google(A2A协议、Gemini模型)、微软(Azure AI基础设施、AutoGen框架)。这一层的竞争最终体现在协议标准的话语权上,谁的协议成为事实标准,谁就控制了生态的底层入口。
平台层:Salesforce(Agentforce)、ServiceNow(Now Assist)、SAP(Joule)、Workday(Illuminate)。这是「Agentic Process嵌入企业软件」的主战场,买单方是有成熟CRM/ERP体系的大企业,竞争核心是开箱即用的业务场景深度和数据整合能力。
工具层:UiPath(Maestro)、Automation Anywhere(APA System)、IBM Watson Orchestrate。这是RPA厂商向Agentic升级的主战场,以存量客户转化为主要增长来源,关键能力是对已有RPA投资的兼容性。
框架层:LangChain、CrewAI、AutoGen、LangGraph及垂直行业专用框架。以开发者社区为核心,商业化路径还在探索,但这一层产出的开源生态反哺了整个行业的技术演进速度。
市场规模方面,AI Agents市场2025年约79.2亿美元,预测到2030年企业级Agentic AI市场达245亿美元(CAGR 46.2%),到2034年可能突破2000亿美元。
Gartner预测,2026年底40%的企业应用将集成AI Agent,2028年Agentic AI将进入33%的企业软件。这个增速背后是整个企业自动化市场的重新洗牌,不只是AI领域的增量。
技术演进上,三条技术已经比较清晰。
多智能体协作走向成熟:从单个Agent处理单个Process,升级为Agent团队处理端到端业务。专业化分工的多Agent架构在复杂任务上的性能是量级级别的提升,这个方向会是2026至2027年产品化的主战场。
标准协议生态形成:MCP + A2A + SKILL.md三个协议标准,正在构建Agent生态的基础设施框架。协议标准化意味着不同厂商的Agent可以无缝互操作,将大幅降低企业的平台锁定风险,也将加速整个行业的分工深化。
可信治理框架落地:Agent自主决策的责任归属、行为可解释性、人机协作的权限划分,正在从「工程讨论」走向「监管议题」。欧盟AI法案、美国的AI行政命令,都在把治理要求变成合规硬约束。哪家厂商先把治理框架做成产品,哪家就先拿到强监管行业的门票。
Gartner 预测的市场整合已经开始,那 40% 的失败项目会加速这个进程。对企业来说,选择有长期战略可信度的合作伙伴,比追最新技术噱头重要得多。
后记:掌握流程,掌握未来
Andrew Ng的那句话,到今天仍然精准:未来不是更大的模型,而是更聪明的流程。Agentic Process,正是那个流程本身。
它不是一时风潮。从2023年的实验玩具到2026年的生产力基础设施,这个跨越已经完成。2026年的关键议题不再是「要不要用」,而是「怎么用得稳、用得对」。
机会清单很长:企业流程重构(从RPA升级是最明确的存量市场)、垂直行业专用Agent生态(法律、医疗、财务各有百亿以上机会)、多模态扩展(视觉理解加行动执行,正在打开RPA从未触及的场景)。MIT Sloan & BCG调研的2102家组织中,66%预期Agentic AI将带来运营模式的根本性变化。
但风险同样不能被乐观情绪掩盖。信任度从43%跌到27%(一年内),是一个严肃的信号:市场对那些言过其实的早期部署已经开始厌倦和反弹。幻觉、成本失控、安全合规漏洞、责任归属,这些不是边缘问题,是产业化落地的核心挑战。
Agentic Process填补了传统AI(规则执行或单次生成)与真正自主智能之间的空白,成为连接LLM潜力与现实业务价值的桥梁。掌握它的人和组织,会在未来五年获得决定性竞争优势。