news 2026/2/19 5:52:32

【AI开发新范式】Anthropic颠覆认知:停止制造“Agent动物园“,通用Agent+Skills才是王炸!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【AI开发新范式】Anthropic颠覆认知:停止制造“Agent动物园“,通用Agent+Skills才是王炸!

当全世界都在狂造Agent,Anthropic说:停一下

过去一年,AI行业陷入了一场"军备竞赛":OpenAI、Google、Meta,从大厂到创业团队,几乎所有人都在疯狂构建AI Agent。财务Agent、法务Agent、运营Agent……似乎未来就是"无穷无尽的智能体"时代。

但就在这股热潮中,Anthropic突然踩了刹车,给出了一个反直觉的建议:别再造那么多Agent了,未来是通用Agent + Skills(技能库)

这不是唱反调,而是一次底层范式的重构。

“智能体动物园”:Agent越多,债越大

Sam Altman有个很直白的比喻:现在管理Agent就像带一群初级员工——你给任务,它产出,你质检,打回去返工,再拼装。听起来很爽,但现实是管理成本会迅速转移到你身上

问题出在哪?当你为每个业务场景复制粘贴一个新Agent,表面上能力在增长,实际上你在积累三种债:

维护债:每个Agent都有自己的prompt、工具链、权限、评测集。十个Agent = 十套系统,版本一乱就是灾难。

专业债:通用模型很聪明,但不专业。它会生成看起来很对的财务报表,但字段定义、审批流程、合规口径全是错的。企业要的不是灵感,是一致性。

知识债:同一条业务规则在五个Agent里各写一遍,还可能版本不一致。上下文窗口有限,想把所有规则塞进去?代价是成本暴涨、调试困难。

这就是所谓的"智能体动物园"——不是夸张,而是工程必然。当你用复制粘贴扩展能力,就会用维护地狱来还债。

Anthropic的答案:别造人,造"入职手册"

Anthropic的逻辑很工程化:别再造一堆不同的Agent,保留一个通用Agent内核,把专业经验做成可复用的技能包

这个心智切换非常关键。它把竞争焦点从"谁的prompt更长"切到"谁能把流程知识模块化、版本化、可组合"。

用一个接地气的比喻:通用Agent就像新员工,智商高、工具会用,但不了解你公司的流程。传统做法是每来一个新岗位需求就重新招人,结果岗位越多、维护越炸。Skills的做法是给同一个新人发不同的入职手册——财务一本、法务一本、招聘一本。哪天流程改了?改手册,所有人同步更新。

Cloud Skills:不是提示词,是流程资产

那Skills到底是什么?它不是更长的提示词,而是一组为Agent打包的、可组合的流程性知识

三个关键特征:

流程性:不是告诉Agent"财务报表是什么",而是"怎么做"——先拉数据、再校验、再汇总、再套模板、最后出具。

可组合:像搭积木一样。同一条链路里可以同时用"数据分析skill"+“合规审查skill”+“报表格式化skill”。

可执行:确定性的部分交给脚本跑(计算、转换、生成文件),模型负责规划、选择、解释。这让Agent从"能聊两句的助手"变成"可交付的系统"。

技术上,Skill以skill.md为入口,包含元数据、执行指南、配套脚本。最大的好处是它天生适配Git——评审、版本管理、回滚,你终于可以像管代码一样管业务流程了。

工程魔法:渐进式披露与代码执行

Skills能扩展到大规模,核心靠两个工程设计:

渐进式披露:启动时只加载技能的元数据(名字、描述),Agent知道"有什么"但不把细节塞进上下文。触发时才读取skill.md,需要更多材料时再按需打开。结果是:技能库可以无限扩,上下文却不会爆。

代码执行:让模型用自然语言逐token生成排序结果?又贵又不稳。Skills允许把确定性任务写成脚本,Agent需要时直接运行。模型负责决策,Runtime负责稳定交付

这两个设计让Skills不再是"玄学",而是可观测、可调参、可评测的工程系统。

MCP + Skills:连接能力 + 业务方法

很多人会问:MCP和Skills是什么关系?

一句话:MCP解决"能连什么",Skills解决"怎么把事做对"

MCP是工具和数据源的标准接口层,让Agent能连CRM、网盘、数据库。Skills是工作流和规范层,告诉Agent步骤怎么走、边界是什么、输出格式怎么写。

典型企业任务就是两层组合:先通过MCP拉数据 → 用分析Skill做指标口径 → 用报表Skill输出到模板 → 通过MCP写回知识库或发到协作工具。

组织变革:技能资产成为新护城河

从多Agent切到通用Agent+Skills,团队分工会被迫重写:

AI产品经理:不再排功能列表,而是规划技能资产组合。要追的不是Agent数量,是Skills的覆盖面、复用率、质量标准。

架构师:补齐企业治理——技能目录、权限模型、发布流水线、可观测性。Skills要进企业,就必须像软件一样被治理。

开发者:重心转向知识工程——写可执行的SOP、写确定性脚本、做上下文编排。还会更频繁地跟领域专家共创,把口头经验翻译成可版本化的资产。

业务专家:这是最颠覆的——会计、法务、招聘这些非技术角色也能直接写Skills。当业务能写,平台就必须给模板、给规范、给评审机制,否则你会得到"技能库里的野生SOP"。

技能市场与生态分化

一旦标准化,下一步自然是市场化。Linux基金会已成立AAIF推动Agent互操作标准,技能目录、技能应用商店正在路上。

两类Skills会分化:

  • 通用Skill:报表处理、文档生成等,可跨企业迁移
  • 私有Skill:企业内部SOP、合规规则,沉淀组织独特经验

对从业者来说,未来的竞争力可能不是会写Agent,而是能把领域经验做成可迁移、可审计、可组合的Skill包。这是新的分发单元。

一句话总结

当模型越来越通用,真正拉开差距的不是你有多少Agent,而是你把多少组织经验沉淀成了可复用、可治理、可分发的Skills

知识组织方式,正在成为AI时代的新核心竞争力。

那么,如何系统的去学习大模型LLM?

作为一名深耕行业的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/15 17:19:16

Open-AutoGLM技术全貌曝光(20年AI专家亲述架构设计逻辑)

第一章:Open-AutoGLM的技术到底是啥Open-AutoGLM 是一个面向自动化自然语言理解与生成任务的开源框架,其核心技术融合了图神经网络(GNN)与大规模语言模型(LLM)的协同推理机制。该架构通过构建语义-逻辑双通…

作者头像 李华
网站建设 2026/2/7 22:25:00

Java计算机毕设之基于springboot的深圳市体育中心体育赛事管理、场地管理、场地预约管理、赛事管理(完整前后端代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/2/18 15:54:45

TensorFlow镜像中的随机种子控制:保证实验可复现性

TensorFlow镜像中的随机种子控制:保证实验可复现性 在一次CI/CD流水线的例行构建中,某自动驾驶团队发现同一模型版本连续两次训练出的感知精度相差超过0.8%——代码未变、数据一致、GPU环境相同。问题最终追溯到一个看似微不足道却影响深远的细节&#x…

作者头像 李华