news 2026/4/23 0:48:55

别再让AI“自由发挥“了!Anthropic新架构:教会AI“专业技能“,小白也能成为大模型架构师

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
别再让AI“自由发挥“了!Anthropic新架构:教会AI“专业技能“,小白也能成为大模型架构师

01

破除“智能”幻觉:我们过度设计了逻辑,却忽略了经验

在 AI Agent 的开发一线,最令人沮丧的并非模型的“幻觉”,而是其 不稳定性(Inconsistency) 。开发者们往往陷入一种怪圈:堆砌冗长的 System Prompt,设计复杂的 Few-shot 示例,构建繁琐的重试机制,但 Agent 在执行特定任务时依然像个捉摸不定的实习生。

我们面临的核心矛盾在于:我们拥有的是高智商的机器,而非有经验的专家。 我们过度设计了推理逻辑,却在“经验标准化”上投入太少。 Anthropic 提出的“技能(Skill)”范式,正是要实现 智能与逻辑的解耦 ,将不确定的 AI 推理转化为可重复的工程资产。

02

博学者还是专业人士?一致性胜过高智商

在商业落地中,企业真正需要的是什么?Anthropic 的工程师 Barry Zhang 和 Mahesh Murag 提出了一个尖锐的对比:

面对 2025 年的报税任务,你会选择谁?

Mahesh:

智商 300 的天才,能从第一性原理推导数学逻辑,但对税法一窍不通。

Barry:

拥有 20 年经验的资深税务专家。

答案显而易见。你不需要天才在你的税单上现场推演税法,你需要的是 稳定、一致的行业经验执行 。当前的 Agent 瓶颈在于它们太像 Mahesh:聪明、灵活,但每次任务都是一场“即兴发挥”。

正如技术专家 Jiang Yanqing 所言:“你不会希望在报税时让天才从零开始推导税法。”商业价值往往诞生于“一致性”而非“灵感”。

03

文件夹即技能:回归文件系统的极简力量

Anthropic 对“技能”的定义极其硬核且实用: 技能是一组组织的文件夹(Collection of files),其核心是一个 SKILL.md 文件。

这并非简单的重命名,而是一次架构层面的范式转移:

代码作为通用接口:

模型不再仅仅是通过对话进行交互,而是通过运行环境(Runtime)操作文件系统和执行脚本。这种“薄脚手架(Thin Scaffolding)”设计,让 Agent 的核心逻辑简化为 Bash 指令和文件操作。

解耦 MCP 与技能:

这是一个关键的架构界限。 MCP (Model Context Protocol) 负责“管道连接(Plumbing)” ,即与外部世界的连接性;而 技能(Skills)负责“大脑专业知识(Expertise)” ,即程序化知识的封装。

可重用的经验包:

技能可以包含脚本(Python/Bash)、二进制文件或资产。当 Claude 发现自己反复编写同样的样式处理脚本时,它可以将其保存为“技能”,供“未来的自己”直接调用。这种可迁移的学习(Transferable Learning)让 Agent 具备了跨session的记忆。

04

渐进式披露:保护昂贵的上下文窗口

为了让 Agent 能够扩展到拥有成百上千项技能,Anthropic 引入了 渐进式披露 (Progressive Disclosure) 机制。

在运行时,模型最初仅感知到技能的 元数据(Metadata) ——即知道自己“有这个能力”。只有当任务触发该技能时,Agent 才会读取 SKILL.md 中的详细核心指令。这种模块化设计确保了有限的上下文窗口(Context Window)不会被无关的工具说明填满,实现了真正的可组合性。

05

新计算堆栈:模型是处理器,技能是应用

AI 架构正迅速向传统计算机系统靠拢。我们可以清晰地定义这个新堆栈:

传统计算组件AI Agent 架构角色定义
处理器 (Processor)模型 (Models)廉价且通用的计算力
操作系统 (OS)运行环境 (Runtime)管理 Token 输入输出与文件系统
应用程序 (Applications)技能 (Skills)核心价值:封装的领域经验

行业共识正在形成:“智能是廉价的,技能是稀缺的 (Intelligence is cheap, Skills are scarce)”。

企业的护城河将不再是模型本身,而是那一组组封装了专有工作流、品牌规则和机构习惯的 SKILL.md 库。

06

确定性的力量:非技术人员的“超能力”

“技能”范式的最大红利在于:它赋予了业务专家(如财务、法务、招聘人员)直接“教导”AI 的能力。这种转变带来了“可信的枯燥感(Trustworthy Boringness)”。

以 Jiang Yanqing 的“下一代分析 Agent”为例:

不再自创定义:

通过 SKILL.md 预设 SQL 模板,Agent 必须执行经过审计的指标定义(如毛利率计算),而非现场发挥。

人机协同(Human-in-the-Loop):

技能可以声明 必需参数 。如果用户提问中缺失关键维度(如时间跨度),Agent 会触发 UI 提示。

这种从“自由创作”到“执行剧本”的转变,已经在生命科学(Cadence 的 EHR 数据分析)和企业协同(Notion 的工作空间研究)等领域产生实效。

07

结语:从“构建 Agent”到“教导 AI”

我们正处于从“重复造 Agent 轮子”转向“沉淀组织知识”的拐点。 SKILL.md 的标准化格式确保了知识的持久性:Claude 今天写下的逻辑,可以被未来更强大的模型版本直接继承。

未来的 AI 员工,入职第一天就应拥有访问团队“技能文件夹”的权限。它无需重新学习,因为它加载的是你团队累积数年的最佳实践。

一个启发性的问题: 当智能变得唾手可得,你的组织有哪些不可替代的、累积多年的“行业经验”,值得被立即编码进 SKILL.md 中?

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 0:51:39

导师严选8个AI论文软件,MBA毕业论文高效写作必备!

导师严选8个AI论文软件,MBA毕业论文高效写作必备! AI 工具助力论文写作,高效与精准并存 在当前的学术环境中,AI 工具已经成为许多 MBA 学生和研究者不可或缺的助手。尤其是在撰写毕业论文的过程中,如何在保证内容质量的…

作者头像 李华
网站建设 2026/4/18 20:21:59

收藏!大模型应用开发:程序员突破内卷的百万年薪新赛道

2025年春季,一则招聘动态在程序员圈层引发轩然大波:国内某头部科技企业为“大模型应用开发工程师”岗位开出154万年薪,这并非博人眼球的营销操作,而是招聘市场中真实达成的就业案例。当“35岁职业天花板”“技术内卷致身心俱疲”成…

作者头像 李华
网站建设 2026/4/20 6:17:08

Unity游戏翻译工具终极攻略:3步搞定多语言游戏体验

Unity游戏翻译工具终极攻略:3步搞定多语言游戏体验 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 还在为玩不懂外文游戏而烦恼吗?这款智能翻译插件能让你的Unity游戏瞬间说中文&a…

作者头像 李华
网站建设 2026/4/18 4:27:20

终极无配置远程游戏串流完整解决方案

终极无配置远程游戏串流完整解决方案 【免费下载链接】Internet-Hosting-Tool Enable Moonlight streaming from your PC over the Internet with no configuration required 项目地址: https://gitcode.com/gh_mirrors/in/Internet-Hosting-Tool 想要在任何地方畅享PC游…

作者头像 李华
网站建设 2026/4/17 20:08:18

Java 多模型管理难题?JBoltAI 路由网关高效破解

在AI大模型应用爆发的当下,越来越多Java企业开始采用“多模型并行”策略:用GPT-4处理复杂推理、国内合规模型承载敏感数据、开源DeepSeek覆盖高性价比场景、专有模型执行特定业务任务。然而,这种“大模型杂货铺”模式却让Java技术团队陷入前所…

作者头像 李华