news 2026/7/6 0:31:30

Coze Skills发布,一篇保姆级的Skills解读来了!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Coze Skills发布,一篇保姆级的Skills解读来了!

Datawhale干货

作者:平凡,英国Northumbria University讲师,

计算机博士

在昨晚的直播里,我们深入探讨了一个核心问题:当AI能给出正确答案时,我们真正需要的是什么?

答案往往是:符合我个人或团队特定习惯、格式与质量标准的可交付成果。 有人先快跑,有人先定标准;有人先结论后证据,有人先铺背景再收束——这些长期形成的默认方法论,AI 默认很难稳定复刻。

为了覆盖最多人,AI 往往走“最大公约数”,给出正确但同质的教科书式答案:能解决大部分通用问题,却经常错过你的那部分专业偏好(格式、语气、风险边界、细节标准、交付要求)。

这也正是 Claude 提出的 Skill 概念近期备受关注的原因:它看起来只是“模版 + 例子 + 规则 + 触发机制”,却能把大模型/Agent 的输出从“能答”推到“能交付”。

Skill 的价值就在这:不让 AI 更聪明,而是让 AI 更像你。它把你脑子里的隐性习惯封装成可复用模块,明确输入/输出标准、缺信息怎么追问、哪些不能编、怎样算合格,从而把“个人经验”变成稳定的可交付能力。

但一个新问题随之而来:如何低门槛地、稳定地创建一个Skill,并让它能被他人轻松复用?

扣子这次的重磅2.0升级,给出了一个漂亮的答案。

它不止于借鉴理念,更通过扣子编程等设计,将Skill的创建、调试、发布门槛降到极低,真正推动“个人经验”到“可共享产品”的跃迁。

下面,我就结合直播中的实操演示,为大家拆解 Skill这一爆火的概念以及扣子 Skills 的革新之处。

一、扣子Skills:把AI的随机世界线收束到你要的那条

扣子Skills 最有意思的地方在于:它让这件事从“自己用”走到了“大家用”。你可以把日常的解决方案做成人人可用的 Skill:别人只要按你的输入方式喂材料,就能得到符合你标准的交付物。

我做的这个“大白话数据分析”Skill,就把我平时跟一些社科教授合作的经验流程在扣子上固定了下来。

先把他们的大白话需求转换成专业术语,然后接着做数据预处理、分析、绘图以及最后的报告生成,甚至连报告的格式都可以固定下来,比如很常用的IEEE格式。

很多人第一次听到 Skill,会下意识理解成:“哦,就是我把提示词写得更完整、更细,效果就更稳定。”

这当然有帮助,但还不够。

提示词更像一次性的对话策略:这次我希望你按某种方式回答。而 Skill 更像一个能力模块:我把一套解决问题的方式固化下来,让它可调用、可复用、可迭代。

这是刚刚提到的“非计算机或者统计背景用户的数据分析Skill”,它最核心的就是SKILL.md这个文件,它其实就是一个操作手册,定义了从输入到输出的整体流程,每一步的操作都被确定了下来。

这个流程很像论文写作中的伪代码形式,也是从输入到输出的规范操作,AI的发散性思维会被约束,关注于根据操作规范来处理问题。

这个过程其实就是把世界线收束的逻辑,从输入到输出可能有N种方案,但只有X这个方案才是最适合当前的操作规范。

特别是一些本身就具有 SOP(标准作业流程)的工作,你会发现用扣子Skills来实现的效果几乎是“降维打击”。

为什么?因为 SOP 类任务的本质不是“灵感”,而是稳定性:你要的不是一个看起来不错的答案,而是一套可重复执行、可检查、可交付的流程。

而大模型最麻烦的地方恰恰是“发散”——它太会给你多种可能性了。

在写文章时这可能是优点,但在做交付时,它经常变成缺点:

  • 你要的是一个能用的结果,它给你一堆“可选方案”;

  • 你要的是固定格式,它给你自由发挥;

  • 你要的是可复现,它给你每次都不一样的“灵感版本”。

Skill 的意义,就是把这种发散拉回来:让模型按你的规范走。

二、扣子Skills的原理

扣子Skills背后长这个样子,它的核心刚刚我们说过了,就是SKILL.md这个文件,它规范了一套整体流程,如何从A到B,但只有总纲还不够。

  • assets:包含了可以复用的模板,比如输出样式,可以让agent稳定输出自定义格式;

  • references:作为skill的补充,考虑到了各种情况下的不同处理方案

  • scripts:多为代码文件,被触发时会自动运行并处理

  • requirements:python包文件列表,运行这个skill沙盒所需要的包

可以把扣子skills看成一个沙盒环境,它在启动后会生成一个独立的运行环境,从Skill的启动界面也能看到虚拟机信息。

我的“人话版数据分析Skill”的后台界面和运行demo是这样的,可以看到每一步有哪些功能被调用了,特别是其中的一些tricky问题,比如数据集不完整或者结构不一致。

这么一个 Skill 的创建,在扣子 Skills 出现之前是很复杂的,这也是为什么 Claude Skill 只在小范围内火热,扣子 Skills 把这么一套复杂的流程极简化了,秘密就在于扣子编程,它把技能/Skill 的创建也做成了类似于 Agent 的形式。

你可以通过简单的描述来让扣子编程来完成背后的所有操作。

而原则上只需要一句 Prompt 即可,这是我总结的一套方法论,可以适用于大多数的情况,可以作为一个参考。

因为本身扣子编程背后也是大模型,你描述出你的需求后,它本身也会自主的进行分析,最后给你生成一套完整的 Skill 套装内的所有文件,里面包含了我们开始提到的所有文件。

也对应了后台的创建过程,它同样也是一个自我迭代的过程,分析指令+创建文件+最后的校准。

但是这个过程并不是一蹴而就的,就跟 SOP 的流程需要打磨一样,不可能一开始就有完美的 Skill,所以后续是需要不断迭代的。

迭代有两种方法,Skill 包里面内容是支持编辑的,如果 review 的时候发现有问题可以自己修改。

同样的,如果没有markdonw以及代码经验,可以采用跟扣子编程对话的形式,跟创建初始一样,继续通过对话来让扣子自我迭代。

扣子 Skills 的优势:它把 Skill 从“我能用”推到“大家能用”

现在已经上架的不少 Skill,使用量都已破万。很明显,大家对那些“平时觉得很复杂但又确实需要”的流程型能力是有强需求的,只是现实中的实现门槛太高,往往直接把人劝退。

尤其是我试了官方的视频 Skill:它能把原本需要“规划、找资料、片段合成、配音配乐、转场”等一整套繁琐流程,一次性跑通并做成可用成品。

这是一次性生成的视频。

如果大家想尝试的话,可以用这个Prompt:

生成城市纸雕穿梭视频,分别穿梭杭州、上海、成都、重庆、武汉、黑龙江。16:9比例,一共30s。 画面风格:超精细立体剪纸纸雕艺术创作,采用绚烂彩剪工艺+凸烫金线工艺,前景层层叠构建立体纸雕空间:都市地标群错落排布 + 城市建筑细节 每到一座城市,旁白都会说一句代表这座城市的古诗 视频提示词:立体剪纸纸雕艺术风格,以FPV第一人称视角猛地垂直俯冲, (结合后续城市内容,来撰写丝滑运镜、切换到下个城市的提示词)

只需要选择扣子的“视频”选项,然后再加自己的Prompt即可。

除了官方提供的几个Skills,还有很多领域的专家也把自己的Skill整理上架了,比如这个“一键结构视觉设计”,可以辅助你分析参考网页的视觉DNA。

再比如这个Markdown排版工具,可以一次性的将Markdown文档转换为精美的HTML或者PDF。

这是我用关键词“流场艺术”做的,可以动态调整生成的细节,比如速度、随机程度以及色彩等。

这才过了两天,就已经看到上架了很多的精美Skills。说到这里,其实扣子 Skills 最让我惊讶的,不是它能不能做 Skill,而是它把 Skill 这件事做得更“落地”。我总结下来就三点,比较实在。

第一点:门槛低

以前把经验变成可复用能力,常被工程细节卡住(结构、依赖、脚本、异常等)。扣子把这些劝退点压缩掉:用自然语言描述,它先搭好 Skill 骨架并跑通最小版本,你再迭代打磨,而 Skill 本来就需要不断优化。

第二点:它更擅长把多步操作串起来

Skill 的核心价值在把多步 SOP 串成流程:先检查信息缺口→追问补齐→生成主输出→补齐沟通稿/汇报稿/模板→自检不合格就重写。相比单次生成,这更贴近真实工作推进。

第三点:它更像一个产品形态

当你开始想着“这个 Skill 不只是我自己用,别人也要用”,你会自然变得更认真:输入要更清楚,输出要更固定,边界要更明确,遇到坏数据、缺信息要有兜底。扣子把发布、复用这条路铺得更顺,所以它会逼着你从“写提示词”变成“做一个别人敢用的东西”。这一步一旦跨过去,你沉淀下来的就不只是效率,而是一套可以不断迭代的能力资产。

这也是我觉得扣子 Skills 有意思的地方:它不是让模型突然聪明很多,而是把你的那套默认解法固定下来,让结果从“看起来可以”变成“真的可以交付”。你以为只是习惯,但当它能被反复调用、能被别人用、还能持续迭代的时候,它就开始有产品的味道了。

最后留一个最简单的判断题:你最近一个月里,有没有一件事你重复做了 10 次以上,而且你能把它“做成”,但别人经常做不成?如果有,它大概率就是你最值得做成 Skill 的那条“世界线”。


一起“赞”三连

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/1 21:38:25

GPEN能否用于医学影像增强?X光片测试结果披露

GPEN能否用于医学影像增强?X光片测试结果披露 1. 引言:从人像修复到医学影像的跨界探索 你可能已经听说过 GPEN —— 一个专注于人脸肖像增强与老照片修复的AI工具。它擅长让模糊的人脸变得清晰,让褪色的照片重获细节,甚至能“无…

作者头像 李华
网站建设 2026/6/26 11:59:58

开源AI基础设施新选择:Qwen3嵌入模型集群部署实战案例

开源AI基础设施新选择:Qwen3嵌入模型集群部署实战案例 1. Qwen3-Embedding-0.6B 模型特性解析 1.1 多任务能力与性能优势 Qwen3 Embedding 系列是 Qwen 家族中专为文本嵌入和排序任务打造的最新成员,基于强大的 Qwen3 密集基础模型构建。该系列覆盖了…

作者头像 李华
网站建设 2026/7/1 18:04:09

Sambert vs FastSpeech2:中文TTS部署性能全方位对比评测

Sambert vs FastSpeech2:中文TTS部署性能全方位对比评测 1. 中文语音合成的两大主流方案:Sambert与FastSpeech2 你有没有遇到过这样的场景?需要为一段产品介绍生成配音,但找专业配音员成本太高,自己录又不够专业。这…

作者头像 李华
网站建设 2026/7/1 21:39:24

Qwen-Image-Layered+ComfyUI搭建指南,本地运行超简单

Qwen-Image-LayeredComfyUI搭建指南,本地运行超简单 1. 为什么你需要图层化图像编辑能力 你有没有遇到过这样的问题:想把一张产品图里的背景换成纯白,但边缘总带毛边;想给海报中的人物换件衣服,结果连头发都糊成一片…

作者头像 李华
网站建设 2026/7/1 22:59:55

Excel逻辑函数四剑客:AND、OR、NOT、XOR从基础到高阶实战指南

当你的数据需要做出“且”、“或”、“非”、“异或”的判断时,这四大逻辑函数就是Excel中最高效的决策引擎。 一、AND函数:严格的“全达标”检查官 核心机制与特性 AND函数执行逻辑与运算:所有条件都为TRUE时才返回TRUE,否则返…

作者头像 李华
网站建设 2026/6/26 12:00:06

儿童绘本创作新方式:Cute_Animal_Qwen镜像实战应用

儿童绘本创作新方式:Cute_Animal_Qwen镜像实战应用 1. 让孩子喜欢的动物图片,一句话就能生成? 你有没有试过给孩子讲睡前故事时,想配几张可爱的动物插图,却找不到风格匹配的图片?或者想做一本专属的儿童绘…

作者头像 李华