news 2026/4/8 18:11:37

更新啦!我用 Claude Skills 做的剪辑 Agent!识别效果+交互大升级

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
更新啦!我用 Claude Skills 做的剪辑 Agent!识别效果+交互大升级

大家好,我是成峰。

剪辑 Skills 更新了。

上一版发出去后,收到很多反馈:

最多的问题是两个:

  • 下载 5GB 模型要等几十分钟,很多人直接放弃了

  • 文档里一行行找口误,太累了

所以这次做了一次大改:

替换了火山引擎的音视频识别模型,提升了交互界面。

效果怎么样?直接对比剪映:

剪辑 Skills:

剪映:

同样一段视频,剪映漏掉的口误,AI全识别出来了,并且也有更好的展示效果。

三个核心改进

根据用户反馈,这次主要更新了三个方面。

1.更快:API 替代本地模型

上一版需要下载 5GB 的本地模型,很多人反馈下载太慢。

这次直接换成 API 调用。

  • 下载快:不用等几个小时下模型

  • 运行快:API 服务器比你的电脑快得多

2.更准:口误识别系统重构

以前的口误识别比较粗暴,现在整个系统重构了。

模型替换

豆包的音视频字幕,是我体验下来识别最准的。

(感谢 @极客杰尼 提供情报)

AI语义理解

现在 AI 会逐段分析:

根据规则判断每一段:静音、重复句、卡顿词、语气词……

用户习惯透明化

所有的识别规则,都放在一个独立的文件夹里:

你觉得哪条规则不对,直接改文件就行。想加新规则,新建一个 md 文件就行。

3.更直观:可视化审核界面

这是最大的改进。

以前剪辑完成后,AI 会在命令行里输出一个审查稿。你需要在文本里找问题,然后告诉 AI 要改哪里。

现在启动剪辑后,会自动启动一个审核服务。

打开浏览器,你能看到一个类似剪映剪口播的界面:

额外多加了两个功能:

功能 1:加速按钮

可以倍速听完整个视频。

功能 2:复制删除列表

这个功能是给 AI 学习用的。

确认审核结果后,点击「复制删除列表」,把删除的片段信息复制出来,然后告诉 AI。AI 会分析你的表达习惯,下次剪辑时就能更准确地识别。

这就是我一直强调的自更新机制—— 越用越懂你。

使用方法

过程更加简单了,15 分钟搞定。

第1步:下载 Skills(1分钟)

帮我下载剪辑 Skills: - 地址:https://github.com/Ceeon/videocut-skills - 存放路径:.claude/skills/(直接克隆到此目录,不要创建子文件夹)

第2步:配置 API Key(3分钟)

这次用的是火山的「音视频字幕生成」能力。

它有试用,免费 20 个小时:

登录火山的模型管理,开通 “音视频字幕生成”:

获取 API Key:

输入/v,选择videocut:安装,输入 API Key,完成配置。

第3步:剪口播(10分钟)

输入/v,选择videocut:剪口播,输入视频路径。

AI 会自动: 1.调用 API 转录 2.启动审核本地服务 3.给一个审核界面的链接

打开链接,就能看到审核界面:

我们可以在这里检查 AI 识别得准不准。

操作方式:Shift + 拖动,选中或取消选中片段。

四个功能按钮

1.播放— 和剪映一样,自动跳过已选中的片段 2.倍速播放— 剪映没有的功能,说话慢的视频可以加速听 3.复制删除列表— 如果差别特别大,可以把自己的删除结果复制给 AI 学习用,它会学习你的习惯 4.执行剪辑— 确认无误后,点击自动完成剪辑

剪辑完成后,它就会多出来一个名称结尾叫cut的视频。

第4步:加字幕(3分钟)

和之前一样,输入/v,选择videocut:字幕

记得在词典文件里加入你的专有名词,字幕准确率会更高。

四步搞定,全程可视化。

如果你之前试过觉得麻烦,这次可以再试试。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/28 17:18:12

学员焕发第二春,这个月收入破7000+

独孤实操AI项目,已经有一段时间了。 带的团队和学员。 来自各行各业的。 其中有个学员,之前做餐饮服务员。 加入AI项目前,问东问西。 问的问题很幼稚,独孤都不想理他了。 但是他对这个项目很坚持。 非要付费报名参加。 没…

作者头像 李华
网站建设 2026/4/2 11:19:37

保姆级教程:ccmusic-database/music_genre音乐分类Web应用部署

保姆级教程:ccmusic-database/music_genre音乐分类Web应用部署 1. 这个应用到底能帮你做什么? 你有没有遇到过这样的场景: 收到一段朋友发来的无名音频,听了几秒却猜不出是爵士还是电子?做音乐推荐系统时&#xff0…

作者头像 李华
网站建设 2026/4/6 2:07:30

FLUX.1-dev效果实测:比SDXL更强的光影表现,附案例展示

FLUX.1-dev效果实测:比SDXL更强的光影表现,附案例展示 1. 开箱即用:为什么这次实测值得你花5分钟看完 你有没有试过这样的情景——输入一段精心打磨的提示词,点击生成,结果画面里阳光的方向乱了、玻璃反光像贴纸、人…

作者头像 李华
网站建设 2026/4/6 22:58:28

深度测评9个降AI率工具 千笔AI帮你轻松降AIGC

AI降重工具的崛起:让论文更“自然”的秘密武器 在如今的学术写作中,AI生成内容(AIGC)已经成为一种常见现象。然而,许多学生发现,使用AI工具撰写论文后,查重率偏高、AI痕迹明显,甚至…

作者头像 李华
网站建设 2026/4/8 14:07:32

PHP机械制造大文件上传进度条展示方案?

要求:免费,开源,专业技术支持 前端:vue2,vue3,vue-cli,html5,jquery,webuploader 后端:php 服务器:linux,centos,Windows, 数据库:MySQL,达梦数据库,人大金仓 平台:Windo…

作者头像 李华
网站建设 2026/4/4 1:18:48

LLaVA-1.6-7B新功能实测:4K分辨率图片识别体验

LLaVA-1.6-7B新功能实测:4K分辨率图片识别体验 你有没有试过把一张高清商品图、一张复杂信息图表,甚至是一张高像素手机拍摄的风景照丢给多模态模型,结果它只盯着角落里的一个按钮说“这是一个圆形物体”?或者更糟——直接忽略关…

作者头像 李华