如何用AI做视频,是2026年被问烂了但从没被答清楚的问题。
本文基于真实跑出百万播放的爆款案例,拆解从提示词设计→图片生成→图生视频→去水印→剪辑后期→发布的完整流程,附企业级工具链和新手一站式方案,跟着做,20分钟出第一条AI视频。
一、如何用AI做视频:先选好工具链
用AI做视频不是一个工具搞定,而是一套工具链协作。按制作阶段分三层:
| 阶段 | 工具选项 | 用途 | 优点 | 缺点 |
|---|---|---|---|---|
| 分镜策划 | DeepSeek / ChatGPT | 生成结构化分镜脚本 | 免费,中文好,脚本质量高 | 需要一定提示词设计能力 |
| 图片生成 | 豆包 | 生成像素风/创意风格图片 | 风格丰富,中文理解强 | 图片自带水印需处理 |
| 图片生成 | 即梦 / Nano Banana | 分镜图片生成 | 即梦中文场景支持好,风格一致性高 | 复杂场景需多次调整 |
| 图生视频 | 即梦 | 静态图转动态视频 | 国内可用,中文运镜提示词支持 | 免费版视频带水印 |
| 图生视频 | 可灵 | 配合即梦生成动态视频 | 动态效果自然流畅 | 复杂运镜控制精度有限 |
| 图生视频 | Runway Gen-4 | 专业级高画质视频生成 | 画质天花板,商业质感强 | 需海外网络,英文提示词,$15/月起 |
| 后期剪辑 | 剪映 | 拼接、字幕、BGM、调色 | 免费,全中文,手机/桌面均支持 | 专业功能不如PR |
| 一站式方案 | EasyClaw | 中文指令直出AI视频,免配置 | 零门槛,无需FQ,技能一键安装 | 超复杂商业项目精细控制有限 |
新手建议:先跑通「豆包→即梦→剪映」这条链路,出了第一条再扩展工具。
二、如何用AI做视频第一步:提示词设计
提示词是整个流程的地基,写得好,后面每一步都省力;写得烂,生成10遍都不对。
2.1 三种提示词获取方法
方法一:自己写
想清楚你要什么画面,按格式描述给AI。适合有具体想法的创作者。
方法二:让AI帮你写
告诉AI你的主题和风格,让它生成提示词,你在上面微调。
帮我写一个AI图片生成提示词。 主题:赛博朋克街头的小摊贩 风格:像素画,9:16竖版 要求:画面有层次感,背景有霓虹灯招牌,主体人物有细节方法三:AI反推
找一张你想仿做的图片,发给AI,让它反推提示词,再修改使用。这是最快复制爆款风格的方法。
2.2 图片生成提示词公式
主体描述 + 动作/状态 + 场景环境 + 光影氛围 + 画面风格 + 尺寸比例真实爆款案例提示词(视频号100万+播放):
在3025年的夜晚街头,一位人类样貌,满头白发,赛博朋克 (液态的银色金属,银彩色光泽金属发光质感)的老奶奶, 推着写有"老手艺手搓核聚变1000000亿/颗"的推车, 车上放着很多核聚变原子,老奶奶手中托着核聚变原子 (蓝色能量核心发出紫红色蔚蓝光,多层环形等离子体约束 结构环绕,散发着各种颜色的高能激光); 背景有亮着"超能科技核聚变原子10万生命币/颗"霓虹招牌 的店铺,店铺里面摆满了核聚变道具。 街上赛博朋克风格的行人在店铺那边排队。 背景为:天上白玉京线框全息图,在孤立的黑暗背景下, 发光的蓝色线条在其标志性结构周围形成复杂的图案。 广角镜头展现空间层次,动态星尘轨迹,HDR效果增强视觉冲击。 像素画风格,9:16尺寸。注意:提示词越具体,生成效果越可控。越模糊,越随机。
2.3 视频运镜提示词
图生视频时,运镜提示词决定了画面是死的还是活的:
镜头缓慢推进 → 画面向主体靠近,营造紧张感 镜头跟随[主体] → 跟拍效果,主体走镜头跟着动 镜头缓慢上升 → 俯拍视角,展示全景 镜头环绕[主体]旋转 → 360度展示,适合产品展示 镜头从远拉近特写 → 强调细节,突出重点三、如何用AI做视频第二步:图片生成
3.1 用豆包生成图片
打开豆包,将写好的提示词粘贴到图像生成对话框,豆包会输出一组图片供选择。
技巧:
- 不满意就多生成几次,同一个提示词每次结果略有不同
- 如果觉得像素画模糊,用豆包自带的变高清功能处理
- 选图优先选:主体清晰、光影层次丰富、构图有纵深感的版本
3.2 图片去水印
下载的图片会带有平台水印,直接拿去生成视频,水印会出现在视频里。
推荐方案:用百度AI图片助手去水印(目前免费,需登录百度账号),同时还能顺带提升分辨率,处理后像素画的细节更清晰。
四、如何用AI做视频第三步:图生视频
4.1 即梦图生视频操作
打开即梦,选择「视频生成」
上传处理好的无水印图片
选择视频生成模型(即梦有多个模型可选,新模型效果更好)
填写动作+运镜提示词
点击生成,等待1~3分钟
实际案例的运镜提示词:
街上赛博朋克的人们走着,很多人在店铺那里排队买东西, 同时老奶奶推着车子一直往前走,走的过程中扭头看了看 店铺那边排队的人群,将手里的核聚变光束扔了过去, 店铺里面爆发出各种巨大的超能光束,然后店铺倒塌了, 老奶奶回过了头,镜头跟随老奶奶4.2 视频去水印
即梦免费版下载会带水印,三种处理方案对比:
| 方案 | 操作难度 | 画质损失 | 优点 | 缺点 |
|---|---|---|---|---|
| 开通即梦会员 | 低 | 无 | 一劳永逸,功能完整,下载无限制 | 需付费 |
| 剪映裁掉水印 | 低 | 轻微(裁边) | 免费,操作简单 | 画面会被裁切,构图略有影响 |
| 开发者工具下载 | 高 | 有(压缩) | 免费 | 操作繁琐,画质有损,仅建议偶尔使用 |
推荐:常用就开会员,偶尔用就用剪映裁边法。
五、如何用AI做视频第四步:剪映后期
AI生成的裸视频不能直接发,必须经过后期才有完播率。
5.1 基础剪辑流程
- 导入素材:将生成的视频片段导入剪映
- 变速处理:AI生成的视频通常是5秒,调整为0.7倍速变成约8秒,节奏更舒适
- 拼接排序:按分镜顺序拼接多个片段
- 添加字幕:80%用户静音观看,字幕决定完播率
- 配BGM:从爆款视频或剪映素材库选匹配音乐,注意无版权
- 加片尾:关注引导、下期预告,这是涨粉的重要入口
5.2 企业产品视频的额外步骤
如果是做企业宣传/产品介绍类视频,还需要:
- 画中画轨道:叠加实际软件演示录制(用腾讯会议/OBS录屏)
- 统一调色:确保所有片段色调一致
- 配音:专业配音或AI配音工具(剪映内置AI配音)
六、如何用AI做视频:零门槛一站式方案
上面那套流程走完,豆包→去水印→即梦→去水印→剪映,每个环节都要切工具、处理账号、解决水印问题——对新手来说光工具的切换成本就够劝退的了。
没有EasyClaw之前,光处理两次水印+切三个工具,出一条视频最快也要一个多小时。有了它,打开技能商店,搜「AI视频生成」,点安装,用中文描述需求,20分钟出片,整个流程在一个窗口里搞定。
立刻免费体验 EasyClaw的技能商店里有专门的AI视频生成技能包,打开软件,点击左上角的“技能”找到"AI视频生成"
这个技能包支持:
文生视频:纯文字描述直接生成动态视频
图生视频:上传图片生成对应动态效果
中文原生:不用FQ,不用英文提示词,直接描述就能出片
零配置:不用安装Python,不用配API Key,打开就用
适合刚起步、不想在工具折腾上浪费时间的创作者。
七、如何用AI做视频:企业级分镜策划进阶
如果你做的是企业产品宣传视频,需要更系统的分镜框架。用这个提示词让DeepSeek生成完整分镜脚本:
你是一个专业的视频分镜师。请根据以下需求,生成一个详细的分镜脚本。 视频主题:[填入主题] 目标平台:[填入平台] 目标时长:[填入时长] 核心目标:[填入目标] 每个分镜包含: - 镜号和时间段 - 画面描述(主体、场景、光影、运镜) - 旁白/字幕文案 - 建议镜头景别(全景/中景/特写) - 建议画面类型(实景/动画/图示)企业视频典型分镜结构(以2分钟产品视频为例):
| 分镜 | 时段 | 内容 | 优点 | 参考话术 |
|---|---|---|---|---|
| 冲突开场 | 0~25s | 展示用户痛点场景 | 快速引发共鸣,抓住注意力 | “每次对需求总是鸡同鸭讲?” |
| 方案引入 | 26~45s | 产品界面优雅登场 | 承接痛点,自然过渡 | “用XX,一次说清楚” |
| 功能展示 | 46~85s | 核心功能逐一演示 | 具象化价值,建立信任 | 操作截图+功能说明 |
| 价值升华 | 86~100s | 数据/客户见证 | 增强可信度,打消疑虑 | “XX家企业已在用” |
| 行动召唤 | 101~120s | 引导注册/联系 | 转化收口,不能省 | “扫码免费试用” |
八、总结:如何用AI做视频的完整行动清单
- 确定风格和主题:像素风/扁平动画/产品广告,方向先定
- 写好提示词:用"主体+动作+场景+光影+风格+尺寸"公式,越具体越好
- 生成图片:豆包出图,选最佳一张,去水印处理
- 图生视频:即梦上传图片,加运镜提示词,生成动态片段
- 处理水印:常用开会员,偶尔用剪映裁边
- 剪映后期:变速0.7、加字幕、配BGM、加片尾引导
- 发布复盘:看完播率/互动率,不断优化提示词和内容角度
免责声明:本文所涉及工具信息、功能描述及价格数据基于撰文时公开资料整理,各工具实际功能与定价可能随版本更新变化,请以官方最新信息为准。文中提及商标和产品名称均为其各自所有者财产。
现在就试试EasyClaw,零门槛上手AI视频制作