如何用AI做视频？2026年从提示词到百万播放的完整实操指南-平芜编程栈

如何用AI做视频，是2026年被问烂了但从没被答清楚的问题。

本文基于真实跑出百万播放的爆款案例，拆解从提示词设计→图片生成→图生视频→去水印→剪辑后期→发布的完整流程，附企业级工具链和新手一站式方案，跟着做，20分钟出第一条AI视频。

一、如何用AI做视频：先选好工具链

用AI做视频不是一个工具搞定，而是一套工具链协作。按制作阶段分三层：

阶段	工具选项	用途	优点	缺点
分镜策划	DeepSeek / ChatGPT	生成结构化分镜脚本	免费，中文好，脚本质量高	需要一定提示词设计能力
图片生成	豆包	生成像素风/创意风格图片	风格丰富，中文理解强	图片自带水印需处理
图片生成	即梦 / Nano Banana	分镜图片生成	即梦中文场景支持好，风格一致性高	复杂场景需多次调整
图生视频	即梦	静态图转动态视频	国内可用，中文运镜提示词支持	免费版视频带水印
图生视频	可灵	配合即梦生成动态视频	动态效果自然流畅	复杂运镜控制精度有限
图生视频	Runway Gen-4	专业级高画质视频生成	画质天花板，商业质感强	需海外网络，英文提示词，$15/月起
后期剪辑	剪映	拼接、字幕、BGM、调色	免费，全中文，手机/桌面均支持	专业功能不如PR
一站式方案	EasyClaw	中文指令直出AI视频，免配置	零门槛，无需FQ，技能一键安装	超复杂商业项目精细控制有限

新手建议：先跑通「豆包→即梦→剪映」这条链路，出了第一条再扩展工具。

二、如何用AI做视频第一步：提示词设计

提示词是整个流程的地基，写得好，后面每一步都省力；写得烂，生成10遍都不对。

2.1 三种提示词获取方法

方法一：自己写
想清楚你要什么画面，按格式描述给AI。适合有具体想法的创作者。

方法二：让AI帮你写
告诉AI你的主题和风格，让它生成提示词，你在上面微调。

帮我写一个AI图片生成提示词。 主题：赛博朋克街头的小摊贩 风格：像素画，9:16竖版 要求：画面有层次感，背景有霓虹灯招牌，主体人物有细节

方法三：AI反推
找一张你想仿做的图片，发给AI，让它反推提示词，再修改使用。这是最快复制爆款风格的方法。

2.2 图片生成提示词公式

主体描述 + 动作/状态 + 场景环境 + 光影氛围 + 画面风格 + 尺寸比例

真实爆款案例提示词（视频号100万+播放）：

在3025年的夜晚街头，一位人类样貌，满头白发，赛博朋克 （液态的银色金属，银彩色光泽金属发光质感）的老奶奶， 推着写有"老手艺手搓核聚变1000000亿/颗"的推车， 车上放着很多核聚变原子，老奶奶手中托着核聚变原子 （蓝色能量核心发出紫红色蔚蓝光，多层环形等离子体约束 结构环绕，散发着各种颜色的高能激光）； 背景有亮着"超能科技核聚变原子10万生命币/颗"霓虹招牌 的店铺，店铺里面摆满了核聚变道具。 街上赛博朋克风格的行人在店铺那边排队。 背景为：天上白玉京线框全息图，在孤立的黑暗背景下， 发光的蓝色线条在其标志性结构周围形成复杂的图案。 广角镜头展现空间层次，动态星尘轨迹，HDR效果增强视觉冲击。 像素画风格，9:16尺寸。

注意：提示词越具体，生成效果越可控。越模糊，越随机。

2.3 视频运镜提示词

图生视频时，运镜提示词决定了画面是死的还是活的：

镜头缓慢推进 → 画面向主体靠近，营造紧张感 镜头跟随[主体] → 跟拍效果，主体走镜头跟着动 镜头缓慢上升 → 俯拍视角，展示全景 镜头环绕[主体]旋转 → 360度展示，适合产品展示 镜头从远拉近特写 → 强调细节，突出重点

三、如何用AI做视频第二步：图片生成

3.1 用豆包生成图片

打开豆包，将写好的提示词粘贴到图像生成对话框，豆包会输出一组图片供选择。

技巧：

不满意就多生成几次，同一个提示词每次结果略有不同
如果觉得像素画模糊，用豆包自带的变高清功能处理
选图优先选：主体清晰、光影层次丰富、构图有纵深感的版本

3.2 图片去水印

下载的图片会带有平台水印，直接拿去生成视频，水印会出现在视频里。

推荐方案：用百度AI图片助手去水印（目前免费，需登录百度账号），同时还能顺带提升分辨率，处理后像素画的细节更清晰。

四、如何用AI做视频第三步：图生视频

4.1 即梦图生视频操作

打开即梦，选择「视频生成」
上传处理好的无水印图片
选择视频生成模型（即梦有多个模型可选，新模型效果更好）
填写动作+运镜提示词
点击生成，等待1～3分钟

实际案例的运镜提示词：

街上赛博朋克的人们走着，很多人在店铺那里排队买东西， 同时老奶奶推着车子一直往前走，走的过程中扭头看了看 店铺那边排队的人群，将手里的核聚变光束扔了过去， 店铺里面爆发出各种巨大的超能光束，然后店铺倒塌了， 老奶奶回过了头，镜头跟随老奶奶

4.2 视频去水印

即梦免费版下载会带水印，三种处理方案对比：

方案	操作难度	画质损失	优点	缺点
开通即梦会员	低	无	一劳永逸，功能完整，下载无限制	需付费
剪映裁掉水印	低	轻微（裁边）	免费，操作简单	画面会被裁切，构图略有影响
开发者工具下载	高	有（压缩）	免费	操作繁琐，画质有损，仅建议偶尔使用

推荐：常用就开会员，偶尔用就用剪映裁边法。

五、如何用AI做视频第四步：剪映后期

AI生成的裸视频不能直接发，必须经过后期才有完播率。

5.1 基础剪辑流程

导入素材：将生成的视频片段导入剪映
变速处理：AI生成的视频通常是5秒，调整为0.7倍速变成约8秒，节奏更舒适
拼接排序：按分镜顺序拼接多个片段
添加字幕：80%用户静音观看，字幕决定完播率
配BGM：从爆款视频或剪映素材库选匹配音乐，注意无版权
加片尾：关注引导、下期预告，这是涨粉的重要入口

5.2 企业产品视频的额外步骤

如果是做企业宣传/产品介绍类视频，还需要：

画中画轨道：叠加实际软件演示录制（用腾讯会议/OBS录屏）
统一调色：确保所有片段色调一致
配音：专业配音或AI配音工具（剪映内置AI配音）

六、如何用AI做视频：零门槛一站式方案

上面那套流程走完，豆包→去水印→即梦→去水印→剪映，每个环节都要切工具、处理账号、解决水印问题——对新手来说光工具的切换成本就够劝退的了。

没有EasyClaw之前，光处理两次水印+切三个工具，出一条视频最快也要一个多小时。有了它，打开技能商店，搜「AI视频生成」，点安装，用中文描述需求，20分钟出片，整个流程在一个窗口里搞定。

立刻免费体验 EasyClaw的技能商店里有专门的AI视频生成技能包，打开软件，点击左上角的“技能”找到"AI视频生成"

这个技能包支持：

文生视频：纯文字描述直接生成动态视频
图生视频：上传图片生成对应动态效果
中文原生：不用FQ，不用英文提示词，直接描述就能出片
零配置：不用安装Python，不用配API Key，打开就用

适合刚起步、不想在工具折腾上浪费时间的创作者。

七、如何用AI做视频：企业级分镜策划进阶

如果你做的是企业产品宣传视频，需要更系统的分镜框架。用这个提示词让DeepSeek生成完整分镜脚本：

你是一个专业的视频分镜师。请根据以下需求，生成一个详细的分镜脚本。 视频主题：[填入主题] 目标平台：[填入平台] 目标时长：[填入时长] 核心目标：[填入目标] 每个分镜包含： - 镜号和时间段 - 画面描述（主体、场景、光影、运镜） - 旁白/字幕文案 - 建议镜头景别（全景/中景/特写） - 建议画面类型（实景/动画/图示）

企业视频典型分镜结构（以2分钟产品视频为例）：

分镜	时段	内容	优点	参考话术
冲突开场	0～25s	展示用户痛点场景	快速引发共鸣，抓住注意力	“每次对需求总是鸡同鸭讲？”
方案引入	26～45s	产品界面优雅登场	承接痛点，自然过渡	“用XX，一次说清楚”
功能展示	46～85s	核心功能逐一演示	具象化价值，建立信任	操作截图+功能说明
价值升华	86～100s	数据/客户见证	增强可信度，打消疑虑	“XX家企业已在用”
行动召唤	101～120s	引导注册/联系	转化收口，不能省	“扫码免费试用”